“Como aprender Data Science?” é uma das perguntas mais frequentes que recebo no meu Instagram.
Começar qualquer coisa não é tarefa fácil. Requer disciplina, tempo e um planejamento detalhado sobre onde você quer chegar.
Falando sobre minha própria história, eu tive que aprender Python e Data Science do absoluto zero em 2015.
O sentimento que eu tive nesse começo foi a de completa frustração, pois por mais que eu terminasse livros e cursos, ficava com a sensação de que não conseguiria fazer um projeto sozinho.
Sei que a maioria de vocês passa pela mesma situação, então gostaria de compartilhar algumas dicas sobre como se deve estudar Data Science.
Também coloquei o vídeo do meu canal do Youtube, onde trato deste mesmo tema 🙂
Dificuldades para aprender Data Science
Em uma pesquisa que eu fiz com os inscritos do Sigmoidal, consegui traçar o perfil exato das pessoas que frequentam este blog.
Fiz várias perguntas a respeito dos sonhos, objetivos e dificuldades de cada um. A quantidade de pessoas que participou foi tão grande que consegui identificar vários fatores relevantes.
E sabe o que mais me impressionou? As dificuldades e obstáculos daqueles que estão começando a estudar Data Science são exatamente as mesmas que eu passei há quase 5 anos.
Não saber por onde começar a estudar Data Science
A maioria das pessoas que participou da pesquisa apontou que a maior dificuldade é não ter a mínima ideia sobre qual trilha de aprendizado seguir.
A internet popularizou o conhecimento e derrubou barreiras, porém separar o joio do trigo é uma tarefa árdua.
Basta ver a resposta de algumas pessoas para ver como isso não é algo exclusivo seu. A maioria das pessoas sofre com essa frustração :/
Quando a gente acumula alguns anos de experiência em Data Science, passa a conseguir escrever nossos próprios métodos e caminhos. No entanto, quando você é iniciante, isso é impossível!
Nível de conhecimento de Python
Identifiquei que mais de 62% das pessoas que querem aprender Data Science são iniciantes em Python – algumas delas estão tendo contato com programação pela primeira vez.
Quando me perguntam se devem focar em aprender Python puro (em primeiro lugar) e somente após isso começar a aprender Data Science, sempre dou a mesma resposta.
Minha opinião sincera é que fazendo isso você está desperdiçando um tempo precioso. Eu sou da vertente que você tem que colocar a mão na massa logo, e ir correndo atrás do conhecimento complementar paralelamente.
O que você precisa é começar. O caminho te ensinará.
Ícaro de Carvalho
Mesmo que você ainda não entenda muita coisa, só o fato de você estar fazendo um projeto na prática vai te dar uma tremenda dose de motivação!
Ah, fora o fato que se você deixar Data Science para “depois que você aprender Python”, corre o risco de nunca começar a estudar nada!
Falta de tempo para estudar Data Science
Como um bom Cientista de Dados, analisei a frequência de palavras que os participantes da pesquisa mais usaram em suas respostas.
Após um tratamento de dados adequado e normalização das palavras, eu plotei a seguinte nuvem de palavras com a biblioteca wordcloud
.
Em destaque, você vê em destaque a palavra “falta” diretamente relacionada à palavra “tempo”.
Falta de tempo é um problema que atinge quase todos os participantes. Seja por cursos, faculdades sendo cursadas, família ou pelo emprego atual, tempo é um obstáculo para aprenderem Data Science.
A maioria dos cursos não é otimizada para quem tem pouco tempo disponível, infelizmente.
Basta lembrar quantas horas você perdeu só para instalar Python, todas as bibliotecas e configurar o ambiente virtual.
Por isso eu sempre recomendo, comecem usando o Google Colab. Você vai ganhar muito tempo, só fazendo isso 🙂
Foco em exemplos práticos e problemas reais
A chave para você aprender Data Science é praticar em cima de exemplos do mundo real.
Você só vai aprender de verdade quando pegar um projeto do zero e sentir orgulho dele no final.
Quer ver uma coisa? Aposto que você tem várias pastas no seu computador, uma para cada curso que já fez no passado.
Aposto também que esses cursos nunca te renderam um projeto que você pudesse publicar no Github, ou que servisse como portfólio do seu trabalho.
Na imagem acima, estão as palavras mais frequentes para a pergunta: “o que não pode faltar em um curso de Data Science”. Olha as mais citadas da lista:
- Prática + Prático
- Exemplos
- Reais
- Projeto
Descobri que é quase unanimidade a premissa de que um curso de Data Science DEVE ser baseado na prática e projetos reais.
Quer ver uma coisa? Faça uma analogia com o modo que bebês aprendem as coisas. Eles aprendem a falar e andar na prática, por exemplo. A nossa natureza humana é practice-based learning.
Somos um algoritmo perfeito de Machine Learning, que precisa da prática (erros e acertos) para aprender (ou aprimorar) habilidades.
Por onde começar a estudar Data Science?
Como eu falei lá em cima, quem está começando precisa de uma direção bem definida.
Por isso eu separei algumas dicas muito valiosas, que vão ajudar você a construir bases sólidas para a carreira de Cientista de Dados.
Também quero te apresentar meu novo treinamento “Data Science na Prática”, que vai começar dia 16 de setembro, trazendo uma proposta inovadora de aprendizado.
Data Science do Zero
O livro Data Science do Zero, do autor Joel Grus, é uma excelente primeira escolha para você ler.
O ritmo do livro é bem tranquilo. O autor começa com o básicos sobre Python, conceitos de Álgebra Linear, Estatística e Probabilidade – tudo com muito código e mão na massa!
Na segunda parte do livro, são apresentadas as técnicas de manipulação de dados e introdução ao Machine Learning.
Notebooks de competidores do Kaggle
Eu não estou falando para você participar de competições do Kaggle, mas sim sobre usar o notebook de outras pessoas para aprender a construir um projeto.
Quando você escolher qualquer competição do Kaggle, vai ver no menu que há uma aba “Notebooks” no menu.
Clique a veja a quantidade de notebooks de outros competidores disponíveis para você olhar e copiar.
Normalmente, os notebooks mais votados são os mais bem documentados. Ou seja, mesmo que você não entenda o código de cara, vai entender exatamente a linha de raciocínio do autor.
Eu recomendo você criar um notebook em branco no Google Colab, colocar o do Kaggle do lado, e ir escrevendo linha a linha.
Esse mindset voltado para a prática vai fazer você absorver mais rápido Data Science.
Curso Data Science na Prática
Eu não sou programador/desenvolvedor de formação. Não tive nenhuma matéria na graduação sobre lógica, algoritmos ou algo do tipo.
Por causa disso, sei bem como é aprender Data Science do zero. Passei pelas mesmas frustrações e desânimos da maioria.
Mas por causa dessas dificuldades, aprendi exatamente como um curso de Data Science NÃO DEVE SER.
Mais do que isso, elaborei ao longo dos últimos meses um treinamento para fazer você a aprender Data Science em três meses e já sair com um portfólio impactante!
A primeira turma do Data Science na prática já começou o treinamento e está vendo assuntos como:
- Introdução ao Data Science;
- Manipulando Dados com Pandas;
- Visualizando Dados com Matplotlib;
- Machine Learning com Scikit-learn;
- Criando um Projeto do Zero.
Trouxe mais que um curso sem aplicação no mundo real, trouxe uma proposta de treinamento 100% baseada na prática, analisando problemas reais como fraudes bancárias e precificação de imóveis.
Infelizmente, já encerram as inscrições para a primeira turma, porém devo abrir uma nova ainda este ano.
Se você quiser saber mais sobre este treinamento inédito, clique no botão abaixo para se cadastrar e ser informado quando abrirem novas vagas.
Ao término do Curso Data Science na Prática, eu garanto que você não terá apenas um diploma, mas também estará pronto para iniciar uma nova carreira em Data Science, com todos os hard e soft skills que de fato importam.
Faça parte desta mudança e entre para nossa comunidade!
Genial! Quero participar do curso assim que abrir vagas!
Devo fazer mais uma turma ainda este ano. Cadastre seu email em https://curso.sigmoidal.ai para ser informado quando abrirem novas vagas 🙂
Olá gostaria de entrar no curso, mas encerrou pode reabrir para m mim, obrigado
Abrirá mais uma turma este ano?
Espero que abra mais vagas mesmo esse ano, eu fui assaltada bem no período das inscrições e não consegui realizar o pagamento… uma pena. Estou ansiosa pelas novas turmas!
Deve ser muito bom esse curso! Já vi alguns vídeos no Youtube e a didática do professor é incrível.
Muito bom