Frequentemente me perguntam, tanto os alunos do Data Science na Prática e Escola de Data Science quanto o pessoal do Instagram, quais livros eu recomendo para quem está começando ou até para quem quer se aprofundar em Data Science.
A literatura é extensa e cresce a cada dia, mas que livros irão realmente o ajudar e fazer com que você cresça na sua carreira e em suas habilidades? É exatamente isso que vamos discutir hoje!
Sobre Data Science
Se você chegou até aqui, já deve ter uma ideia do que é Data Science. Apesar de haver várias linhas de pensamento tentando definir o que é Data Science, uma delas é o uso de dados e modelos de Machine Learning para gerar previsões e insights em uma determinada área.
Data Science é um conjunto de técnicas e ferramentas que torna isso possível. Apesar do crescente movimento de bibliotecas no-code ou low-code, é extremamente importante, para um profissional que quer se destacar no mercado de Data Science, entender os contextos e os acontecimentos por trás das bibliotecas e, além disso, ter um amplo conhecimento do mercado em que o problema está inserido.
Pensando em ajudá-lo a criar essa ponte entre ciência e negócios, vamos começar a nossa lista de livros essenciais para quem quer se destacar em Data Science.
Se conseguir uma vaga como Cientista de Dados é algo do seu interesse, participe da Semana Data Science na Prática, que vai acontecer entre os dias 06 e 12 de Dezembro. Inscreva-se na Semana Data Science na Prática e conheça um plano à prova de falhas para levá-lo do zero à vaga em Ciência de Dados.
7- Introduction to Computation and Programming Using Python – John V. Guttag
Esse livro também pode ser encontrado em formato de curso, pelo MIT, na EdX. Foi um dos primeiros livros e cursos que fiz quando estava entrando na área. O diferencial desse livro é sua capacidade técnica, que é voltada para a academia — mas não é um livro acadêmico, trazendo conhecimentos desde o básico ao avançado. Fique atento: compre a edição mais atualizada.
6- Data Science from Scratch – Joel Grus
Com esse livro, precisamos mais uma vez ter atenção à sua edição. A versão em Português está desatualizada, por isso busque a versão em inglês. Lembre-se de que tecnologias evoluem muito rápido, por isso os materiais também ficam desatualizados rapidamente. Busque sempre as versões mais atualizadas dos livros.
O legal desse livro é que ele foca em ensiná-lo os conceitos, e lhe mostra como fazer tudo na mão, na raça, sem depender muito de bibliotecas ou outras coisas nesse sentido feitas para facilitar a sua vida. Isso é muito bacana, pois lhe dá uma base incrível.
5- Storytelling com Dados – Cole Nussbaumer Knaflic
Para quem acompanha o Sigmoidal há um tempo, sabe a importância e o destaque que damos para Storytelling. Esse livro é valioso mesmo para quem não trabalha nessa área. Você pode ser o melhor da sua área, mas se você não sabe se comunicar, não sabe apresentar seus resultados, não vai adiantar de nada.
É muito comum que Cientistas de Dados foquem muito na técnica, no código, e nem sempre as pessoas que vão consumir seu trabalho serão técnicas o suficiente ou estarão interessadas nas pequenas nuances técnicas, que só quem programa e trabalha com isso vai entender.
A importância de conseguir comunicar seus resultados de forma efetiva e que transforme a sua comunicação em uma vantagem competitiva é o que torna esse livro tão relevante. Esse é um dos livros mais importantes dessa lista.
4- Data Science Para Negócios – Foster Provost e Tom Fawcett
Esse livro também não é só para quem trabalha com dados, com tecnologia. Ele traz insights de negócios e de resolução de problemas que vão além do Data Science. Entender essas coisas é vital para o Cientista de Dados, assim como é muito importante para quem está ao redor dele, mesmo que não atue em uma área diretamente ligada à Ciência de Dados.
Gerentes, diretores, recrutadores, todo mundo que pode estar permeando a área de Data Science vai se beneficiar da leitura desse livro. Ele pode criar a ponte entre quem cria as demandas e quem entrega os resultados de Data Science, para que haja mais performance, mais entrega, e até mais rentabilidade.
3- The Hundred Page Machine Learning Book – Andriy Burkov
Quando comecei a estudar, sentia dificuldade em romper o gap entre intermediário e avançado. Entre o básico e o intermediário, a linha é mais clara, e é mais fácil de romper, mas falta material do intermediário para o avançado.
Esse livro visa a trabalhar esse gap, e levá-lo realmente ao avançado, trabalhando feature engineering, tratamento de dados e avaliação de modelos de uma forma mais técnica e avançada, ajudando-o a alcançar esse próximo nível em Data Science.
2- Approaching (Almost) Any Machine Learning Problem – Abhishek Thakur
Esse livro mudou a minha vida! Ele segue a linha do anterior, ajudando-o a quebrar o gap entre o intermediário e o avançado.
Muita coisa que esse livro traz não é fácil de achar em outros lugares, o que o torna ainda mais valioso. Ele traz desde otimização de hiper-parâmetros, cross validation, avaliação de métricas, ajuda-o a sair do seu Jupyter Notebook para que você possa montar uma estrutura de base para projetos, entre muitas e muitas outras coisas.
Esse é, sem dúvidas, um dos livros mais valiosos e avançados de Data Science; é leitura obrigatória para qualquer Cientista de Dados. Só não está em primeiro lugar nessa lista pois o número 1 é a verdadeira bíblia do Machine Learning!
1- Hands–On Machine Learning with Scikit–Learn, Keras and TensorFlow – Aurelien Geron
Como eu falei ali em cima, esse livro é a verdadeira bíblia do Machine Learning! Porém, muito cuidado, pois a versão em Português, mais uma vez, está desatualizada! Busque pela segunda edição, em Inglês, para ter acesso ao material atualizado.
A segunda edição está atualizada para o Tensorflow 2, que mudou algumas coisas muito importantes, como a API do Keras, que fazem com que a primeira edição fique realmente obsoleta.
O livro tem mais de 800 páginas de muita explicação detalhada, exemplos com código, muito material. Esse não é um livro para você sentar e ler. É um livro para degustar, para apreciar e estudar por um bom período. Não tenha pressa!
Aprenda a estudar, busque entender e não só jogar os exemplos no Jupyter Notebook ou no terminal. A prática deve ser 80% do seu estudo, mas esses 20% de teoria não podem ser esquecidos, e devem ser muito bem aproveitados na hora de estudar esse livro.
Chegou a hora de você conhecer o caminho para eliminar a frustração de não saber por onde começar e investir a sua energia no que realmente vai gerar grandes resultados para você.
Participe da Semana Data Science na Prática, entre os dias 06 e 12 de dezembro, em que vou mostra-lhe o caminho para aprender Data Science e conseguir uma vaga na área.
Clique no botão abaixo e participe da Semana Data Science na Prática
Você também pode ver o vídeo que eu fiz, no qual falei sobre esses livros, e muito mais conteúdo sobre Data Science, VFX, Filmmaking e muito mais no meu canal no YouTube. Inscreva-se no canal para ficar por dentro de todas as novidades!
Show