Escolha uma Página

Frequentemente me perguntam, tanto os alunos do Data Science na Prática e Escola de Data Science quanto o pessoal do Instagram, quais livros eu recomendo para quem está começando ou até para quem quer se aprofundar em Data Science.

A literatura é extensa e cresce a cada dia, mas que livros irão realmente te ajudar, e fazer com que você cresça na sua carreira e em suas habilidades? É exatamente isso que vamos discutir hoje!

Sobre Data Science

Se você chegou até aqui, já deve ter uma ideia do que é Data Science. Apesar de ter várias linhas de pensamento tentando definir o que é Data Science, uma delas é o uso de dados e modelos de Machine Learning para gerar previsões e insights em uma determinada área.

Data Science é um conjunto de técnicas e ferramentas que tornam isso possível. Apesar do crescente movimento de bibliotecas no-code ou low-code, é extremamente importante para um profissional que quer se destacar no mercado de Data Science entender os contextos e os acontecimentos por trás das bibliotecas e além disso, ter um amplo conhecimento do mercado em que o problema está inserido.

Pensando em te ajudar a criar essa ponte entre ciência e negócios, vamos começar a nossa lista de livros essenciais para quem quer se destacar em Data Science.

Se conseguir uma vaga como Cientista de Dados é algo do seu interesse, participe da Semana Data Science na Prática que vai acontecer entre os dias 06 e 12 de Dezembro. Inscreva-se na Semana Data Science na Prática e conheça um plano à prova de falhas para te levar do zero à vaga em Ciência de Dados.


7- Introduction to Computation and Programming Using Python – John V. Guttag

Introduction to Computation and Programming Using Python - Sigmoidal

Esse livro também pode ser encontrado em formato de curso, pelo MIT, na EdX. Foi um dos primeiros livros e cursos que fiz quando estava entrando na área. O diferencial desse livro é sua capacidade técnica, que é voltada para a academia mas não é um livro acadêmico, trazendo conhecimentos desde o básico ao avançado. Fique atento para comprar a edição mais atualizada.


6- Data Science from Scratch – Joel Grus

Data Science from scratch

Com esse livro, precisamos mais uma vez ter atenção à sua edição. A versão em Português está desatualizada, por isso busque a versão em inglês. Lembre-se, tecnologias evoluem muito rápido, por isso os materiais também ficam desatualizados rapidamente. Busque sempre as versões mais atualizadas dos livros.

O legal desse livro é que ele foca em te ensinar os conceitos, e te mostra como fazer tudo na mão, na raça, sem depender muito de bibliotecas, ou outras coisas nesse sentido feitas para facilitar a sua vida. Isso é muito bacana pois te dá uma base incrível.


5- Storytelling com Dados – Cole Nussbaumer Knaflic

Storytelling com Dados - Sigmoidal

Para quem acompanha o Sigmoidal há um tempo, sabe a importância e o destaque que damos para Storytelling. Esse livro é valioso mesmo para quem não trabalha nessa área. Você pode ser o melhor da sua área, mas se você não sabe se comunicar, não sabe apresentar seus resultados, não vai adiantar de nada.

É muito comum que Cientistas de Dados foquem muito na técnica, no código, e nem sempre as pessoas que vão consumir seu trabalho serão técnicas o suficiente ou estarão interessadas nas pequenas nuances técnicas que só quem programa e trabalha com isso vai entender.

A importância de conseguir comunicar seus resultados de forma efetiva e que transforme a sua comunicação em uma vantagem competitiva é o que torna esse livro tão relevante. Esse é um dos livros mais importantes dessa lista.


4- Data Science Para Negócios – Foster Provost e Tom Fawcett

Data Science Para Negócios - Sigmoidal

Esse livro também não é só para quem trabalha com dados, com tecnologia. Ele traz insights de negócios e de resolução de problemas que vão além do Data Science. Entender essas coisas é vital para o Cientista de Dados, mas é muito importante também para quem está ao redor dele, mesmo que não tenha uma área diretamente ligada à Ciência de Dados.

Gerentes, diretores, recrutadores, todo mundo que pode estar permeando a área de Data Science vai se beneficiar da leitura desse livro. Ele pode criar a ponte entre quem cria as demandas e quem entrega os resultados de Data Science, para que haja mais performance, mais entrega, e até mais rentabilidade.


3- The Hundred Page Machine Learning Book – Andriy Burkov

The Hundred Page Machine Learning Book - Sigmoidal

Quando comecei a estudar sentia dificuldade em romper o gap entre intermediário e avançado. Entre o básico e o intermediário a linha é mais clara, e é mais fácil de romper, mas falta material do intermediário para o avançado.

Esse livro visa a trabalhar esse gap, e te levar realmente ao avançado, trabalhando feature engineering, tratamento de dados avaliação de modelos de uma forma mais técnica e avançada, te ajudando a alcançar esse próximo nível em Data Science.


2- Approaching (Almost) Any Machine Learning Problem – Abhishek Thakur

Approaching (Almost) Any Machine Learning Problem - Sigmoidal

Esse livro mudou a minha vida! Ele segue a linha do anterior, onde te ajudar a quebrar o gap entre o intermediário e o avançado.

Muita coisa que esse livro traz não é fácil de achar em outros lugares, o que o torna ainda mais valioso. Ele traz desde otimização de hiper-parâmetros, cross validation, avaliação de métricas, te ajuda a sair do seu Jupyter Notebook para que você possa montar uma estrutura de base para projetos, entre muitas e muitas outras coisas.

Esse é sem dúvidas um dos livros mais valiosos e avançados de Data Science, é leitura obrigatória para qualquer Cientista de Dados. Só não está em primeiro lugar nessa lista pois o número 1 é a verdadeira bíblia do Machine Learning!


1- Hands–On Machine Learning with Scikit–Learn, Keras and TensorFlow – Aurelien Geron

Como eu falei ali em cima, esse livro é a verdadeira bíblia do Machine Learning! Mas muito cuidado, pois a versão em Português, mais uma vez, está desatualizada! Busque pela segunda edição, em Inglês, para ter acesso ao material atualizado.

A segunda edição está atualizada para o Tensorflow 2, que mudou algumas coisas muito importantes como a API do Keras, que fazem com que a primeira edição fique realmente obsoleta.

O livro tem mais de 800 páginas de muita explicação detalhada, exemplos com código, muito material. Esse não é um livro para você sentar e ler. É um livro para degustar, para apreciar e estudar por um bom período. Não tenha pressa!

Aprenda a estudar, busque entender e não só jogar os exemplos no Jupyter Notebook ou no terminal. A prática deve ser 80% do seu estudo, mas esses 20% de teoria não podem ser esquecidos, e devem ser muito bem aproveitados na hora de estudar esse livro.

Chegou a hora de você conhecer o caminho para eliminar a frustração de não saber por onde começar e investir a sua energia no que realmente vai te gerar grandes resultados.

Participe da Semana Data Science na Prática, entre os dias 06 e 12 de dezembro, onde vou te mostrar o caminho para aprender Data Science e conseguir uma vaga na área.

Clique no botão abaixo e participe da Semana Data Science na Prática

Você também pode ver o vídeo que eu fiz falando sobre esses livros, e muito mais conteúdo sobre Data Science, VFX, Filmmaking e muito mais no meu canal no YouTube. Inscreva-se no canal para ficar por dentro de todas as novidades!