Recentemente, postei um vídeo mostrando as principais fontes de dados reais para projetos de Data Science.
Com certeza você já passou por isto: fez um curso bacana, encontrou um tema legal para seu projeto, mas não soube onde encontrar dados para o projeto.
Pensando nisso, e atendendo a inúmeras solicitações, resolvi gravar esse vídeo, em que explico as principais fontes e métodos que eu mesmo utilizo no dia a dia para obter insumos para os meus modelos.
Além de mencionar 3 excelentes fontes, eu dei uma dica imperdível, sobre como pesquisar artigos científicos para descobrir de onde os autores extraíram os dados para usarem em suas pesquisas.
Depois que o vídeo foi gravado, várias pessoas enviaram outros repositórios e dicas de sites, além daqueles originais que eu havia citado no YouTube.
Chequei todas as dicas e resolvi criar também uma lista atualizada, contendo todos eles.
Então, para aumentar ainda mais suas fontes, aqui uma coletânea atualizada de datasets reais para usar em seus projetos pessoais de Data Science:
- Kaggle
- Portal Brasileiro de Dados Abertos
- UCI Machine Learning Repository
- Google Dataset Search
- Dados Abertos do Governo Americano
- Google Acadêmico
- Sidra IBGE
- KD Nuggets
- IBM Data Asset eXchange
Essas fontes com certeza ajudarão você a solucionar problemas de Machine Learning e Data Science em diversas áreas diferentes, utilizando exemplos do mundo real.
Obviamente, existem outras inúmeras fontes. Se você tem alguma que considera imprescindível, deixe-a nos comentários e ajude a divulgar.
Inscreva-se no novo canal do YouTube
E, se você gostou desse conteúdo, inscreva-se agora no YouTube e receba notificações quando eu publicar novos vídeos.
Estamos iniciando uma nova fase no canal, e teremos muitas novidades por lá.
Deixe também suas dúvidas no espaço de comentários do canal. Estarei sempre atento a responder, em vídeos futuros, às dúvidas 🙂