A profissão de cientista de dados (data scientist) foi chamada de “a mais sexy deste século” pela Harvard Business Review. Se você acompanha as notícias na área de tecnologia, com certeza já viu que as companhias precisam cada vez mais de pessoas que saibam transformar informações em produtos.
Se eu tivesse que apostar em uma área para investir em conhecimentos e cursos, iria focar 100% em (1) aprender a programar em Python e (2) começaria a me dedicar ao universo do Data Science.
Para você ter ideia de como esse mercado está aquecido, empresas de recrutamento não estão conseguindo encontrar pessoas qualificadas para a profissão no Brasil (que oferece salários de até 22 mil reais para especialistas na área).
Se você já escutou falar dessa profissão, mas ainda não conseguiu entender o que ela faz, pense no cientista de dados como sendo aquela pessoa que consegue pegar um grande número de dados, extrair informações e gerar conhecimento.
Já no exterior, a média salarial de um cientista de dados fica acima de 11 mil dólares por mês (ou seja, quase 50 mil reais), segundo o site Glassdoor.
Dentre os maiores empregadores para Data Science, estão Startups e Fintechs (como a NuBank), e até mesmo empresas tradicionais como Ambev e Wallmart. Claro, não poderia deixar de mencionar as mais queridinhas de todo mundo da área de TI, Google, Facebook e Apple.
Não sou de exatas. Posso aprender programação e ciência de dados?
Um dos maiores mitos que as pessoas que não estão inseridas no mundo da TI têm é de que apenas empresas de tecnologia precisam de cientistas de dados, e que aqueles que são formado em humanas (direito, administração, etc.) ou biológicas (medicina, farmácia, etc.) não conseguem aprender a programar.
Além de um preconceito contra as outras áreas, é uma crença falsa! Quer um exemplo simples?
Jeremy Howard é uma das mentes mais brilhantes por trás da Inteligência Artificial (IA), na minha opinião, tendo liderado por muito tempo o ranking do Kaggle e promovido cursos de altíssimo nível para Deep Learning. Alguém arriscaria a profissão dele?
Formado em filosofia. Ponto.
O que eu mais tenho visto são jornalistas usando Python para analisar dados de contas públicas (exemplo da Operação Serenata de Amor), ou automações sendo feitas em processos jurídicos por meio da IA. Ah, sem falar as capacidades de algoritmos em detectar doenças como pneumonia e câncer em imagens de ressonância magnética e raio-x.
Alias, ninguém precisa de formação acadêmica para ser um data scientist. Você consegue aprender tudo o que precisar em cursos onlines, livros e estudos de casos dos outros.
Se eu tivesse que resumir o que uma única frase qual o objetivo de um data scientist, eu diria que é analisar uma massa de dados para fazer inferências (previsões). Análise de padrões e previsões podem ser feitas em qualquer coisa ou business.
Quais as principais competências para um Cientista de Dados?
Toda profissão tem seus requisitos que são mais ou menos padrão. Obviamente que nunca é uma regra amarrada, mas no geral eu tenho visto pela experiência que algumas habilidades e competências são BEM desejáveis para quem quiser se destacar em Ciência de Dados.
1. Programação
Dá para analisar dados e até fazer modelos preditivos em planilhas de Excel? Dá, mas não é o ideal, principalmente se você vai lidar com situações do dia a dia e com Big Data. Aprender a programar é obrigatório!
Se há 10 anos falavam para a gente que aprender inglês era obrigatório (e quem não aprendesse inglês estaria fora do mercado), hoje em dia essa é a relidade para a programação.
Se você não programa ainda, faça tudo para aprender. Com certeza, esta será uma competência mandatória daqui a algum tempo. Entre as principais linguagens para Ciência de Dados estão Python, R e Matlab.
Quer uma dica? Fique com Python 🙂
2. Matemática
Quando a gente fala de construir modelos de otimização e inferência, saber o básico de modelagem matemática vai te diferenciar do resto do mercado.
Você não tem que saber Cálculo III ou resolver na mão uma diferenciação parcial, mas precisa entender os conceitos basilares de cada algoritmo.
Entenda o que significa otimização, minimizar custo e função objetivo, e seja mais feliz 🙂
3. Estatística
O que hoje em dia a gente chama de Machine Learning, em boa parte foi tudo o que antes o pessoal chamava de “estatística” (quem é da área, estou generalizando, eu sei).
Se você usa regressão linear, regressão logística e não sabe estatística, as chances são de que você está usando um pacote pronto de Python e não tem ideia do porque ele funciona.
Isso está OK para o começo e aspirante a Cientista de Dados, mas um programador NUNCA pode não querer ir mais fundo, entender o que está usando. Recomendação?
Pelo menos uma vez na vida, construa na mão alguns algoritmos como Gradient Descent e uma Rede Neural com mais de duas camadas. Isso vai fazer muita diferença na sua vida de aprendizado.
4. Criatividade
Last but not Least, seja criativo e treine mais o lado do seu cérebro que pensa em soluções que fogem do senso comum.Sério. Ser criativo vai ser o diferencial de qualquer profissão no futuro.
Enquanto quase metade das profissões irão desaparecer em 20 anos por causa da automação e IA, a criatividade humanda nunca vai ser substituida (até a chegada da Skynet, pelo menos).
Para Data Science, tente sempre relacionar a sua situação problema a outras áreas da vida, e mantenha sempre acompanhando videos e Jupyter Notebooks daqueles que conseguem ficar sempre no topo dos rankings de competições.
Cientista de Dados: a profissão mais “sexy” do século 21.
HARVARD BUSINESS REVIEW
Resumo
Desde quando eu comecei a trabalhar com Data Science há alguns anos, fiquei apaixonado pelas possibilidades de coisas que conseguiria analisar e resolver.
Se eu pudesse dar um conselho hoje a alguém que está começando a programar ou que já tem alguma experiência, seria investir na carreira de Ciência de Dados. Tem muitas oportunidades de trabalho, muitas delas remotas no exterior, e todas pagando um salário acima da média.
Uma coisa é fato, comece a se preparar hoje, mesmo que esteja saindo do zero. Afinal, daqui a 5 anos, você vai ter desejado ter começado hoje 🙂
Aos 51 anos quero ingressar nesse mercado. Acha possível?
Mesmo que não seja, vou tentar. Tenho comonuncentivi a ideía de que quem passou pela maternidade, passa por qualquer coisa, não existe nada mais difícil do que aprender da noite para o dia o que é cuidar de um bebê recém nascido aos 42 e sem nenhuma experiência anterior.
Enfim, gostei muito do seu artigo, muito esclarescedor e motivador. Vou chegar lá e volto pra contar pra você. Por enquanto deixo meu muito obrigada!