Neste episódio nós conversamos com o especialista em Machine Learning Mario Filho, Kaggle Grandmaster com vários títulos em competições globais no Kaggle.
Com quase uma década de experiência, ele vai compartilhar um pouco da sua trajetória até se tornar um Cientista de Dados, os diferentes perfis e níveis educacionais de quem entra na área, sua experiência nas competições do Kaggle e dicas para conquistar sua vaga no mercado de trabalho!
Se você ainda não conhecia o Mário, vou tentar resumir a sua biografia: Lead Data Scientist na área de Machine Learning da Upwork entre 2018 e 2019, consultor de conteúdo pela UC Berkeley, multicampeão de competições do Kaggle, autor do e-book “Manual Prático de Data Science” e consultor em Machine Learning, tendo trabalhado para grandes empresas de Data Science, como Upwork e TOTVS.
Ah sim, ele aprendeu tudo exclusivamente com cursos online.
Em tempos em que você tem acesso gratuito às aulas de Stanford, MIT e Harvard, e ter aula com grandes nomes como Andrew Ng e Jeremy Howard, o Mario Filho é maior validação de que o democratização do conhecimento derrubou qualquer barreira de entrada nessa carreira inovadora.
Agora eu te pergunto, qual a sua desculpa para começar hoje mesmo uma nova carreira?
O que é o Kaggle?
De acordo com informações do próprio site, “Kaggle é o lar da ciência de dados, com mais de 12 milhões de usuários, prontos para resolver seu problema de modelagem preditiva por meio de competições de dados. (…) Dentro do Kaggle, você encontrará todo o código e dados necessários para realizar seu trabalho de ciência de dados. Use mais de 50.000 conjuntos de dados públicos e 400.000 notebooks públicos para conquistar qualquer análise rapidamente.”
Mário conta que, como não tinha formação na área, tinha que provar de alguma forma que entende do assunto, por isso quis participar das competições do Kaggle. Pois a visibilidade que essa plataforma traz é tornaria mais conhecido, além do prêmio oferecido para algumas competições.
De maneira resumida, Kaggle é uma plataforma de ciência de dados e aprendizado de máquinas, em que seus usuários podem encontrar e publicar conjunto de dados, trabalhar com profissionais de dados e participar de competições que resolvem desafios de ciência de dados.
E ele não só participou como venceu algumas competições, que lhe renderam centenas de milhares de dólares. Nada mal para quem não era formado na área, né?
“O melhor passo para resolver um problema é olhar como outras pessoas o solucionaram. Isso lhe vai economizar um tempo absurdo. (…) Como ela pensou, como ela usou uma biblioteca, como ela resolveu uma problema parecido ou igual ao seu.”
Para ele, a melhor maneira de você realmente entender machine learning é competindo, colocando em prática seus conhecimentos para resolver um problema real. É como querer aprender o nado livre (crawl) apenas assistindo a vídeos ou lendo livros. Tem que colocar em prática para testar seus conhecimentos teóricos, o famoso “colocar a mão na massa”.
O caminho percorrido para aprender
Pela falta de formação na área, Mário construiu sua base fazendo muitos cursos remotamente e lendo livros. Alguns dos cursos foram feitos na Coursera, na Udacity, na edX e na prestigiada Caltech (Instituto de Tecnologia da Califórnia). Sobre os livros, conta que estudou pelo “The Elements of Statistical Learning” e “Python for Data Analysis”.
“Nenhum curso vai lhe ensinar tudo, não existe uma única fonte. As abordagens mudam. E o mais importante são os insights de cada professor.”
De fato, nenhum curso vai conseguir abarcar todas as possibilidades e exemplos. Cabe também ao estudante participar dessa construção de conhecimento, não apenas esperando que o responsável pelo curso lhe forneça tudo que ele precisa. Ler para aprender é uma atividade ativa, que depende de esforço mental, já dizia Mortimer Adler no livro “Como Ler Livros”.
O mercado era dominado por acadêmicos com mestrado e doutorado, e o trabalho como freelancer exigia conhecimento prático, conta Mário Filho. Por isso, ele construiu sua base de conhecimento e depois procurou aprender aquilo que ele precisaria para conquistar seus objetivos no mercado de trabalho.
Sobre faculdade, o campeão de competições do Kaggle conta que não é contra; ela é só um meio dentre outros de aprender algo. Ele faz uma observação sobre a mentalidade dos universitários, que acham que, após formado, você não precisa mais estudar, mas isso não é verdade. Você sempre precisará estudar e se aprimorar, complementa ele.
Bem, se a pessoa quer aprender algo, desculpa de não existir fonte não deve existir. Hoje em dia, é possível aprender por livros, vídeos, podcasts, cursos, desde que exista vontade mesmo, ou seja, tem que suar a camiseta.
Sobre a Matemática para Machine Learning
Nosso entrevistado conta que não tinha uma base de matemática. Na verdade, era péssima, segundo ele. Para resolver esse entrave, contou com os conteúdos da plataforma Khan Academy, elogiando sua organização. Também estudou Cálculo pelo MIT.
No entanto, não é preciso saber matemática profundamente para aprender machine learning e ciência de dados, ressalta Mário. Porém, deep learning já requer uma matemática mais pesada para aprender coisas como backpropagation (derivada parcial e tensores, por exemplo), ponderação com a qual nosso entrevistado também concordou.
Você vai resolver meu problema é uma pergunta que todas as empresas e todo mundo faz, comenta Mário Filho. No fundo, é a experiência que conta, ele complementa. De fato, o portfólio é um instrumento imprescindível para você mostrar sua experiência, porque não tem como um recrutador adivinhar quais suas habilidades e o que você já produziu.
A verdade é que mensagens de recrutador no LinkedIn se tornaram uma commoditie, porque estão disparando para todos os lados, observa o entrevistado. Para ele, os passos que você deve seguir são estes: você deve criar um portfólio, escrever artigos, divulgar no LinkedIn e outras plataformas e se candidatar a uma vaga. Em vez de esperar um recrutador achá-lo – lembre-se de que há uma infinidade de pretendentes –, essa é a maneira mais rápida de conseguir uma vaga, ele explica.
Oportunidades na área de dados
Nosso convidado conta que há uma carência de manipulação especializada em ciência de dados no Brasil, e que gráficos e dashboards já fariam uma enorme diferença no uso de dados pelas empresas. Sobre uma recomendação de empresas para quem deseja trabalhar com machine learning, ele cita algumas: Airbnb, Netflix, Nubank, Hotmart, Itaú.
“Ninguém compra uma furadeira porque gosta dessa ferramenta; compra porque precisa dela para fazer um furo. Ninguém compra um curso porque quem o produz é bonito ou legal, mas porque quer aprender algo.”
Em relação a oportunidades no mercado, ele aconselha a saber o que o mercado está buscando. Se quer relatório, aprenda a fazer relatórios; se quer trabalhar com machine learning, aprenda inglês também, porque o Brasil é muito insipiente nessa área, então pense no mercado exterior, completa Mário. Se alguém tiver interesse, ele produziu um vídeo gratuito no YouTube sobre conteúdos bons de venda.
Além de saber o que o mercado busca, você deve saber vender a solução para o problema do mercado, pontua ele. De fato, você tem que investir no seu personal branding, porque nada adianta você ser um profissional excepcional se ninguém o conhece e se você “não sabe vender seu peixe”.
Trabalho como freelancer
Para nosso ilustre convidado, a melhor forma de começar é utilizando uma plataforma para freelancer, como Upwork e Codementor. Essas plataformas abarcam quaisquer áreas (“até” mentoria de Excel), não apenas Data Science, continua ele.
Mário aconselha a realizar estes passos: entrar na plataforma, selecionar um serviço que você quer prestar e se candidatar a uma vaga. Por exemplo, se você sabe SQL, então se candidate a trabalhar com isso, exemplifica ele.
“O importante é personalizar sua proposta de serviço de acordo com a empresa, agregando valor.”
Mário Filho
Por que personalizar? A resposta vem com uma pergunta: você gosta de receber algo genérico (um elogio, uma mensagem), sem seu nome ou característica sua? Ninguém gosta; todos gostamos de algo personalizado, feito para gente, com nossa cara, porque isso tem a ver com cuidado, com consideração. Logo, a empresa quer que você fale diretamente com ela, sem utilizar um CTRL + C + V.
Mário cita uma de suas propostas: “se você quer resolver esse problema, você deve levar em consideração essas coisas e tome cuidado com essas coisas”. E sabe qual era a taxa de sucesso dele? Quase sempre a empresa o contatava. Por quê? Mais outra característica humana: colaboração, ajuda mútua. O recrutador passa a confiar em você, porque você o ajudou e o alertou sem “nada em troca” (embora fosse uma abordagem cuja finalidade era exatamente mexer com ele para ser contatado).
Para conseguir ter credibilidade e ser chamado por outras empresas, você precisa pegar trabalhos menores e conseguir resolver “o pepino” dos clientes, aconselha o multicampeão de competições do Kaggle. Se você for bem-sucedido, a própria plataforma o recomendará e as empresas para as quais prestou serviço escreverão uma nota o elogiando e o recomendando, comenta ele.
Vagas no exterior
A pandemia causada pelo COVID-19 modificou nossa relação com o trabalho de algumas formas, acelerando a automação e implementando mais o trabalho remoto. Em função disso, os profissionais de dados pensaram nas oportunidades no exterior, uma vez que não precisava morar ou viajar para lá.
Quando perguntado em quais empresas de fora ele trabalhou e como elas o encontraram, Mário cita a Upwork e TOTVS, tudo isso por causa da repercussão com as vitórias nas competições do Kaggle.
“Você tem que saber inglês e produzir em inglês se quiser aplicar para o mercado fora do Brasil. O aprendizado desse idioma me abriu mais portas do que qualquer faculdade ou curso me abririam.”
O inglês é o idioma da tecnologia, todo mundo sabe disso. Os livros mais atuais saem em inglês, portanto não tem como não pensar em não aprender esse idioma nos dias de hoje.
Para chamar atenção dos recrutadores, Mário sugere que você publice nas seguintes plataformas: Kaggle, LinkedIn, Medium. E você tem que se candidatar, não esperar a boa vontade das empresas o encontrar, ele alerta.
Pergunta polêmica: R x Python
A verdade é que Python é mais simples de se aprender e mais generalista, abarcando uma infinidade de aplicações. O que é mais fácil: cortar um pão com uma faca de serra ou uma colher? Embora ambos instrumentos consigam cortar, a faca é mais eficiente para esse serviço. É a mesma coisa para Python e R: por que você aprenderia algo mais complexo para produzir o mesmo resultado? A menos que você fosse masoquista ou fosse uma questão de ego (desafiar-se).
Mário segue nessa linha de pensamento também. Atuando como freelancer, o mais fácil para ele era entregar um trabalho em Python, porque essa linguagem é mais flexível, é mais fácil de integrar.
Ele aconselha a você levar em consideração o mercado, ou seja, qual a linguagem mais utilizada ou a linguagem utilizada pela empresa “dos meus sonhos”.
Mario Filho
Conheça o e-book do Mário Filho, “Manual Prático de Data Science”, o qual você encontrar na Amazon. Confesso que fui um dos primeiros a adquirir um exemplar, e recomendo muito o livro.
Neste link você pode encontrar todo seu conteúdo digital. Sobre os cursos dele, há dois: um workshop e um curso completo.
Nesses tempos insanos em que vivemos, em que o tempo é um recurso escasso, gostaria de agradecer a participação do Mário Filho. Não só pela presença e pelo conhecimento transmitido, mas pela sinceridade e simpatia, estando realmente “presente” de corpo e alma.