fbpx
  • Sobre Mim
  • Cursos
  • Política de Privacidade
  • Contato
Sigmoidal
  • Home
  • Artigos
    • All
    • Carreira
    • Data Science
    • Deep Learning
    • Iniciantes
    • Inteligência Artificial
    • Machine Learning
    • NFT
    • Projetos
    • Python
    • Teoria
    • Tutoriais
    • Visão Computacional
    • Youtube
    NFT e artes criadas por Inteligência Artificial

    NFT e artes criadas por Inteligência Artificial

    Crie um sistema de vigilância com drones e Deep Learning

    Crie um sistema de vigilância com drones e Deep Learning

    Python para análise de ações e investimentos

    Python para análise de ações e investimentos

    Revisão do livro Deep Learning

    Revisão do livro Deep Learning

    Entendendo as árvores de decisão em Machine Learning

    Entendendo as árvores de decisão em Machine Learning

    Gerando amostras para modelos de Deep learning no ArcGIS Pro

    Gerando amostras para modelos de Deep learning no ArcGIS Pro

    Como fazer gráficos rotulados em Python

    Como fazer gráficos rotulados em Python

    7 Livros de Data Science em 2021

    7 Livros de Data Science em 2021

    A faculdade te ensinou tudo, menos como conseguir um emprego.

    A faculdade te ensinou tudo, menos como conseguir um emprego.

    Quanto ganha um Cientista de Dados?

    Quanto ganha um Cientista de Dados?

    Trabalhando com Dados Desbalanceados

    Trabalhando com Dados Desbalanceados

    Detector de Fadiga usando Python

    Detector de Fadiga usando Python

    Trending Tags

    • python
    • data science
    • machine learning
    • deep learning
    • tutoriais
  • Python do Zero
  • Produções Sigmoidal
  • Escola de Data Scienceassine
No Result
View All Result
  • Home
  • Artigos
    • All
    • Carreira
    • Data Science
    • Deep Learning
    • Iniciantes
    • Inteligência Artificial
    • Machine Learning
    • NFT
    • Projetos
    • Python
    • Teoria
    • Tutoriais
    • Visão Computacional
    • Youtube
    NFT e artes criadas por Inteligência Artificial

    NFT e artes criadas por Inteligência Artificial

    Crie um sistema de vigilância com drones e Deep Learning

    Crie um sistema de vigilância com drones e Deep Learning

    Python para análise de ações e investimentos

    Python para análise de ações e investimentos

    Revisão do livro Deep Learning

    Revisão do livro Deep Learning

    Entendendo as árvores de decisão em Machine Learning

    Entendendo as árvores de decisão em Machine Learning

    Gerando amostras para modelos de Deep learning no ArcGIS Pro

    Gerando amostras para modelos de Deep learning no ArcGIS Pro

    Como fazer gráficos rotulados em Python

    Como fazer gráficos rotulados em Python

    7 Livros de Data Science em 2021

    7 Livros de Data Science em 2021

    A faculdade te ensinou tudo, menos como conseguir um emprego.

    A faculdade te ensinou tudo, menos como conseguir um emprego.

    Quanto ganha um Cientista de Dados?

    Quanto ganha um Cientista de Dados?

    Trabalhando com Dados Desbalanceados

    Trabalhando com Dados Desbalanceados

    Detector de Fadiga usando Python

    Detector de Fadiga usando Python

    Trending Tags

    • python
    • data science
    • machine learning
    • deep learning
    • tutoriais
  • Python do Zero
  • Produções Sigmoidal
  • Escola de Data Scienceassine
No Result
View All Result
Sigmoidal
No Result
View All Result
Home Artigos Carreira

Qual o Cenário de Data Science no Brasil hoje?

Carlos Melo by Carlos Melo
maio 13, 2020
in Carreira, Data Science, Iniciantes
0
Qual o Cenário de Data Science no Brasil hoje?
58
VIEWS
Compartilhar no LinkedInCompartilhar no FacebookPublicar no Twitter

Se conseguir uma vaga como Cientista de Dados é algo do seu interesse, participe da Semana Data Science na Prática que vai acontecer entre os dias 06 e 12 de Dezembro. Inscreva-se na Semana Data Science na Prática e conheça um plano à prova de falhas para te levar do zero à vaga em Ciência de Dados.

Definir o cenário de Data Science no Brasil era algo muito subjetivo, baseado em muitos “achismos” e opiniões próprias.

Agora não é mais. Graças a uma iniciativa do Data Hackers, provavelmente a mais completa já feita no Brasil, temos dados de uma pesquisa respondida por mais de 1.700 pessoas.

Análise completa do cenário de Data Science no Brasil em 2020

São dados sobre a faixa salarial, formação, linguagens utilizadas, entre outros insumos fornecidos pelos participantes desse survey.

Vamos dar uma olhada nesse dataset e tentar responder algumas perguntas de interesse.

Data Hackers Survey 2019

A pesquisa Data Hackers Survey 2019 foi realizada pela comunidade Data Hackers durante o mês de novembro de 2019.

Conduzida de forma online, foram feitas 36 perguntas, e o resultado (anonimizado) foi disponibilizado dentro da plataforma Kaggle. Veja algumas das perguntas feitas:

  • Pergunta_1 (P1) = Idade?
  • Pergunta_2 (P2) = Gênero?
  • Pergunta_8 (P8) = Qual seu nível de ensino?
  • Pergunta_10 (P10) = Qual sua situação atual de trabalho?
  • Pergunta_16 (P16) = Qual sua faixa salarial atual?
  • Pergunta_19 (P19) = Você se considera um profissional que atua na área de Data Science?
  • Pergunta_21 (P21) = Quais das linguagens de programação listadas abaixo você utiliza no trabalho?

Para ter acesso ao dicionário de variáveis completo, basta acessar o conjunto de dados completo no link lá em cima.

# importar as bibliotecas necessárias
import pandas as pd
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
# melhorar a visualização
pd.set_option('max_columns',170)
%matplotlib inline
%config InlineBackend.figure_format = 'svg'
# importar o dataset para um DataFrame
df = pd.read_csv('https://www.dropbox.com/s/915cbi019cxfpuo/datahackers-survey-2019-anonymous-responses.csv?dl=1')
# extrair o nome da variável da tupla
df.columns = [eval(col)[1] for col in df.columns]

Acima, apenas importei as bibliotecas necessárias e importei o dataset para um DataFrame. Como os colunas são tupla, também extrai o elemento que continha apenas o nome da feature.

Vamos começar a responder algumas perguntas.

Onde vivem os Cientistas de Dados?

Como o objetivo deste artigo é analisar a situação de cientistas de dados, filtrei o DataFrame para os casos onde a resposta para a pergunta “Você se considera um profissional que atua na área de Data Science?” foi sim.

Na sequência, plotei os valores por estados que as pessoas moram atualmente.

# countplot de estado onde mora
plt.figure(figsize=(15,10))
ax = sns.countplot(x="living_state", data=df[df['is_data_science_professional'] == 1], order=df['living_state'].value_counts().index)
plt.title('Cientistas de Dados por Estado', size=14)
plt.xlabel('Estados', size=12)
plt.show()
Análise completa do cenário de Data Science no Brasil em 2020

De acordo com as respostas de profissionais de Data Science, pode-se notar que os estados de São Paulo, Minas e Rio de Janeiro juntos somam 62% dos profissionais do Brasil.

(Des)equilíbrio de gêneros em Data Science no Brasil

Todos sabemos do desequilíbrio que há entre os gêneros femininos e masculinos em Data Science no mundo.

Apesar das diversas iniciativas e conscientização da sociedade nos últimos anos, conseguimos ver que essa balança ainda está longe do ideal.

# plotar gráfico de gêneros
plt.figure(figsize=(8,8))
ax = sns.countplot(x="gender", data=df[df['is_data_science_professional'] == 1], order=df['gender'].value_counts().index)
plt.title('Cientistas de Dados por Gênero', size=14)
plt.xlabel('Gênero', size=12)
plt.show()

Dos participantes do survey que se consideram profissionais de Data Science, apenas 17% se declararam mulheres.

O contraste com os 83% de homens mostra que o desbalanceamento de classes é nítido.

Qual a formação dos cientistas de dados no Brasil?

O retrato mostrado pela pesquisa Data Hacker mostra um cenário brasileiro composto de profissionais que têm em sua maioria o diploma de graduação ou bacharelado.

# ver formação dos profissionais de data science
plt.figure(figsize=(18,10))
ax = sns.countplot(x="degreee_level", data=df[df['is_data_science_professional'] == 1], order=df['degreee_level'].value_counts().index)
plt.title('Cientistas de Dados por Nível Educacional', size=14)
plt.xlabel('Nível Educacional', size=12)

Um detalhe interessante é que, enquanto 32% dos entrevistados possuem graduação ou bacharelado, 21% deles ainda são estudantes de graduação.

Cientistas de Dados com Mestrado ou Doutorado+ representam apenas 13% do universo analisado.

Qual a idade média dos Cientistas de Dados no Brasil?

A idade média do profissional de Data Science é de aproximadamente 30 anos.

Você pode acompanhar o perfil dessa distribuição olhando o histograma abaixo.

# plotar histograma de idade
plt.figure(figsize=(12,6))
ax = sns.distplot(df.age)
plt.title('Cientistas de Dados por Idade', size=14)
plt.xlabel('Idade', size=12)
plt.show()

Outras informações estatísticas da idade puderam ser extraídas usando df.age.describe():

  • O profissional mais jovem tinha 18 anos de idade
  • O profissional mais experiente tinha 50 anos.

Qual o salário de um cientista de dados no Brasil?

Os salários são, talvez, o maior atrativo na narrativa a favor da Ciência de Dados como profissão. Vemos em todos os lugares notícias de salários altíssimos na empresa X, fintech Y, que são, realmente, excelentes.

Mas será essa a realidade dos Cientistas de Dados no Brasil?

Vamos dar uma olhada nos dados do nosso dataset, e entender como está essa distribuição de acordo com a nossa realidade.

ordem_salarios = ["Menos de R$ 1.000/mês",
         "de R$ 1.001/mês a R$ 2.000/mês",
         "de R$ 2.001/mês a R$ 3000/mês",
         "de R$ 3.001/mês a R$ 4.000/mês",
         "de R$ 4.001/mês a R$ 6.000/mês",
         "de R$ 6.001/mês a R$ 8.000/mês",
         "de R$ 8.001/mês a R$ 12.000/mês",
         "de R$ 12.001/mês a R$ 16.000/mês",
         "de R$ 16.001/mês a R$ 20.000/mês",
         "de R$ 20.001/mês a R$ 25.000/mês"]
labels = ["Menos de R\$ 1.000",
         'de R\$ 1.001 a R\$ 2.000',
         "de R\$ 2.001 a R$ 3.000",
         "de R\$ 3.001 a R\$ 4.000",
         "de R\$ 4.001 a R\$ 6.000",
         "de R\$ 6.001 a R\$ 8.000",
         "de R\$ 8.001 a R\$ 12.000",
         "de R\$ 12.001 a R\$ 16.000",
         "de R\$ 16.001 a R\$ 20.000",
         "de R\$ 20.001 a R\$ 25.000"]
# plotar o gráfico de salários
ax = sns.countplot(df[df['is_data_science_professional'] == 1].salary_range, order=ordem_salarios)
ax.set_xticklabels(labels=labels, rotation=45, horizontalalignment='right');
Salários de cientistas de dados (Data Science) no Brasil

Temos sim, salários altos, com alguns respondentes declarando salários acima dos 25 mil reais mensais. Entretanto, vemos que a maioria dos Cientistas de Dados do Brasil ganham entre 3 e 12 mil reais.

Sendo mais específico, a maior parte dos profissionais pertence à categoria “de R$ 4.001 a R$ 6.000”.

Pode chamar atenção o fato de termos Cientistas de Dados ganhando menos de R$ 3.000, entretanto, precisamos lembrar que essa pesquisa envolve desde estagiários aos cargos mais altos da área, o que provavelmente explica esse intervalo.

Qual a linguagem de programação mais usada em Data Science?

Pra quem acompanha o Sigmoidal, isso não é novidade. Python é o campeão absoluto nesse quesito.

Ainda na frente do R, temos SQL, que faz sentido, visto que profissionais utilizando das mais diversas tecnologias precisarão acessar seus dados de alguma maneira, o que muitas vezes é feito por meio de queries em SQL.

# plotar linguagens mais usadas
plt.figure(figsize=(10,5))
ax = sns.countplot(x="most_used_proggraming_languages",
                   data=df.replace("Não utilizo nenhuma das linguagens listadas", "N.D.A."))
plt.title('Cientistas de Dados por Linguagem de Programação Mais Utilizada', size=14)
plt.xticks(rotation= 45,horizontalalignment='right')
plt.xlabel('Linguagem de Programação Mais Utilizada', size=12);
Linguagem mais usada em Data Science.

Mesmo tendo um número de adeptos consideravelmente maior que as linguagens restantes, a diferença entre R e Python é realmente significativa.

Ou seja, mais um motivo para você escolher o Python como sua linguagem de programação.

Como Aprender Data Science

Se você se interessou pela área e deseja saber mais sobre carreira, salários e como começar uma carreira do zero, convido você a participar da Semana Data Science na Prática.

Serão 4 aulas 100% grátis, onde vou explicar a minha metodologia para você aprender Data Science. Além disso, vou mostrar na prática como fazer um projeto completo.

Espero você na nossa Semana Data Science na Prática. Clique no botão abaixo e faça sua inscrição agora.

RESERVAR MEU LUGAR

Depois da inscrição, aproveita para acompanhar todas as novidades e atualizações do evento diretamente pelo meu Instagram. Um forte abraço!

Tags: carreiradata scienceprofissãopythonsalário
Previous Post

Guia Básico de Pré-Processamento de Dados

Next Post

Deep Learning

Carlos Melo

Carlos Melo

Piloto da Força Aérea Brasileira por 16 anos, Mestre em Ciências e Tecnologias Aeroespaciais pelo ITA e criador do Sigmoidal.

Next Post
Deep Learning

Deep Learning

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Fique Conectado

  • 20.5k Followers
  • Trending
  • Comments
  • Latest
Como Tratar Dados Ausentes com Pandas

Como Tratar Dados Ausentes com Pandas

agosto 13, 2019
NFT e artes criadas por Inteligência Artificial

NFT e artes criadas por Inteligência Artificial

junho 17, 2022
Crie um sistema de vigilância com drones e Deep Learning

Crie um sistema de vigilância com drones e Deep Learning

junho 11, 2022
Redes Neurais Multicamadas com Python e Keras

Redes Neurais Multicamadas com Python e Keras

junho 6, 2019
Setembro Amarelo: Análise do Suicídio no Brasil, com Data Science

Setembro Amarelo: Análise do Suicídio no Brasil, com Data Science

10
Machine Learning para a Detecção de Câncer de Mama

Machine Learning para a Detecção de Câncer de Mama

4
NLP para analisar Rony Meisler, CEO da Reserva

NLP para analisar Rony Meisler, CEO da Reserva

3
Redes Neurais Convolucionais com Python

Redes Neurais Convolucionais com Python

2
NFT e artes criadas por Inteligência Artificial

NFT e artes criadas por Inteligência Artificial

junho 17, 2022
Crie um sistema de vigilância com drones e Deep Learning

Crie um sistema de vigilância com drones e Deep Learning

junho 11, 2022
Python para análise de ações e investimentos

Python para análise de ações e investimentos

junho 7, 2022
Revisão do livro Deep Learning

Revisão do livro Deep Learning

junho 1, 2022

Recent News

NFT e artes criadas por Inteligência Artificial

NFT e artes criadas por Inteligência Artificial

junho 17, 2022
Crie um sistema de vigilância com drones e Deep Learning

Crie um sistema de vigilância com drones e Deep Learning

junho 11, 2022
Python para análise de ações e investimentos

Python para análise de ações e investimentos

junho 7, 2022
Revisão do livro Deep Learning

Revisão do livro Deep Learning

Sigmoidal

O melhor conteúdo técnico de Data Science, com projetos práticos e exemplos do mundo real.

Fique Conectado

Navegar por Categoria

  • Artigos
  • Blog
  • Carreira
  • Cursos
  • Data Science
  • Deep Learning
  • Destaques
  • Iniciantes
  • Inteligência Artificial
  • Livros
  • Machine Learning
  • NFT
  • Produções Originais
  • Projetos
  • Python
  • Teoria
  • Tutoriais
  • Visão Computacional
  • Youtube

Artigos Recentes

NFT e artes criadas por Inteligência Artificial

NFT e artes criadas por Inteligência Artificial

junho 17, 2022
Crie um sistema de vigilância com drones e Deep Learning

Crie um sistema de vigilância com drones e Deep Learning

junho 11, 2022
  • Sobre Mim
  • Cursos
  • Política de Privacidade
  • Contato

© 2022 Sigmoidal - Aprenda Data Science e Python na prática.

No Result
View All Result
  • Home
  • Sobre Mim
  • Cursos e Livros
  • Contato

© 2022 Sigmoidal - Aprenda Data Science e Python na prática.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist