fbpx
Sigmoidal
  • Home
  • CursosNOVO
  • Sobre Mim
  • Contato
Sem Resultado
Ver Todos Resultados
  • Home
  • CursosNOVO
  • Sobre Mim
  • Contato
Sem Resultado
Ver Todos Resultados
Sigmoidal
Sem Resultado
Ver Todos Resultados
Home Artigos Visão Computacional

O que é Visão Computacional?

Conheça a área mais inovadora de todas e descubra as oportunidades e salários para um Engenheiro de Visão Computacional.

Carlos Melo por Carlos Melo
julho 13, 2023
em Visão Computacional
0
O que é Visão Computacional
8
COMPARTILHAMENTOS
258
VIEWS
Publicar no LinkedInCompartilhar no FacebookCompartilhar no Whatsapp

A visão computacional é uma das áreas mais fascinantes e inovadoras do mundo. É um campo que busca compreender como funciona a nossa percepção visual e mimetizar a capacidade humana de enxergar a realidade externa, capturada a partir dos mais diferentes tipos de sensores.

Se enxergar as cosias parece natural e automático para você, eu não posso dizer o mesmo de como as coisas funcionam para as máquinas. Afinal estamos falando de uma ciência não é apenas sobre máquinas “vendo” coisas; é sobre interpretar essas imagens, identificando objetos, compreendendo o contexto e tomando decisões baseadas nessa interpretação. Trata-se de extrair informações a partir de bytes na memória.

Visão Computacional é a arte de fazer máquinas enxergarem.

Através da visão computacional, nós podemos dar às máquinas a capacidade de “ver” e “entender” o mundo, abrindo uma infinidade de aplicações possíveis. Seja muito bem-vindo ao admirável mundo dos pixels!

Visão Computacional, a arte de fazer máquinas enxergarem

A visão é nosso sentido mais poderoso, com cerca de 60% do nosso cérebro envolvido na percepção visual. Essa ideia é central na visão computacional, que busca fazer as máquinas “enxergarem”. Essa disciplina enfrenta o desafio de permitir que as máquinas interpretem o mundo como nós fazemos, como identificar objetos complexos ou não convencionais.

Visão computacional é um processo complicado, pois a máquina precisa capturar, processar e interpretar os raios de luz do mundo externo para formar um conceito do objeto. Essa tarefa é complexa e ainda estamos longe de igualar a precisão e riqueza de detalhes que uma criança pequena pode apresentar ao descrever um objeto.

Para compreender a razão dessa dificuldade desse problema inverso, observe a figura abaixo. Enquanto nós, seres humanos, percebemos a realidade através de nossos sentidos externos e formulamos conceitos de objetos por meio do intelecto (este associado à alma, dentro de uma concepção metafísica), um computador vê apenas… números. Para aqueles que quiserem se aprofundar mais na teoria de formação de imagem, confiram este artigo teórico que escrevi recentemente.

Formação da Imagem em Visão Computacional

Diferença entre Processamento de Imagem e Visão Computacional

Quando iniciamos no universo da ciência de dados, especialmente no domínio das imagens, podemos encontrar dificuldade em diferenciar dois conceitos fundamentais.

O processamento de imagem envolve técnicas para melhorar ou destacar características de uma imagem, seja para torná-la melhor em termos de qualidade, ou para ressaltar aspectos específicos. Por exemplo, ao aplicar uma técnica de processamento de imagem a uma foto, você pode destacar as bordas de objetos ou remover o fundo. Essas técnicas são usadas para manipular a imagem e ressaltar características, mas não produzem informação adicional por si só.

Por outro lado, a visão computacional busca extrair informações significativas de imagens ou vídeos, transformando dados brutos em conhecimento útil. É um processo mais sofisticado e analítico que envolve o uso de modelos de previsão e análises exploratórias para obter insights a partir de imagens. Por exemplo, ao usar um rastreamento facial em um vídeo, você pode obter um modelo 3D da face que pode ser aplicado em diferentes contextos, desde aplicações de realidade aumentada até reconhecimento facial.

O que é Visão Computacional
Diferença entre Processamento de Imagem e Visão Computacional.

Para simplificar, pode-se dizer que enquanto o processamento de imagem envolve a manipulação direta da imagem, a visão computacional utiliza essa imagem processada para extrair informações e insights. Portanto, apesar de serem campos distintos, eles são complementares e ambos costumam ser utilizados em conjunto em muitos projetos de ciência de dados.

Quais são as aplicações

A complexidade de modelar o mundo visual supera em muito a de modelar fenômenos como a produção de sons falados. Apesar dos desafios, algoritmos de visão já são aplicados com sucesso em diversas situações do mundo real.

Eu mesmo já trouxe vários exemplos projetos aqui no blog como detector de fadiga, sistema de vigilância com drones, mapeamento 3D em tempo real, entre outros. Veja também uma lista mais extensa de aplicações possíveis:

  • Realidade Aumentada e Virtual: a visão computacional é a tecnologia fundamental que permite aos dispositivos reconhecer e interagir com o ambiente físico, essencial para criar experiências de realidade aumentada e virtual imersivas.
  • Inspeção de Máquinas: inspeção rápida de peças para garantia de qualidade utilizando visão estereoscópica com iluminação especializada para medir tolerâncias em asas de aeronaves ou peças de carroceria de automóveis, ou procurar defeitos em fundições de aço usando visão de raios-X.
  • Imagem de Super-resolução: essa técnica usa a visão computacional para melhorar a resolução espacial de imagens digitais, superando as limitações físicas do sistema de imagem e fornecendo imagens de maior qualidade e clareza.
  • Reconhecimento Óptico de Caracteres (OCR): a tecnologia OCR, habilitada pela visão computacional, permite aos computadores ler e reconhecer textos em imagens digitais ou documentos digitalizados, facilitando tarefas que exigiriam entrada de dados manual, como digitalizar registros antigos ou extrair texto de documentos manuscritos.
  • Varejo: reconhecimento de objetos para checkouts automatizados e lojas completamente automatizadas.
  • Reconhecimento de Objetos: a visão computacional é usada para reconhecer e classificar objetos em imagens e vídeos. Isso tem aplicações variadas, desde reconhecimento facial em software de segurança até análise de movimentos em vídeos de vigilância e esportes.
  • Imagem Médica: a visão computacional pode ser usada para analisar imagens médicas, como raios-X e ressonâncias magnéticas, para identificar e diagnosticar condições médicas.
  • Veículos Autônomos: capazes de dirigir de ponto a ponto entre cidades, bem como voo autônomo.
  • Controle de Qualidade: na manufatura, a visão computacional pode ser usada para inspecionar produtos em busca de defeitos, como arranhões ou amassados nas superfícies.
  • Robótica: a visão computacional é utilizada na robótica para permitir que as máquinas identifiquem e interajam com objetos no ambiente.
  • Agricultura: na agricultura, a visão computacional pode ser usada para monitorar o crescimento e a saúde das culturas, identificar pragas e otimizar o rendimento das colheitas.
  • Construção de modelos 3D (fotogrametria): construção totalmente automatizada de modelos 3D a partir de fotografias aéreas e de drones.

Em resumo, a visão computacional tem uma ampla gama de aplicações potenciais em diversas indústrias. À medida que a tecnologia continua a avançar, podemos esperar ver cada vez mais usos inovadores dessa tecnologia poderosa.

Quanto ganha um Engenheiro de Visão Computacional

O salário de um Engenheiro de Visão Computacional pode variar significativamente dependendo de diversos fatores como a localização, o setor da indústria, a experiência e a especialização do profissional. Entretanto, de acordo com estatísticas e relatórios de salários, a média salarial para essa posição nos Estados Unidos gira em torno de $120.000 a $150.000 por ano, com possibilidade de ir além dependendo da empresa e do nível de senioridade.

No Brasil, embora os salários tendam a ser menores quando comparados aos Estados Unidos, os profissionais de Visão Computacional ainda estão entre os mais bem remunerados na área de tecnologia, com salários variando entre R$108.000 e R$180.000 por ano.

Essa é uma carreira em rápido crescimento, com demanda crescente em setores como automotivo, varejo, saúde, logística e muitos outros que estão implementando cada vez mais soluções baseadas em visão computacional. Como tal, a perspectiva de carreira e o potencial de ganho para os engenheiros de visão computacional são altamente promissores.

Habilidades Necessárias para um Engenheiro de Visão Computacional

Ser um Engenheiro de Visão Computacional significa dominar várias disciplinas simultaneamente. Em termos de linguagem de programação, Python e C++ são as mais demandas atualmente. Para você ter uma ideia, a Tesla costumar treinar seus modelos e prototipar features em Python, embarcando o produto em C++ em uma etapa posterior.

No campo da teoria, as principais habilidades envolvem principalmente o conhecimento de matemática, especificamente cálculo e álgebra linear. Além disso, um Engenheiro de Visão Computacional deve estar muito bem familiarizado com bibliotecas como TensorFlow, PyTorch e OpenCV.

Como aprender Visão Computacional do zero?

Se você está buscando uma nova carreira, ou se simplesmente quer aprender mais sobre essa tecnologia fascinante, convido você a se inscrever na nossa Especialização em Visão Computacional.

Nesse programa, você terá a chance de aprender visão computacional do zero e se preparar para conquistar sua primeira vaga nesse campo em crescimento. Diferente de qualquer curso ou treinamento que você já viu, a Especialização oferece uma abordagem prática com aulas aprofundadas e uma metodologia baseada em projetos reais.

Além disso, você terá a oportunidade de desenvolver 15 projetos práticos e construir um portfólio poderoso. Com uma base teórica robusta e ensinamentos no melhor padrão ITA de qualidade, você estará preparado para lidar com os desafios do mundo real.

 

Especialização em Visão Computacional

 

E se você não sabe programar, não se preocupe! Ao se matricular na Especialização, você receberá imediatamente o acesso a uma trilha de Python, permitindo que você aprenda Python do absoluto zero.

Então, o que você está esperando? Clique aqui e se inscreva inscreva agora mesmo.

Tags: carreiracomputer visionengenheiro de visão computacionalopencvprofissãosaláriovisão computacional
Post Anterior

Construindo Roma em um dia: Reconstrução 3D com Visão Computacional

Próximo Post

Introdução ao MediaPipe e Pose Estimation

Carlos Melo

Carlos Melo

Engenheiro de Visão Computacional graduado em Ciências Aeronáuticas pela Academia da Força Aérea (AFA) e Mestre em Engenharia Aeroespacial pelo Instituto Tecnológico de Aeronáutica (ITA).

Relacionado Artigos

O que faz um Engenheiro de Visão Computacional
Visão Computacional

O que faz um Engenheiro de Visão Computacional

por Carlos Melo
agosto 1, 2023
Introdução ao MediaPipe e Pose Estimation
Visão Computacional

Introdução ao MediaPipe e Pose Estimation

por Carlos Melo
julho 15, 2023
Construindo Roma em um dia: Reconstrução 3D com Visão Computacional
Visão Computacional

Construindo Roma em um dia: Reconstrução 3D com Visão Computacional

por Carlos Melo
abril 15, 2023
Visão Computacional

ORB-SLAM 3: Tutorial Completo para Mapeamento 3D e Localização em Tempo Real

por Carlos Melo
abril 10, 2023
Visão Computacional

Geometria da Formação de Imagens: Matrizes, Transformações e Sistemas de Coordenadas

por Carlos Melo
março 29, 2023
Próximo Post
Introdução ao MediaPipe e Pose Estimation

Introdução ao MediaPipe e Pose Estimation

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Destaques Sigmoidal

Visão Computacional do zero até uma vaga no exterior

Visão Computacional do zero até uma vaga no exterior

abril 22, 2021
Aprenda Python e se destaque no mercado

Aprenda Python e se destaque no mercado

julho 17, 2022
Detector de Fadiga usando Python

Detector de Fadiga usando Python

outubro 6, 2020
Especialização em Visão Computacional Especialização em Visão Computacional Especialização em Visão Computacional

Seguir

  • Camera Tracking, Reconstrução 3D e a Arte da Visão 🎥👁️‍🗨️

O “camera tracking” é uma técnica que permite a análise e reprodução do movimento da câmera em filmagens 2D. 

Esta análise fornece dados vitais sobre a posição e orientação da câmera ao longo do tempo, sendo essencial para a integração de elementos 3D virtuais em visuais 2D. 

A minha jornada acadêmica levou-me ao coração da engenharia de visão computacional, onde explorei tópicos cruciais como lens distortion, camera calibration e image processing. Dediquei-me a técnicas avançadas, abrangendo desde a utilização de filtros Gaussianos, conversão de imagens para grayscale até algoritmos de keypoint detection. 

No decorrer de meus estudos, tive a chance de trabalhar com métodos clássicos, como “Harris Corner Detection”, e também com abordagens mais contemporâneas como ORB, além de descritores como SIFT, SURF e BRISK.

Mas apesar da minha formação predominantemente técnica, centrada no mundo dos modelos quantitativos e da modelagem matemática, identifiquei um diferencial valioso na trilha da visão computacional.

🎨 Esse diferencial foi a capacidade de não se limitar apenas ao lado técnico. Ao contrário, busquei uma fusão entre a precisão técnica e a sensibilidade artística.

Compreendi que a verdadeira inovação surge quando se une o rigor técnico à visão criativa. Nessa intersecção, a arte e a ciência dançam juntas, produzindo resultados que são ao mesmo tempo precisos e emocionalmente impactantes.

Como o escritor A. D. Sertillanges expressou tão eloquentemente, nossa vocação como seres humanos exige que primeiro estejamos profundamente enraizados em nossa humanidade, viajando com confiança e solidez:

💬 “Toda ciência, quando cultivada isoladamente, não é apenas incompleta, mas também repleta de riscos.”

Serve como um lembrete constante de que dentro de cada tarefa computacional e linha de código existe uma miríade de histórias, prontas para serem reveladas e compartilhadas. 

#machinelearning #visãocomputacional
  • 🤖Você já testou essa ferramenta? 

Prece mentira, mas você pode gravar um vídeo seu agora mesmo, e subir nesse site para ele dublar para inglês e várias outras línguas! 🇺🇸🇪🇸🇧🇷🇩🇪

E não apenas isso! Ele sincroniza inclusive os seus lábios para ficar o mais real possível. 

O que você achou? Que tal testar agora mesmo e me mandar?

#machinelearning #inteligenciaartificial
  • ‘Eu nasci assim, eu cresci assim, vou sempre usar arquivos CSV…’ 🎶

Será mesmo? Se a síndrome de Gabriela te prende aos antigos e gigantes arquivos CSV, é hora de repensar! 🤔

Calma, não me entenda mal. Eu uso arquivos CSV para muitas coisas, mesmo! Mas permita-me apresentar um formato que já é bem conhecido pelos engenheiros de dados, mas que, por algum motivo, ainda não é muito famoso entre os cientistas de dados.

O principal problema do CSV é sua estrutura. Eles são armazenados como uma lista de linhas (conhecido como orientado a linhas), o que causa duas grandes complicações: eles são lentos para consultar e, para complicar ainda mais, SQL e CSV simplesmente não se dão bem.

Agora, entre em cena o Parquet: um formato orientado a colunas. Diferentemente dos CSVs, ele organiza seus dados por colunas, o que facilita e agiliza a consulta.

Além disso, é um formato de código aberto, licenciado sob Apache, o que o torna uma opção atrativa não apenas pela sua eficiência, mas também pela flexibilidade e transparência. Engenheiros de dados já se beneficiam das vantagens do Parquet há algum tempo, então por que os cientistas de dados não dariam uma chance também?

Se você é um cientista de dados e ainda não experimentou o Parquet, talvez seja o momento de se aventurar. E aí, já conhecia essa alternativa? Deixe seus comentários! 🚀

#machinelearning #datascience  #visaocomputacional
  • Eu não aprendi a estudar do dia para a noite.

Foram anos de aprimoramento e busca contínua por um método que me permitisse aprender qualquer coisa sozinho.

Nessa sequência de stories eu conto um pouco da minha trajetória, passando pela AFA, ITA e aprendizado de línguas. 

Se você ainda não tem o hábito da leitura, mas gostaria de aprender qualquer coisa rapidamente, como autodidata, você não pode perder a live de hoje. 

🔴AULA AO VIVO (hoje, às 20 horas)

✅Como criar uma rotina de estudo
✅Como criar resumos e notas de revisão
✅Como manter o foco e a concentração
✅Técnicas de Ultra-Aprendizado

Clique no link dos stories e ative a notificação da aula!
  • 📚Ao contrário do que o senso comum pode te induzir a pensar, você não pode querer apenas estudar livros técnicos. 

Ler e memorizar demandam a construção de múltiplas habilidades em diferentes dimensões. Afinal, você precisa crescer não apenas na vida profissional, mas também na humana, espiritual e familiar. 

No entanto, a escolha de livros errados podem prejudicar perigosamente a formação do conhecimento intelectual.

Por esse motivo, aqui vai uma sugestão de livros para aqueles que querem começar uma vida de estudos. 

E se você quiser aprender mais sobre como melhorar sua memória, elaborar resumos da maneira correta e manter o foco na leitura, mande uma mensagem por direct com a palavra “ESTUDO”. 

Depois que você enviar a palavra “estudo”, eu vou te encaminhar o link da aula exclusiva que eu farei sobre o assunto. 

Agora me diz, quais desses livros você já leu? Ou está na fila para leitura?

#leitura #estudos #machinelearning #computervision
  • ORB-SLAM é um sistema SLAM (Localização e Mapeamento Simultâneos) de última geração que utiliza uma combinação de métodos baseados em características e métodos diretos para alcançar desempenho em tempo real em diversas plataformas. Foi concebido por pesquisadores da Universidade de Zaragoza, Espanha, e agora é amplamente adotado tanto na academia quanto na indústria.

O nome ORB-SLAM deriva do seu uso de características Oriented FAST e Rotated BRIEF (ORB) para detectar e combinar pontos-chave em imagens. Essas características, juntamente com outras técnicas como fechamento de loop e otimização de pose, garantem uma localização e mapeamento robustos e precisos.

Graças à sua combinação de métodos baseados em características e diretos, juntamente com suas capacidades em tempo real e compatibilidade versátil de plataforma, ORB-SLAM destaca-se como um recurso inestimável para profissionais em visão computacional e robótica.

Ansioso para aprender como implementar o ORB-SLAM 3, desde sua instalação até a execução do sistema usando seus dados? Acesse o blog do sigmoidal e veja o tutorial com o passo a passo que eu preparei.

https://sigmoidal.ai

#visãocomputacional #machinelearning #slam #opencv
  • Filhos não são um direito, mas um dom de Deus. E hoje fomos abençoados com o nascimento da Bettina. 

Já te amamos muito, minha Pycotinha!
  • Sorria, você está sendo filmado (e analisado pela Visão Computacional)! Estimação de velocidade, fluxo óptico de pedestres e veículos, identificação de objetos abandonados, análise de comportamentos, cruzamento de dados com a base da polícia... quais outras possibilidades você enxerga?
Instagram Youtube LinkedIn Twitter
Sigmoidal

O melhor conteúdo técnico de Data Science, com projetos práticos e exemplos do mundo real.

Seguir no Instagram

Categorias

  • Artigos
  • Blog
  • Carreira
  • Colunistas
  • Cursos
  • Data Science
  • Deep Learning
  • Destaques
  • Entrevistas
  • Inglês
  • Iniciantes
  • Inteligência Artificial
  • Livros
  • Machine Learning
  • Notícias
  • Outros
  • Projetos
  • Python
  • Teoria
  • Tutoriais
  • Visão Computacional
  • Youtube

Navegar por Tags

camera calibration cancer carreira cientista de dados cnn computer vision Cursos dados desbalanceados data science data science na prática decision tree deep learning gis gpt-3 healthcare image formation iniciantes jupyter kaggle keras machine learning matplotlib medicina mnist nft opencv pandas personal branding portfólio profissão python redes neurais redes neurais convolucionais regressão logística salário seaborn sklearn tensorflow titanic tutorial vagas visão computacional vídeo youtube árvore de decisão

© 2023 Sigmoidal - Aprenda Data Science e Python na prática.

Sem Resultado
Ver Todos Resultados
  • Home
  • Cursos de Visão Computacional, Data Science e Python
  • Artigos
  • YouTube
  • Sobre Mim
  • Contato

© 2023 Sigmoidal - Aprenda Data Science e Python na prática.

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

Aprenda Python do Zero

50% Off

Oferta exclusiva de aniversário do Sigmoidal. Inscreva-se no curso Python do Zero hoje mesmo.

QUERO APROVEITAR O DESCONTO