A visão mecânica é a base dos carros autônomos e é fundamental para um futuro totalmente autônomo.
Principais conclusões
- Os carros autônomos dependem da tecnologia de visão mecânica para ver e compreender o que os rodeia, permitindo-lhes detectar objetos, identificar sinais e navegar na estrada.
- A visão mecânica em carros autônomos consiste em um sistema de câmera, computação de ponta e algoritmos de IA, que trabalham juntos para coletar informações visuais, processá-las em tempo real e identificar padrões e objetos.
- A visão mecânica é crucial para alcançar total autonomia em carros autônomos, pois permite classificação de objetos, detecção de faixas e sinais, identificação de sinais e reconhecimento de tráfego. O futuro dos veículos autônomos reside nos avanços em IA, computação de ponta e tecnologia de câmeras.
Carros autônomos sempre chamaram a atenção. Embora ainda não tenhamos carros totalmente autônomos, temos carros com recursos avançados sistemas de assistência ao motorista (ADAS) capazes de direção automática, mudança de faixa, estacionamento e controle de cruzeiro com reconhecimento de tráfego.
Um carro autônomo usa vários sensores para seu ADAS, sendo a visão mecânica a principal forma de detectar, identificar e calcular a distância de objetos e do ambiente geral. Sem visão mecânica, carros autônomos com controle de cruzeiro e piloto automático são muito improváveis.
O que é visão de máquina?
A visão mecânica é uma tecnologia que permite às máquinas ver e reconhecer objetos no ambiente circundante. É um subconjunto da visão computacional que se concentra nas aplicações industriais de detecção de objetos orientada à visão em máquinas autônomas, como robôs e veículos.
A visão mecânica hoje usa algoritmos de aprendizado profundo de IA, como redes neurais convolucionais (CNNs) para criar modelos robustos e bem generalizados que possam identificar com precisão objetos em vários condições. Torna possível implementar a visão mecânica em diversas tarefas que exigem maior confiabilidade na fabricação, agricultura, robótica e automotiva.
Como funciona a visão mecânica em carros autônomos?
A visão mecânica em carros autônomos normalmente pode ser dividida em três partes: o sistema de câmera, o processamento (computação de ponta) e a IA. Essa pilha de tecnologia permite que um veículo autônomo veja, pense e identifique sinais e obstáculos enquanto dirige. Vamos discutir cada parte em profundidade para entender como essas tecnologias se unem para formar a visão mecânica de um carro autônomo.
Sistema de câmera
A visão mecânica depende de sistemas de câmeras para coletar informações visuais sobre o ambiente. Os carros autônomos empregam várias câmeras instaladas ao redor do carro para coletar o máximo de informações visuais possível.
Dois sensores principais são usados em câmeras de visão de máquina: semicondutores de óxido metálico complementar (CMOS) e dispositivos de carga acoplada (CCD). Para carros autônomos, o CMOS é frequentemente preferido por sua rápida velocidade de leitura e poderoso desempenho no navio. eletrônicos e recursos de processamento paralelo, tornando-o o sensor mais rápido, embora sujeito a ruídos ou artefatos. Soluções, como diferentes modos de iluminação, visão noturna digital e filtros, podem ajudar o sensor CMOS durante condições de iluminação abaixo das ideais.
Para carros autônomos, as câmeras são instaladas a certas distâncias umas das outras para produzir visão estereoscópica. A visão estereoscópica é a capacidade de combinar duas ou mais entradas visuais, criando uma sensação de profundidade ou tridimensionalidade nos objetos e no ambiente. Isso, por sua vez, permite que os carros triangulem e calculem a distância aproximada entre o objeto e o carro.
Como os humanos têm dois olhos, também nos beneficiamos da visão estereoscópica. Você pode testar você mesmo; feche um olho e selecione um pequeno objeto em sua mesa. Coloque a mão na lateral do objeto e certifique-se de que a ponta do objeto esteja a pelo menos cinco centímetros de distância. Tente pausar por alguns segundos e veja o quão confiante você está com sua aproximação. Agora, tente abrir os dois olhos e veja como sua sensação de profundidade fica muito melhor.
Computador de borda
Enquanto o sistema de câmeras do carro autônomo coleta dados, um computador de bordo (processador de borda) processará todas as entradas em tempo real para atualizar o sistema sobre o status do ambiente imediatamente. Embora as tarefas típicas de visão mecânica possam economizar dinheiro usando a computação em nuvem, há simplesmente muitos risco de carros autônomos serem conectados à nuvem, mesmo que seja para terceirizar o processo em seus requisitos de visão artificial.
Usar um computador de ponta para processar dados de entrada elimina problemas de latência e garante que os dados sejam recebidos, processados e comunicados em tempo real. Os computadores edge para carros autônomos usam computadores especializados que integram processadores gráficos de IA, como Tensor Core e CUDA Cores da NVIDIA.
Algoritmos de IA
Algoritmos sempre foram uma parte crucial da visão mecânica. O algoritmo é o que permite a um computador identificar todos os padrões, formas e cores fornecidos pelo sistema de câmera. O uso de IA em vez de algoritmos de visão de máquina mais tradicionais aumenta muito a capacidade de um carro autônomo de identificar objetos, sinais de trânsito, marcações rodoviárias e semáforos de maneira confiável. Muitos algoritmos de IA estão sendo usados para treinar carros autônomos. Os mais populares incluem:
- YOLO (você só olha uma vez): Um algoritmo de detecção de objetos em tempo real que identifica e rastreia objetos no campo de visão do carro.
- SIFT (transformação de recurso Scale-Icar'sant): Usado para extração de recursos, ajuda o carro a reconhecer pontos de referência e objetos distintos em seu entorno.
- Histograma de Gradientes Orientados (HOG): Usado para reconhecimento de objetos, concentra-se na extração de padrões e gradientes locais de imagens.
- TextonBoost: Um algoritmo que auxilia no reconhecimento de objetos por meio da análise de texturas do ambiente.
- Ada Boost: Empregado para classificação de dados, o AdaBoost combina vários classificadores fracos para tomar decisões sólidas sobre os objetos e obstáculos no caminho do veículo.
A importância da visão mecânica em carros autônomos
A visão mecânica é a principal forma de um carro autônomo sentir e compreender o que está ao seu redor. Sem visão mecânica, é muito provável que os carros autônomos sejam empurrados de volta para o nível 1 no mundo. escala de autonomia do veículo e pode nunca alcançar a autonomia total.
Com a visão mecânica, os carros autônomos agora são capazes de classificar objetos, detectar faixas e sinais, identificar sinais e reconhecer tráfego.
Embora muitos veículos autônomos agora utilizem vários sensores, como LIDAR, RADAR e SONAR, todos dependem fortemente de visão mecânica para ver o ambiente, identificar objetos e compreender o significado de sinais e semáforos no estrada. Todos esses sensores extras existem apenas para aumentar a visão mecânica e aumentar a segurança de pessoas, animais e propriedades.
Dito isto, a visão mecânica pode funcionar de forma independente, sem a ajuda de outros sensores, para fornecer capacidades de piloto automático. Na verdade, os mais novos carros autônomos da Tesla abandonaram o RADAR e agora dependem exclusivamente da visão mecânica para seu sistema de piloto automático.
Embora isso não signifique nada em termos de desacreditar a utilidade de outras tecnologias de sensores, mostra a importância e o poder da visão mecânica em carros autônomos.
O futuro da visão mecânica em veículos autônomos
A visão mecânica é a base dos carros autônomos. Através da visão mecânica, os carros podem ver e perceber o ambiente exatamente como os humanos. Embora os desafios persistam, os benefícios da visão mecânica em termos de segurança e navegação não podem ser subestimados. Quanto ao futuro dos veículos autônomos, quaisquer avanços adicionais em IA, computação de ponta e/ou câmeras a tecnologia certamente tornará os carros autônomos mais eficientes, o que provavelmente os levará a um nível mais alto de automação.