Essa inteligência artificial permite que carros autônomos “se lembrem” de trajetos anteriores para planejar rotas mais seguras.
Um dos maiores problemas dos sistemas de direção autônoma é que, mesmo enxergando a estrada perfeitamente bem, eles ainda tomam decisões incertas em curtos períodos no trânsito caótico das cidades. Os sistemas avançados têm dificuldade em lidar com situações complexas e variáveis no trânsito. Mas um novo estudo argumenta que esses carros não precisam de uma visão melhor, mas sim de uma memória melhor.
No artigo científico KEPT (Knowledge-Enhanced Prediction of Trajectories from Consecutive Driving Frames with Vision-Language Models) , pesquisadores da Universidade de Tongji e colaboradores desenvolveram um sistema que ajuda veículos autônomos a "lembrar" cenas de direção anteriores antes de escolher o que fazer em seguida.
Como funciona essa nova tecnologia de direção autônoma?
O método, chamado KEPT, utiliza vídeos da câmera frontal, compara-os com uma vasta biblioteca de vídeos reais de condução anteriores e, em seguida, prevê uma trajetória mais segura a curto prazo com base tanto na cena atual quanto em exemplos recuperados do passado. A ideia central é bastante intuitiva. Em vez de pedir a um modelo de IA que reaja a cada situação como se nunca tivesse visto nada parecido antes, o KEPT permite que ele se lembre de momentos semelhantes de condução anterior.
Esses exemplos são então inseridos em um modelo de visão-linguagem como parte de um processo de raciocínio estruturado. Isso é importante, pois os pesquisadores afirmam que grandes modelos de visão-linguagem podem, caso contrário, apresentar alucinações, ignorar restrições físicas ou sugerir movimentos que parecem plausíveis no papel, mas não são ideais para um carro de verdade. Assim, o KEPT funciona basicamente como um mecanismo de proteção para manter o modelo ancorado em situações de tráfego semelhantes no mundo real.
É melhor do que os sistemas autônomos convencionais?
Os pesquisadores testaram o KEPT no amplamente utilizado benchmark nuScenes e afirmaram que ele superou tanto os sistemas de planejamento de ponta a ponta convencionais quanto os planejadores mais recentes baseados em visão computacional em métricas de circuito aberto. O sistema conseguiu inclusive reduzir o erro de previsão e diminuir os indicadores de colisão potencial, mantendo a recuperação de informações rápida o suficiente para ser viável em situações reais de direção.
Isso pode fazer parecer uma escolha óbvia para carros autônomos de próxima geração, mas ainda não está pronto para as ruas. Mesmo assim, a ideia geral é convincente. Se os carros autônomos conseguirem combinar a percepção em tempo real com uma memória significativa de como situações semelhantes se desenrolaram no passado, eles poderão acabar tomando decisões que pareçam menos instintivas e mais humanas.

