A nova versão do FSD da Tesla foi lançada, e o grande problema que deixou Musk envergonhado em público foi finalmente resolvido!

Isso tudo são redes, querido. Nada além de redes.

Em agosto do ano passado, o CEO da Tesla, Elon Musk, demonstrou pessoalmente o FSD Beta v12, que ainda não havia sido lançado oficialmente na época, em seu Model S.

O que há de especial no FSD Beta v12 é que ele é o primeiro sistema de direção autônoma de ponta a ponta do mundo baseado inteiramente em redes neurais. Em outras palavras, ele é verdadeiramente “impulsionado por IA”.

A julgar pelos padrões das atuais transmissões de vídeo ao vivo, a transmissão ao vivo com qualidade de imagem que não era tão boa quanto a dos smartphones há dez anos, a tela girava e tremia com frequência, e a qualidade profissional do âncora era preocupante, obviamente não era uma transmissão ao vivo de sucesso. Mas o tema “IA leva Musk à casa de Zuckerberg” é realmente interessante, com quase 12 milhões de pessoas assistindo online.

Mais importante ainda, durante esta transmissão ao vivo de 45 minutos, o FSD Beta v12 assumiu apenas uma vez, em outras ocasiões, seu estilo de direção era basicamente o mesmo das pessoas comuns.

Assim que a transmissão ao vivo começou, Musk encontrou uma condição incomum na estrada – um desvio temporário devido à construção. Mas o FSD não hesitou e cruzou-o facilmente a uma velocidade não muito baixa. Musk também disse na época que o sistema “nunca tinha visto uma superfície de estrada assim”.

Durante a transmissão ao vivo, o FSD v12 pareceu funcionar bem, mas muitas pessoas ainda encontraram um problema – as condições das estradas em Palo Alto, no Vale do Silício, na Califórnia, eram muito amigáveis.

Em Palo Alto, não há pedestres atravessando a rua em todos os lugares, nem motocicletas e bicicletas emergindo repentinamente de pontos cegos. Mesmo os internautas americanos que estão acostumados a ver estradas largas disseram que é hora de aumentar a força do FSD v12. Este tipo de condições de estrada simplesmente não é suficiente.

Mas agora, como o FSD Beta v12 é oficialmente lançado para usuários norte-americanos, já podemos ter uma ideia de suas verdadeiras capacidades a partir dos vídeos de muitos blogueiros estrangeiros.

V12, dividindo duas eras de direção inteligente, antes e depois

O usuário do YouTube Whole Mars Catalog foi um dos primeiros blogueiros a receber a versão de teste e vem testando os recursos do Tesla FSD desde 2020.

A julgar pelo vídeo, o FSD Beta v12 tem excelente desempenho na cena “velha e difícil” de espera em uma noite chuvosa.

Viajando por uma estrada estreita em uma noite chuvosa, o vídeo não foi acelerado

Não há problema durante o dia. Vire para a estrada secundária e quando chegar ao seu destino, pare e estacione em vez de estacionar no meio da estrada como antes.

Comparado com o FSD Beta v11, a velocidade de desvio do v12 foi significativamente melhorada. Enfrentando o mesmo carro estacionado na estrada, a ação de desvio do v12 é completamente comparável à de um motorista humano, enquanto o v11 está "preso" no meio de a estrada, e o motorista tive que pisar no acelerador para ajudar o veículo a passar.

Modelo S atualizado para FSD Beta V12

Modelo Y ainda equipado com FSD Beta V11

Além disso, o Whole Mars Catalog acredita que as curvas à esquerda desprotegidas do FSD Beta v12 foram significativamente melhoradas em comparação com as versões anteriores, e a capacidade de reconhecer semáforos também é mais forte.

Na transmissão ao vivo há cinco meses, a única vez que Musk assumiu o controle do veículo foi por causa do reconhecimento incorreto dos semáforos. No meio da transmissão ao vivo, o Modelo S erroneamente viu o sinal verde para virar à esquerda como um sinal verde para seguir em frente em um cruzamento e então começou a dirigir, mas foi parado por Musk .

▲ O semáforo errado

Musk sorriu sem jeito e disse que assistiria a mais “vídeos de semáforos” para o FSD resolver o problema. É isso mesmo, diferentemente dos FSDs anteriores, o crescimento do FSD Beta V12 não depende de linhas de código, mas sim de vídeos.

Tesla observou nas notas de lançamento do FSD Beta V12: “O FSD Beta V12 atualiza a pilha de condução nas ruas da cidade em uma única rede neural ponta a ponta, treinada em milhões de videoclipes, substituindo mais de 300.000 linhas de código C++ explícito”.

A chamada solução ponta a ponta refere-se a todo o processo de "controle de percepção-decisão" dentro de uma estrutura de sistema unificado, e o treinamento é concluído por meio de métodos de aprendizado profundo em vez de decompô-lo da maneira tradicional. É composto por vários módulos, como percepção, posicionamento, planejamento de caminho e controle. O módulo superior gera os resultados e orienta a execução do módulo inferior.

Os resultados altamente abstratos da conexão em série entre cada módulo da solução modular podem estar errados. O próximo módulo de previsão não pode reparar o erro ou requer muito pós-processamento ou julgamento para restaurar o erro, e o efeito pode não ser muito bom. Ao mesmo tempo, cada módulo requer um conjunto de dados separado, o que consome muito dinheiro para requisitos de rotulagem, e a implantação separada requer maior poder de computação.

Chen Li, pesquisador da equipe Pujia OpenDriveLab do Shanghai AI Lab, disse anteriormente em uma entrevista ao China Business News que a solução modular ainda é dominada por regras especializadas nas partes de tomada de decisão e controle, e é ajustada manualmente por meio de sistemas especialistas, com capacidades de generalização fracas.

É como um aluno que ouve com atenção, mas não pensa de forma divergente. Ele sabe tudo o que o professor ensina. Mas quando encontra algo que o professor não ensinou, é difícil dizer. Pode-se dizer que são dois métodos diferentes: um é dar a resposta correta e apenas segui-la, o outro é dar ideias para a solução do problema e depois fazer inferências.

FSD, deve ser um “bom aluno”

A razão pela qual o FSD Beta v12 atraiu muita atenção e a razão pela qual Musk lançou uma transmissão ao vivo para promovê-lo é, em última análise, porque ele mudou os meios de realizar uma direção inteligente.

Enquanto houver um sinal vermelho à frente, todos irão parar atrás da linha branca.

Então o FSD aprendeu a regra de "pare no sinal vermelho, vá no sinal verde". Este é o resultado da autoaprendizagem do FSD, e não da resposta padrão dada a ele pelos humanos. Esta é a rede neural, ou para usar um método mais termo popular – IA.

Aprenda a direção autônoma aprendendo os comportamentos de direção de um grande número de motoristas reais. Este é um processo de transição de um novo motorista para um motorista experiente. Quanto mais você dirige, mais você verá o mundo, acumulará experiência e se tornará uma pessoa melhor. Ao contrário dos humanos, o FSD pode devorar enormes quantidades de conteúdo e aprender com ele. Esta eficiência é muito superior à da maioria dos trabalhadores migrantes que só conduzem quando se deslocam de e para o trabalho.

Mas as redes neurais não são perfeitas.

Pense nisso, quando você estava crescendo, você encontrou algumas pessoas más que poderiam "desviá-lo" – o FSD também verá alguns maus hábitos de direção "demonstrados" por motoristas humanos indisciplinados.

Durante a transmissão ao vivo de Musk, o engenheiro sentado no banco do passageiro mencionou que nos Estados Unidos apenas 0,5% dos motoristas pararão completamente antes de um sinal de pare para observar, e a grande maioria optará por passar devagar. No entanto, as autoridades reguladoras exigirão o sistema de direção inteligente para parar completamente na frente do sinal.Para esse fim, Tesla precisa especificamente "ensinar" o FSD, aumentar o peso da "demonstração" do funcionamento correto e deixá-lo "aprender" algo de bom.

No FSD Beta v12, o sistema pode identificar com precisão os sinais de parada em cada cruzamento, parar e observar, e responder com sensibilidade suficiente quando as condições de ultrapassagem forem atendidas. A versão anterior pode hesitar por um longo tempo devido a pedestres ou bicicletas na beira da estrada.

No entanto, o Catálogo Whole Mars também afirmou que o FSD atual ainda não é perfeito e “não está pronto para ser lançado para todos”. Por exemplo, em alguns cruzamentos bifurcados, o volante irá oscilar para a esquerda e para a direita, incapaz de se decidir; em alguns cruzamentos relativamente vazios, o veículo irá ocasionalmente parar por um longo tempo e ser demasiado cauteloso.

O veículo parou neste cruzamento por 15 segundos

Musk afirmou anteriormente que o FSD v12 tirará o chapéu da versão beta e não terá mais o sufixo “Beta”, mas a versão atualmente enviada aos usuários ainda tem o logotipo “Beta”. Tudo o que posso dizer é que o FSD ainda tem muito que aprender.

Outra questão que vale a pena considerar é o custo.

Musk mencionou que a Tesla investe até 2 mil milhões de dólares em FSD todos os anos, o que é sem dúvida um negócio que queima dinheiro. Para outras empresas automobilísticas que ainda lutam para obter lucros, se podem pagar esse dinheiro é um tema inevitável. O treinamento do modelo por si só é uma soma astronômica de dinheiro.

O treinamento em vídeo do Tesla FSD Beta V12 requer até 15.000 GPUs NVIDIA H100, o que coloca a Tesla entre os 12 primeiros na lista de quantidade de compras da NVIDIA no terceiro trimestre de 2023. Embora Tesla tenha lançado seu próprio supercomputador Dojo em 2021, que também foi produzido em massa com sucesso em 2023, Tesla ainda precisa da NVIDIA, e apenas uma pequena parte do treinamento usa Dojo.

A NVIDIA também tem marcas chinesas em sua “grande lista de clientes”. Para enfrentar os desafios da Tesla, a cadeia nacional da indústria de condução autônoma também tem implantado soluções ponta a ponta, incluindo testes de simulação no treinamento de modelos ponta a ponta.

Na mesma lista, o Baidu, que está profundamente envolvido na direção inteligente e na IA há muito tempo, ficou em 8º lugar e comprou um total de 30.000 Nvidia H100. Atrás do Baidu está o Alibaba, que comprou um total de 25.000 GPUs. Ressalte-se que em agosto de 2022, a Xpeng anunciou que construiria em conjunto com o Alibaba um centro de computação inteligente com capacidade computacional de 600PFLOPs (petaflops).

A NIO está mais preocupada com o poder de computação do veículo. O sistema de direção inteligente da NIO usa atualmente 34 NVIDIA Orin Ou seja, o seu poder computacional estará acima dos 1000TOPS.

Com o desenvolvimento contínuo de modelos em grande escala, os requisitos de poder de computação para direção inteligente aumentarão ainda mais. O chamado "poder de computação é inútil" só pode ser conversa fiada.

Qualquer pessoa com rodas está interessada e bem-vinda para se comunicar. E-mail: [email protected]

# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo