Xiaoyi em Wenjie M7 abre uma nova entrada para a experiência de vida inteligente de cenário completo da Huawei
Recentemente, há uma notícia de última hora no campo da IA. Um engenheiro de software do Google acredita que o modelo de IA do Google LaMDA tem "autoconsciência" e publicou um relatório de diálogo de 21 páginas para provar isso, mas ainda tenho um pouco pouco de "despertar AI" Duvidoso.
A IA realmente se desenvolveu até este ponto? Afinal, até mesmo o assistente de voz, a tecnologia de IA mais usada, é frequentemente reclamado pelos usuários como "retardo mental artificial". ele come cinzas.
No lançamento de verão da Huawei de ontem, a Huawei lançou o segundo modelo da marca AITO construído em conjunto com a Celis, o M7. Também experimentei este modelo pela primeira vez. No cockpit Hongmeng no M7, não esperava me levar o maior surpresa não é o interior, assentos e áudio, mas o assistente de voz Xiaoyi.
Como usuário sênior da Huawei, estou bastante familiarizado com as habilidades de Xiaoyi, mas desta vez ela ainda me trouxe uma nova experiência e também comecei a entender o sentimento do engenheiro de software do Google, porque essa IA é muito parecida com as pessoas.
Despertar da IA? Xiaoyi em AITO M7 é muito "humano"
A taxa de adoção da função de interação de voz inteligente em carros de passageiros chineses atingiu 86% em 2021, mas, na verdade, muitos motoristas raramente usam essa função, porque aquelas instruções que até as crianças podem entender facilmente ”A IA é difícil de entender.
Em 2016, um vídeo de um motorista de Shandong "avisando" o assistente de voz no carro ainda é um vídeo popular na Estação B. O irmão mais velho do motorista queria que o assistente de voz fizesse uma ligação, mas não importa quantas vezes ele dissesse isso, a voz com uma voz doce O assistente não conseguia entender.
Experiências semelhantes podem ser familiares para muitos motoristas. Pela minha própria experiência, pelo menos essas situações me fazem perder a paciência com o assistente de voz do carro:
- Depois de entrar no carro e dar partida, se você quiser usar o assistente de voz para definir várias funções, como ar-condicionado, ventilação do banco, navegação e áudio, precisará acordar repetidamente e esperar que ele acorde após a transmissão de cada vez. A eficiência pode ser mais lenta do que manual.
- Ao viajar com a família e amigos, o assistente de voz pode ser perturbado pelo som do copiloto e do banco traseiro. mas é embaraçoso pensar nisso.Os ursos também são um perigo para a segurança.
- Após ativar o aplicativo na tela do carro por meio do assistente de voz, algumas operações ainda precisam ser passadas ou tocadas manualmente.
Na experiência do Wenjie M7, também me concentrei em testar o desempenho do Huawei Xiaoyi nos cenários acima.
Percepção inteligente da zona multi-som: artefato de viagem em família
Em viagens em família, você pode ter se deparado com uma situação tão embaraçosa. O carro está cheio de jovens e velhos, o motorista quer mudar a música, o copiloto quer ajustar o banco, o passageiro de trás quer abrir a janela e há crianças ursos.Gritando, você tem que se distrair enquanto dirige para atender às diferentes necessidades de sua família.
Desta vez, a percepção inteligente da zona multi-som no M7 pode finalmente resolver este problema. carro pode emitir comandos de forma independente para Xiaoyi.
Simulei a cena de uma viagem em família. Diferentes assentos no carro estavam cheios de pessoas. Ao mesmo tempo, dei instruções diferentes a Xiaoyi. Xiaoyi pode fornecer serviços a tempo de acordo com nossas instruções e também pode desligar a área de som onde o filho urso está localizado, evite que ele cause problemas.
Para alcançar essa experiência, é necessária uma excelente colaboração de software e hardware. Primeiro, através do conjunto de microfones distribuído ao redor do carro, Xiaoyi pode identificar as fontes de som em diferentes posições e, em seguida, filtrar o ruído de fontes de som não-alvo para identificar com precisão a fonte sonora. .
Atualmente, existem muitos carros que suportam áreas multi-som, mas alguns deles são devido à falta de boa adaptação de algoritmos de IA e software e hardware, a taxa de reconhecimento correta não é alta ou precisa ser muito alta ou perto do microfone para ter sucesso, e a experiência é desigual.
Quando meus colegas e eu experimentamos a percepção multitonal de Xiaoyi, podemos basicamente dar instruções suavemente com nossa voz habitual de fala e postura sentada, e a experiência é bastante suave.
Diálogo contínuo: Este é o estado de falar com as pessoas
Como mencionado anteriormente, a percepção da zona multi-som precisa eliminar fontes de som interferentes para que Xiaoyi possa reconhecer os comandos que precisam ser ouvidos.Quando ela faz isso bem, ela pode naturalmente alcançar outra função prática – diálogo contínuo.
Para simplificar, você pode emitir vários comandos diretamente para Xiaoyi ao mesmo tempo, sem ter que acordá-la todas as vezes, você também pode interrompê-la no meio, e Xiaoyi pode bloquear automaticamente comandos inválidos respondendo uma mensagem de voz ou conversando um poucas palavras. , Xiaoyi pode suportar 60 segundos de diálogo contínuo.
Esta é uma função muito útil para os motoristas. Por exemplo, depois de entrar no carro, defino uma finalidade de navegação e adiciono um waypoint, depois ligo o ar condicionado, a ventilação do assento e finalmente abro o podcast que não ouvir da última vez, tudo de uma vez.
Além disso, desta vez Xiaoyi também adicionou um comando rápido do motorista principal sem acordar, para que você não precise ligar para Xiaoyi toda vez que operar, o que é mais eficiente e não será embaraçoso quando houver muitas pessoas no carro .
Antigamente, eu raramente usava voz para controlar essas funções no carro. Não é que o carro não suporte, mas tenho que chamar xx colegas N vezes, e tenho que esperar que cada comando seja executado, o que é muito menos rápido do que a minha operação manual.
Visualmente falando: use o som como um mouse e libere suas mãos
Embora existam cada vez mais funções que podem ser controladas pelo assistente de voz do veículo, depois de abrir algumas funções do aplicativo por voz, operações como puxar páginas para baixo, alternar guias, etc. estão escondidos mais profundamente, entre na pesquisa do menu multi-nível, existem riscos de segurança na condução.
No Wenjie M7, esse tipo de experiência interativa desumana começou a ser valorizada e aprimorada pelos fabricantes. Xiaoyi suporta "visual e falado", e as funções vistas na tela podem ser controladas diretamente por voz, assim como usar a voz como um mouse para "deslizar e clicar" diretamente, e você não precisa mais fazer isso.
Esta função também está adaptada a um grande número de aplicativos de terceiros.Eu testei os aplicativos mais usados, como Himalaya e QQ Music, que são muito suaves.
Além disso, os usuários não precisam memorizar instruções muito precisas. Xiaoyi pode entender expressões como "o primeiro". Eles não precisam passar mais tempo olhando para a tela e são menos propensos a se distrair durante dirigindo. , isso é bom.
Sugestão de Xiaoyi: realmente me entenda
Falando da tela de controle central, embora seja a primeira vez que experimente o Wenjie M7, não estou familiarizado com a operação. Isso pode ser porque me acostumei a usar o sistema Hongmeng no meu celular. -car experiência também mudou um pouco.
"Sugestão Xiaoyi" no celular me lembrará de informações de entrega expressa no caminho para sair do trabalho, recomendar restaurantes e outras informações de acordo com minha localização. Em Wenjie M7, "Sugestões Xiaoyi" também podem julgar o status do usuário com base em hábitos e cenas de direção e dar sugestões correspondentes.
Por exemplo, quando o nível de combustível/eletricidade estiver muito baixo, a Sugestão Xiaoyi solicitará proativamente o posto de gasolina/posto de carregamento próximo e perguntará se você precisa navegar. Mesmo se você sair do carro e esquecer de levar o telefone, Xiaoyi tomará a iniciativa de lembrá-lo.
Pode-se ver que, seja demanda passiva ou demanda ativa, Xiaoyi conseguiu fazer um julgamento mais preciso. E o fluxo contínuo de Xiaoyi do celular para o carro me faz sentir que a experiência de interação carro-máquina do M7 é muito semelhante à de um smartphone.
Voz personalizada: um ovo de páscoa humano
Nessa experiência, também encontrei um easter egg da Xiaoyi que me surpreendeu, que é a voz customizada, o que significa que posso substituir a voz da Xiaoyi pela voz da minha família, amantes ou amigos, só preciso gravar uma voz, Xiaoyi vai logo aprender.
De acordo com o padrão Microsoft MOS, um método de avaliação de qualidade de voz reconhecido internacionalmente, quanto mais próxima a voz da IA estiver da voz humana, mais confortável ela será. Além disso, Xiaoyi também apóia o reconhecimento do cantonês, dialeto de Sichuan e outros dialetos, e eu finalmente não tenho que brigar com ela com um bocado de "melão de inverno cozido".
No filme de ficção científica "Her", o protagonista masculino se apaixonou por uma assistente de voz de IA, em grande parte por causa da voz de IA. Claro, quantos meninos podem resistir à voz de Scarlett Johansson?
Vozes familiares podem fazer Xiaoyi parecer uma pessoa emocional, o processo de interação é mais real e natural, e estou mais disposto a me comunicar com ela. Se você transformar a voz de Xiaoyi na pessoa que você ama, mesmo que ela não esteja mais ao seu lado, não seria uma coisa romântica?
Além disso, Xiaoyi também suporta palavras de ativação personalizadas, e a sensação geral é mais como se comunicar com amigos ao seu redor, o que parece refletir a futura interação de voz da Huawei, que se desenvolverá em direção ao antropomorfismo.
Embora a IA atual no mercado não tenha realmente alcançado o nível de "despertar da consciência", após essa experiência, a impressão de Xiaoyi em mim é de fato cada vez mais como um ser humano, pelo menos posso tentar me comunicar com ela como uma pessoa normal .
Isso também me lembra Jarvis, o mordomo da IA em Homem de Ferro. Depois de mais de 10 anos, podemos finalmente esperar ter um verdadeiro "Jarvis"?
A que distância Jarvis está de nós?
Na semana passada, a União Europeia aprovou uma proposta para proibir a venda de veículos a combustível a partir de 2035, e a indústria automobilística está inaugurando sua maior mudança desde a era industrial. As "novas quatro modernizações" (eletrificação, rede, inteligência e compartilhamento) tornaram-se uma tendência na indústria.No futuro, a indústria automobilística passará de uma batalha de hardware para uma batalha de dados e sistemas.
O julgamento do CEO do Grupo Volkswagen, Herbert Diess, sobre o futuro da indústria automotiva está se tornando uma realidade:
No futuro, o carro se tornará um dos dispositivos de Internet mais complexos, mas mais valiosos.
No futuro, os passageiros usarão o carro com mais frequência e o tempo de uso poderá dobrar.
No futuro, o carro não será mais uma simples caixa, mas um espaço mais confortável e aconchegante.
A inteligenteização dos automóveis é uma tendência irreversível, entre as quais a interação por voz tornou-se a função central das fábricas de automóveis para construir uma experiência inteligente. Com o desenvolvimento da tecnologia de condução autônoma, o assistente de voz se tornará, sem dúvida, o transportador mais importante da interação homem-veículo no futuro, e pode até ser considerado um dos novos "três itens principais" da nova era do carro.
Isso requer um assistente de voz inteligente que possa se comunicar com você como um humano, que também é a impressão que Xiaoyi me deu. Do ponto de vista da experiência estática, acho que a experiência inteligente de Xiaoyi em Wenjie M7 já pertence ao primeiro escalão de assistentes de voz em veículos.
Recentemente, Xiaoyi também obteve a primeira certificação oficial de nível A de assistente de voz automotivo da CATARC. Ele teve um bom desempenho em 18 testes, incluindo telefone, navegação, controle de carro, visibilidade para falar, resposta de despertar, associação semântica e multi- interação redonda. Excelente, confirma ainda mais o meu julgamento.
Em outras palavras, Xiaoyi pode ser um dos atuais assistentes de voz do carro que podem se comunicar com os usuários da maneira mais humana de comunicação.
A IA está avançando a um ritmo muito mais rápido do que os humanos, e não deve ser surpreendente que assistentes de voz como Xiaoyi estejam ficando melhores em entendê-lo. Mas isso ainda está longe de "Jarvis", porque a inteligência de "Jarvis" não se reflete apenas em sua inteligência, mas pode ser profundamente integrada e adaptada em quase qualquer cena, tornando-se um mordomo universal cobrindo todas as cenas.
No território da Huawei, esta pode ser a forma definitiva de Xiaoyi.
A nova entrada da Huawei para uma experiência de vida inteligente em todos os cenários
Na onda da fabricação de carros novos , a experiência de interação humano-computador do cockpit inteligente representado por Wenjie M7 está se tornando cada vez mais abundante. E essas funções não estão apenas atendendo a condução em si, mas estão começando a se expandir para cenários de vida digital conectados ao carro, como controlar dispositivos domésticos inteligentes com a máquina do carro e até mesmo dar sugestões com base na cena de ir ao trabalho ou sair do trabalho.
Esse tipo de desenvolvimento parece ser o caso quando os smartphones surgiram, e os cenários de serviço além das chamadas surgiram um após o outro, e os telefones celulares gradualmente se tornaram um importante portador da vida digital das pessoas. Agora, a Huawei também poderá usar o cockpit inteligente para melhorar sua própria ecologia interconectada de todos os cenários, para que o "terminal móvel" do carro se torne uma entrada importante na ecologia inteligente.
Não é difícil conectar vários cenários, mas não é fácil tornar a interação entre terminais ecológicos inteligente e suave. A experiência de interconexão de protocolos como Bluetooth e ZigBee usados no passado é equivalente a dar a pontes frágeis de prancha única "ilhas isoladas" que não suportam vento e ondas, como costelas de frango.
A tarefa de Xiaoyi é ajudar a interação de um grande número de terminais no ecossistema Huawei tendem a ser automatizados.
Em outras palavras, Xiaoyi será outro importante ponto de entrada para os equipamentos ecológicos de cena completa da Huawei . Atualmente, a Huawei alcançou gradualmente uma colaboração perfeita entre terminais e todos os cenários por meio do HarmonyOS. No futuro, todos os dispositivos no ecossistema da Huawei poderão fornecer aos usuários mais serviços inteligentes baseados em cenários sob o gerenciamento de Xiaoyi, um assistente inteligente. De acordo com o segmento , localização e hábitos comportamentais, mobilizam as funções relevantes do dispositivo para fornecer o serviço mais adequado ao usuário no momento mais adequado.
Quando o Xiaoyi mais inteligente e mais "semelhante ao humano" conecta perfeitamente os três cenários de home-car-carry-carry, ele integra recursos de hardware, recursos do sistema e ecologia de serviço e faz sugestões com base nas intenções do usuário e as executa com eficiência. Então nós realmente temos o Homem de Ferro "Jarvis", e a magia da tecnologia mais uma vez nos trouxe para uma nova era.
A Huawei acabará se tornando uma "empresa de super terminal" com base nisso, assim como nossas visões anteriores sobre o futuro da Huawei:
O Hyperterminal não depende do número de tipos de terminais, mas do controle dos principais componentes e sistemas operacionais, do controle e da influência do ecossistema e da exploração prospectiva da interação humano-computador.
#Bem-vindo a prestar atenção à conta oficial do WeChat de Aifaner: Aifaner (WeChat: ifanr), conteúdo mais interessante será trazido para você o mais rápido possível.