Vivo usa IA para criar uma ilha onipotente |

Aifaner concentra-se nos “produtos de amanhã”. A coluna de filosofia difícil tenta despojar-se da tecnologia e dos parâmetros e explorar a origem da natureza humana no design de produtos.

Ao falar sobre assistentes de IA, há duas metáforas que são frequentemente usadas, mas são mais apropriadas – Jarvis do Homem de Ferro e o filme de ficção científica “Her”.

Eles não são apenas um assistente de voz de aparência mais inteligente, mas nos permitem ver a forma ideal de AI OS.

Jarvis pode fazer muito mais do que apenas definir um alarme e abrir um aplicativo, mas pode realizar quase qualquer tarefa que precise ser concluída em sistemas e dispositivos. Isso requer o uso de IA para reconstruir a experiência interativa do sistema de baixo para cima, e até mesmo. reconhecer as intenções do usuário. Executar operações.

"Her", dublado por Scarlett Johansson, cria uma experiência de usuário rica em calor e emoção, refletindo o fortalecimento da conexão emocional entre a interação humano-computador na era da IA, e essa expressão emocional muitas vezes requer mudanças sutis na voz, o que é. algo que muitas IAs atualmente não possuem.

Tal forma não pode ser realizada apenas por um modelo ou hardware poderoso, mas requer uma integração profunda de IA e sistemas.

No último lançamento do OriginOS 5 da vivo, vejo novos avanços nesta tentativa. Embora tenha havido inúmeros telefones com IA no ano passado, este pode ser o momento em que a IA e o sistema operacional móvel estarão mais integrados.

Um dos principais sinais é que durante a experiência não consegui perceber a existência da tecnologia de IA na maior parte do tempo, e a melhor tecnologia deveria ser “transparente”.

Na era da IA, a suavidade do sistema precisa ser redefinida

Durante muito tempo, os usuários julgaram basicamente a suavidade do sistema com base no fato de ele estar travado ou não. Este ainda é um critério muito importante. Mas na era da IA, o requisito de suavidade do sistema vai além de simplesmente buscar velocidade “rápida”.

Desta vez, o mecanismo de armazenamento Ledger do OriginOS 5 reconstrói todo o sistema de gerenciamento de memória para oferecer suporte a uma experiência interativa suave a partir da tecnologia subjacente.

Ao mesmo tempo, coopera com uma série de tecnologias pioneiras anteriores do OriginOS para otimizar a interação, como "agendamento injusto", "computação heterogênea", "placa gráfica virtual", etc., para garantir a suavidade do sistema.

Entre eles, em cenários de uso de alta frequência, como navegar no TikTok e assistir WeChat, a melhoria na suavidade do OriginOS 5 pode ser claramente sentida.

Isso ocorre porque o OriginOS 5 pode alocar memória automaticamente de acordo com os cenários de uso. Depois de usar Douyin por mais de uma hora, o uso de memória é 15% menor que o do antigo sistema WeChat, um gigante da memória, também pode ver a velocidade de carregamento do. melhoria de milhares de mensagens não lidas.

Comparado com a facilidade de uso do aplicativo, o que mais me surpreende no OriginOS 5 são algumas experiências que não são de natureza intuitiva. “Natural” não significa “intuitivo”, e uma interação natural na interface do usuário deve fazer com que as pessoas se sintam intuitivas, agradáveis ​​e confortáveis.

Um grande número de funções do OriginOS 5 suportam a excitação global. Por exemplo, se eu quiser chamar o assistente de IA "Blue Heart Little V", o método mais comumente usado é pressionar longamente o botão liga / desliga. , pressione longamente com dois dedos ou pressione longamente a barra de navegação na parte inferior da tela.

A conveniência da evocação global é que você basicamente pode encontrar o caminho mais curto que melhor se adapta aos seus hábitos de uso em cada interface para concluir a operação desejada.

No cenário de pesquisa, pressionar longamente a tela com dois dedos para abrir a "Pesquisa do Pequeno Círculo V" é mais intuitivo. Após selecionar a peça a ser pesquisada, o reconhecimento de intenção do Lanxin Little V será acionado para recomendar automaticamente os serviços necessários. , como consultar informações da enciclopédia ou criar uma programação de lembretes.

Na verdade, a pesquisa por seleção de círculo não é um recurso novo, mas há dois detalhes otimizados no OriginOS 5. Um é que a seleção de círculo é mais precisa e o conteúdo pode ser selecionado e identificado desenhando linhas, círculos e toques longos, e o outro são os serviços de recomendação ativa.

A pesquisa por IA é usada por cada vez mais pessoas hoje em dia. O motivo importante é que ela pode pesquisar usando linguagem natural em vez de palavras-chave. Ao mesmo tempo, também pode atuar como um assistente. suas necessidades e dar mais ajuda.

Quando interações e sistemas semelhantes são perfeitamente integrados, este é o verdadeiro significado de “fluência”.

OriginOS 5 é chamado de AIOS pela vivo pela primeira vez. A essência do chamado AIOS é proporcionar uma experiência de usuário mais natural e confortável, entender as reais necessidades dos usuários e simplificar as etapas de obtenção de serviços.

Bill Buxton, um pioneiro no campo da interação humano-computador, certa vez listou em um artigo os princípios que a interface natural do usuário NUI deveria seguir, incluindo um:

Simplicidade acima de tudo: a complexidade é inimiga das interfaces de usuário naturais. Cada interação deve ser autoexplicativa e não exigir manual de instruções.

Existem muitos detalhes no OriginOS 5 que podem produzir um prazer “intuitivo” nas interações .

Por exemplo, a alternância dinâmica de diferentes operações, como notificações de mensagens, pequenas janelas de vídeo e pesquisas, é consistente. Esse design pode parecer discreto, mas se você alternar rapidamente entre várias janelas pequenas, poderá experimentar os benefícios de uma percepção visual consistente. de coordenação.

Acreditamos que o fluxo natural do sistema e o melhor efeito é fluir como a água.

A simplicidade é a sofisticação máxima. A simplicidade é a complexidade máxima – na natureza, a água é a substância mais adequada para expressar esta qualidade.

A água é a substância mais macia do mundo, mas pode penetrar nas rochas mais duras do mundo.

Coloque água em um copo e ela muda para o formato do copo;

Coloque água em um bule e ele terá o formato de um bule;

Coloque água na garrafa e ela assumirá o formato da garrafa.

A água pode fluir, chiar, pingar ou colidir, e a água muda de acordo com a situação.

A interação do sistema mais natural e suave, ou seja, em diversos cenários de uso, é como a água, que é neblina e orvalho no céu e uma nascente no solo.

Esta não é apenas uma estética de design, mas também a aparência que os aplicativos de IA devem ter quando implementados.

Uma ilha onipotente no seu celular

No início do ano, Ai Faner afirmou no ifanRank que a IA se tornaria o novo sistema operacional para smartphones, e os modelos grandes seriam o núcleo do sistema operacional inteligente.

O sistema pode compreender a linguagem natural do usuário e compreender gradualmente as intenções do usuário com base no treinamento de dados locais. Os serviços e funções fornecidos pelos aplicativos anteriores são perfeitamente integrados ao sistema e chamados, e o usuário só precisa falar sobre suas necessidades.

Quando toda a interface interativa se tornar uma superinteligência, a maneira como usamos os telefones celulares também mudará.

No OriginOS 5, Lan Xin Xiao V também foi atualizado para um agente, que pode entender as intenções do usuário como os humanos, prever as necessidades com antecedência e fornecer uma experiência de usuário cada vez melhor com você.

Os agentes são uma importante direção de pesquisa na indústria atual de inteligência artificial, fora dos grandes modelos, e espera-se que tragam um enorme progresso no campo da IA. Bill Gates ainda acredita:

Os agentes não mudarão apenas a forma como todos interagem com os computadores. Eles também irão revolucionar a indústria de software, provocando a maior revolução na computação desde que passamos da digitação de comandos para o clique em ícones.

As melhorias de eficiência trazidas pelo OriginOS 5 através da IA ​​são inseparáveis ​​de quatro palavras: reconhecimento de intenção , que é também a atualização mais surpreendente deste sistema.

O reconhecimento de intenção é mais óbvio na "Ilha Atômica". Contanto que eu arraste e solte texto, imagens e outros conteúdos na Ilha Atômica, eles serão colocados na Ilha Atômica em ordem de prioridade com base nos serviços previstos necessários para a próxima etapa. .

Quando arrasto e solto um endereço, a primeira coisa exibida é a navegação do mapa, e posso ir diretamente.

Quando estava conversando, recebi um link de senha para uma plataforma de compras online. Arrastei e soltei para abrir o salto diretamente.

Quando recebo notificações de várias reuniões do grupo, posso arrastá-las e soltá-las para criar uma programação imediatamente.

A eficiência do fluxo de informações foi bastante melhorada, o que é especialmente útil quando procuro informações em vários aplicativos. Quando vejo alguns textos e imagens que desejo compartilhar, posso arrastá-los e soltá-los diretamente para enviá-los a amigos do WeChat, ou. registre-os rapidamente em minhas anotações.

Além disso, usar Atomic Island com Little V Circle Search pode abrir um novo mundo.

Por exemplo, procurei alguns guias de decoração de casa em Xiaohongshu. Não só posso compartilhá-los com minha família ou gravar notas arrastando-as e soltando-as na Ilha Atômica, mas também posso circular as fotos e fornecer links para compra.

Em cenários de escritório, também posso usar o Atomic Island e alguns aplicativos de IA para criar um fluxo de trabalho mais eficiente.

Quando participo de uma reunião online, ligo o "Little V Helper" para ativar as legendas em tempo real. Se estou me comunicando com amigos estrangeiros ou assistindo a algumas transmissões ao vivo em idiomas estrangeiros, também posso atuar como intérprete simultâneo e gravar. o resumo em Atomic Notes.

Posso usar a função de escrita em V pequeno para simplificar ou expandir com base nas minhas necessidades e também posso ajustar o estilo da linguagem. Por exemplo, posso tornar o estilo de escrita mais adequado e formal.

Então eu arrasto e solto na Ilha Atômica e envio para diferentes colegas que precisam colaborar. Isso pode melhorar muito a eficiência em cenários onde você precisa promover projetos frequentemente interna e externamente.

Lógica de uso semelhante se aplica a muitos aplicativos, e os serviços de aplicativos mais comumente usados ​​também podem ser personalizados no topo, o que permite explorar cenários mais interessantes com base em suas necessidades.

Atualmente, os aplicativos de terceiros comumente usados ​​​​suportam basicamente arrastar e soltar da Ilha Atômica, incluindo WeChat, Douyin, Meituan, Alipay, Xiaohongshu, Weibo, Amap, etc., cobrindo aplicativos de alta frequência para necessidades diárias, alimentação, habitação e transporte.

Durante meu período de uso, o Atomic Island foi bastante preciso na identificação de minhas intenções de arrastar e soltar. Assim como a lâmpada mágica de Aladim, há uma pessoa da Estrela Azul dentro para ajudá-lo a realizar seus desejos e pode lhe fornecer os serviços que você deseja, mesmo sem fazer um pedido.

Além disso, há um ovo de páscoa mais esperado em termos de IA – o assistente de reservas de Xiao V (PhoneGPT). Contanto que você insira os requisitos de pedido, o sistema pode abrir automaticamente o Dianping para procurar restaurantes e usar a IA para fazer chamadas. para reservar restaurantes com comerciantes em nome do usuário.

Após o sucesso da reserva, a IA enviará imediatamente ao usuário um cartão contendo o endereço do restaurante e informações de contato. Você pode navegar até o restaurante com um clique direto ou salvá-lo na programação como um lembrete programado.

Este é um estado ideal para o trabalho de agentes inteligentes. A IA pode não apenas aprender a entender as intenções de operação do usuário, mas também simular seres humanos para concluir operações funcionais. .

Há alguns anos, o Google também lançou um serviço de reserva por telefone com IA chamado Duplex, que pode ajudá-lo a alugar um carro, reservar ingressos de cinema e assentos em restaurantes, mas não estava maduro. Mais tarde, a mídia descobriu que muitas das reservas de IA. fornecidos por este serviço foram, na verdade, concluídos manualmente.

Mas isto demonstra o enorme potencial das aplicações de IA. Com as crescentes capacidades de grandes modelos, explorações como a vivo têm muitas possibilidades de implementação. Esta nova forma de interação humano-computador permite que os usuários obtenham serviços de forma “sem sentido”. Eles não precisam se preocupar com o aplicativo em si. O serviço deve se ajustar automaticamente de acordo com as necessidades do usuário.

Esta mudança no conceito de interação também se reflete no Canvas recentemente lançado da OpenAI, Karina Nguyen, diretora de pesquisa da OpenAI, acredita:

A interface AGI definitiva em minha mente é uma tela em branco.

Pode evoluir e transformar-se de acordo com as preferências humanas e inventar novas formas de interagir com os humanos, redefinindo a nossa relação com a tecnologia de IA e a Internet como um todo.

Ao contrário de muitas IAs, as funções de IA no OriginOS 5 não são apenas “inteligentes”, mas também parecem mais “humanas”.

Ao acordar Lan Xin Xiao V com sua voz, você pode sentir que o tom superantropomórfico integrado do sistema está mais próximo do humano, sem qualquer sensação de dissonância. Você também pode escolher entre uma variedade de dialetos e até mesmo apoiar idiomas minoritários, como o Miao, falado apenas por milhões de pessoas.

Esses 7 dialetos também podem ser reconhecidos e convertidos em texto em “vivo Listening and Speaking”, o que significa que esse recurso de acessibilidade não é útil apenas para usuários com deficiência auditiva, mas usuários comuns também podem utilizá-lo para se comunicar com usuários de diferentes dialetos.

Há também alguns detalhes bem pensados ​​​​em "vivo Audição". Por exemplo, clicar duas vezes no texto pode ampliá-lo e exibi-lo ao contrário, facilitando a visualização da pessoa com quem você está falando e reduzindo as barreiras de comunicação.

O que mais me impressiona é o timbre personalizável. Apenas lendo um trecho de texto, o sistema pode treinar seu timbre para ser a voz de reportagem de “Blue Heart Little V”. Pedi à minha esposa que personalizasse sua voz para mim, e até ela ficou surpresa ao ver que a voz soava tão parecida com a dela. Isso também aumentou minha disposição de usar a comunicação por voz e por telefone celular.

À medida que a tecnologia de geração de IA continua a atualizar a cognição sensorial das pessoas, precisamos sentir uma experiência calorosa e emocional na interação humano-computador.

Bill Buxton acredita que a interface natural do usuário NUI deve ser capaz de detectar o contexto do usuário, incluindo posição, postura, emoção, etc., e ajustar dinamicamente o método de interação com base nessas informações, para que a interface possa fornecer um ambiente mais personalizado e relevante experiência.

A experiência interativa de IA do OriginOS 5 está começando a se aproximar desse NUI, permitindo-nos realmente começar a ter nosso próprio Jarvis em nossos celulares.

Design original do OriginOS 5, AI OS “transparente”

Há dois mil anos, o antigo arquiteto romano Vitrúvio propôs três princípios de arquitetura em seu livro "Dez Livros de Arquitetura": Firmitas, Utilitas e Venustas. Esses três princípios básicos são considerados os princípios eternos do projeto arquitetônico e mais tarde evoluíram para Durabilidade, Conveniência e Encantamento.

Estes princípios não são aplicáveis ​​apenas ao campo da arquitetura, mas também têm um impacto profundo no pensamento moderno do design de produtos. O pensamento humanístico de Vitrúvio baseado em “pessoas” é na verdade um conceito de “design original”.

Coincidentemente, isso ecoa a filosofia de design do OriginOS através do tempo e do espaço. A “Origem” no OriginOS na verdade não se refere à origem ou origem, mas ao retorno à origem das coisas, incluindo a origem do mundo físico e a origem das necessidades humanas. .

Design é a origem, origem é o design

Seja eliminando interfaces redundantes e simplificando operações e retornando aos métodos de interação mais intuitivos e naturais, ou usando IA para perceber o ambiente e o status dos usuários, entender suas necessidades básicas e verdadeiras intenções e tornar o feedback e os serviços mais próximos do mundo físico ., são todos a resposta do OriginOS 5 ao “design original”.

Com base nas ideias de Vitruvius e combinando-as com a experiência real, podemos resumir os princípios de design do OriginOS 5 como:

  • Natural: fornece uma experiência interativa natural e suave e reduz a carga cognitiva dos usuários.
  • Eficiente: Use IA para obter adaptação inteligente e consciência situacional e atender proativamente às necessidades do usuário.
  • Prazer: Concentre-se nas necessidades emocionais e estéticas dos usuários para criar uma experiência interativa e visual agradável.

A tecnologia ideal deve ser “transparente” para que os usuários não possam sentir a existência da tecnologia e se concentrem na experiência em si.

A interação “transparente” do OriginOS 5 é uma manifestação de “retorno às origens das necessidades humanas”. As pessoas estão acostumadas a feedback direto e imediato no mundo físico, e o OriginOS 5 traz essa experiência para o mundo digital, tornando-a familiar e confortável para os usuários.

Isso me lembra a rota de interação humano-computador mencionada pelo colunista do New York Times, John Markoff, no livro "Dancing with Robots", IA (Intelligent Augmentation). Ele enfatizou que a IA e os humanos estão em um relacionamento colaborativo, e as máquinas deveriam. uma expansão das capacidades humanas, não uma substituição.

Para usar um conceito mais popular, trata-se de um copiloto, um copiloto que auxilia o piloto principal na operação da aeronave. Quando o piloto principal precisar descansar ou realizar outras tarefas, o copiloto assumirá o controle, e os dois. são solidariamente responsáveis ​​pela operação da aeronave.

Em 1980, Steve Jobs comparou o computador pessoal a uma “bicicleta para a mente”. Por que não um carro, um avião ou um foguete, mas uma bicicleta?

A afirmação vem de um artigo da revista "Scientific American" O autor descobriu que embora a velocidade absoluta das bicicletas não possa ser comparada com o transporte motorizado, se forem calculadas as calorias queimadas por quilômetro percorrido, a taxa de ciclismo humano é a mais alta. ainda mais alto que um avião.

A essência desta metáfora é que não importa qual seja o dispositivo de computação, ele deve ser baseado em pessoas. Produtos inteligentes com IA como núcleo devem se tornar as “bicicletas para o cérebro” das pessoas.

O filósofo Robert Nozick acredita que "a sabedoria é o conhecimento de coisas importantes, e esse conhecimento aqui se torna a característica do pensamento e do comportamento de uma pessoa (sábia)".

A sabedoria de hoje não vem apenas de organismos baseados em carbono, mas também é alimentada pela inteligência baseada em silício. O que vemos no OriginOS 5 não é apenas uma atualização de tecnologia, mas também uma visão profunda e uma resposta às necessidades humanas.

Somente voltando ao básico poderemos ter uma visão do futuro.

# Bem-vindo a seguir a conta pública oficial do WeChat do aifaner: aifaner (WeChat ID: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo |