O impacto do GPT nas interfaces do produto
1. Informações básicas
1.1 Por que os modelos grandes são importantes?
Como um tipo de modelo de linguagem grande (LLM), o modelo GPT (Generative Pre-Trained Transformer) da OpenAI demonstra a inteligência da máquina mais próxima dos seres humanos hoje. A característica mais importante do GPT é que ele usa trilhões de parâmetros e os dados de texto do toda a Internet permite que modelos de computador produzam emergência inteligente (Emergência). Emergência na física geralmente se refere ao aparecimento recorrente de certos padrões estáveis em fenômenos caóticos.A emergência é a categoria mais desafiadora na compreensão de fenômenos naturais complexos. A partir de uma entrevista recente com Sam Altman, chefe da OpenAI, e Ilya, cientista-chefe, podemos entender como domar o grande modelo de linguagem que surge com inteligência e como fazê-lo servir às pessoas de maneira estável e segura (alinhamento, alinhamento). A OpenAI não dominou totalmente Embora seja um método de depuração eficaz, o GPT ainda é uma caixa preta até certo ponto.
Precisamos perguntar por que um modelo de linguagem mudará o mundo. O ChatGPT é realmente mais obediente e melhor em falar, mas o que há de tão bom em uma ferramenta inteligente de interação de texto? Há dois motivos: 1. A inteligência artificial tem vários modos (Modal). A pesquisa entre diferentes modos penetra e compete entre si. O modo com melhor desempenho será o primeiro a definir a trajetória das futuras aplicações de IA. ChatGPT mostra modal de texto a inteligência dominará o desenvolvimento recente da IA. 2. O texto é muito importante como entrada para a sociedade humana.
Ponto 1, multimodalidade. A inteligência artificial que utiliza imagens como modalidade tem sido desenvolvida há muitos anos.A Visão Computacional, que repetidamente obteve grandes avanços no reconhecimento de imagens e na direção autônoma, é outra entrada para a inteligência artificial. Nos últimos dez anos, houve uma explosão de artigos nas três conferências CVPR/ICCV/ECCV. Mesmo que as importações paralelas sejam removidas, é o epítome da explosão da inteligência de imagem. O surgimento do OpenAI reverteu a posição de destaque da inteligência gráfica em aplicações de IA, e até mesmo sua trajetória de desenvolvimento – quando a Meta lançou o Segment-Anything (um algoritmo gráfico para segmentar diferentes objetos em imagens), o modelo mostrou um poder semelhante ao GPT em texto Com capacidades de migração a custo zero, algumas pessoas também exclamaram que o CV tradicional está morto (um exagero).
A influência do ChatGPT na modalidade texto dispensa elaboração, pois vai além do simples valor da pesquisa científica e redefine a inteligência e o potencial de negócios da modalidade texto. O produto DALL·E da OpenAI também fornece inteligência de imagem fora da modalidade de texto. O código aberto Stable Diffusion e o código fechado Midjourney, como senhores supremos no campo dos gráficos de Vincent, também contribuíram para inúmeros avisos de “morte” na indústria criativa. Em suma, a IA penetra-se nas duas modalidades de texto e imagem e ultrapassa os limites da inteligência na competição mútua.
– Modalidade texto + imagem do OpenAI: ChatGPT + DALL·E
– UI da Web de difusão estável (modal de imagem): difusão estável
– Midjourney (modal gráfico): Midjourney
Ponto 2: A modalidade textual é a entrada para a sociedade humana. Você pode consultar as opiniões de Yuval Harari (autor de "Uma Breve História da Humanidade") em uma entrevista exclusiva ao The Economist: Ele acredita que a linguagem é o sistema operacional da sociedade humana, e a inteligência artificial invadiu esse sistema, e A IA mudará isso através da linguagem, o próprio sistema operacional, mudou completamente a história humana. A programação do comportamento humano e do feedback social por grandes modelos terá um enorme impacto devido à intrusão do sistema de linguagem.
Para obter mais informações, consulte: yuval-noah-harari-argumenta-que-ai-hackeou-o-sistema-operacional-da-civilização-humana
1.2 Custo do LLM
Quanto custa treinar um modelo verdadeiramente grande?
Em primeiro lugar, independentemente de imagens e vídeos, grandes modelos requerem pelo menos os dados de texto de toda a Internet; dezenas de milhares de A100 são necessários para iniciar; o consumo de energia computacional da eletricidade necessária se tornará um custo que não pode ser ignorado; o custo de tentativa e erro é incontrolável: pode ser medido em vários meses O tempo de treinamento e o custo de mão de obra; o método de treinamento do modelo e ajuste preciso é desconhecido ou não é público, e o modelo grande ainda é uma caixa preta. A soma destas razões levou ao facto de existirem apenas algumas empresas no planeta que podem possuir grandes modelos, porque isso requer recursos financeiros extremamente fortes e uma tolerância ao risco extremamente elevada. grandes empresas sem espírito de aventura não são dignas de possuí-lo.
Elon Musk estimou em uma entrevista recente que o treinamento de um modelo de nível GPT-5 pode usar de 30.000 a 50.000 chips H100, usando a arquitetura técnica mais recente e os principais pesquisadores de IA (consulte OpenAI, cerca de 200+ pessoas). Por fim, Musk deu o custo inicial do modelo grande. Comparado com a avaliação recente do modelo de startup de grande escala, este valor é de grande valor de referência: US$ 250 milhões.
1.3 Oportunidades
Na assembleia de acionistas da Tencent de 2023, o CEO da Tencent, Ma Huateng, respondeu a perguntas sobre ChatGPT e IA, dizendo: “Inicialmente pensamos que (inteligência artificial) era uma oportunidade única em uma década para a Internet, mas quanto mais pensávamos sobre isso , mais sentimos que esta era uma oportunidade semelhante que só ocorre uma vez em um século. Oportunidades como a revolução industrial que inventou a eletricidade." Ma Huateng disse que as empresas de Internet acumularam muito no campo da IA, e a Tencent também está imerso em pesquisa e desenvolvimento, mas não tem pressa em terminar cedo e exibir os produtos semiacabados. “Para a revolução industrial, retirar as lâmpadas um mês antes não é tão importante a longo prazo. A chave é fazer um trabalho sólido nos algoritmos subjacentes, poder de computação e dados e, mais importante, é a implementação do cenário , e atualmente (nós) ainda estamos pensando. Sinto que muitas empresas estão muito precipitadas agora e parece que é para aumentar o preço das ações, o que não é o nosso estilo.
Resumindo, não há necessidade de pressa para aumentar o preço das ações, e não há necessidade de pressa para inovar, pois o caminho a percorrer é longo. Os modelos grandes não são novas aplicações, são a própria revolução.
Eu também tenho algumas opiniões. A diferença entre retirar a lâmpada com um mês de atraso e retirá-la com um mês de antecedência é se você acaba sendo Edison ou alguma segunda pessoa desconhecida que inventa a lâmpada. No entanto, apesar das incríveis capacidades dos grandes modelos, o desafio de domesticação e melhoria ainda é árduo. Estamos em um período desafiador quando construímos um avião pela primeira vez. Se quisermos voar com segurança e estabilidade, ainda precisaremos de muitas lições aprendidas com dificuldade com os fracassos para entender onde está a linha vermelha. A OpenAI lançou o plug-in Plugin, que é um método de produto em potencial. No entanto, o desempenho comercial atual do plug-in não é claro. A App Store que deverá ser acionada pelo plug-in também não está clara em todos os momentos. Como transformar GPT em um produto com valor comercial ainda é desconhecido. Ao longo dos anos, a Goose Factory tem sido pioneira na vantagem do segundo motor e tem o trunfo da microinovação. Não é necessariamente irracional aproveitar ao máximo os seus pontos fortes.
2. GPT causa mudanças na camada de interação humano-computador (HCI/UI)
Interface do usuário, interface de interação do usuário, conhecida como UI. Hoje, todo mundo vive no oceano da UI. Muitas pessoas da Internet acreditam que UI ≈ web + design de aplicativo. Esse entendimento limita muito a conotação de UI. Uma definição mais profissional de UI deveria ser chamada de HCI, Interface Homem-Computador, interface de interação humano-computador. Nos últimos quase um século de desenvolvimento, as pessoas projetaram várias gerações de UI distintas com base no poder de computação e no nível de inteligência das máquinas da época. Estamos na fase de transição de GUI para NLI.
- PCI: Interface de cartão perfurado, interface interativa de cartão perfurado
- CLI: interface de linha de comando, interface interativa de linha de comando
- GUI: Interface gráfica do usuário, interface gráfica interativa
- NLI: Interface de linguagem natural, interface interativa de linguagem natural
- BCI: Brain Computer Interface, interface de interação cérebro-computador
2.1 PCI, interface de cartão perfurado interface de cartão perfurado
Acima: Uma pilha de cartões perfurados contendo um programa.
Abaixo: funcionários dos EUA em 1950 fazendo cartões perfurados contendo uma seção de dados do Censo dos EUA.
2.2 CLI, interface de linha de comando da interface de linha de comando
As linguagens de programação são ainda mais encapsuladas e aparecem dispositivos de exibição, e as ferramentas de linha de comando se tornam a interface interativa mais importante para computadores. A operação CLI é eficiente e poderosa.
2.3 GUI, Interface gráfica do usuário Interface gráfica do usuário
A GUI, a interface gráfica do usuário que Jobs “roubou” da Xerox, deu início à revolução do computador pessoal.
Essa camada de interface foi extremamente influente, e o primeiro aplicativo matador do mundo nasceu na GUI, a planilha VisiCalc do Macintosh, que também foi o antecessor do Excel.
Até hoje, a interface de usuário bonita e suave do Mac ainda é um dos recursos de produto mais atraentes para os usuários.
2.4 NLI, interface de linguagem natural
1. Texto para texto https://openai.com/chatgpt
2. Texto para imagem https://openai.com/dall-e-2
3. Texto para vídeo 文生视频
Runway: Avançando a criatividade com inteligência artificial.
Diga uma palavra: "Uma bela renderização de conceito de sala de estar." "Gere uma bela renderização de conceito de sala de estar."
4. Comportamento de Texto para Ação
Adepto:
O objetivo da Adept é construir um assistente inteligente completo por meio da automação de software. A linguagem natural será o único conteúdo interativo que os usuários Adeptos precisarão usar no futuro.
2.5 BCI, interface cérebro-computador
Do pensamento à ação, do pensamento humano ao comportamento da máquina. O NeuroLink, que foi amplamente divulgado no ano passado, permite que macacos joguem Pong com seus pensamentos, e as pessoas também podem usar interfaces cérebro-computador para controlar jogos simples e próteses mecânicas. Nesta fase, produtos cérebro-computadores mais significativos ajudam principalmente as pessoas com deficiência a controlar as próteses e a restaurar a sua capacidade de viver. A tecnologia cérebro-computador atual ainda é um pouco cedo para discutirmos interfaces revolucionárias de interação humano-computador.
2.6 Resumo
-A conotação de UI precisa ser expandida
A comunicação entre máquinas e humanos requer uma camada de mídia interativa, que controla os limites de entrada e saída na interação humano-computador. O meio interativo filtrará e converterá as informações humanas, tornando essas entradas humanas estranhas seguras e identificáveis para a máquina; ao mesmo tempo, os resultados retornados pela máquina serão filtrados e convertidos pelo meio interativo, tornando-os seguros, utilizáveis e valiosos para humanos.
Esta camada de mídia interativa conectando humanos e máquinas é a definição de UI.
Na revolução da Internet das últimas duas décadas, a GUI padronizou todos os métodos de entrada que as pessoas desejam fazer com a máquina por meio de formas de operação limitadas, como botões, arrastar, polias, zoom com os dedos, operações com vários dedos, agitação, inversão, hardware botões, etc. Esta entrada padronizada é compreendida pela máquina e retornada como saída padronizada. A revolução do PC e da Internet móvel equiparou UI e GUI, mas na verdade a UI é muito mais rica do que os métodos de interação existentes da GUI.
O surgimento da GPT destruiu diretamente esse equilíbrio. O impacto mais importante das máquinas se tornarem mais inteligentes nos produtos é que a tolerância a falhas do computador para a linguagem natural foi muito melhorada. Ele não precisa mais de um filtro que só pode receber informações muito limitadas para entender as pessoas. A linguagem natural falada todos os dias está ainda misturada com todos os tipos de lógica, dicas, sarcasmo e erros. A melhoria da tolerância a falhas da IA para linguagem natural destruirá definitivamente a atual camada de interação da GUI como UI:
1. Uma grande transformação na experiência do usuário (UX). Os usuários mudaram do método principal de interação de "clicar, deslizar, arrastar" com os dedos e o mouse no passado para a interação usando linguagem natural como interface.
2. A GUI atual desaparecerá? Não, por dois motivos. Primeiro, quando o modelo não é preciso o suficiente ou a produção de IA é imatura, a aparência elegante e a experiência da GUI ainda são atraentes para os usuários, e o custo de interação com os dedos e o mouse é muito menor do que o da linguagem natural. Em segundo lugar, referindo-se aos diferentes estágios de desenvolvimento da IU, a linha de comando preta está desatualizada? Não, a GUI não desaparecerá imediatamente. Se for mais eficiente usar a interface interativa da era anterior, esse tipo de interação ainda existirá mesmo que o limite de uso seja alto.
3. A ferramenta de linha de comando (CLI) ainda é a maneira mais eficiente de realizar operações detalhadas no computador. No futuro inteligente, se você precisar operar um aplicativo em profundidade, alguém poderá dizer: abra sua GUI, assim como dizem os programadores de hoje: abra seu terminal.
4. A interface de interação humano-computador se desenvolverá no sentido de diminuir a profundidade das operações do computador e diminuir o limite de uso. O mesmo vale para as mudanças que os grandes modelos estão prestes a desencadear. Você pode ver esta tendência: linha de comando CLI – interface gráfica GUI – linguagem natural NLI – interface cérebro-computador BCI.Essa tendência está diminuindo cada vez mais a capacidade dos computadores de operar em profundidade e também diminui o limite para os usuários e inferior.
5. Os melhores engenheiros de computação não podem ser substituídos por seu conhecimento profundo das máquinas e capacidades operacionais aprofundadas, mas apenas os melhores engenheiros podem sobreviver.
Na imagem abaixo, podemos ver mais claramente por que o GPT causará grandes mudanças na IU do produto? Porque as linguagens de máquina no passado eram muito severas e tinham tolerância a falhas extremamente baixa. Um único erro de pontuação em uma linguagem de programação pode tornar todo o programa inoperante. A magia mais importante trazida por grandes modelos é melhorar significativamente a tolerância a falhas da máquina para a linguagem natural humana (Linguagem Natural, NL). Resumindo, a futura interface interativa em linguagem natural tomará a caixa de entrada de texto como ponto de partida e terá como objetivo a interação multimodal e altamente dinâmica.
Limite de uso: quanto mais próximo estiver dos humanos, menor será o limite de uso. Linha de comando CLI > Interface gráfica GUI > Linguagem natural NLI > Interface cérebro-computador BCI
Eficiência de operação: Quanto mais longe da máquina, menor será a eficiência do controle. Linha de comando CLI > Interface gráfica GUI > Linguagem natural NLI > Interface cérebro-computador BCI
-A evolução do NLI
·Iniciar: caixa de entrada de texto
·Desenvolvimento: caixa de entrada multimodal, voz, imagem, vídeo · Objetivo : entrada – texto multimodal, som, imagem, vídeo => retorno – Texto útil, Voz, Imagem, Vídeo + comportamento útil do software.
Quais modos o Vision pro pode oferecer: interação tridimensional, gestos, gravidade, rotação, texto de voz, imagens estáticas e vídeo em tempo real.
·Futuro : Falar com humanos é apenas o ponto de partida para compreender o mundo com grandes modelos. Usar LLM como cérebro, câmeras como olhos e braços robóticos como membros é uma nova interface para a IA interagir com o mundo físico.
-Timberter – um aplicativo de "contagem de madeira" baseado em algoritmos visuais que já existe há muitos anos . O que aconteceria se acrescentássemos a ele as capacidades de raciocínio de um modelo grande e um braço robótico capaz de realizar o manuseio?
-Um robô controlado por voz? Interface de voz OpenAI GPT-4 Whisper
3. Ecossistema de IA
3.1Forbes AI 50
A Forbes selecionou as 50 empresas de IA mais promissoras do ano nos últimos anos. Diferente dos anos anteriores, a lista de empresas de IA deste ano não é apenas da América do Norte, mas das 50 empresas mais promissoras e valorizadas de mais de 800 empresas ao redor do mundo, dos Estados Unidos, Canadá, Israel, Reino Unido e Japão.
Abaixo está a lista completa que compilei, incluindo OpenAI, Jasper, Hugging Face, Adept… todas as startups de IA que você conhece. Os alunos interessados podem acessar o site da Forbes para lê-lo, e não iniciarei a discussão. Forbe AI 50
3.2 Mais startups de IA
Os cenários de uso concentram-se principalmente no lado C: Texto generativo, Áudio, Imagem, Vídeo + Pesquisa + Copilt Automatizado. As aplicações do lado B baseiam-se principalmente na integração e podem estar em categorias específicas da indústria: direito, medicina e saúde, pesquisa acadêmica (biologia, física, matemática) e análise inteligente. Além disso, há infraestrutura de IA: banco de dados de vetores, modelo de IA de grande porte, segurança de IA, desenvolvimento e operação DevOps e Copilt automatizado.
A imagem abaixo contém uma lista de mais empresas geradas por IA (março de 2023, da perspectiva dos VCs americanos).Os estudantes interessados podem experimentar por conta própria.
4. Integração de grandes modelos e produtos
4.1 Custos de integração
O custo de integração aqui não é apenas uma discussão sobre o custo de desenvolvimento da integração de IA em produtos, mas também o custo de aprendizagem e o tempo necessário para que os usuários concluam o trabalho com a mesma qualidade do passado, usando aplicativos inteligentes de IA. As aplicações de IA só serão valiosas quando o custo de integração for significativamente inferior ao custo original (custos de desenvolvimento e operação + custos do utilizador).
Custo de integração = custo de desenvolvimento de produto de IA + custo do usuário ao usar o aplicativo de IA para concluir o trabalho com a mesma qualidade no passado
Dê dois exemplos para ilustrar a importância dos custos de integração.
Frente: AIGC gera materiais de preenchimento/materiais para design de jogos.
Há um trabalho intensivo de mão-de-obra no design e desenvolvimento de jogos, incluindo a preparação de materiais de preenchimento, diálogos de personagens NPC, mudança de estilo, cenas de borda… Este tipo de trabalho não possui altos requisitos de originalidade, mas o custo de tempo não pode ser reduzido significativamente.
Se você usar ferramentas de IA para gerar esses materiais não importantes e, finalmente, ajustá-los por designers experientes, será totalmente viável obter os mesmos resultados de qualidade do passado.
Custo de integração de materiais não críticos gerados por IA < < < Custo de preparação de materiais tradicionais
O AIGC merece ser promovido no contexto dos materiais do jogo.
Por outro lado: uma solução para gerar anúncios avançados usando IA completa.
Embora as soluções de publicidade de IA pareçam ter reduzido o custo de geração de texto, imagens e vídeos no processo de criação de publicidade anterior, um anúncio verdadeiramente atraente e avançado geralmente requer uma quantidade extremamente grande de criação personalizada e modificações secundárias.
Portanto, quando utilizadores reais (prestadores de serviços de publicidade que utilizam a criação de IA, ou consumidores de publicidade que pretendem eliminar anunciantes) fazem ajustes secundários ao conteúdo publicitário gerado pela IA, será necessário muito esforço para atingir o mesmo nível de qualidade da publicidade anterior. O custo de ajuste é muito superior ao dos métodos tradicionais e, na maioria dos casos, é até impossível atingir a mesma qualidade.
Custo de integração de IA da publicidade de ponta >> Custo original da publicidade tradicional.
O serviço completo de IA resolve a criação avançada de publicidade personalizada, o que não é realista hoje.
É claro que, à medida que o desempenho do modelo melhora, até mesmo os meios e as preferências do mercado mudam (marketing de precisão, preferências personalizadas). O caso negativo atual se tornará um caso positivo, e o caso positivo também poderá se tornar um caso negativo.
4.2 Métodos de integração
Modelos grandes acionarão dois tipos de produtos. Um produto totalmente novo construído em torno de recursos de IA pode ser chamado de AI Naive/AI nativo. A outra é adicionar funções de IA ao software tradicional e realizar uma transformação inteligente, que pode ser chamada de atualização de IA/atualização de IA. Esses dois métodos formarão UIs de produtos diferentes.
Os fatores mais importantes na integração de produtos de IA:
1. Desempenho do modelo de IA
2. O custo de desenvolvimento e operação de produtos de IA + o custo dos utilizadores que utilizam aplicações de IA (custos de integração).
5. Informações sobre ferramentas de IA
A composição dos aplicativos de IA: infraestrutura Infra + middleware Middleware + aplicativo (essas definições podem se sobrepor)
5.1 Aplicação de IA | Aplicação
-Mecanismos de busca: Novo Bing, Google Bard
– Perguntas e respostas sobre bate-papo: ChatGPT, Jasper, vários aplicativos de bate-papo inteligentes
– Vincent Pictures: meio da jornada, difusão estável
-Vincent Vídeo: Pista
-Automação: Adepto
…
Mais referências de ferramentas (domésticas): Caixa de ferramentas de IA | Coleção de ferramentas de IA | Navegação no site de IA
5.2 Middleware |
O modelo grande é um modelo básico, que possui o conhecimento mais extenso e mostra fortes capacidades de generalização, mas sua precisão em cenários precisos é insuficiente. Este também é o principal desafio na aplicação de modelos grandes. A importância do middleware é organizar o conhecimento de cenários profissionais, expandir a base de conhecimento de modelos, melhorar a precisão da IA e, finalmente, fornecer interfaces convenientes e utilizáveis para conectar aplicativos de camada superior. Como o custo das interfaces de linguagem natural é muito baixo, muitos middlewares fornecem diretamente interfaces de aplicativos e uma janela de bate-papo, como o primeiro AgentGPT.
-AgenteGPT
https://github.com/reworkd/AgentGPT
https://agentgpt.reworkd.ai/
Mais ferramentas de middleware:
-Langchain: https://github.com/hwchase17/langchain
-AutoGPT: https://github.com/Significant-Gravitas/Auto-GPT
-BabyAGI: https://github.com/yoheinakajima/babyagi
-HuggingGPT: https://github.com/huggingface/transformers
…
Existem muitos middlewares semelhantes, então não vou listar todos eles.
5.3 Infraestrutura | Infra
-Modelo
Modelos grandes: OpenAI GPT, Google Bard, Antrópico, Wenyan Yixin, Baichuan Intelligence…
Modelo de código aberto:
Lhama: https://github.com/facebookresearch/llama
Alpaca: https://github.com/tatsu-lab/stanford_alpaca
Vicuna: https://lmsys.org/blog/2023-03-30-vicuna/
GPT4ALL: https://github.com/nomic-ai/gpt4all
ChatGLM: https://github.com/THUDM/ChatGLM-6B
Baichuan-7B: https://github.com/baichuan-inc/baichuan-7B
…
Difusão estável (modo de imagem): https://github.com/AUTOMATIC1111/stable-diffusion-webui
-Banco de dadosBanco de dados
Consulte o banco de dados vetorial recomendado pela OpenAI: https://platform.openai.com/docs/guides/embeddings/how-can-i-retrieve-k-nearest-embedding-vectors-quickly
Zilliz tem um produto de código aberto Milvus: https://github.com/milvus-io/milvus
-Compile e execute compilação e DevOps
Como executar modelos grandes em dispositivos locais e dispositivos de baixo custo é um obstáculo à distribuição de capacidades de IA.
MLC-LLM (Machine Learning Compilation-LLM) é uma ferramenta de compilação para ML. Ele permite que modelos grandes sejam executados localmente. https://mlc.ai/mlc-llm/
A experiência de uso é a seguinte. Instale a ferramenta mlc-chat-cli-nightly por meio do conda no ambiente local, baixe o modelo do Hugging Face e execute o modelo grande no Mac local para perguntas e respostas:
Execute modelos grandes localmente em dispositivos móveis:
6. Conclusão
Modelo grande: Para grandes modelos de código fechado, como GPT, os desafios estão na cenárioização do modelo, segurança de dados, precisão, eficiência de depuração, engenharia imediata e acoplamento de interfaces de engenharia. Os modelos de código aberto de autoimplantação não são estritamente modelos grandes. Os desafios estão na velocidade, no desempenho e no desempenho de benchmark.
Middleware: conecta a camada de modelo e a camada de aplicação, fornece plug-ins de conhecimento em campos específicos; expande cenários de aplicação e fornece interfaces de aplicação rapidamente; reduz custos de desenvolvimento e operação e manutenção.
Camada de aplicação: tolerância do desempenho do modelo em cenários de uso, benefício = valor de uso – custo de integração; resposta a riscos: ilusão de IA, segurança de IA.
A interface do usuário é a cola forte que conecta pessoas e computadores. O design do produto ocorre nesta interface. A revolução causada pela GPT terá um enorme impacto na interface do produto. O conteúdo deste artigo é minha pesquisa e compilação de informações relacionadas à IA nos últimos meses. Esta rota evolutiva precisa considerar que o desempenho do modelo é imperfeito, começando pela interação de texto, expandindo-se para multimodalidades ricas e diversas e usando novas experiências interativas para atender a necessidades antigas e novas.
A questão central da revolução da IA sempre será: o que é essa interface?
Deixe-me terminar com as palavras de Lennon: No final tudo ficará bem. Se não estiver bem, não será o fim.
# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.