Precisamos de mais aplicadores de IA que não construam grandes modelos
Tudo em IA, em 2024 esse nó quase se tornará o tema principal das empresas de tecnologia da Internet.
Parece que o mundo inteiro caiu no AI Fomo (fobia de IA de perder). As empresas de tecnologia lançaram uma corrida armamentista em grande escala para alcançar o OpenAI. Indivíduos comuns estão preocupados em serem substituídos pela IA, então a IA de 199 yuans curso ganhou um grande número de fãs.
Na “Batalha de Centenas de Modelos” que assola a China, o Kingsoft Office é considerado um caso atípico. Esta empresa, que possui a maior participação no mercado nacional de software de escritório e fluxo de caixa abundante, não investiu na concorrência de grandes modelos, mas é a primeira na China a lançar o assistente de escritório inteligente WPS AI baseado em grandes modelos de linguagem.
Na Conferência de Produtividade do Kingsoft Office de ontem, o CEO Zhang Qingyuan enfatizou mais uma vez que o Kingsoft Office é um aplicador de modelos grandes e atualmente está conectado a quase todos os grandes modelos convencionais na China.
Desta forma, Kingsoft Office, que é All in AI, está experimentando o terceiro nó importante depois de passar da era do PC para a era da Internet móvel nos últimos 36 anos.Os dois primeiros nós afetaram a tendência do mercado de software de escritório da China. .
Na década de 1980, Qiu Bojun trancou-se no quarto 501 do Caiwuwei Hotel em Shenzhen por 14 meses, usando um computador 386 para digitar 120.000 linhas de código assembly. Em 1988, nasceu o WPS 1.0.
Em 2002, o funcionário nº 6 da Kingsoft, Lei Jun, liderou mais de 100 engenheiros para passar três anos reescrevendo mais de 5 milhões de linhas de código WPS e lançou o WPS 2005, que é totalmente compatível com o Microsoft Office.
▲ Lei Jun (esquerda) e Qiu Bojun
Agora, a chegada de grandes modelos começou a mudar a forma como os aplicativos de software são usados e desenvolvidos. Zhang Qingyuan acredita que até mesmo a palavra UI (User Interface) desaparecerá no futuro. A Kingsoft também suspendeu todos os negócios não relacionados à IA desde o ano passado e embarcou em uma transformação abrangente.
Ifaner previu no ifanRank no início do ano que estamos caminhando para a "era das grandes aplicações" de instrumentalidade, universalização e industrialização. Em 2024, veremos mais aplicações nativas de IA que atendam às necessidades dos consumidores ou das empresas.
O caminho dos grandes modelos está gradualmente a ficar saturado e, obviamente, precisamos de mais empresas que se concentrem na implementação de produtos de IA para transformar capacidades de grandes modelos em produtividade e criatividade da indústria.
O mito da produtividade da IA
Olhando para as ferramentas populares de IA do ano passado, seja o Copilot da Microsoft ou o Sora, que começou a aparecer na tela durante o Festival da Primavera, muitas vezes há duas palavras de alta frequência que aparecem junto com ele – subversão e substituição.
Embora estas ferramentas de IA sejam concebidas para melhorar a produtividade, em comparação com as melhorias de eficiência que podem trazer, quantos empregos podem ser substituídos e quais indústrias são interrompidas é sempre o tema mais discutido. Muitas organizações estão até dispostas a calcular a percentagem precisa.
Qual é a natureza da ferramenta? Ajude-nos a realizar o que queremos com mais facilidade. Existem duas maneiras de melhorar a produtividade: melhorar a eficiência de uma única etapa, reduzir o número de etapas necessárias no processo da tarefa ou realizar as duas coisas ao mesmo tempo.
Uma série de ferramentas de IA impulsionadas por grandes modelos encurtaram enormemente o processo desde a proposta de requisitos até a concretização de ideias.
Basta dizer uma frase, deixar a IA descrevê-la em alguns segundos e, em seguida, gerar mais de 20 páginas de PPT.
Alguns vídeos que no passado exigiam filmagem e pós-produção agora são transformados em um comando imediato.
Mesmo que seja uma foto casual tirada com um telefone celular, os transeuntes ou detritos podem ser removidos circulando-os com o dedo.
Zhang Qingyuan previu em uma entrevista no ano passado que em cerca de um ano, as pessoas poderão usar "100 yuans por mês para contratar um assistente de escritório completo" para obter um novo controle sobre o software de escritório, incluindo quaisquer formulários, tabelas e cálculos complexos Todas as barras de ferramentas desaparecerão do software de escritório. Este método de “assinatura” mudará fundamentalmente o modelo de negócios do software de escritório.
Por trás disso está, na verdade, o fato de que a IA acelerou o processo de democratização do poder da computação.
Fu Zihao, gerente de produto da WPS AI, fez uma observação em um compartilhamento não muito tempo atrás: O surgimento de grandes modelos não pode ser comparado ao surgimento da Internet móvel. É mais como a era do nascimento do PC e do nascimento da nuvem.
À medida que as necessidades e os cenários emergentes na sociedade humana se tornam cada vez mais complexos, o poder computacional do cérebro já não é suficiente e começamos a expandir o poder computacional através dos computadores. Mas o limite para liberar totalmente o poder da computação não é baixo. Você pode precisar conhecer linguagens de programação. Mesmo as tabelas Excel e PS comumente usadas não são fáceis de usar.
AIGC resolve o problema do limite de poder computacional: desde que você use uma linguagem natural, o computador pode entender sua lógica de pensamento e gerar resultados, encurtando bastante a cadeia da ideia ao resultado.
Se você entende essa lógica, sua resposta à recente entrevista de Sam Altman sobre quantos empregos a IA substituirá pode ser mais ressonante. A maneira como Altman pensa sobre isso não é a porcentagem do trabalho que a IA fará, mas a porcentagem da tarefa que a IA fará durante um período de tempo.
Acho que esta é uma questão mais interessante, impactante e importante do que quanto trabalho a IA pode realizar, porque é uma ferramenta que pode funcionar em níveis cada vez mais complexos, em escalas de tempo cada vez mais longas. Concluir cada vez mais tarefas e permitir que as pessoas operem de uma forma mais flexível. Então talvez as pessoas sejam mais produtivas.
Esse pensamento não é valioso apenas para os usuários, mas também para os desenvolvedores de ferramentas de IA. Porque o que os usuários realmente precisam não é de modelos com parâmetros cada vez maiores, mas de ferramentas que lhes facilitem a implementação de suas ideias, como uma resposta clássica de Steve Jobs:
Devemos começar com a experiência do usuário e depois voltar a desenvolver a tecnologia, em vez de começar com a tecnologia, e depois tentar pensar em maneiras de ver onde essa tecnologia pode ser usada.
Interação copiloto
No artigo "O primeiro ano do grande modelo, o sistema operacional da civilização humana está passando por uma grande atualização", mencionamos que a próxima geração do revolucionário modo de interação humano-computador pode ser a interface natural do usuário (NUI).
O princípio fundamental do NUI é a simplicidade acima de tudo. A complexidade é inimiga das interfaces de usuário naturais. Cada interação deve ser autoexplicativa e não exigir manual de instruções.
Copilot é a forma ideal de ferramenta de IA sob a lógica interativa NUI. A palavra copiloto é derivada do termo aviação e refere-se ao copiloto que auxilia o piloto principal na operação da aeronave. Quando o piloto principal precisa descansar ou realizar outras tarefas, o copiloto assume o controle. Os dois são conjuntamente responsável pelo voo seguro da aeronave.
Penso que esta é também a descrição mais apropriada da interação humano-IA. A Microsoft define o Copilot como: um aplicativo ou componente que usa tecnologia de processamento de linguagem natural ou grandes modelos de linguagem para ajudar as pessoas a concluir tarefas complexas ou cognitivas.
A WPS AI também considera a interação humano-computador como uma de suas três direções estratégicas, também chamada de Copilot, uma interação natural baseada em múltiplas rodadas de perguntas e respostas baseadas em linguagem natural, que pode ser profundamente incorporada em vários cenários de documentos e colaboração.
Por exemplo, o WPS AI Enterprise Edition lançado ontem pode fornecer serviços digitais aos funcionários com "artes liberais e ciências", como assistentes de leitura, assistentes de desenho, assistentes de atendimento, análise de vendas, análise de contratos, etc., atingindo vários cenários sutis de escritório.
Entre eles, o Copilot Pro pode ajudar as operadoras a usar linguagem natural para conduzir produtos de BI para analisar dados, e também pode chamar API WPS 365 e API de propriedade empresarial para resolver necessidades de automação de escritório.
Os dados do GitHub mostram que 88% dos desenvolvedores que usam o GitHub Copilot dizem que são mais produtivos, 74% dizem que podem se concentrar em um trabalho mais satisfatório e 77% dizem que isso os ajudou a reduzir o tempo que gastam procurando informações ou exemplos.
Zhang Qingyuan tem uma descrição muito apropriada: a interação em linguagem natural reduz muito os custos de interação do usuário, o que significa que o Photoshop pode entrar diretamente no mercado de ferramentas como "Meitu Xiu Xiu".
Os usuários podem realizar funções complexas no Photoshop com a dificuldade interativa de operar o Meitu Xiuxiu. Esta situação está ocorrendo em cada vez mais tipos de produtos de IA. Se você prestar atenção às atualizações do WPS AI no ano passado, também descobrirá que a interface do usuário está sendo constantemente simplificada e a entrada em linguagem natural começa a substituir as funções de alguns botões originais.
Pode-se ver que o atual conjunto de processamento de documentos de escritório se transformou em um escritório de IA completo composto por "escritório + colaboração + IA". Um produto pode realizar cada vez mais tarefas com eficiência, mas integra cada vez menos módulos funcionais. Essa também será a tendência das ferramentas de IA.
A inovação em tecnologia é essencialmente a evolução da interação humano-computador. Quando o Copilot se desenvolver até certo ponto, toda a interface interativa pode até se tornar um superaplicativo. Não apenas os botões de função serão cancelados, mas muitos aplicativos em si poderão não precisar mais existir sozinho.
Precisamos de mais empresas de IA que não façam grandes modelos
Muitas pessoas consideram os grandes modelos ou AIGC como a quarta revolução industrial. Na verdade, se uma tecnologia deve ser rotulada como revolucionária, na verdade não se refere ao avanço tecnológico em si, mas à sua capacidade de afetar toda a sociedade empresarial e mudar a maior parte. pessoas. estilo de vida.
Seja a vapor, eletricidade ou Internet, não há dúvida de que atende a essas características, mas e o modelo grande? Pelo menos nesta fase não é definitivamente possível atingir este nível. O que precisamos é aproveitar as capacidades de grandes modelos através de produtos de aplicação de IA para impactar o trabalho e a vida das pessoas.
▲ Ng Enda
O cientista da computação Andrew Ng também acredita que , como uma nova geração de tecnologia de uso geral, a IA tem mais oportunidades em aplicações em larga escala .
É por isso que disse desde o início que precisamos de mais empresas de IA que não façam modelos. Grandes modelos são indispensáveis como tecnologia subjacente, mas as empresas de IA que se concentram em atender às diversas necessidades dos consumidores e às diversas transações comerciais definitivamente precisam de mais para fazer a IA realmente explodir no nível social.
Assim como a tecnologia multitoque, os aplicativos maduros existiam há mais de 20 anos, quando o iPhone original foi lançado, mas apenas a Apple tornou essa tecnologia uma solução interativa para quase todos os smartphones subsequentes.
Nesta onda de IA, também existem exploradores que não produzem modelos grandes, mas estão determinados a ser grandes usuários de modelos. Kingsoft Office é um dos melhores.
A estratégia do Kingsoft Office é muito pragmática e focada em cenários de implementação, alcançando cooperação profunda com quase todas as principais empresas nacionais de grandes modelos de IA, incluindo MiniMax, Zhipu AI, SenseTime, Wenxinyiyan, Tongyi Large Model, etc. .
A Kingsoft desempenha o papel de uma estação de triagem, responsável por determinar todos os problemas e cenários do usuário a serem resolvidos e então chamar o modelo mais adequado para executar a tarefa. Alguns cenários de nicho são complementados por pequenos modelos desenvolvidos pela própria Kingsoft Office para atender às necessidades.
Por exemplo, SenseTime é excelente em análise de dados e WPS AI o chama para lidar com cenários que exigem pensamento científico. Cenas como texto e PPT são completadas por meio de modelos como Zhipu AI.
A vantagem deste método de aplicação de quebrar um grande modelo em partes é que ele pode aproveitar ao máximo os pontos fortes de cada modelo e obter vantagens complementares sem ser limitado pelas capacidades de um determinado modelo. Até o GPT-4 apresenta deficiências em alguns cenários.
Na conferência de imprensa da WPS de ontem, Zhang Qingyuan mencionou um ponto que me impressionou profundamente. Ele disse que todas as funções que viu hoje podem ser experimentadas imediatamente e devem ser implementadas nos cenários reais de aplicação dos clientes.
Além da involução contínua do processamento de textos longos em caixas de bate-papo, que outras aplicações mais criativas existem para a IA? Vale a pena explorar isso por mais pessoas. Embora os aplicativos de grandes modelos estejam atualmente em sua infância, deveria haver mais aplicadores de IA como Jinshan.
# Bem-vindo a seguir a conta pública oficial do WeChat de aifaner: aifaner (WeChat ID: ifanr).Mais conteúdo interessante será fornecido a você o mais rápido possível.