A Lark e a Anker se uniram para criar um feijão com inteligência artificial, seu “cérebro externo”, pesando apenas 10 gramas.

O setor de hardware de IA tem sido realmente difícil de avaliar no último ano.
Entre os diversos dispositivos de IA apresentados na CES no início deste ano, estavam um cortador de cabelo com IA que deixou muitos perplexos, uma namorada holográfica que prometia companhia por meio de IA e um chuveiro com IA que parecia determinado a incorporar o ChatGPT em todos os aspectos da vida cotidiana…
O mercado de hardware de IA foi inundado por inúmeras "pseudonecessidades" impulsionadas por exageros e truques de marketing. Após um período de intensa competição, os dispositivos de gravação com IA, que visavam precisamente a necessidade essencial de "gravar e organizar", emergiram como uma das poucas categorias sobreviventes. No entanto, a inovação neste setor parece ter entrado em um ciclo vicioso. Todos estão começando a lançar designs "do tamanho de um cartão de crédito", tentando tornar os gravadores de voz finos e volumosos o suficiente para serem acoplados à parte traseira de um telefone…
Existe uma solução melhor? A Anker Innovations, em colaboração com a Lark, apresentou uma resposta contraintuitiva. Desta vez, em vez de fabricar cartões convencionais, eles criaram um grão de IA para gravação de áudio de 10 gramas.
A APPSO teve acesso a este novo produto uma semana antes do lançamento, e em poucos dias ele se tornou parte integrante do meu fluxo de trabalho. Usamos em nossas roupas, penduramos em nossos computadores, realizamos reuniões editoriais, assistimos a lançamentos de produtos — quando nos deparamos com qualquer tipo de entrada de informação de alta densidade, agora o ligamos inconscientemente primeiro.

Nossa conclusão é que esta pode ser a "tecnologia obsoleta" menos ultrapassada do ano, e ainda assim a ferramenta de produtividade mais "salvadora". Além do seu design impecável — ela me acompanha aonde quer que eu vá, gravando tudo o que faço — o aspecto mais importante é o suporte da IA do Lark. Ela não só fornece resumos de IA em tempo real, como também transforma gravações de arquivos independentes em documentos online colaborativos, integrados diretamente à minha base de conhecimento do Lark e a todo o meu fluxo de trabalho.
Se você não suporta aqueles cartões magnéticos que eliminam a porta USB-C em prol da espessura e só podem ser carregados por contato, se está farto da sensação de ficar grudado na parte traseira do telefone e de ter o microfone bloqueado, então provavelmente deveria experimentar este AI Bean.


A principal mudança neste produto é que ele foi transformado em um acessório. Tem 23,2 mm de diâmetro, pesa 10 gramas e tem aproximadamente o tamanho de uma moeda. A vantagem direta disso é que podemos prendê-lo na gola da camisa como um broche ou usá-lo como um colar.
Você pode sonhar acordado à vontade durante a próxima reunião.
Se o formato do hardware resolve o problema de "facilidade de transporte", então a interação do software precisa resolver o problema de "facilidade de uso".
Na era dos gravadores de voz, o fluxo de trabalho comum era linear: gravação -> transcrição. Mas, ao se deparar com reuniões que duram uma ou duas horas, mesmo com alta precisão na transcrição, ler milhares de palavras em formato cascata continua sendo um desastre.
Mesmo na era da IA, a lógica de funcionamento de vários sistemas de gravação ainda é essencialmente linear. A maioria dos sistemas de IA precisa primeiro converter a gravação em texto e, em seguida, gerar um resumo refinado com base no conteúdo do texto.
Essa experiência de ter que esperar até o final da reunião para obter o resumo da IA parece ser um viés retrospectivo.
Ao utilizarmos esse hardware de gravação com IA, o incluímos em diversas reuniões de seleção de tópicos conosco e observamos algumas mudanças diferentes.
Minha impressão mais direta é que isso transforma nosso brainstorming, originalmente coloquial, fragmentado e até um tanto incoerente, em um mapa lógico visualizado em tempo real.
As sessões de brainstorming costumam ser muito diversas. Frequentemente, estamos discutindo as características das startups de IA atuais, e então desviamos o assunto para a lista de bilionários globais da Forbes, e depois falamos sobre como algumas pessoas na empresa estão tirando licença, e como a gripe H1N1 está se alastrando na primavera.

▲ Resumos em tempo real estão disponíveis em duas versões: diagrama de Ishikawa (ou diagrama de espinha de peixe) e resumo textual.
A capacidade de atenção humana normalmente dura apenas de 15 a 20 minutos, e é muito provável que se disperse assim que a conversa entrar em um novo assunto . Mas o resumo em tempo real da Lark AI age como uma mão invisível, trazendo você rapidamente de volta ao ponto principal.
Se fosse qualquer outra IA, eu provavelmente teria que voltar e ler todo o seu discurso daquele período, já que o texto transcrito seria longo, confuso e ilógico.
Enquanto conversávamos lá em cima, o sistema filtrava silenciosamente as bobagens e listava os tópicos que propusemos, descrevendo a viabilidade, a abordagem e as etapas de execução para cada um deles.
Com essa estrutura organizada gerada em tempo real, podemos descobrir rapidamente "o que fazer a seguir", em vez de ficarmos presos ao "que acabamos de dizer".
Nesse processo, a IA deixa de ser uma ferramenta para processamento pós-evento e se torna um "segundo cérebro" que opera em paralelo à reunião. A ditado é apenas o básico; seu grande diferencial é a análise em tempo real da lógica do diálogo.
A IA Lark consegue organizar a lógica com base no conteúdo e apresentá-la em tabelas e linhas do tempo adequadas. Isso não só melhora significativamente a eficiência das reuniões, como também facilita a obtenção de informações como nunca antes.
Além de participar de reuniões, também mantínhamos esse dispositivo de gravação conectado ao computador para que pudéssemos assistir a uma coletiva de imprensa juntos.

Inicialmente, pensei que o reconhecimento de múltiplas pessoas ao falar com alto-falantes de computador poderia não ser muito preciso, já que não se trata de uma pessoa real falando em um ambiente tridimensional; no entanto, o desempenho foi bastante bom ao interagir diretamente com os alto-falantes do computador.
Assistimos a um evento de lançamento da OpenAI e a Lark AI conseguiu reconhecer que, na transmissão ao vivo online, Altman começou a falar primeiro, seguido por outros colegas da OpenAI. Da mesma forma, a Lark conseguiu resumir a parte atual da apresentação em tempo real, com base na fala de cada pessoa.
Na área de IA, traduzir textos brutos em inglês é algo comum. Antes, tínhamos que manter um plugin de tradução aberto enquanto fazíamos anotações em outra janela – um processo caótico e frustrante.
Mas este pequeno dispositivo de gravação teve um desempenho notável. O aspecto mais difícil da tradução simultânea é a "tradução automática complexa" causada pela falta de contexto, mas o Lark AI pareceu "entender" o contexto e ajustar sua estratégia de tradução em tempo real. Diante de termos técnicos frequentes, sua velocidade de reação e precisão superaram minhas expectativas, e todo o processo transcorreu praticamente sem qualquer constrangimento por falta de clareza.

▲ De acordo com a descrição do aplicativo, ele oferece suporte à tradução em tempo real de 24 idiomas e também consegue distinguir entre falantes em tempo real.
Isso é crucial para os profissionais da mídia: ser capaz de obter informações precisas e estruturadas mais rapidamente do que os outros durante uma coletiva de imprensa em andamento é uma vantagem competitiva fundamental.
Após o término da gravação, o que recebemos não foi mais um relato cronológico, mas um resumo inteligente, logicamente rigoroso e focado nos pontos principais.
Nesta ata inteligente, mesmo após várias horas de reuniões intensas, a IA Lark consegue resumir discussões complexas em um único gráfico. Este quadro de resumo é editável, como um slide do PowerPoint.

▲ Uma tela gerada pela IA Lark no navegador da web, mostrando a página de edição.
Você nem precisa ler o resumo escrito. Na maioria das vezes, consigo entender a reunião basicamente só olhando para este diagrama. O conteúdo específico de cada tópico é dividido em pontos e áreas, e destacado com cores diferentes.
Diferentemente da maioria dos resumos de áudio gerados por IA, o Lark AI seleciona automaticamente elementos visuais, como tabelas e gráficos, com base no conteúdo do diálogo para facilitar a leitura do resumo.

▲ Atas inteligentes com gráficos detalhados e recursos multimodais; incluindo resumos, capítulos inteligentes, decisões importantes e citações memoráveis, tudo organizado por IA.
A seção de lista de tarefas extrai diretamente os "itens a serem feitos" mencionados na reunião, juntamente com o cronograma. É comum haver confusão com esses cronogramas quando há muitas reuniões em um dia; agora o Lark oferece uma seção separada para isso.
O mesmo princípio se aplica a capítulos importantes, decisões-chave e momentos memoráveis. Organizá-los separadamente tem a grande vantagem de me permitir localizar rapidamente a transcrição completa das conversas em que discutimos esse tópico em uma reunião.
É como um professor que destaca os pontos principais após a aula, organizando todo o conteúdo que vale a pena revisar para que não precisemos fazer anotações extras.
Mais interessante ainda, antes da gravação completa da ata pela IA, podemos obter um resumo rápido. Ao pressionar o botão de finalizar gravação, uma pequena janela será exibida imediatamente no aplicativo Lark, mostrando o resumo com os pontos principais e as tarefas pendentes.

▲ A janela de término sem espera fornece um resumo da reunião, uma lista de tarefas e os principais pontos abordados imediatamente após o término da reunião.
Este resumo rápido não é apenas uma ata de reunião qualquer; os anos de experiência da Lark na criação de documentos nos ensinaram o que queremos ver. Veja, por exemplo, nossa reunião matinal de seleção de tópicos. Este resumo instantâneo inclui um resumo, listas de tarefas e principais conclusões. A IA da Lark exibirá diretamente o conteúdo mais importante primeiro.
Cada registro está relacionado a trabalhos anteriores.
Resumos em tempo real, pré-visualizações rápidas de resumos, quadros brancos inteligentes… esses recursos são realmente poderosos, mas não são o verdadeiro diferencial deste gravador.
Seu grande diferencial é que ele elimina as barreiras entre hardware e software, permitindo que os dados fluam livremente.
Após recebermos a ata completa de cada reunião de seleção de tópicos, podemos analisá-la mais detalhadamente. Em um celular ou site, abra o Miaoji, encontre a ata que acabou de ser gravada e você poderá visualizar o relatório completo.

▲ Captura de tela da página Notas no aplicativo Lark, mostrando os dispositivos conectados e os arquivos processados.
Esses recursos de IA também são destaques de outras marcas, mas, em nossa experiência, descobrimos que a Lark possui uma vantagem competitiva que nenhuma outra plataforma consegue igualar.
O maior problema com muitos gravadores de voz com IA é que os dados são estáticos. Após a gravação, o arquivo é armazenado no aplicativo, mas quando você quer usá-lo, precisa exportá-lo, salvá-lo como um documento, compartilhá-lo e, em seguida, abrir o WeChat para enviá-lo aos seus colegas.
Mas este dispositivo de gravação é diferente; ele faz parte do ecossistema Lark, sendo um dispositivo independente. Cada palavra gravada não existe no hardware, mas flui diretamente para a base de conhecimento do Lark.
A maioria dos aplicativos de gravação com inteligência artificial só consegue fazer perguntas com base no arquivo atual. No Lark, porém, o arquivo de gravação pode ser integrado a todo o conteúdo da nossa biblioteca de documentos do Lark, e a IA do Lark responderá com base em toda a base de conhecimento.

▲ O recurso Perguntas e Respostas sobre Conhecimento oferece acesso direto a todos os documentos do Lark, incluindo conteúdo gravado usando hardware de gravação de áudio com inteligência artificial, como atas inteligentes e gravações de texto completo.
Por exemplo, quando registramos informações sobre o navegador ChatGPT Atlas no evento de lançamento da OpenAI, fizemos uma pergunta na plataforma de perguntas e respostas do Lark: "Quais navegadores de IA estamos acompanhando?". Ele conseguiu pesquisar em todos os meus documentos e lembrar do Google Chrome, do navegador de IA da Microsoft e de outros sobre os quais eu já havia escrito.
É uma sensação maravilhosa; o Lark parece ter aberto um portal conveniente para o mundo físico para mim. Além de digitar, agora posso armazenar coisas na base de conhecimento simplesmente falando.
Construir uma base de conhecimento é uma tarefa muito árdua para a maioria dos usuários. Nossas ideias podem estar espalhadas por qualquer canto do mundo, e é por isso que o conceito de "Flash Capsule" permanece popular desde sua criação, há alguns anos. Organizar todas as ideias em nossas mentes e toda a nossa produção em uma base de conhecimento sistemática, lógica e pesquisável é bastante difícil.
Mas, ao usar essa ferramenta de gravação, descobri que o fardo de construir uma base de conhecimento praticamente desapareceu . Arquivos de gravação que antes eram considerados silos de dados se tornaram minha fonte inesgotável de munição criativa. Até mesmo aquelas ideias que foram rejeitadas na reunião de seleção de tópicos agora podem ficar guardadas na base de conhecimento, esperando para serem retomadas algum dia.
Isso é algo que outras plataformas de gravação com IA não conseguem me oferecer. Somente integrando documentos, registros de bate-papo, calendários e reuniões é que esses dados de áudio realmente ganham vida.

▲ Calendário, documentos na nuvem, perguntas e respostas, mensagens, videoconferências, etc., a gravação com IA integra todo o ecossistema Lark.
As atas geradas por IA são inerentemente colaborativas. Você pode exportá-las diretamente como Word ou PDF, ou compartilhá-las com colegas com um único clique. Os membros da equipe podem comentar, destacar e colaborar diretamente nessas atas multimodais que incluem áudio, texto e gráficos.
O melhor hardware de IA deve ser invisível, imperceptível e, ainda assim, útil.
Em comparação com empresas de hardware que tentam convencer os usuários de que "você precisa de uma IA", a abordagem conjunta da Anker Innovations e da Lark parece muito mais pragmática.
Em vez de tentar criar um dispositivo completamente novo e estranho que os usuários nunca viram antes, a empresa se concentrou no cenário consolidado de "gravação e reprodução", que já foi comprovado inúmeras vezes, e o aperfeiçoou.
A Anker Innovations aproveitou seus anos de experiência em engenharia de hardware para reduzir o dispositivo ao tamanho de um botão de 10g, resolvendo os problemas de transporte e uso, tornando o hardware invisível e a gravação perfeita.
A Lark, por outro lado, alavanca seu principal diferencial: uma profunda compreensão de "como as pessoas se comunicam". Por estar tão familiarizada com cenários de comunicação complexos e profissionais, a Lark tornou-se uma ferramenta indispensável e eficiente no escritório ou ambiente de trabalho. Portanto, ao se deparar com discussões longas, desconexas ou até mesmo contraditórias em gravações, ela consegue decompor a linguagem falada em conclusões claras, listas de tarefas e consenso.
O Lark realmente eleva o nível, passando de simplesmente ouvir a voz para compreender a intenção, permitindo que os dados transcendam a mera gravação e se transformem em decisões práticas dentro da sua base de conhecimento do Lark. 
Talvez este produto não nos faça gritar como se estivéssemos assistindo a um filme de ficção científica, nem seja um daqueles conceitos criativos de tirar o fôlego da CES. Mas para quem precisa processar informações, é uma ferramenta de produtividade que você teria prazer em carregar consigo todos os dias, capaz de transformar conversas perdidas em oportunidades valiosas.
Na atual explosão de hardware de IA, talvez não precisemos de um terminal de IA completamente novo que tente substituir os telefones celulares. O que talvez precisemos seja simplesmente de uma "interface" que possa conectar melhor o mundo físico e os ativos digitais.
#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.

