Por que ousariam cobrar mil yuans a mais por ano por um cartão de gravação que custa mil yuans?

Nota do editor:
Quando a IA começa a buscar sua própria forma, algumas de suas escolhas são inesperadas.
A inteligência artificial deu origem a um botão dedicado em smartphones, aparentemente reacendendo seu impulso evolutivo há muito perdido. Os óculos, com seu acesso natural à visão e à audição, começam a se assemelhar à próxima geração de terminais pessoais. Alguns dispositivos pequenos e focados parecem mais confiáveis ​​do que os dispositivos multifuncionais em certos momentos. Enquanto isso, tentativas radicais de substituir smartphones por dispositivos descartáveis ​​foram recebidas com frieza.
A implementação de tecnologia nunca se resume apenas a acumular funções; também envolve os hábitos das pessoas, a adequação aos cenários e a redefinição do conceito de "fácil de usar".
ifanr lança a coluna "Crônicas dos Gadgets de IA", com o objetivo de observar, junto com você: como a IA está mudando o design de hardware, como está remodelando a interação humano-computador e, mais importante, de que forma a IA entrará em nosso dia a dia?
Este é o 9º artigo da série Crônicas de Objetos de IA.

Nos últimos anos, o "hardware de IA" tornou-se muito popular, mas parece inevitavelmente se enquadrar na narrativa de "vendas pontuais".

A conferência de imprensa apresentou um conceito grandioso, utilizando ideias e imaginação para concluir a primeira fase de persuasão. No entanto, após a implementação pelos usuários, descobriu-se que suas funcionalidades não correspondiam à narrativa que prometia.

Como resultado, a frequência de uso do produto despencou e ninguém estava disposto a continuar pagando pelo serviço pós-venda. Por fim, o número de usuários ativos diários caiu para algumas centenas, levando a um fim desastroso.

Mas a Plaud quebrou esse ciclo vicioso: não só lucrou com meu gravador de voz, como também planejou continuar lucrando US$ 1.000 comigo todos os anos, chegando eventualmente a US$ 250 milhões por ano.

Mais importante ainda, estou realmente disposto a investir nisso, especialmente porque o conceito de hardware de IA ainda é muito questionado, o que estabeleceu diretamente todo um modelo de negócios.

O hardware é o ponto de entrada, o aplicativo é o núcleo.

O plano inicial gratuito da Plaud inclui 300 minutos de transcrição.

No entanto, para um usuário que precisa de habilidades de gravação profissionais e, portanto, precisa comprar um gravador de voz, 300 minutos é apenas um pacote de teste.

Subindo na faixa de preço, a versão profissional custa 339 yuans por ano e oferece 1200 minutos de transcrição por mês, enquanto a assinatura "Premium" custa 1099 yuans por ano e oferece tempo ilimitado.

É aqui que as coisas ficam interessantes. O preço de um gravador de voz Plaud Note é de apenas cerca de 1049 yuans.

Em outras palavras, o custo de uma assinatura anual pode ser até mais caro do que o próprio hardware.

Qual é, afinal, o segredo do Plaud que faz com que as pessoas estejam dispostas a gastar 1.000 yuans para comprar um gravador de voz e, em seguida, continuar gastando 1.000 yuans todos os anos para usá-lo?

Na verdade, o que constitui a experiência central do Plaud não é o hardware do gravador de voz em si, mas o aplicativo que o acompanha.

Este aplicativo é bastante puro; todas as suas funções giram em torno do processamento de "gravações", o que lhe confere um aspecto sofisticado e profissional.

Sua função principal é a de "notas": o Plaud utiliza um modelo complexo para processar o conteúdo gravado. Você pode deixar tudo a cargo do Plaud, que gera as notas com um único clique, ou pode selecionar o idioma, o modelo de IA e o modelo de transcrição.

Mas o que realmente diferencia o Plaud em termos de "resultados" é o seu recurso de modelos, que acredito ser o principal fator que justifica o investimento.

O site oficial disponibiliza inicialmente uma grande quantidade de modelos prontos, abrangendo diversos cenários e profissões, como reuniões, discursos, telefonemas, entrevistas, assuntos médicos, financeiros e jurídicos. Há também alguns modelos "funcionais" que analisam as intenções do orador e a dinâmica de poder na gravação, podendo até mesmo analisar a dinâmica psicológica e a honestidade do falante.

Em essência, os modelos da Plaud são longas sequências de instruções fixas. Eles usam modelos grandes para organizar e direcionar as gravações. O que a Plaud vende são conjuntos de instruções pré-escritas.

Por se tratar de um prompt, ele permite naturalmente que os usuários criem seus próprios modelos — isso é muito semelhante a um produto feito por alguém que realmente entende do assunto, porque, muitas vezes, os modelos genéricos não são adaptados às necessidades individuais; o que é realmente valioso é a sua própria lógica para processar informações.

Por exemplo, realizamos uma reunião de seleção de tópicos todas as manhãs, que envolve pontos-chave como conteúdo do tópico, essência do tópico, informações essenciais e editores responsáveis. A transcrição comum pode registrar esses pontos, mas é difícil transformá-los em algo que possa ser executado diretamente.

Mais tarde, simplesmente escrevi um modelo para o Plaud e o configurei para organizar os dados de acordo com essas dimensões. O resultado final foi muito claro: cada tópico foi dividido separadamente e cada tarefa foi atribuída com precisão.

Ao utilizar diferentes modelos, a mesma gravação pode ser analisada e destilada de maneiras distintas. Através do processamento repetido, podemos extrair as informações mais valiosas da gravação.

Uma das impressões que Plaud me passa é que é uma empresa muito voltada para as pessoas.

Muitos produtos de gravação, como o Lark Notes, são centrados nas próprias "gravações de reuniões". Cada vez que uma gravação é concluída, anotações são geradas automaticamente e podem ser usadas diretamente para atribuir tarefas.

Mas o Plaud é construído em torno do que as "pessoas" ouvem, focando na interação entre elas. Primeiro, ele grava 100% e, em seguida, por meio de resumos e modelos, retém e destaca os 50% do conteúdo mais valioso e apresenta os 10% essenciais.

Diferentes modelos representam diferentes maneiras de visualizar a informação original. Use o modelo que melhor se adequa aos seus interesses — ele não substitui o pensamento humano, mas pode oferecer perspectivas diferentes.

Ao reter as informações originais mais essenciais e adicionar as memórias e experiências geradas pelo cérebro humano durante a conversa, o nível de compreensão que pode ser alcançado por meio da comunicação pode ser verdadeiramente maximizado.

"Eletricidade e Iluminação" na Era da Inteligência Artificial

Embora seja um "hardware de IA", a Plaud não lucra com o "hardware" em si; a maior parte de sua receita vem de assinaturas.

Este é o modelo de negócio clássico das "lâminas de barbear": os fabricantes de lâminas vendem não apenas a lâmina em si, mas também lâminas de reposição. Após a compra do aparelho, os usuários precisam continuar pagando e ficam presos a um ecossistema.

No contexto atual, assemelha-se a uma lógica padrão de "precificação orientada por IA". A principal diferença entre os diferentes níveis de assinatura não reside na qualidade e velocidade, mas na duração, quantidade e no número de "Tokens" que você está disposto a pagar.

Claro que isso não significa que o gravador de voz da Plaud seja inútil. Para usuários que gravam com frequência, um acessório físico específico para gravação pode melhorar muito a experiência.

Será que a Plaud, assim como a OpenAI, lucra com "modelos de IA"? Não parece.

A excelente experiência do usuário do Plaud é de fato garantida por um amplo modelo de linguagem, e você pode escolher entre vários modelos, como DeepSeek, Qianwen e Doubao. No entanto, o "modo automático" padrão é a essência do Plaud: ele permite que você se preocupe menos com os detalhes técnicos e obtenha os resultados diretamente.

Essa é também a característica mais marcante da era da IA: pagamos pelos resultados, não pelas ferramentas em si ou pelo processo.

A Plaud não vende "IA" em si; ela não cria seus próprios modelos de grande escala. Em vez disso, vende um "método de usar IA".

Essencialmente, os grandes modelos de IA são apenas uma força motriz, semelhante à água e à eletricidade. Eles têm uma energia enorme, mas ainda não os desenvolvemos o suficiente e não ultrapassamos o âmbito dos chatbots.

Assim como há 200 anos, ninguém sabia para que serviria a descoberta da eletricidade por Faraday, até que as lâmpadas elétricas, os telefones e outros aparelhos elétricos surgiram.

Plaud é a "lâmpada" da era da IA.

Os ambiciosos Rabbit R1 e Humane Ai Pin são mais como produtos da "identificação de problemas com IA" no contexto da onda da IA ​​generativa.

Em resumo, são essencialmente formas de hardware que utilizam "IA pela IA", sem se vincularem verdadeiramente a um cenário de usuário específico ou usarem a IA para resolver problemas do mundo real.

Para a Plaud, a IA não é importante. Desde o início, a empresa só queria fazer um bom trabalho de "gravação". O modelo de IA em larga escala é apenas o caminho mais curto para atingir esse objetivo.

Assim como o problema da iluminação que aflige a humanidade desde os tempos antigos, os humanos já haviam inventado velas antes das luzes elétricas, mas a eficiência e o efeito de iluminação das luzes elétricas superaram em muito os do passado, então optamos pelas luzes elétricas.

A Plaud funciona com uma lógica semelhante. Temos um grande modelo de IA com capacidades de processamento de linguagem sem precedentes, então o usamos para resolver problemas em cenários de gravação e tornar a "gravação" melhor do que nunca.

Certamente podemos usar chatbots existentes como o ChatGPT ou o Gemini para nos ajudar a processar essas gravações, mas para obter bons resultados, precisamos de palavras-chave de alta qualidade. Se o modelo não for bom o suficiente, temos que alterá-lo, o que não é uma forma intuitiva de usá-lo.

O Plaud, por outro lado, não exige que os usuários considerem qual modelo grande usar ou forneça sugestões melhores. Ele oferece uma certeza que proporciona bons resultados aos usuários com um único clique.

Além disso, dentre um grande número de produtos similares, o Plaud é o que apresenta maior "certeza".

O que estamos dispostos a pagar é por essa certeza — a certeza de acesso instantâneo sem a necessidade de uma "loteria".

O hardware de IA deve absorver a "complexidade".

Muitas pessoas não sabem, de fato, como usar a IA.

O "não consigo" mencionado aqui se refere a duas coisas: primeiro, não buscar ativamente produtos de IA, mas, mais importante, não saber como usar a IA, presumindo que simplesmente inserir uma breve mensagem em uma caixa de diálogo permitirá que ela entenda completamente suas intenções e forneça um resultado utilizável imediatamente.

O problema reside aqui: o número de pessoas realmente dispostas a investir tempo pesquisando prompts, fluxos de trabalho e diferenças entre modelos — em outras palavras, aquelas que "sabem usar IA" — é extremamente pequeno. A maioria dos usuários não tem a paciência nem a necessidade para isso. Eles precisam de resultados, não de se tornarem engenheiros de prompts semi-especialistas.

Afinal, nossa expectativa em relação à IA é alcançar os melhores e mais numerosos resultados com o mínimo esforço.

Se você não sabe como usar IA, então não saberá como um produto de IA qualificado e utilizável deve ser — por isso, a indústria tecnológica atual está repleta do chamado "hardware de IA" que é pura propaganda e nenhum valor; que tem IA, mas nenhuma capacidade.

As pessoas veem muita publicidade e confundem facilmente a capacidade de conversar, gerar e contatar modelos com um produto consolidado, mas isso está longe de ser suficiente.

Um bom produto de IA deve fazer pelo menos duas coisas: primeiro, deve saber que é improvável que os usuários utilizem IA, portanto, não deve repassar o custo de aprendizado para eles; segundo, deve ser capaz de comprimir as capacidades originalmente voláteis do modelo em um resultado relativamente estável.

É aí que reside o valor do Plaud; ele resolve um problema muito real: nem todos querem aprender IA, mas todos querem que as coisas sejam feitas.

Antes do Plaud, todos eram iguais. Todos apertavam o mesmo botão e recebiam o mesmo conteúdo de alta qualidade. A única diferença era a quantidade de conteúdo que podiam obter após a assinatura.

Um "modelo" mais avançado é o "guia rápido" fornecido pela Plaud, que permite escolher as sugestões apropriadas com base nas suas necessidades; se isso não for suficiente, vários modelos criados por usuários são um complemento ainda mais poderoso. Você não precisa estudá-los; a Plaud oferece os benefícios da IA ​​diretamente para você.

Assim como acontece com as compras dentro do jogo, o Plaud ajuda você a pesquisar os modelos de linguagem em constante evolução e a criar sugestões melhores e mais elaboradas, eliminando completamente a ansiedade de ficar para trás.

A Plaud basicamente vende um plugin de "IA para speedrun" que simplifica as complexidades e suaviza as falhas para você.

Não é difícil de afirmar, mas pouquíssimas empresas conseguem se concentrar em uma única atividade e dedicar todos os seus recursos a ela. Grandes fabricantes com atuação em diversas áreas buscam ser "generalistas" em vez de "especialistas" e dificilmente investirão tantos recursos em apenas uma função de gravação. Enquanto isso, pequenas startups não possuem a experiência e o conhecimento necessários para alcançar esse nível de excelência.

É por isso que a Plaud se tornou líder do setor: porque é pura e focada exclusivamente na gravação. Como resultado, todos os seus recursos são dedicados a refinar o som diariamente, tornando-a mais precisa e eficiente que a concorrência.

Não inventou um mundo completamente novo, nem apresentou visões particularmente extravagantes do futuro. Simplesmente comprovou um ponto crucial: nesta fase, os produtos de IA mais valiosos muitas vezes não são os que possuem as capacidades mais chamativas, mas sim os que oferecem maior segurança às pessoas comuns.

Espero ver cada vez mais "Elogios".

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.