Não fique muito animado com os recursos de IA do Samsung Galaxy S24

Uma renderização de um Samsung Galaxy S24 amarelo.
Arséne Lupin / X

“Uma nova era de IA móvel.” É assim que a Samsung está divulgando sua próxima linha de smartphones da série Galaxy S24 . Para o evento Unpacked que acontecerá no final deste mês, a empresa promete “uma experiência móvel totalmente nova alimentada por IA”.

Samsung não será o primeiro nome a mergulhar no hype da IA ​​​​despertado por empresas como ChatGPT e Midjourney . Os dois pesos pesados ​​do silício para smartphones – Qualcomm e MediaTek – recentemente fizeram um grande show sobre os recursos de IA generativa no dispositivo de seus mais recentes processadores principais e intermediários.

A mudança é evidente. IA será a palavra-chave do marketing para telefones. Mas o que exatamente nos espera? A forma como estes chamados “avanços da IA” irão acrescentar algum valor significativo permanece um segredo. Ou talvez seja apenas um truque existente esperando para ser reempacotado com um nome diferente ou aplicativo nativo.

A Samsung pode entregar a mercadoria ou vacilar espetacularmente

Teaser do Galaxy AI da Samsung.
É melhor que isso não seja um truque, Samsung. Samsung

Vamos começar com os telefones da série Galaxy S24. Eles serão fornecidos com o chip Snapdragon 8 Gen 3 da Qualcomm . A fabricante de chips está fazendo algumas afirmações ousadas sobre as capacidades generativas de IA de seu novo chipset de primeira linha. Por exemplo, diz-se que ele produz uma imagem a partir de prompts de texto em um segundo usando a tecnologia Stable Diffusion AI .

A Qualcomm ofereceu uma explicação técnica fascinante de como otimizou a tecnologia Stable Diffusion para operação no dispositivo. A rival MediaTek também afirma que os recursos de IA no dispositivo de seu carro-chefe Dimensity 9300 permitirão a geração de texto para imagem em menos de um segundo, cortesia da Difusão Estável.

No momento, já temos um telefone equipado com o mais recente carro-chefe da Qualcomm. O dispositivo em questão é o iQoo 12 , mas é interessante ver que os materiais de marketing do telefone não mencionam nenhum truque generativo de IA, especialmente o tipo que está sendo promovido pela Qualcomm e MediaTek.

Vamos supor que a Samsung será a pessoa destinada a oferecer esse recurso de geração de texto para imagem. O que isso vai conseguir no final do dia? No momento, não sabemos se o truque de texto para imagem será incluído em um aplicativo de terceiros ou se a Samsung irá integrá-lo em um de seus aplicativos.

A verdadeira questão é quanto valor isso agregará aos nossos padrões diários de uso de smartphones. O que um comprador médio do Galaxy S24 fará com imagens geradas com uma única linha de texto? Talvez eles usem essas imagens geradas por IA para adicionar um pouco de entusiasmo aos bate-papos ou fazer barulho nas redes sociais.

Mas ainda há algum atrito aqui. Você terá que gerar essas imagens a partir de uma linha de texto, salvá-las localmente (ou copiá-las diretamente para a área de transferência) e, em seguida, colar essas imagens de IA no aplicativo de bate-papo de sua escolha. A solução ideal seria se a Samsung integrasse de alguma forma o truque de geração de imagem para texto diretamente no teclado.

Demonstração de difusão estável da Qualcomm para telefones.
Qualcomm

Mais uma vez, por que ter tantos problemas quando emojis, GIFs e adesivos podem dar conta do recado? Além disso, a saída de 512 x 512 pixels não é resolução suficiente para colocar essas imagens geradas por IA em um trabalho de faculdade ou apresentação de trabalho.

Além disso, o sistema provavelmente não será gratuito. O vídeo de demonstração da MediaTek menciona uma opção Premium disponível. Os compradores do Galaxy S24 podem acabar atingindo um limite de tokens de texto para imagem quando atingirem um certo número de resultados, após o que serão rebaixados para um nível de velocidade de geração de imagem mais lento ou solicitados a pagar uma taxa de assinatura.

Mas se essa for a realidade, então a questão toda é discutível porque já temos soluções como o Dall-E da OpenAI por aí. Você pode obtê-lo para gerar imagens gratuitamente ou pagar pelo ChatGPT Plus para aproveitar as vantagens da geração de imagens mais rápida e detalhada com o modelo Dall-E 3 mais recente. Esse é apenas um dos muitos geradores de texto para imagem que existem.

A Qualcomm afirma que o Snapdragon 8 Gen 3 é o “primeiro a oferecer suporte a modelos multimodais Gen AI”. Isso significa que o chatbot (baseado no modelo Llama da Meta) executado nativamente em um telefone aceitará entradas na forma de texto e imagens, bem como voz. Mais uma vez, isso não é o único, pois o ChatGPT-4 já oferece esse recurso, embora por trás de uma assinatura.

Nós realmente precisamos disso?

Snapdragon AI Assistant em telefones.
Qualcomm

Um dos recursos mais promissores anunciados pela Qualcomm é a expansão de imagens de IA. Essencialmente, você pode expandir a tela de uma imagem em qualquer direção que desejar, e a IA generativa no dispositivo gerará pixels de forma inteligente com base no prompt de texto e adicionará mais objetos ao quadro original.

É incrível testemunhar esse truque – ver uma imagem se expandir com a adição de mais objetos, e o horizonte se ampliar como se um mestre pintor estivesse retocando seu trabalho. Mas você não quer fazer isso com as fotos que você clica em um telefone para salvá-las como uma memória. Usar a expansão generativa de IA neles é como poluir suas memórias com visuais e cenários falsos que você nunca experimentou.

A sumarização é outra grande aposta para implantação de IA generativa no dispositivo em telefones. É ótimo para ler as notícias e ficar por dentro dos últimos desenvolvimentos em diferentes domínios. No entanto, esse truque só se destacaria se houvesse atrito mínimo. Por exemplo, se os usuários puderem resumir uma notícia na mesma página do navegador em vez de abrir outro aplicativo.

Se este for o caso, por que não mudar para um aplicativo que já faz isso? Por exemplo, Artifact é um aplicativo incrivelmente projetado do cofundador do Instagram, Kevin Systrom , que usa IA para resumir artigos para você.

Já existem aplicativos e sites que veiculam notícias na forma de pepitas resumidas, como o Inshorts. Para sua caixa de entrada, Shortwave é um excelente aplicativo que pode fazer mais do que apenas resumir cadeias de e-mail para você, sem nenhum custo extra.

Enviando resumo por e-mail em Shortwave
Aplicativos como o Shortwave são ótimos para resumir suas cadeias de e-mail. Nadeem Sarwar / Tendências Digitais

A IA generativa no dispositivo também promete truques como edição de fotos baseada em voz. Parece incrivelmente útil, mas é difícil imaginar quanta conveniência isso acrescentará às nossas vidas quando filtros de um toque e controles deslizantes granulares oferecem um fluxo igualmente rápido e mais gratificante para editar mídia em telefones.

A seguir, vamos passar para a situação comum em torno do uso de IA apenas para iniciar alguns bate-papos genéricos ou obter respostas que, de outra forma, exigiriam pesquisas alimentadas pela Internet. Mais uma vez, vamos nos deparar com problemas qualitativos.

Os modelos generativos de IA executados nativamente em telefones – como o Llama da Meta – não são os mais avançados de seu tipo devido à disponibilidade fundamental de recursos. Não procure mais, o Google. O Pixel 8 Pro executa apenas o menor dos grandes modelos de linguagem do Google, chamado Gemini Nano . Por que não mudar para algo como ChatGPT ou Pi por meio de seus aplicativos móveis dedicados , em vez de se contentar com um modelo de linguagem menos capaz?

Onde a IA generativa realmente precisa estar

Assistentes de IA em comparação com ChatGPT.
Nadeem Sarwar / Tendências Digitais

No momento, vejo a IA generativa fazendo seu melhor truque é dissociando as tarefas do smartphone da nuvem (e a exigência de estar online o tempo todo) e oferecendo uma pitada extra de segurança. Mas, para fazer isso, esses truques de IA no dispositivo precisam funcionar como um assistente, semelhante ao Google Assistant, Alexa ou Siri.

Ou melhor ainda, eles precisam se tornar parte do assistente. Diga ao seu assistente de IA generativo para pegar todas as imagens de gatos da sua biblioteca, transformá-las em uma colagem e enviá-las ao seu pai. Ou peça para planejar o melhor itinerário para uma viagem de um dia à Disneylândia, encontrar a passagem mais barata para o próximo fim de semana e organizar todos esses detalhes no Google Agenda.

Além disso, se uma ferramenta de IA generativa no dispositivo não envia mais seus dados para os servidores em nuvem e mantém todas as operações locais em seu smartphone, não há muito com que se preocupar com a privacidade dos dados. Pelo menos teoricamente, é isso. Por enquanto, não tenho certeza sobre a visão do Galaxy AI que a Samsung está vendendo, mas seria interessante ver se a Samsung pode realmente oferecer experiências de IA generativas significativas ou apenas um monte de truques pouco práticos e enigmáticos.