Resumo Matinal O iOS 27 da Apple pode trazer uma grande atualização para o aplicativo Fotos / OnePlus e realme supostamente se fundiram / O uso de tokens no meu país atingiu 211 trilhões de yuans no ano passado

cobrir

⚖

O processo judicial entre Elon Musk e Ultraman começou oficialmente. Musk argumenta que roubar de instituições de caridade é errado, enquanto a OpenAI rebate dizendo que Musk está apenas sendo invejoso por não ter conseguido o que queria.

A DeepSeek está testando em versão beta um "modo de reconhecimento de imagem", e um novo modelo multimodal pode estar prestes a ser lançado.

Há rumores de que o iOS 27 da Apple trará uma grande atualização para o aplicativo Fotos.

Com uma nova rodada de financiamento a caminho, a avaliação da Anthropic pode ultrapassar os 900 bilhões de dólares.

Em busca de uma resposta abrangente para a fabricação de automóveis: o "modelo Huawei" – com poucos ativos, chips desenvolvidos internamente e apostando na população global de alta renda.

No ano passado, o volume total de transações com tokens no meu país atingiu 21,1 trilhões, com uma média diária superior a 100 trilhões no final do ano.

Informações indicam que a OnePlus e a realme se fundiram oficialmente em uma subunidade de negócios, com Li Bingzhong nomeado gerente geral.

☁

O lucro líquido da Alphabet no primeiro trimestre aumentou 81%, e o Google Cloud ultrapassou a marca de US$ 20 bilhões pela primeira vez.

☁

O Azure cresce 40%, a IA dispara 123% e os negócios de nuvem da Microsoft aceleram em todas as áreas.

A Meta reportou receita de US$ 56,3 bilhões no primeiro trimestre, com lucro líquido 61% maior em comparação com o ano anterior.

A Soda Music ultrapassa a NetEase Cloud Music e se torna a terceira maior plataforma de música da China.

Os segmentadores de palavras por IA exibem "viés linguístico": quando questionados sobre Claude em hindi, o consumo de palavras é mais de três vezes maior do que em inglês.

O primeiro programa de graduação em "Inteligência Artificial Comercial" na China foi aprovado, e a Universidade de Ciência e Tecnologia da China começará a matricular alunos neste outono.

A série Xiaomi 13 suporta atualização de bateria.

Sam Altman: A precificação baseada em tokens eventualmente se tornará obsoleta; a OpenAI almeja ser uma "fábrica de inteligência".

O chip Xuanjie O3 da Xiaomi foi revelado, podendo torná-lo o primeiro celular com tela dobrável a apresentar esse chip.

Tencent IMA lança agente de conhecimento "copiloto"

AntBrains Ling-2.6-flash Código Aberto

Os stickers do WeChat permitem a publicação de imagens originais com resolução de até 200 megapixels.

Grandes notícias

O processo judicial entre Elon Musk e Ultraman começou oficialmente. Musk argumenta que roubar de instituições de caridade é errado, enquanto a OpenAI rebate dizendo que Musk está apenas sendo invejoso por não ter conseguido o que queria.

Segundo o The New York Times e o The Verge, o caso Musk contra a OpenAI entrou oficialmente na fase de depoimentos em 28 de abril no Tribunal Distrital dos EUA para o Distrito Leste da Califórnia, em Oakland.

Vale ressaltar que, apenas um dia antes do julgamento, Musk publicou mais de 20 mensagens no X, referindo-se a Altman como "Altman Golpista". Antes do início do julgamento, a juíza Yvonne González Rogers convocou Musk à sua bancada e o advertiu sobre seu comportamento fora do tribunal.

"Como podemos prosseguir com o julgamento se você continua piorando as coisas fora do tribunal?" Por fim, ambas as partes concordaram em "restringir suas declarações" nas redes sociais.

Musk então apareceu como a primeira testemunha, posicionando-se como "o salvador da humanidade" e resumindo o futuro da IA ​​em dois possíveis resultados: "ou uma utopia ao estilo de Star Trek ou uma distopia ao estilo de O Exterminador do Futuro". Ele chamou Ultraman diretamente de "ladrão".

Roubar de uma instituição de caridade é errado. Se o réu for absolvido, isso abrirá um precedente para saquear todas as instituições de caridade nos Estados Unidos.

No entanto, o repórter do The Verge presente no local observou que o depoimento de Musk ficou muito aquém das expectativas. Ele dedicou um tempo considerável a relatar sua trajetória empreendedora pessoal, em vez de se concentrar nas principais acusações do caso, e chegou a afirmar ser a verdadeira força motriz por trás da OpenAI.

A ideia foi minha, eu a nomeei, recrutei a equipe principal e forneci todo o capital inicial. Fora isso, não fiz nada.

A declaração foi seguida por uma pausa, aguardando risos, mas a plateia reagiu de forma tímida. Quando lhe pediram para apresentar Sion Zilis, ex-membro do conselho da OpenAI, Musk respondeu vagamente: "Ela é minha, hum, chefe de gabinete, e, você sabe" — Zlis é mãe de vários dos filhos de Musk. Risos irromperam da plateia, enquanto o júri parecia perplexo.

O advogado principal da OpenAI, William Savitt, apresentou uma narrativa completamente diferente em sua declaração inicial: "Estamos aqui porque Musk não conseguiu o que queria. Meu cliente tem a coragem de ter sucesso sem ele, e Musk não gosta disso."

Savitt apresentou ao júri e-mails internos de 2017 mostrando que os assessores de Musk haviam discutido proativamente a possibilidade de lhe conceder uma participação de 55% na divisão com fins lucrativos, e ressaltou que Musk nunca havia se oposto à monetização da OpenAI antes do ChatGPT se tornar um sucesso. "Isso é pura birra."

A reivindicação de Musk ultrapassa os 150 bilhões de dólares. Se ele perder, Altman consolidará seu controle sobre a OpenAI, permitindo que a empresa prossiga com seu plano de IPO, avaliado em aproximadamente 730 bilhões de dólares. O julgamento deve durar quatro semanas, e Musk continuará a ser interrogado hoje.

grandes empresas

A DeepSeek está testando em versão beta um "modo de reconhecimento de imagem", e um novo modelo multimodal pode estar prestes a ser lançado.

A DeepSeek lançou ontem um teste do "Modo de Reconhecimento de Imagem", juntamente com o "Modo Rápido" e o "Modo Especialista" já existentes, que possui recursos completos de compreensão multimodal de imagens e não se limita ao reconhecimento de texto por OCR.

 Leitura relacionada: DeepSeek acaba de receber uma grande atualização! Finalmente, ele "abre os olhos" | Inclui diversos testes em situações reais

Com base em testes práticos, o modo de reconhecimento de imagem do DeepSeek demonstra alta precisão geral, fornecendo uma resposta em apenas meio segundo sem ativar o "modo de raciocínio". Ele apresenta bom desempenho no reconhecimento e compreensão de cenários comuns, como fotogramas de filmes, imagens abstratas e fotos de produtos.

O que é ainda mais notável é o seu processo de pensamento: além de descrever o conteúdo das imagens, ele questiona ativamente a identidade da editora, as metáforas e os subtextos das imagens, corrigindo-se diversas vezes durante o raciocínio. Mesmo antes de chegar a uma conclusão, ele espontaneamente lista perguntas para verificar as premissas uma a uma, apresentando uma lógica de raciocínio próxima aos hábitos de leitura humana.

No entanto, o modo de reconhecimento de imagem ainda apresenta limitações significativas. No clássico teste de "contagem de dedos", o DeepSeek cometeu um erro na primeira tentativa, alegando estar "tonto de tanto contar", mas conseguiu dar a resposta correta após orientação ou dicas do usuário.

Além disso, o processo de reconhecimento de imagem atualmente não oferece suporte a buscas online e depende exclusivamente da base de conhecimento do próprio modelo para responder às perguntas. Ele não consegue reconhecer itens mais recentes, como o mascote da Apple, "Finder-chan", lançado este ano.

Ainda ontem, Xiaokang Chen, pesquisador da equipe multimodal do DeepSeek, postou no X: "Agora, nós te vemos."  A publicação, acompanhada de uma imagem comparativa do mascote baleia da DeepSeek, com os olhos vendados e abertos, foi amplamente interpretada como uma prévia do lançamento iminente de um novo modelo multimodal.

Há rumores de que o iOS 27 da Apple trará uma grande atualização para o aplicativo Fotos.

Segundo a Bloomberg, a Apple está aprimorando significativamente os recursos de edição de fotos integrados em iPhones, iPads e Macs. Baseada na plataforma Apple Intelligence, a empresa planeja lançar um novo conjunto de ferramentas de edição de imagens com inteligência artificial no iOS 27, iPadOS 27 e macOS 27, com lançamento previsto para junho deste ano.

Segundo o repórter Mark Gurman, o novo recurso adicionará uma seção "Ferramentas Inteligentes da Apple" à interface de edição do aplicativo Fotos, que inclui quatro ferramentas: Estender, Aprimorar, Reenquadrar e Limpar.

  • A função "Expandir" permite que os usuários gerem conteúdo adicional para além das bordas da imagem original ou preencham automaticamente a cena ao redor. Os usuários podem controlar a direção e a extensão da expansão arrastando a borda da imagem com os dedos.
  • A função "Aprimoramento" utiliza IA para otimizar automaticamente a cor, a iluminação e a qualidade geral da imagem;
  • A função "Recomposição" destina-se principalmente a fotos espaciais, permitindo aos usuários ajustar a perspectiva após tirar a foto;
  • O recurso "Eliminação por IA", que já existe na versão atual do iOS 26 e permite remover objetos específicos de imagens, continuará disponível no iOS 27.

 Leitura relacionada: iOS 27 aprimora a edição de fotos com IA; a Apple também começa a sentir a ansiedade em relação à IA.

Com uma nova rodada de financiamento a caminho, a avaliação da Anthropic pode ultrapassar os 900 bilhões de dólares.

Segundo a Bloomberg, a Anthropic está considerando uma nova rodada de financiamento com uma avaliação potencial de mais de US$ 900 bilhões. Se bem-sucedida, ultrapassaria a OpenAI e se tornaria a startup de IA mais valiosa do mundo.

Fontes familiarizadas com o assunto revelaram que investidores já fizeram ofertas à Anthropic, propondo avaliações mais que o dobro de seu valor atual. As negociações estão em estágio inicial e a empresa ainda não aceitou nenhuma oferta.

Quanto aos acionistas existentes, o Google se comprometeu a investir US$ 10 bilhões na Anthropic, avaliando a empresa em US$ 350 bilhões, e planeja investir até US$ 30 bilhões adicionais caso a empresa atinja determinadas metas de desempenho; a Amazon também investiu US$ 5 bilhões, avaliando a empresa em US$ 350 bilhões, e pretende injetar outros US$ 20 bilhões ao longo do tempo.

Em busca de uma resposta abrangente para a fabricação de automóveis: o "modelo Huawei" – com poucos ativos, chips desenvolvidos internamente e apostando na população global de alta renda.

Segundo o Jiemian News, Ma Junye, presidente do projeto Dreame Auto, revelou ontem em entrevista à imprensa em São Francisco que a equipe da Dreame Auto iniciou os preparativos já em 2021 ou 2022, aproximadamente na mesma época que a Xiaomi Auto, e depois passou por um período de silêncio técnico de cerca de três anos.

A equipe conta atualmente com mais de 1.000 membros, sendo que aproximadamente 70% deles são da área de P&D, e a expectativa é que esse número chegue a quase 2.000 no segundo semestre deste ano. O CEO Yu Hao está profundamente envolvido no design e na definição do produto, mantendo contato frequente com a equipe, quase que diariamente.

Em termos de modelo de negócios, a Seeking adota um "modelo Huawei", que envolve pesquisa e desenvolvimento conjuntos com OEMs nacionais e estrangeiros consolidados e fabricação por contrato, sem construir sua própria fábrica de veículos.

Em termos de tecnologia central, insistimos no desenvolvimento próprio, abrangendo chassis inteligentes totalmente eletrônicos, motor do veículo, bateria de estado sólido, cockpit inteligente e, pela primeira vez, confirmamos o planejamento e desenvolvimento independentes do cockpit e do chip de computação para direção inteligente.

Em resposta às dúvidas externas sobre o fluxo de caixa, Ma Junye afirmou que "reservou fundos suficientes para fabricar carros" e que introduziu capital social e fundos da indústria para compartilhar os riscos.

Em relação aos preços dos produtos, a Dreame deixou claro que "definitivamente não fabricará carros com preço inferior a 200.000 yuans". O preço inicial de seus modelos de produção em massa será superior a um milhão de yuans , com algumas versões ultrapassando os dois milhões de yuans. Um cupê totalmente elétrico será lançado no próximo ano, seguido por um SUV da mesma série. Em termos de estratégia de mercado, a Dreame visa atingir aproximadamente 400 milhões de indivíduos de alta renda em todo o mundo, buscando preencher a lacuna no mercado externo para veículos chineses de nova energia de alta gama.

Ele negou explicitamente a comparação com "a próxima LeEco", enfatizando que a Dreame está envolvida em pesquisa e desenvolvimento de tecnologia genuína e comprometida em entregar produtos físicos ao mercado global.

No ano passado, o volume total de transações com tokens no meu país atingiu 21,1 trilhões, com uma média diária superior a 100 trilhões no final do ano.

Segundo a CCTV News, o "Relatório Nacional de Pesquisa de Recursos de Dados (2025)" foi oficialmente divulgado ontem na 9ª Cúpula da China Digital.

O relatório mostra que o uso diário de tokens em nível nacional aumentou de mais de 1 trilhão no início do ano passado para 100 trilhões no final do ano, demonstrando uma tendência de crescimento exponencial; o uso total de tokens durante todo o ano atingiu aproximadamente 211 trilhões.

Informações indicam que a OnePlus e a realme se fundiram oficialmente em uma subunidade de negócios, com Li Bingzhong nomeado gerente geral.

Segundo o site Leifeng.com, a OPPO divulgou um comunicado interno na noite passada, anunciando oficialmente a fusão das marcas OnePlus e Realme para formar uma unidade de negócios de sub-séries.

  • Li Bingzhong, vice-presidente sênior da OPPO, foi nomeado gerente geral da Unidade de Negócios de Sub-Séries, responsável pela operação geral da unidade.
  • Os sistemas de marketing e serviços da OnePlus e da realme serão integrados à nova unidade de negócios, com Xu Qi, ex-presidente de marketing e serviços da realme, assumindo a chefia da área de marketing e serviços da subunidade de negócios.

Em termos de produto, a OPPO estabeleceu simultaneamente um centro de produtos de sub-séries, com departamentos de produtos nacionais e internacionais subordinados a ele, todos sob a liderança unificada de Li Jie, que se reporta diretamente a Liu Zuohu. Wang Wei, ex-vice-presidente da realme, foi nomeado vice-gerente geral do centro de produtos de sub-séries, também se reportando a Li Jie.

No âmbito de P&D, a equipe original de P&D da realme retornou ao grupo como um todo, e os departamentos de imagem, hardware e outros foram integrados à OPPO, tornando-se unidades subordinadas aos diversos departamentos de hardware da OPPO.

O lucro líquido da Alphabet no primeiro trimestre aumentou 81%, e o Google Cloud ultrapassou a marca de US$ 20 bilhões pela primeira vez.

Hoje, a Alphabet, empresa controladora do Google, divulgou seu relatório de resultados do primeiro trimestre, mostrando uma receita total 22% maior em relação ao ano anterior, atingindo US$ 109,9 bilhões, lucro líquido 81% maior em relação ao ano anterior, chegando a US$ 62,6 bilhões, e lucro diluído por ação de US$ 5,11, marcando o 11º trimestre consecutivo de crescimento de receita em dois dígitos.

  • A receita dos serviços do Google cresceu 16%, atingindo US$ 89,6 bilhões, com a receita do Google Search e outras receitas crescendo 19%, para US$ 60,4 bilhões, a receita de publicidade do YouTube crescendo 11%, para US$ 9,9 bilhões, e a receita de assinaturas, plataforma e dispositivos crescendo 19%, para US$ 12,4 bilhões.
  • A receita do Google Cloud cresceu 63% em relação ao ano anterior, atingindo US$ 20 bilhões, ultrapassando a marca de US$ 20 bilhões pela primeira vez, enquanto o lucro operacional aumentou significativamente para US$ 6,6 bilhões, ante US$ 2,2 bilhões no mesmo período do ano passado.
  • Outras receitas comerciais (incluindo os táxis autônomos da Waymo e os serviços de entrega por drones da Wing) foram de US$ 411 milhões, uma ligeira queda em relação ao ano anterior, enquanto o prejuízo operacional aumentou para US$ 2,1 bilhões;
  • O lucro operacional total do grupo aumentou 30%, atingindo US$ 39,7 bilhões, e a margem de lucro operacional expandiu 2 pontos percentuais, chegando a 36,1%.

Pela primeira vez, o Google Cloud tornou-se o principal motor de crescimento da empresa, com a receita de produtos baseados em modelos de IA generativa crescendo quase 800% em relação ao ano anterior, e a carteira de pedidos quase dobrando para mais de US$ 460 bilhões em relação ao trimestre anterior; o número de usuários ativos mensais da versão empresarial do Gemini aumentou 40% em relação ao trimestre anterior, e as vendas de licenças para o ecossistema de parceiros aumentaram nove vezes em relação ao ano anterior.

Entretanto, os modelos próprios da empresa processaram mais de 16 bilhões de tokens por minuto por meio de chamadas diretas à API, um aumento de cerca de 60% em comparação com o trimestre anterior, e o número total de usuários de assinaturas pagas de IA atingiu 350 milhões, marcando o trimestre mais forte de sua história.

O Azure cresce 40%, a IA dispara 123% e os negócios de nuvem da Microsoft aceleram em todas as áreas.

Hoje, a Microsoft divulgou seus resultados referentes ao terceiro trimestre do ano fiscal de 2026, que termina em 31 de março de 2026:

A receita atingiu US$ 82,9 bilhões, um aumento de 18% em relação ao ano anterior; o lucro líquido GAAP foi de US$ 31,8 bilhões, um aumento de 23% em relação ao ano anterior; o lucro líquido não-GAAP (excluindo o impacto do investimento da OpenAI) foi de US$ 31,79 bilhões, um aumento de 20% em relação ao ano anterior.

  • O segmento de Produtividade e Processos de Negócios gerou US$ 35 bilhões em receita, um aumento de 17% em relação ao ano anterior, com a receita do Microsoft 365 Business Cloud crescendo 19%, a receita do Consumer Cloud 33%, o Dynamics 365 22% e o LinkedIn 12%.
  • O segmento de Nuvem Inteligente gerou US$ 34,7 bilhões em receita, um aumento de 30% em relação ao ano anterior, enquanto a receita do Azure e de outros serviços em nuvem cresceu 40%.
  • O segmento de computadores pessoais gerou US$ 13,2 bilhões em receita, uma queda de 1% em relação ao ano anterior, enquanto a receita de conteúdo e serviços do Xbox diminuiu 5%.
  • O lucro bruto total foi de US$ 56,1 bilhões, com uma margem bruta de aproximadamente 67,6%, ligeiramente inferior aos 68,7% registrados no mesmo período do ano passado, principalmente devido ao impacto negativo do aumento dos custos da infraestrutura de serviços em nuvem (os custos de serviço aumentaram aproximadamente 28% em relação ao ano anterior).

O principal motor de crescimento é a sinergia acelerada entre IA e computação em nuvem. A receita anualizada do negócio de IA da Microsoft ultrapassou US$ 37 bilhões, um aumento de 123% em relação ao ano anterior; a receita total da Microsoft Cloud atingiu US$ 54,5 bilhões, um aumento de 29% em relação ao ano anterior.

A Meta reportou receita de US$ 56,3 bilhões no primeiro trimestre, com lucro líquido 61% maior em comparação com o ano anterior.

Hoje, a Meta divulgou seu relatório de resultados do primeiro trimestre deste ano:

A empresa alcançou uma receita de US$ 56,3 bilhões, um aumento de 33% em relação ao ano anterior; um lucro líquido de US$ 26,77 bilhões, um aumento significativo de 61% em relação ao ano anterior, e um lucro diluído por ação de US$ 10,44.

  • A receita da família de aplicativos atingiu US$ 55,91 bilhões, dos quais US$ 55,02 bilhões foram provenientes de receita publicitária, um aumento de 33% em relação ao ano anterior, contribuindo com US$ 26,9 bilhões em lucro operacional.
  • A Reality Labs reportou uma receita de US$ 402 milhões, uma ligeira queda de 2,4% em relação ao ano anterior; e um prejuízo operacional de US$ 4,028 bilhões.
  • A margem de lucro operacional global manteve-se em 41%, a mesma do mesmo período do ano passado.

O principal fator de crescimento deste trimestre foi o aumento tanto no volume quanto no preço da publicidade: as impressões de anúncios aumentaram 19% em relação ao ano anterior, e o preço médio dos anúncios aumentou 12% em relação ao ano anterior, o que, em conjunto, impulsionou o rápido crescimento da receita publicitária.

A empresa espera que a receita total para o segundo trimestre deste ano fique entre US$ 58 bilhões e US$ 61 bilhões, e sua previsão de despesas totais para o ano todo permanece inalterada, entre US$ 162 bilhões e US$ 169 bilhões, mas sua previsão de investimentos de capital foi elevada para entre US$ 125 bilhões e US$ 145 bilhões, refletindo principalmente o aumento dos preços dos componentes de hardware e a demanda por expansão de data centers neste ano .

A Soda Music ultrapassa a NetEase Cloud Music e se torna a terceira maior plataforma de música da China.

Ontem, a empresa de análise QuestMobile divulgou seu "Relatório da Primavera da Internet Móvel na China em 2026", que mencionou uma mudança no cenário da indústria de aplicativos de música online:

Kugou Music e QQ Music possuem mais de 200 milhões de usuários ativos mensais cada, mantendo a liderança no mercado; o Soda Music ultrapassou o NetEase Cloud Music pela primeira vez, entrando no top 3; enquanto o NetEase Cloud Music foi ultrapassado pelo Soda Music, ficando em quarto lugar.

O relatório destaca que a música voltada para bebidas não alcoólicas acelerou sua "explosão" durante a temporada do Festival da Primavera, com um aumento expressivo de downloads e penetrando com sucesso nos mercados de meia-idade, idosos e classes sociais mais baixas.

Os segmentadores de palavras por IA exibem "viés linguístico": quando questionados sobre Claude em hindi, o consumo de palavras é mais de três vezes maior do que em inglês.

Ontem, o pesquisador de IA Aran Komatsuzaki divulgou os resultados de uma análise comparativa dos principais tokenizadores de modelos em larga escala, revelando que esses tokenizadores exibem "viés linguístico":

Quando usuários que não falam inglês usam o mesmo tipo de token, o número real de tokens consumidos é muito maior do que o dos usuários que falam inglês, o que equivale a pagar silenciosamente um "imposto para não falantes de inglês".

Ele traduziu o famoso artigo de Rich Sutton, "The Bitter Lesson", para nove idiomas e os inseriu nos tokenizadores de seis modelos diferentes. Usando o número de tokens no texto original em inglês na ferramenta de segmentação de palavras da OpenAI como base, ele mediu o consumo múltiplo de cada idioma em diferentes modelos.

Os resultados mostraram que, ao fazer a mesma pergunta em chinês, o Claude consumiu 1,71 vezes o valor de referência, enquanto o OpenAI consumiu apenas 1,15 vezes. A situação foi ainda mais acentuada para o hindi no Claude, onde o consumo de tokens excedeu o valor de referência em 3,24 vezes, e para o árabe, chegou a 2,86 vezes.

Na comparação de 6 modelos, o Anthropic apresentou o maior "imposto para idiomas não ingleses", seguido pelo Kimi; Gemini e Qwen apresentaram os menores impostos para idiomas não ingleses. Komatsuzaki afirmou categoricamente: "Francamente, eu não esperava que o Claude fosse tão ruim, e a diferença é enorme. Acredito que os clientes corporativos ficarão muito preocupados com esse tipo de problema."

Komatsuzaki destaca que a eficiência da segmentação de palavras depende da proporção de cada idioma nos dados de treinamento do modelo: os dados em inglês são abundantes, portanto as palavras em inglês são comprimidas de forma eficiente; os dados em outros idiomas são escassos, portanto, só podem ser segmentados em partes menores.

Para os usuários, o aumento no consumo de tokens eleva diretamente os custos das chamadas à API, leva a tempos de espera mais longos para as respostas dos modelos e faz com que a janela de contexto se esgote mais rapidamente. Sua conclusão é: quem tiver a maior participação de mercado terá tokens mais econômicos.

O primeiro programa de graduação em "Inteligência Artificial Comercial" na China foi aprovado, e a Universidade de Ciência e Tecnologia da China começará a matricular alunos neste outono.

A Universidade de Ciência e Tecnologia da China (USTC) anunciou recentemente que o Ministério da Educação aprovou oficialmente a criação de um programa de graduação em "Inteligência Artificial para Negócios" em sua Escola de Negócios de Ciência e Tecnologia e Escola de Administração. A USTC torna-se, assim, a primeira universidade na China a oferecer este curso e planeja receber sua primeira turma de alunos de graduação neste semestre de outono.

Após quase dois anos de múltiplas rodadas de revisão e avaliação, este curso se posiciona como não puramente voltado para a tecnologia, com foco na aplicação integrada da IA ​​em cenários de negócios. Seu sistema de conhecimento abrange as teorias fundamentais de IA, economia e gestão, cobrindo tópicos de vanguarda como inovação em modelos de negócios baseados em IA, arquitetura de hardware de IA e ecossistema industrial, agentes de inteligência de negócios, investimento em ciência e tecnologia impulsionado por IA e governança de IA.

Em termos de objetivos de formação, os alunos irão dominar sistematicamente as principais teorias de administração de empresas, inteligência artificial, otimização matemática e ciência da computação, e aprimorar oito competências essenciais, incluindo integração de IA nos negócios, análise inteligente de dados, tomada de decisão colaborativa entre humanos e máquinas e design de sistemas de negócios.

A série Xiaomi 13 suporta atualização de bateria.

A página mais recente da loja online da Xiaomi mostra que a empresa lançou um serviço de "upgrade de bateria" para dois dispositivos da série 13. O preço é o mesmo do upgrade anterior para o Xiaomi 13 Ultra: 149 yuans pela bateria + 40 yuans pela mão de obra.

  • Xiaomi Mi 13: 4500mAh → 4850mAh
  • Xiaomi 13 Pro: 4820mAh → 5361mAh

Vale ressaltar que, após a substituição, será necessário atualizar para o sistema operacional 3.0.3XX. No início deste mês, a Xiaomi lançou um serviço de "Upgrade de Bateria" para o Xiaomi 13 Ultra, que permite a troca para uma bateria de 5500mAh (a original tem 5000mAh).

 Sam Altman: A precificação baseada em tokens eventualmente se tornará obsoleta; a OpenAI almeja ser uma "fábrica de inteligência".

Segundo o Stratechery, o CEO da OpenAI, Sam Altman, afirmou recentemente em entrevista ao comentarista de tecnologia Ben Thompson que o modelo de precificação de IA baseado em tokens é insustentável a longo prazo e que o setor eventualmente migrará para um sistema de precificação baseado na "conclusão de tarefas".

Altman usa o modelo mais recente, GPT-5.5, como exemplo para ilustrar essa conclusão: o preço de um único token no GPT-5.5 é maior do que o da geração anterior, GPT-5.4, mas o número de tokens consumidos para concluir a mesma tarefa é significativamente menor . Ele acredita que os usuários nunca se importaram de fato com a quantidade de tokens consumidos.

Na verdade, você não se importa com quantos tokens a resposta usa; você só quer concluir a tarefa. O que importa para você é o preço total e se você poderá acessar os tokens sempre que precisar.

Partindo disso, Altman revisou o posicionamento da OpenAI, transformando-a de uma "fábrica de tokens" para uma "fábrica de inteligência". Seu objetivo principal é fornecer o máximo de inteligência possível ao menor custo possível. Os usuários não precisam se preocupar se o modelo subjacente é grande ou pequeno, quantos tokens são usados ​​ou se ele é executado em uma GPU ou no chip Trainium, desenvolvido pela própria Amazon.

Altman também revelou que, atualmente, muito mais clientes da OpenAI estão solicitando poder computacional adicional do que negociando preços mais baixos. Ele traçou um paralelo entre a IA e serviços públicos tradicionais, como água e eletricidade, apontando diferenças fundamentais entre os dois:

Se considerarmos a inteligência como um "serviço público" (como água e eletricidade), não conheço nenhum outro serviço público que me faça sentir que, enquanto o preço for baixo o suficiente, continuarei a usá-lo e a usá-lo cada vez mais. Não existe tal serviço público.

O CEO da AWS, Matt Garman, acrescentou que, embora o preço unitário do poder computacional tenha diminuído em várias ordens de magnitude nos últimos 30 anos, a quantidade total de poder computacional vendida hoje é maior do que nunca, e a lógica de crescimento da demanda por IA é muito semelhante.

Novos produtos

O chip Xuanjie O3 da Xiaomi foi revelado, podendo torná-lo o primeiro celular com tela dobrável a apresentar esse chip.

Segundo o XimiTime, o banco de dados Mi Code revelou recentemente as especificações do SoC O3 da Xiaomi, que deverá ser o primeiro a equipar o futuro Xiaomi MIX Fold 5 (codinome interno "lhasa"). O preço inicial estimado é de cerca de US$ 1.500 (aproximadamente RMB 10.200).

Dados vazados mostram que o O3 passou por uma reformulação completa de sua arquitetura, com a frequência do super núcleo aumentada de 3,89 GHz no O1 para 4,05 GHz. Ele adotará uma arquitetura de três clusters: "super núcleo (Prime) + núcleo grande de alto desempenho (Titanium) + núcleo pequeno (Little)", removendo o cluster de núcleo grande em comparação com a geração anterior, o O1.

  • A frequência dos núcleos menores aumentou significativamente de 1,79 GHz para 3,02 GHz, um aumento de cerca de 68%, superando a geração anterior de núcleos maiores, que atingia 1,89 GHz;
  • A frequência dos núcleos de alto desempenho foi ligeiramente aumentada de 3,39 GHz para 3,42 GHz, com uma alteração mínima.
  • A frequência da GPU foi aumentada de 1,2 GHz para aproximadamente 1,5 GHz, um aumento de cerca de 25%.
  • A especificação de frequência da memória permanece inalterada em 9600 MT/s.

O Geely Galaxy M7 Voyager está sendo lançado com preço inicial de 109.800 yuans.

Ontem, o Geely Galaxy M7 Voyager foi lançado oficialmente, oferecendo quatro versões de configuração com preços que variam de 109.800 a 137.800 yuans. Em termos de aparência, o novo carro mantém a linguagem de design da família Geely Galaxy, apresentando uma faixa contínua de luz LED na dianteira e uma grade de entrada de ar inteligente que se ajusta automaticamente de acordo com a velocidade do veículo e as necessidades de refrigeração.

O veículo mede 4770 mm de comprimento, 1905 mm de largura e 1685 mm de altura, com uma distância entre eixos de 2785 mm e uma capacidade de porta-malas de 700 litros. Está disponível em seis cores: azul, verde, prata, branco, preto e cinza.

  • Equipado com a tecnologia híbrida 2.0 da Thor, o motor possui uma eficiência térmica de 47,26%, uma potência máxima do sistema de 175 kW e uma eficiência global de 93,1%.
  • Todos os modelos estão equipados com uma bateria de 29,8 kWh, que proporciona uma autonomia puramente elétrica de 225 km e uma autonomia combinada de 1730 km com o tanque de gasolina cheio e a bateria totalmente carregada.
  • O cockpit apresenta o sistema Galaxy Flyme Auto 2, uma tela de controle central de 15,4 polegadas com resolução 2.5K, um chip Longying-1 de 7nm, um HUD de 25,6 polegadas e carregamento sem fio refrigerado a ar de 50W;
  • A configuração padrão inclui a solução Qianli Haohan H3, que suporta NOA de alta velocidade, rampas de entrada/saída automáticas e assistência ao estacionamento em todos os cenários.

 Leitura relacionada: O Geely Galaxy M7 Voyager foi lançado por 109.800 yuans, equipado com uma bateria de 30 kWh em toda a série, atingindo um consumo de combustível de apenas 3,35 litros por 100 km.

A XGIMI lança quatro novos produtos de ponta, com o X50 Ultra Max atingindo uma taxa de contraste nativa de 10000:1.

Na noite passada, a XGIMI realizou seu evento de lançamento de novos produtos na China, apresentando quatro séries principais: X50 Ultra, RS30, AURA3 e MIRA 4K.

Série X50 Ultra:

  • Equipado com o "X-Vision Bionic Optical Engine" de desenvolvimento próprio, ele integra cinco componentes de hardware principais, incluindo a abertura biônica contínua DynaEye, o chip de qualidade de imagem independente X-Vision e a fonte de luz laser RGB pura;
  • O modelo topo de linha X50 Ultra Max atinge uma taxa de contraste nativa de 10.000:1 e uma taxa de contraste de nível de preto dinâmico de 100.000:1, rompendo pela primeira vez a barreira do "nível de dez mil" para taxa de contraste nativa de projetores DLP domésticos;
  • Equipado com o chip de qualidade de imagem independente X-Vision, desenvolvido em conjunto com a Tsinghua Unigroup, é o terceiro chip dedicado à qualidade de imagem para projetores na indústria, depois da Sony e da JVC;
  • Por tempo limitado, o X50 Ultra Max está com preço de 17.999 yuans e o X50 Ultra, de 13.999 yuans.

A série RS30 herda a mesma tecnologia do X50 Ultra. O modelo topo de linha RS30 Ultra Max apresenta a mesma abertura biônica DynaEye de ajuste contínuo, uma taxa de contraste nativa de 7000:1, brilho de 5500 VCIA/6800 ISO e, em todos os modelos, vem de fábrica com tilt-shift bidirecional inteligente, permitindo a projeção em uma tela de 100 polegadas a 3 metros de distância. Oferece quatro opções de configuração, do Pro ao Ultra Max.

As TVs a laser da série AURA3 apresentam uma taxa de contraste de 10.000, projeção ultracurta para montagem na parede, suporte para telas enroláveis ​​de até 150 polegadas, pesam menos de 10 kg e cobrem 99% da gama de cores BT.2020.

A série MIRA 4K aprimora a resolução de 1080p da geração anterior para 4K e adiciona uma função "Galeria de Luz e Sombra", que inclui mais de 100 papéis de parede artísticos integrados. No modo de espera, a parede pode ser usada como uma tela de exibição.

Tencent IMA lança agente de conhecimento "copiloto"

Ontem, a Tencent IMA lançou oficialmente o "copiloto", um agente de IA para inteligência artificial que permite aos usuários criar seus próprios agentes de IA. Ele é compatível com cinco plataformas principais: Mac, Windows, iOS, Android e HarmonyOS. Atualmente, trata-se de um sistema baseado em aplicativo e será implementado gradualmente, de acordo com a ordem de recebimento das solicitações.

Uma das principais funcionalidades do copiloto é seu sistema de memória altamente personalizado, composto por quatro módulos principais: configurações do copiloto, perfil do usuário, memória de longo prazo e experiência/habilidades. O agente de IA consegue memorizar o histórico, os hábitos e as prioridades do usuário, permitindo acesso contínuo em diferentes cenários e a autorreconfiguração.

Em termos de percepção do ambiente, o Copilot suporta a visualização em modo flutuante no aplicativo IMA, detectando automaticamente a página da web, o arquivo ou o conteúdo da base de conhecimento que o usuário está navegando e podendo emitir comandos de processamento diretamente, sem a necessidade de carregar arquivos adicionais.

Em termos do ecossistema de habilidades, o Copilot inclui inicialmente habilidades oficiais integradas, como operações em base de conhecimento, anotações e geração de relatórios. A habilidade de base de conhecimento agora permite a leitura do texto principal de um arquivo e pode resumir informações de vários arquivos.

O Step Image Edit 2, lançado pela Step Star, possui 3,5 bilhões de parâmetros, superando modelos com 20 bilhões de parâmetros.

O Step Image Edit 2, um modelo de nova geração para geração e edição de imagens, foi lançado oficialmente ontem pela Step Star. Ele enfatiza o design leve, a alta qualidade e a resposta extremamente rápida. Com apenas 3,5 bilhões de parâmetros, a empresa afirma que seu desempenho real supera o de grandes modelos de edição de imagens de código aberto que variam de 12 a 20 bilhões, gerando uma única imagem em apenas 0,5 a 2 segundos.

No benchmark acadêmico público KRIS-Bench, o Step Image Edit 2 ocupa o primeiro lugar no ranking geral de modelos leves de edição de imagens.

Em termos de funcionalidades, o modelo suporta geração e edição de imagens, renderização em chinês e inglês, edição local, raciocínio visual, consistência de assunto e transferência de estilo, podendo abranger cenários de aplicação prática como criação de propriedade intelectual, design de pôsteres, geração de quadrinhos, embelezamento de retratos, retoque de fotos de viagens e geração de retratos.

Motubrain, um "cérebro geral" de inteligência incorporada, foi lançado pela BioScience.

Ontem, a Bioscient Technology lançou o Motubrain, um modelo universal de ação no mundo real, que se posiciona como o "cérebro universal" de robôs inteligentes incorporados. Ele unifica percepção, previsão e execução em um único modelo, permitindo que os robôs realmente compreendam e interajam com o mundo físico.

  • Generalização multitarefa: quanto mais tarefas um modelo executa, mais inteligente ele se torna, não ficando mais limitado ao treinamento em um único cenário;
  • Adaptação multi-robô: Um modelo pode ser adaptado a robôs de diferentes formatos, rompendo com a prática tradicional de "um robô, um modelo";
  • Execução de tarefas de longo alcance: É possível concluir tarefas complexas com mais de 10 ações consecutivas de uma só vez, em vez de executar apenas 2 a 3 etapas no nível de demonstração;
  • Tomada de decisão preditiva dinâmica: Ela consegue antecipar mudanças ambientais e se ajustar conforme a execução da ação.

Em avaliações de especialistas, o Motubrain liderou as listas internacionais do WorldArena (capacidade de compreensão do modelo mundial) e do RoboTwin 2.0 (capacidade de execução do robô). Este último alcançou uma pontuação média de 96,0 em 50 tarefas complexas, tornando-se o único modelo com uma pontuação média superior a 95.

O modelo de tradução de código aberto Hy-MT1.5 da Tencent, desenvolvido pela Hunyuan, suporta 33 idiomas.

Ontem, a Tencent Hunyuan lançou oficialmente o código aberto do Hy-MT1.5, um modelo de tradução offline para dispositivos móveis. O tamanho compactado é de apenas 440 MB e suporta 33 idiomas, 5 dialetos e línguas minoritárias. Pode ser usado sem conexão com a internet.

Dados oficiais mostram que o modelo de 1,8 bilhão de parâmetros supera modelos de código aberto maiores, como o Tower-Plus-72B e o Qwen3-32B, bem como APIs de tradução comerciais convencionais, como o Microsoft Translator e o Doubao Translation, no teste de referência de tradução chinês-estrangeiro Flores-200.

 Abraço facial: embraceface.co/tencent/Hy-MT1.5-1.8B-1.25bit

Galaxy General-Purpose Open Source Robot Large Model LDA: Pode ser usado mesmo com "dados inválidos" e fica mais robusto com a prática.

Ontem, a Galaxy General Robotics lançou o LDA "Hidden World-Motion Basic Model" de ontologia cruzada, com o algoritmo principal e o código totalmente disponibilizados como código aberto simultaneamente. O artigo relacionado foi selecionado para o RSS de uma importante conferência na área de robótica.

A principal inovação do LDA reside na sua utilização inédita, unificada e eficaz de todos os tipos de dados incorporados — abrangendo diversos tipos de dados, incluindo híbridos virtual-real, híbridos humano-máquina, dados com e sem rótulos de ação e dados de qualidade variável. Experimentos mostram que, à medida que a escala de dados aumenta de milhares para dezenas de milhares de horas, o desempenho do modelo continua a melhorar de forma constante; mesmo com a introdução de uma grande quantidade de dados inválidos, o desempenho não diminui, mas sim aumenta.

  • Arquitetura do Modelo : O LDA implementa a estrutura WAM (World-Action Model), unificando as quatro capacidades de geração de políticas, previsão de dinâmica direta, inferência de dinâmica inversa e previsão visual dentro do mesmo espaço de representação, formando um circuito fechado completo de "percepção-decisão-feedback";
  • Representação visual : A substituição do VAE tradicional pelo espaço latente estruturado DINO filtra eficazmente interferências de aparência, como iluminação e textura, permitindo o alinhamento na aprendizagem da dinâmica ontológica. Dados comparativos mostram que a taxa de sucesso do UWM praticamente estagna ao escalar de 0,1 bilhão para 1 bilhão de parâmetros, enquanto o LDA continua a melhorar o desempenho com a mesma escala.
  • Espaço de Ação : Propõe-se um espaço de ação unificado centrado na mão, que mapeia todas as ações do corpo para as mudanças de posição do pulso e padrões de contato da mão com o efetor final, desacoplando completamente a semântica da operação da estrutura mecânica específica, de modo que operações como agarrar, girar e inserir possam compartilhar leis dinâmicas em todo o corpo.

AntBrains Ling-2.6-flash Código Aberto

A Ant Financial tornou oficialmente público ontem o código-fonte dos pesos flash do Ling-2.6. O modelo possui um total de 104 bilhões de parâmetros, com apenas 7,4 bilhões ativados durante cada inferência, e uma janela de contexto de 256 mil.

O Ling-2.6-flash introduz um mecanismo de atenção linear híbrido na arquitetura Ling 2.0, atualizando a atenção GQA original para uma arquitetura híbrida 1:7 MLA + Lightning Linear e combinando-a com um design MoE altamente esparso, resultando em uma eficiência de inferência significativamente melhor do que outros modelos do mesmo nível.

Em um ambiente H2O de 4 cartões, a velocidade de geração pode chegar a 340 tokens/s, e o pico de desempenho de pré-preenchimento e decodificação é cerca de 4 vezes maior do que o de modelos de código aberto semelhantes.

Em avaliações relacionadas a agentes de IA, o Ling-2.6-flash teve um desempenho excepcional, com múltiplos indicadores como BFCL-V4, TAU2-bench, SWE-bench Verified (61,2%), Claw-Eval e PinchBench atingindo ou se aproximando do nível de última geração (SOTA) para o mesmo nível de parâmetros.

 Abraço Facial: embraceface.co/inclusionAI/Ling-2.6-flash

Novo consumo

Os stickers do WeChat permitem a publicação de imagens originais com resolução de até 200 megapixels.

Ontem, o WeChat anunciou oficialmente que passará a suportar o envio e a visualização de imagens originais em seu recurso de figurinhas e firmou uma parceria com a OPPO para permitir o compartilhamento de imagens de ultra-alta definição de 200 megapixels em figurinhas. Atualmente, esse recurso está disponível apenas para dispositivos Android e os usuários podem experimentá-lo atualizando para a versão 8.0.71 ou superior.

Projeto "Unboxing" do Museu de Arte JD é lançado

Ontem, o JD Museum anunciou oficialmente o lançamento de seu projeto de arte pública, "Unboxing JD Museum", que percorrerá Pequim, Suqian e Shenzhen a partir de maio.

O projeto utiliza caixas de papelão da JD Express como meio de expressão, tendo como elemento central o "Pavilhão de Papelão", um salão de exposições móvel projetado em conjunto pela Shenzhen Daxing Jizi e pela Beijing Small Production. O pavilhão apresentará conteúdo multimídia, incluindo vídeos, instalações e sons.

Durante sua primeira parada em Pequim, o projeto lançou um desafio criativo online com duas vertentes: artesanato e inteligência artificial. Também firmou parceria com o programa beneficente "Starlight Relay" da JD.com para expor pinturas de crianças de áreas rurais. Além disso, o projeto realizou questionários e entrevistas com mais de 100 artistas e acadêmicos do mundo todo, e os resultados serão preservados em arquivos digitais e publicações.

Lindo

O filme "O Diabo Veste Prada 2" estreia hoje.

"O Diabo Veste Prada 2" estreou oficialmente hoje e já está em cartaz nos cinemas de todo o país.

O filme centra-se no impacto da era digital nos meios de comunicação tradicionais da moda: a outrora influente revista "Runway" enfrenta uma crise de sobrevivência, e a "magnata da moda" Miranda (Meryl Streep) e a sua antiga assistente Andy (Anne Hathaway) voltam a trabalhar juntas.

A série "Supergirl" da DC confirmada para importação.

Segundo o Douban Movie, o novo filme de super-heroína da DC Pictures, "Supergirl", teve sua estreia confirmada na China continental, com a data de lançamento ainda a ser definida.

A história é uma adaptação da aclamada HQ da DC Comics "Supergirl: Tomorrow's Daughter" e conta a história de Kara, que, para salvar seu amado cachorro Krypton, se une a um parceiro que conhece por acaso, e os dois embarcam em uma corrida contra o tempo.

#Siga a conta oficial do iFanr no WeChat: iFanr (ID do WeChat: ifanr), onde você encontrará conteúdo ainda mais interessante o mais breve possível.