O unicórnio AI Step Star completou centenas de milhões de dólares em financiamento, e os seis dragões domésticos da AI entraram nas finais

A APPSO descobriu que o grande modelo unicórnio Step Star concluiu recentemente centenas de milhões de dólares em financiamento da Série B. Os principais investidores desta rodada de financiamento incluem a Capital Investment Co., Ltd., de propriedade estatal de Xangai, e seus fundos estratégicos e financeiros incluem Tencent Investment, Wuyuan Capital e Qiming Venture Partners.

É relatado que este financiamento será utilizado para continuar a promover a investigação e desenvolvimento de modelos básicos, reforçar as suas capacidades de raciocínio multimodal e complexo e aumentar a cobertura de cenários de aplicação do lado C através de produtos e ecologia, proporcionando aos utilizadores uma experiência de usuário rica e diversificada.

Os dados mostram que no segundo semestre de 2024, o número de chamadas para a API multimodal Step Star aumentou mais de 45 vezes . Nos últimos 10 meses, a Step Star lançou um total de 11 modelos básicos autodesenvolvidos, entre os quais os modelos da série Step foram repetidamente classificados como "Nº 1 na China" em grandes listas oficiais de avaliação de modelos no país e no exterior .

A série Step de modelos básicos da Step Star, que se concentra em "trilhões + multimodal", é desenvolvida rapidamente e seu desempenho permanece líder no mercado interno . Atualmente, cada vez mais desenvolvedores estão criando funções e experiências de aplicativos C-end mais ricas com base em seus grandes modelos multimodais e explorando e atendendo novos cenários de consumo por meio de aplicativos nativos de IA.

A estratégia da empresa gira em torno de cenários que “têm necessidades reais” e “podem trazer inovação na experiência do utilizador”, apostando em “supermodelos” + “super aplicações” , através da combinação de auto-investigação e cooperação ecológica, e das capacidades da sua base base de grandes modelos, com foco na criação de experiências inovadoras para usuários finais C.

Do ponto de vista do modelo básico, Step Star é uma das poucas grandes startups de modelos na China que formou uma gama completa de matrizes de modelos, desde a compreensão até a geração, do texto ao multimodal . No futuro, a empresa insistirá na pré-formação e continuará a lançar um impacto na AGI (inteligência artificial).

Em termos de negócios de produtos, Step Star lançou o assistente inteligente " Yuewen " que suporta interação multimodal. Sua função de pesquisa visual inteligente multimodal "Pergunta de Fotografia" é a primeira função na China a ser integrada ao botão de controle da câmera do iPhone 16. .

Os desenvolvedores estão criando funções e experiências de aplicativos C-side mais ricas com base em seu grande modelo multimodal . O aplicativo de IA de celebridades da Internet " Book of Stomach " pode ajudar os usuários a registrar sua dieta de uma forma mais rápida e interessante; o aplicativo de cura psicológica de IA " Forest Healing Room " realiza interação multimodal entre usuários e produtos de cura;

Na área de terminais inteligentes, a Step Star também cooperou com os principais fabricantes de telefones celulares, como OPPO e Honor, para desenvolver tecnologia de grande modelo na área de criação de conteúdo. A Step Star alcançou uma cooperação estratégica com a Chinese Online e a China National Knowledge Infrastructure para; explore como usar tecnologia de modelo grande Estimule a produção e a demanda de vários cenários de criação de conteúdo.

No campo das finanças e da economia, a empresa de tecnologia de modelo em grande escala "Caiyue Xingchen", co-fundada pela Jiemian Finance Association, lançou o modelo vertical em grande escala da indústria financeira " Finstep " e o modelo privado do lado C que pode fornecer funções aos usuários como mineração de dados de IA e interpretação de relatórios financeiros " Pequeno Deus da Riqueza ". Além disso, a Step Star também cooperou com a Taijunan e a Jiemian Finance Association para lançar o primeiro modelo vertical de títulos multimodais em grande escala da indústria com centenas de bilhões de parâmetros, o " Modelo Grande Junhong Lingxi ".

Jiang Daxin, fundador e CEO da Step Star, planeja que o caminho da empresa para realizar AGI seja " modalidade única – multimodalidade – a unificação da compreensão e geração multimodal – modelo mundial – AGI ". À medida que a competição entre os grandes modelos domésticos "Six Little Dragons" continua a se intensificar, a Class Star continuará a fazer esforços tanto nos modelos básicos quanto nos produtos C-end, esforçando-se para atingir vários campos e fornecer produtos de modelos grandes mais avançados para diferentes grupos de usuários .

Além de seu rico negócio de produtos C-end, a Step Star também lançou a série Step de grandes modelos de uso geral com excelente desempenho. A seguir está uma breve introdução do produto:

  • Passo 1 : Um grande modelo de linguagem com centenas de bilhões de parâmetros, com raciocínio lógico, conhecimento de chinês e inglês, matemática e desempenho de código superior a GPT-3.5;
  • Passo 1V : Grande modelo multimodal, compreende imagens, textos, dados, gráficos com precisão e tem recursos de criação de conteúdo, raciocínio lógico, análise de dados, etc .;
  • Step-1X : Modelo de geração de imagens grandes, com forte compreensão semântica e capacidades de realização criativa de imagens;
  • Step-Video : Um grande modelo de geração de vídeo que suporta a geração de vídeos de alta definição 1080P e 10s. É bom para compreensão semântica, seguimento de instruções, movimento e geração estética de estilo chinês;
  • Step-tts-mini : Reprodução de fala e geração de modelos grandes Carregue 5 segundos de áudio para reproduzir com precisão características de timbre e emoções individuais;
  • Step-Asr : Um grande modelo de reconhecimento de fala que pode reconhecer diferentes sotaques e convertê-los em texto com precisão;
  • Passo 2 : Um grande modelo de linguagem com trilhões de parâmetros, usando arquitetura MoE, com forte controle sobre os detalhes de geração de linguagem e excelente capacidade de compreender e seguir instruções humanas. Ocupa o primeiro lugar na China e o quinto no mundo na avaliação "LiveBench". lista;
  • Step-1.5V : Versão iterativa do grande modelo multimodal, com capacidades de compreensão multimodal mais fortes, realizando o salto da compreensão de imagem para a compreensão de vídeo;
  • Step-1.5v-turbo : modelo de compreensão de vídeo, identifica com precisão objetos, personagens e ambientes de vídeo, entende a atmosfera de vídeo e as emoções dos personagens e tem forte capacidade de acompanhamento de comando;
  • Áudio Step-1o : Um grande modelo de voz ponta a ponta com 100 bilhões de parâmetros, suporta entrada e saída mista de voz e texto, responde rapidamente e pode fornecer uma experiência interativa natural, de alto QI e alto EQ;
  • Step-1-flash : versão extremamente rápida do modelo grande, usada para lidar com tarefas em campos gerais, suporta comprimento de contexto de 8K, baixo atraso na primeira palavra e velocidade de saída rápida.

# Bem-vindo a seguir a conta pública oficial do WeChat de Aifaner: Aifaner (ID do WeChat: ifanr). Mais conteúdo interessante será fornecido a você o mais rápido possível.

Ai Faner | Link original · Ver comentários · Sina Weibo |