Os chips emblemáticos têm um desempenho ruim, esse “pote” não pode deixar a Samsung de volta

Mesmo que você não seja um entusiasta da eletrônica de consumo, deve conhecer o talo do "dragão de fogo" nos últimos dois anos.

▲ Foto de: "Game of Thrones"

A principal razão é que nas últimas gerações de chips emblemáticos do Android, o consumo de energia foi “acumulado” um após o outro. O alto desempenho geralmente é acompanhado por um alto consumo de energia, que também é acompanhado por um aumento acentuado no calor do telefone celular.

Isso traz uma vantagem e uma desvantagem. A vantagem é que os fabricantes estão obtendo níveis cada vez mais altos de "dissipação de calor", enquanto a desvantagem é que o ajuste do chip está se tornando mais conservador, bem como uma parede de controle de temperatura mais baixa.

Sob o aperto contínuo de alto desempenho (como executar "Yuan Shen"), basicamente em 10 ~ 15 minutos, os produtos reduzirão ativamente a frequência do super núcleo do chip. Se a temperatura ainda estiver alta, o próximo limite é o grande essencial.

Por outro lado, usando chips emblemáticos com tecnologia mais avançada, em condições diárias, deve haver uma melhora na vida útil da bateria.

No entanto, em uso, a melhoria da vida útil da bateria é "aspergir água", que tem pouco efeito e depende do carregamento rápido de alta potência para continuar a vida.

Além disso, há outro ponto, a recente instabilidade do processo de 4nm na fundição da Samsung pode ser considerada um motivo. Seu próprio chip principal Exynos 2200 também teve um desempenho inferior, não intencionalmente.

Como resultado, a Qualcomm, que foi "profundamente prejudicada", também anunciou o uso do processo de 4nm da TSMC no recém-anunciado Snapdragon 8+ Gen1 Soc e afirmou diretamente no PPT que o desempenho foi melhorado em 10% e o consumo de energia foi reduzido em 30%.

Parece que o baixo desempenho dos chips principais do Android é tudo porque o processo de 4 nm da Samsung é "muito ruim", então o TSMC é um "resgate"?

O 4nm da TSMC é apenas um "pano de figura"

TSMC e Samsung são quase os dois principais oligarcas na produção de chips de processo avançado do mundo. Os dois quase dominam o mercado mundial de chips produzidos abaixo de 10nm.

▲ Imagem de: wccftech.com

Em poucos anos, de 10nm para 4nm, e também estão construindo linhas de produção e fundições de 3nm, a competição está se intensificando.

Ao contrário da fundição pura da TSMC, a Samsung é uma empresa de fabricação verticalmente integrada (IDM) que integra chips de design independentes, chips de produção e chips próprios da Exynos.

10 anos atrás, a Samsung queria estar à frente do TSMC, e o chip A4 da Apple também foi magicamente modificado do Samsung Exynos, e foi fabricado por ele.

Devido à identidade especial da Samsung e ao fato de a tela e a memória dependerem da Samsung, o risco é muito alto e a Apple começou a oferecer suporte ao TSMC para transferir o risco.

Depois de reviravoltas, a TSMC construiu uma nova linha de produção, alocou uma equipe profissional e finalmente conquistou a fundição exclusiva do chip A8 da Apple. Juntamente com as vendas sem precedentes do iPhone 6 e 6 Plus, a TSMC se beneficiou muito com isso.

Posteriormente, os chips da série A da Apple começaram a ser vinculados ao TSMC e ajudaram seu desenvolvimento por meio da inclinação de recursos. Hoje, os chips da série A e da série M da Apple são todos fundidos pela TSMC e se tornaram os clientes de maior prioridade, nenhum deles.

▲ TSMC e Apple estão profundamente ligados. Imagem de: appuals.com

Ao mesmo tempo, o "mito" da alta estabilidade da fundição de chips TSMC foi criado.

Ambos 5nm e 4nm ficam atrás da Samsung da TSMC, e eles não são desencorajados, mas têm um garanhão. Anunciou um investimento de 133 trilhões de won (cerca de 8.000 trilhões de yuans), visando o processo de 3nm, tornando-se assim o maior fabricante de SoC do mundo.

▲ Imagem de: Samsung

E, abandonando a tecnologia FinFEET, mas um passo para a tecnologia do transistor GAAFET, para alcançar a ultrapassagem do TSMC, o sucesso ou o fracasso está aqui.

Voltando ao presente, a densidade de wafer de 5 nm e 4 nm da Samsung e a estabilidade do processo não são tão boas quanto o TSMC, então há de fato uma certa lacuna quando é realimentado ao chip principal.

O MediaTek Dimensity 9000 no início deste ano usa o processo de 4 nm da TSMC, o núcleo ultra-grande Cortex-X2 (3,05 GHz), o núcleo grande A710 (2,85 GHz) e o núcleo médio A510 (1,8 GHz) no 1+ 3+4 arquitetura de três clusters. ) são muito superiores ao Qualcomm Snapdragon 8 Gen1.

Em teoria, tem maior desempenho e melhor eficiência energética, tornando-o um chip perfeito.

No entanto, após alguns meses de espera, quando os carros-chefe equipados com o Dimensity 9000 são lançados, o desempenho real da eficiência energética não é muito diferente da versão da Qualcomm.

Nesta promoção de alto nível da Qualcomm, quando o Snapdragon 8+ Gen1 usando o processo de 4nm da TSMC terá melhor desempenho, na verdade eu não tinha grandes expectativas.

▲ Após o lançamento do Snapdragon 8+ Gen1, a "Supercopa" de muitos fabricantes também retornará, e o destaque está chegando.

Tendo em vista o overclocking abrangente do Snapdragon 8+ Gen1 (Cortex-X2 3,2 GHz + A710 2,75 GHz + A510 2,0 GHz), o desempenho absoluto será aprimorado. Quanto à melhoria, depende do ajuste dos fabricantes e o mesmo é verdade para a eficiência energética.

Desta forma, a tecnologia de processo de 4nm da TSMC é mais como um "pano de figo" para chips emblemáticos, cobrindo a nova arquitetura da versão pública extremamente fraca da Arm.

A arquitetura da versão pública do Arm é a "culpada"

Nos últimos dez anos, o Arm mudou 9 versões da arquitetura, e o Armv9 mais recente é uma atualização do conjunto de instruções relativamente importante.

Com a atualização do conjunto de instruções, a Arm também anunciou a versão pública do IP da CPU, que é o super-large core Cortex-X2, large core (performance core) Cortex-A710 e Mid-core (performance core) Cortex-A510 .

▲ Imagem de: Braço

A versão pública da arquitetura da CPU ainda usa a arquitetura three-plex, ou seja, 1+3+4. É uma evolução da arquitetura big.LITTLE anterior. O objetivo nada mais é do que "o núcleo certo para o trabalho certo" para melhorar a eficiência energética.

A arquitetura mista de núcleos grandes e pequenos agora é amplamente utilizada em CPUs de desktop e móveis das arquiteturas X86 e Arm.

▲ Intel 12 também adota a arquitetura híbrida de P+E.

A versão pública da arquitetura de três clusters da Arm, se cada um desempenha suas próprias funções, o super-core X2 fornece desempenho absoluto, o A710 de núcleo grande compartilha os requisitos diários de desempenho e o A510 de núcleo médio completa as tarefas correspondentes com baixo consumo de energia consumo.

Os três núcleos, cada um com seu próprio propósito, devem ser inclinados em design e invocação.

O Cortex-X2, que é uma versão totalmente otimizada do X1, duplica o cache L3 para 8 MB, aumenta a área do cache, otimiza o atraso de comunicação e obtém uma melhoria de 16% no IPC (desempenho também compreensível).

▲ O núcleo supergrande melhorou significativamente. Imagem de: Arm

Dos produtos seguintes, o Snapdragon 8Gen1 e o Dimensity 9000 têm melhor desempenho do que o Snapdragon 888 quando o desempenho está totalmente ativado e o consumo de energia não "explode".

É razoável trocar o alto consumo de energia por alto desempenho.

Mas o grande núcleo e o núcleo médio têm grandes problemas, e são esses dois núcleos com novos "nomes" que fazem com que os principais chips sejam substituídos com frequência.

O Cortex-A710 não usa uma arquitetura mais recente, ainda é a otimização do clássico A78, e pode ser mais correto chamá-lo de A79.

A Anandtech chamou esse novo nome de "um interessante boato de marketing", e o desempenho do A710 é evidente.

▲ Alto consumo de energia e alto desempenho. Imagem de: Arm

No PPT da Arm, o A710 tem uma melhoria de desempenho de 10%, além de otimizar 30% de eficiência energética. No entanto, do ponto de vista da curva, o maior desempenho está localizado principalmente na parte de alto consumo de energia, e é obtido dobrando o cache L3 (8MB).

A otimização da eficiência energética apenas reduz o throughput de distribuição do núcleo A710 (de 6 para 5), ​​não a partir da otimização da arquitetura.

▲ Não imite. Imagem de: tenor

O A710 é uma versão otimizada do A78, e o A78 é uma versão com overclock do A77. Por alguns anos, a equipe de design do grande núcleo da Arm ainda está explorando o potencial da arquitetura A77, mas depois que o A78 atinge a frequência de ponto ideal da arquitetura, a taxa de eficiência energética do A710 é trovejante, especialmente quando o sistema precisa de alto desempenho mas não é suficiente para mudar para o X2 ultra-grande Quando o núcleo é usado, o consumo de energia decola diretamente.

Inclusive, a Arm usa diretamente o A78 de 4nm com o núcleo ultra-grande X2, que pode ter melhores resultados.

Como um grande núcleo, o A710 precisa de mais desempenho do que um design de eficiência energética.O braço está na direção errada.

▲ A510 recém-projetado. Imagem de: Braço

Relativamente falando, o núcleo do Cortex-A510 é uma nova arquitetura de design. E ao contrário da equipe de Austin que projetou os dois núcleos do X2 e do A710, ele foi projetado pela equipe de Cambridge.

A arquitetura A510 adota muitas ideias de design inovadoras, como o uso de "hyper-threading" para compartilhar o cache L2 e, ao mesmo tempo, a largura de banda L1, L2 e L3 é aumentada em duas vezes a do A55, melhorando assim desempenho de ponto flutuante em 50%, e operações de inteiro também têm uma melhoria de 35%.

No entanto, o A510 ainda usa "execução sequencial" em vez da "execução fora de ordem" dos núcleos energeticamente eficientes nos chips da série A da Apple. Para evitar a latência de instrução, o front-end do A510 foi aumentado, o cache foi duplicado e o back-end foi ampliado.

▲ Alguns honestos Arm, note que o eixo vertical é o consumo de energia. Imagem de: Arm

A ideia de design também é relativamente clara, apenas para melhor "desempenho". Apenas o resultado final, mas com pouco sucesso.

A partir do PPT da Arm, o A510 só pode obter melhor desempenho que o A55 no caso de alto consumo de energia.

No entanto, em termos de baixo consumo de energia, que é o foco do núcleo de eficiência energética, é difícil abrir o gap com o A55, havendo até algumas “reversões”.

▲ Não imite. Imagem de: tenor

No geral, entre as arquiteturas de três clusters que a Arm apresentou nos últimos anos, apenas o núcleo ultragrande Cortex-X2 é uma mudança relativamente normal. O A510 começou a se concentrar no desempenho máximo.

A versão pública Arm do IP da CPU ainda é assim, então não espere que o chip principal seja modificado com base nisso, quão bom o desempenho pode ser.

Se você não quer abraçar o ecossistema de aplicativos de 64 bits das grandes fábricas, você tem que sair e pegar o "pote"

Após o lançamento do Armv9, a maior mudança é abandonar completamente os aplicativos de 32 bits e adotar totalmente os aplicativos de 64 bits.

Em outras palavras, na arquitetura de três clusters, em teoria, todos os núcleos não suportam mais aplicativos de 32 bits, mas para o ambiente de aplicativos Android no mercado chinês, a Arm aprovou especialmente os núcleos no A710 para serem compatíveis com 32-bit. aplicações de bits.

Ou seja, ao abrir um aplicativo de 32 bits, ele forçará o A710, um núcleo de alto consumo de energia, a permanecer ativo, mesmo que você apenas desligue a tela para ouvir uma música.

De fato, desde o Armv8, o Arm promove aplicativos de 64 bits, e a Google Store também estipulou que novos programas devem suportar aplicativos de 64 bits em agosto de 2019.

No entanto, muitos fabricantes de aplicativos domésticos não fizeram melhorias. Muitos aplicativos comumente usados, como Alipay, QQ e NetEase Cloud, ainda são de 32 bits, e não há planos para quando a versão de 64 bits será lançada.

Além disso, as lojas de software de muitos fabricantes domésticos de Android não têm partições de aplicativos de 64 bits correspondentes, e os aplicativos de 32 e 64 bits são misturados.

No entanto, OPPO, vivo e Xiaomi já começaram a popularizar os aplicativos de 64 bits. A primeira etapa é restringir os novos aplicativos a 64 bits. Quanto aos aplicativos comumente usados, nenhuma medida relevante foi divulgada por enquanto.

Nos últimos anos, os principais chips do Android encontraram problemas com frequência. O motivo mais fundamental é que a direção do design da arquitetura de versão pública do Arm viola a intenção original da arquitetura de três clusters, e os fabricantes nacionais não adotam ativamente aplicativos de 64 bits .

Quanto a ser TSMC ou Samsung, Dimensity ou Qualcomm, no lado do dispositivo, a diferença entre eles é bem menor que os números no PPT.

#Bem-vindo a prestar atenção à conta oficial do WeChat de Aifaner: Aifaner (WeChat: ifanr), conteúdo mais interessante será trazido para você o mais rápido possível.

Love Faner | Link original · Ver comentários · Sina Weibo