O futuro dos gráficos rápidos para PC? Conectando-se diretamente a SSDs
Aumentos de desempenho são esperados a cada nova geração das melhores placas gráficas , mas parece que a Nvidia e a IBM estão de olho em mudanças maiores.
As empresas se uniram para trabalhar na Big Accelerator Memory (BaM), uma tecnologia que envolve a conexão de placas gráficas diretamente a SSDs super-rápidos. Isso pode resultar em maior capacidade de memória da GPU e largura de banda mais rápida, limitando o envolvimento da CPU.
Esse tipo de tecnologia já foi pensado e trabalhado no passado. A interface de programação de aplicativos (API) DirectStorage da Microsoft funciona de maneira semelhante, melhorando as transferências de dados entre a GPU e o SSD. No entanto, isso depende de software externo, se aplica apenas a jogos e funciona apenas no Windows. Os pesquisadores da Nvidia e da IBM estão trabalhando juntos em uma solução que elimina a necessidade de uma API proprietária enquanto ainda conecta GPUs a SSDs .
O método, divertidamente chamado de BaM, foi descrito em um artigo escrito pela equipe que o projetou. Conectar uma GPU diretamente a um SSD forneceria um aumento de desempenho que poderia ser viável, especialmente para tarefas com muitos recursos, como aprendizado de máquina. Como tal, seria usado principalmente em cenários profissionais de computação de alto desempenho (HPC).
A tecnologia atualmente disponível para processar cargas de trabalho tão pesadas exige que a placa gráfica dependa de grandes quantidades de memória para fins especiais, como HBM2, ou seja fornecida com acesso eficiente ao armazenamento SSD. Considerando que os conjuntos de dados estão crescendo em tamanho, é importante otimizar a conexão entre a GPU e o armazenamento para permitir transferências de dados eficientes. É aí que entra o BaM.
“O BaM mitiga a amplificação do tráfego de E/S, permitindo que os threads da GPU leiam ou gravem pequenas quantidades de dados sob demanda, conforme determinado pela computação”, disseram os pesquisadores em seu artigo, citado pela primeira vez pelo The Register . “O objetivo do BaM é estender a capacidade de memória da GPU e aprimorar a largura de banda efetiva de acesso ao armazenamento, ao mesmo tempo em que fornece abstrações de alto nível para os threads da GPU para facilitar o acesso sob demanda e granular a estruturas de dados massivas na hierarquia de memória estendida.”
Para muitas pessoas que não trabalham diretamente com esse assunto, os detalhes podem parecer complicados, mas a essência é que a Nvidia quer confiar menos no processador e se conectar diretamente à fonte dos dados. Isso tornaria o processo mais eficiente e liberaria a CPU, tornando a placa gráfica muito mais autossuficiente. Os pesquisadores afirmam que esse design seria capaz de competir com soluções baseadas em DRAM, permanecendo mais barato de implementar.
Embora a Nvidia e a IBM estejam, sem dúvida, inovando com sua tecnologia BaM, a AMD trabalhou nessa área primeiro: em 2016, ela revelou a Radeon Pro SSG, uma GPU de estação de trabalho com SSDs M.2 integrados. No entanto, o Radeon Pro SSG foi concebido para ser estritamente uma solução gráfica, e a Nvidia está dando alguns passos adiante, com o objetivo de lidar com cargas de trabalho de computação complexas e pesadas.
A equipe que trabalha no BaM planeja liberar os detalhes de sua otimização de software e hardware como código aberto, permitindo que outros desenvolvam suas descobertas. Não há menção de quando, se alguma vez, o BaM poderá ser implementado em futuros produtos da Nvidia.