A Nvidia acaba de anunciar um novo supercomputador que pode mudar o futuro da IA. O DGX GH200, equipado com quase 500 vezes mais memória do que os sistemas com os quais estamos familiarizados agora, logo cairá nas mãos do Google, Meta e Microsoft.
O objetivo? Revolucionando IA generativa, sistemas de recomendação e processamento de dados em uma escala nunca antes vista. Os modelos de linguagem como o GPT serão beneficiados e o que isso significará para os usuários comuns?
Descrever o DGX GH200 da Nvidia requer o uso de termos com os quais a maioria dos usuários nunca precisa lidar. “Exaflop”, por exemplo, porque o supercomputador fornece 1 exaflop de desempenho e 144 terabytes de memória compartilhada. A Nvidia observa que isso significa quase 500 vezes mais memória do que em um único sistema Nvidia DGX A100.
Vamos voltar para a figura de 1 exaflop e dividi-la um pouco. Um exaflop equivale a um quintilhão de operações de ponto flutuante por segundo (FLOPs). Para comparação, o RTX 4090 da Nvidia pode atingir cerca de 100 teraflops (TFLOPs) quando em overclock. Um TFLOP equivale a um trilhão de operações de ponto flutuante por segundo. A diferença é impressionante, mas é claro que o RTX 4090 não é uma GPU de data center. O DGX GH200, por outro lado, integra um número substancial dessas GPUs de alto desempenho que não pertencem nem perto de um PC de consumo.
O computador é alimentado pelos superchips GH200 Grace Hopper da Nvidia. Existem 256 deles no total, que, graças à tecnologia de interconexão NVLink da Nvidia, são capazes de trabalhar juntos como um sistema unificado, criando essencialmente uma GPU massiva.
Os superchips GH200 usados aqui também não precisam de uma conexão PCIe tradicional entre a CPU e a GPU. A Nvidia diz que eles já estão equipados com um Nvidia Grace CP, U baseado em ARM, bem como uma GPU H100 Tensor Core. A Nvidia também tem algumas interconexões sofisticadas de chips, desta vez usando o NVLink-C2C. Como resultado, diz-se que a largura de banda entre o processador e a placa gráfica foi significativamente melhorada (até 7 vezes) e mais eficiente em termos de energia (até 5 vezes).
Embalar mais de 200 desses chips em uma única potência de um supercomputador é bastante impressionante, mas fica ainda melhor quando você considera que, anteriormente, apenas oito GPUs podiam ser unidas ao NVLink por vez. Um salto de oito para 256 chips certamente dá à Nvidia algum direito de se gabar.
É difícil não imaginar que o DGX GH200 poderia melhorar o Bard, ChatGPT e Bing Chat.
Agora, onde vai parar o DGX GH200 e o que ele pode oferecer ao mundo? A Nvidia está construindo seu próprio supercomputador Helios como meio de avançar em sua pesquisa e desenvolvimento de IA. Ele abrangerá quatro sistemas DGX GH200, todos interconectados com o Quantum-2 InfiniBand da Nvidia. A expectativa é que ele fique online até o final do ano.
A Nvidia também está compartilhando seu novo desenvolvimento com o mundo, começando com Google Cloud, Meta e Microsoft. O objetivo é praticamente o mesmo — explorar cargas de trabalho de IA generativas.
Quando se trata do Google e da Microsoft, é difícil não imaginar que o DGX GH200 possa melhorar o Bard, o ChatGPT e o Bing Chat.
O poder computacional significativo fornecido por um único sistema DGX GH200 o torna adequado para o avanço do treinamento de modelos de linguagem sofisticados. É difícil dizer exatamente o que isso pode significar sem comentários de uma das partes interessadas, mas podemos especular um pouco.
Mais potência significa modelos maiores, o que significa texto com mais nuances e precisão e uma gama mais ampla de dados para serem treinados. Podemos ver uma melhor compreensão cultural, mais conhecimento do contexto e maior coerência. Chatbots de IA especializados também podem começar a surgir, substituindo ainda mais os humanos em campos como a tecnologia.
Devemos nos preocupar com o possível deslocamento de empregos ou devemos ficar entusiasmados com os avanços que esses supercomputadores podem trazer? A resposta não é direta. Uma coisa é certa – o DGX GH200 da Nvidia pode agitar as coisas no mundo da IA, e a Nvidia acaba de aumentar sua liderança em IA sobre a AMD mais uma vez.
Recomendações dos editores