Tecnologia

Como a Intel provou desempenho aberto e escalável em IA no MLPerf Inference v6.0 com Xeon 6 e GPUs Arc Pro B70/B65

Resultados do MLPerf mostram ganhos de desempenho e eficiência em plataformas híbridas CPU+GPU, com até 128 GB de VRAM combinada para modelos de até 120 bilhões de parâmetros

A Intel destacou seus resultados no MLCommons MLPerf Inference v6.0 para reforçar a estratégia de oferecer uma pilha aberta e escalável para inferência de inteligência artificial. Os testes apresentados pela empresa evidenciam ganhos consistentes em performance e eficiência ao combinar os novos processadores Intel Xeon 6 com as GPUs Intel Arc Pro B70 e B65, soluções direcionadas a estações de trabalho profissionais, data centers e cenários de edge.

Capacidade para modelos grandes e alta simultaneidade

Segundo a Intel, sistemas equipados com até quatro GPUs Arc Pro B70/B65 alcançam até 128 GB de VRAM combinada, o que permite executar modelos com até 120 bilhões de parâmetros com alta simultaneidade. Essa capacidade de memória e paralelismo é apontada pela empresa como fundamental para lidar com cargas de trabalho modernas, especialmente em aplicações de IA generativa que demandam grande volume de memória e processamento contínuo.

Plataforma aberta, containerizada e escalável

Um dos diferenciais ressaltados foi a adoção de uma stack aberta e containerizada, otimizada para ambientes Linux. A arquitetura permite escalar workloads de maneira eficiente — de um único nó até infraestruturas corporativas completas — e busca reduzir barreiras à adoção, diminuir custos e evitar dependência de soluções proprietárias. A Intel destaca que essa abordagem facilita a integração em pipelines existentes e o gerenciamento de aplicações em produção.

CPUs continuam centrais na infraestrutura de IA

Apesar do foco nas GPUs para aceleração, a Intel reitera o papel estratégico das CPUs na infraestrutura de IA. Os processadores Xeon 6 são responsáveis por funções críticas como orquestração, pré e pós-processamento de dados e distribuição de carga entre aceleradores. Em resultados anteriores do MLPerf (v5.1), os Xeon 6 com núcleos de performance (P-cores) entregaram até 1,9x de ganho geracional, evidenciando a importância da CPU no conjunto de soluções.

A empresa também destacou instruções e tecnologias de aceleração presentes nos processadores, como AMX e AVX-512, que ampliam a capacidade de execução de cargas de IA diretamente na CPU e podem reduzir a dependência exclusiva de GPUs em determinadas tarefas.

Competitividade e posição no ecossistema

Além dos números de desempenho, a Intel enfatizou a relação custo-benefício de suas ofertas e a presença consolidada no ecossistema de IA: a companhia afirma ser o único fornecedor a submeter resultados de CPUs de forma independente no MLPerf e estar presente em mais da metade dos sistemas testados com aceleração por IA. Segundo a empresa, isso reforça seu papel como peça central tanto em soluções baseadas em CPU quanto em plataformas híbridas com GPU.

Com os avanços reportados no MLPerf Inference v6.0, a Intel projeta um cenário em que a inferência de IA se torna mais acessível, distribuída e executada de forma privada — uma tendência alinhada à demanda por processamento local, segurança e baixa latência em setores sensíveis.