Song Jiqiang, vice-presidente da Intel Corporation e diretor do Instituto de Pesquisa da Intel na China: A infraestrutura de IA heterogênea é a tendência de desenvolvimento futuro
2025-11-26 09:46
Favoritos

No dia 23 de novembro, a 22ª Exposição Internacional de Semicondutores da China (IC China 2025) foi inaugurada no Centro Nacional de Convenções da China, em Pequim. Na 7ª Conferência Global de Empreendedores de CIs, realizada simultaneamente, Song Jiqiang, vice-presidente da Intel Corporation e diretor do Instituto de Pesquisa da Intel na China, discursou. Ele afirmou que o foco da computação de IA mudou de modelos básicos de propósito geral para aplicações de inferência. No futuro, 80% da computação de IA será usada na área de inferência. A infraestrutura de IA heterogênea é a tendência futura.

Song Jiqiang afirmou que a IA baseada em agentes é a parte do campo de inferência que realmente gera valor para o cliente. Sua demanda por poder computacional aumentará gradualmente a partir de 2025, ultrapassando a escala usada para treinamento e ajuste fino de modelos básicos. Este ano, sua escala já cresceu 140 vezes, atingindo um uso mensal de 1400 trilhões de tokens. Para lidar com o rápido crescimento da demanda por IA baseada em agentes, o suporte de poder computacional é fundamental. A largura de banda e o armazenamento da infraestrutura computacional precisam acompanhar o ritmo. Os provedores de serviços de tokenização, como provedores de serviços em nuvem e data centers, também precisam otimizar sua estrutura de custos em nível de sistema.

Song Jiqiang destacou que a IA de agentes inicial era projetada especificamente para um modelo de linguagem particular na camada intermediária e correspondia a combinações específicas de hardware e software na camada inferior. Ela era otimizada para uma arquitetura de aplicação específica, resultando em escalabilidade limitada. A tecnologia emergente de cadeias de pensamento suporta capacidades mais amplas e de nível superior, mas também requer mais etapas de execução e modelos mais diversos. O número de tokens usados ​​para resolver um problema usando a abordagem de cadeias de pensamento é 10 vezes maior do que antes. Além disso, como um agente pode ter múltiplas cadeias de pensamento, o uso e a complexidade dos tokens aumentarão mais de cem vezes.

Portanto, Song Jiqiang enfatizou que a infraestrutura de IA heterogênea é definitivamente a tendência futura, melhorando o desempenho, a eficiência e a relação custo-benefício das aplicações atuais, mantendo a eficácia a longo prazo para futuras aplicações de IA de agentes.

Ele afirmou que tal arquitetura computacional requer suporte técnico em pelo menos três dimensões.

Primeiramente, na camada de hardware, para evitar limitações de arquiteturas ou fornecedores específicos, é necessário construir uma base de arquitetura de hardware heterogênea. Essa também é uma abordagem comumente discutida e adotada na construção de centros de computação e serviços de nuvem pública.

Em segundo lugar, no nível intermediário do sistema, um número crescente de aplicações de inferência existe no escopo do trabalho de uma única empresa, portanto, é crucial garantir a facilidade de desenvolvimento de aplicações corporativas e a implantação de servidores. A capacidade computacional deve ser fornecida na escala exigida e suportada pela empresa, e soluções de escalonamento abertas baseadas em Ethernet são necessárias para a interconectividade.

Em terceiro lugar, uma pilha e uma estrutura de software mais abertas são essenciais, exigindo programabilidade, configurabilidade e suporte para múltiplas estruturas de IA.

Song Jiqiang compartilhou ainda uma série de práticas e inovações da Intel. Por exemplo, em termos de tecnologia de processo, são necessárias soluções com maior eficiência energética, maior desempenho e fabricação mais flexível. Em outubro deste ano, a Intel anunciou os detalhes técnicos de seu mais recente processo de fabricação, o Intel 18A, que utiliza transistores RibbonFET com porta envolvente e a tecnologia de alimentação PowerVia com montagem traseira, proporcionando maior densidade de transistores, melhor desempenho por watt e menor consumo de energia, suportando pelo menos três gerações de futuros produtos para clientes e servidores da Intel.

Em relação à tecnologia de encapsulamento, Song Jiqiang afirmou que a Intel continua a desenvolver tecnologias avançadas: do encapsulamento 2D tradicional à solução de interconexão multichip EMIB 2.5D, às tecnologias Foveros 2.5D e 3D e, finalmente, ao Foveros Direct 3D. Com o suporte de tecnologias avançadas de encapsulamento, o espaçamento entre os bumps dos chips foi reduzido para menos de 10 micrômetros.

Song Jiqiang também compartilhou a visão da Intel para futuros chips personalizados. Ele destacou que os futuros chips personalizados poderão conter tanto a unidade de computação principal da Intel quanto a unidade de computação do cliente, e poderão ser encapsulados juntos utilizando tecnologia 3D. Graças à construção flexível, aliada a tecnologias como EMIB 2.5D e TSV, o tamanho dos chips será significativamente aumentado, atingindo atualmente uma escala equivalente a cerca de uma dúzia de fotomáscaras. Isso proporcionará novas oportunidades para processadores ou aceleradores de IA personalizáveis ​​no futuro. Ele afirmou que, em resposta às diversas necessidades de aplicações futuras, espera soluções de chips mais eficientes em termos de energia e com recursos personalizados.

Este boletim é uma compilação e reprodução de informações de parceiros estratégicos e da internet global, destinado apenas para troca de informações entre leitores. Em caso de infração ou outros problemas, por favor, informe-nos imediatamente, e este site fará as devidas modificações ou exclusões. A reprodução deste artigo é estritamente proibida sem autorização formal. E-mail: news@wedoany.com