A Apple disse na segunda-feira que os modelos de IA que alimentam o Apple Intelligence, seu sistema de IA, foram pré-treinados em processadores projetados pelo Google, um sinal de que as principais empresas de tecnologia estão procurando alternativas à Nvidia quando se trata de treinar IA de ponta.
A escolha da Apple da unidade de processamento de tensor (TPU) do Google para treinamento é detalhada em Artigo técnico recém publicado por Separadamente, a Apple lançou uma versão prévia do Apple Intelligence para alguns dispositivos na segunda-feira.
As caras GPUs da Nvidia dominam o mercado de chips de treinamento de IA de ponta e têm tido uma demanda tão alta nos últimos anos que tem sido difícil obtê-las nas quantidades necessárias. OpenAI, Microsoft e Anthropic usam GPUs Nvidia em seus modelos, enquanto outras empresas de tecnologia, incluindo Google, Meta, Oracle e Tesla, estão adquirindo-as para construir seus sistemas e ofertas de IA.
Na semana passada, tanto o CEO da Meta, Mark Zuckerberg, quanto o CEO da Alphabet, Sundar Pichai, fizeram comentários sugerindo que suas empresas e outras do setor podem estar investindo demais em infraestrutura de IA, mas reconheceram que os riscos comerciais de fazer o contrário eram muito altos.
“A desvantagem de ficar para trás é que você estará fora de posição em termos da tecnologia que mais importa nos próximos 10 a 15 anos”, disse Zuckerberg em entrevista. Podcast Com Emily Chang da Bloomberg.
A Apple não mencionou Google ou Nvidia em seu artigo de 47 páginas, mas observou que o Apple Foundation Model (AFM) e o servidor AFM são treinados em “clusters de nuvem TPU”. Isso significa que a Apple alugou servidores de um provedor de nuvem para realizar os cálculos.
“Este sistema nos permite treinar modelos AFM de forma eficiente e escalonável, incluindo AFM no dispositivo, servidor AFM e modelos maiores”, disse a Apple em seu artigo.
Representantes da Apple e do Google não responderam aos pedidos de comentários.
A Apple revelou seus planos de IA mais tarde do que muitos de seus concorrentes, que adotaram ruidosamente a IA generativa logo após o OpenAI lançar o ChatGPT no final de 2022. Na segunda-feira, a Apple apresentou o Apple Intelligence. O sistema inclui diversas novidades, como visual atualizado da Siri, melhor processamento de linguagem natural e resumos gerados por IA em campos de texto.
No próximo ano, a Apple planeja lançar funções baseadas em IA generativa, incluindo criação de imagens, geração de emojis e uma Siri aprimorada que pode acessar as informações pessoais do usuário e realizar ações dentro dos aplicativos.
Em um artigo divulgado na segunda-feira, a Apple disse que o AFM no dispositivo foi treinado em um único “chip” de 2.048 chips TPU v5p trabalhando juntos. Este é o chipset TPU mais avançado, lançado pela primeira vez em dezembro. O servidor AFM foi treinado em 8.192 chips TPU v4 configurados para funcionar juntos como oito chips na rede do data center, de acordo com o jornal.
As TPUs mais recentes do Google custam menos de US$ 2 por hora, e o chip é usado quando reservado com três anos de antecedência, de acordo com Para o site do GoogleO Google introduziu suas TPUs pela primeira vez em 2015 para cargas de trabalho internas e as disponibilizou ao público em 2017. Elas estão agora entre os chips personalizados mais maduros projetados para IA.
No entanto, o Google é um dos maiores clientes da Nvidia. Ela usa GPUs e GPUs da Nvidia para treinar sistemas de IA e também vende acesso à tecnologia da Nvidia em sua nuvem.
A Apple disse anteriormente que a inferência, que significa pegar um modelo de IA pré-treinado e executá-lo para gerar conteúdo ou fazer previsões, acontecerá parcialmente nos chips da Apple em seus data centers.
Este é o segundo artigo técnico sobre o sistema de IA da Apple, após um lançamento mais geral em junho. Apple disse na hora Ela estava usando unidades de processamento térmico (TPU) ao desenvolver seus modelos de IA.
A Apple está programada para anunciar seus resultados trimestrais após o fechamento do pregão de quinta-feira.
Não perca esses insights do CNBC PRO