Relatório estima que gastos da DeepSeek com hardware podem chegar a US$ 500 milhões

A DeepSeek da China se tornou o principal assunto no mundo da tecnologia nesta semana, com muitos na indústria e em Wall Street focados em um único número: US$ 6 milhões (aproximadamente R$ 29,76 milhões).

No documento da DeepSeek sobre seu mais novo modelo de inteligência artificial, a empresa informou que seus custos totais de treinamento foram de US$ 5,576 milhões (aproximadamente R$ 27,72 milhões), baseados no preço de aluguel das unidades de processamento gráfico da Nvidia. A DeepSeek fez uma ressalva clara, dizendo que o número incluía apenas o “treinamento oficial” do modelo e excluía os custos relacionados a “pesquisas anteriores e experimentos de remoção sobre arquiteturas, algoritmos ou dados”.

Impacto da DeepSeek nos mercados e concorrência

No início da semana, o Assistente de IA da DeepSeek alcançou o cobiçado posto de aplicativo gratuito mais baixado na App Store nos Estados Unidos, destronando o ChatGPT da OpenAI. As ações globais de tecnologia caíram, com os fabricantes de chips Nvidia e Broadcom perdendo juntos US$ 800 bilhões (aproximadamente R$ 3,97 trilhões) em valor de mercado na última segunda-feira (27).

Um novo relatório da SemiAnalysis, uma empresa de pesquisa e consultoria em semicondutores, trouxe mais contexto para as despesas da DeepSeek. A empresa estimou que os gastos com hardware da DeepSeek estão “bem acima de US$ 500 milhões ao longo da história da empresa”, acrescentando que os custos de P&D e o custo total de propriedade são significativos. Gerar “dados sintéticos” para o modelo treinar exigiria “uma quantidade considerável de computação”, escreveu a SemiAnalysis.

O relatório mencionou que o Claude 3.5 Sonnet da Anthropic custou “dezenas de milhões para treinar”, mas destacou que a Anthropic levantou bilhões de dólares da Amazon e do Google, um indicativo da quantidade maior de dinheiro necessária para operar os modelos e a empresa.

“Isso acontece porque eles precisam experimentar, criar novas arquiteturas, coletar e limpar dados, pagar funcionários e muito mais”, disse a SemiAnalysis.

O próprio documento da DeepSeek não inclui uma estimativa de seus custos de computação. A empresa não respondeu imediatamente a um pedido de posicionamento.

“Para ser claro, a DeepSeek é única por ter sido a primeira a alcançar esse nível de custo e capacidades “, escreveram os analistas da SemiAnalysis. A empresa acrescentou que o R1 da DeepSeek “é um modelo muito bom” e que “alcançar rapidamente esse nível de raciocínio é objetivamente impressionante”.

Especialistas e analistas destacaram nesta semana a qualidade do modelo da DeepSeek e notaram o quão impressionante ele é, considerando que os EUA restringiram a exportação de chips para a China três vezes em três anos. Isso gerou preocupações de que os EUA estão ficando para trás de seu principal adversário em um mercado que deve alcançar US$ 1 trilhão (aproximadamente R$ 4,97 trilhões) em receita dentro de uma década.

Origem e crescimento da DeepSeek

Analistas da Bernstein escreveram em uma nota na segunda-feira (27) que “de acordo com as muitas (ocasionalmente histéricas) análises polêmicas que vimos [no final de semana], as implicações variam de ‘Isso é realmente interessante’ a ‘Este é o fim do complexo de infraestrutura de IA como o conhecemos’”.

A DeepSeek foi fundada em 2023 por Liang Wenfeng, cofundador da High-Flyer, um fundo de hedge quantitativo focado em IA. A startup de IA supostamente cresceu a partir da unidade de pesquisa em IA do fundo de hedge em abril de 2023 para focar em modelos de linguagem de grande escala e alcançar a inteligência geral artificial, ou AGI — um ramo da IA que iguala ou supera a inteligência humana em uma ampla gama de tarefas, e que a OpenAI e outros estão buscando.

A DeepSeek ainda é totalmente propriedade e financiada pela High-Flyer, segundo analistas da Jefferies.

Tecnologia e controvérsias envolvendo o r1

O burburinho em torno da DeepSeek começou a ganhar força no início deste mês, quando a startup lançou o R1, seu modelo de raciocínio que rivaliza com o o1 da OpenAI. Ele é de código aberto, o que significa que qualquer desenvolvedor de IA pode usá-lo.

Como outros chatbots chineses, o da DeepSeek tem limitações em certos tópicos: quando questionado sobre algumas das políticas do líder chinês Xi Jinping, por exemplo, o DeepSeek supostamente desvia o usuário de questões semelhantes.

O CEO da OpenAI, Sam Altman, elogiou publicamente o modelo, mas a empresa também afirmou acreditar que há evidências de que a DeepSeek colheu indevidamente dados da OpenAI para construir seu produto. Em um evento em Washington, D.C. organizado pela OpenAI na quinta-feira (30), Altman disse que a DeepSeek é “claramente um grande modelo”.

“Isso é um lembrete do nível de competição e da necessidade de uma IA democrática vencer”, disse ele. Ele afirmou que isso também aponta para o “nível de interesse em raciocínio, o nível de interesse em código aberto”.

O post Relatório estima que gastos da DeepSeek com hardware podem chegar a US$ 500 milhões apareceu primeiro em Times Brasil- Licenciado Exclusivo CNBC.

Relatório estima que gastos da DeepSeek com hardware podem chegar a US$ 500 milhões

Impacto da DeepSeek nos mercados e concorrência

Origem e crescimento da DeepSeek

Tecnologia e controvérsias envolvendo o r1

Newsletter

Obrigado