Como o novo modelo de IA da China, DeepSeek, ameaça a liderança dos EUA

Um laboratório de inteligência artificial pouco conhecido na China gerou pânico no Vale do Silício ao lançar modelos de Inteligência Artificial que superam os melhores dos EUA apesar de serem desenvolvidos com menor custo e usando chips menos potentes.

O laboratório, chamado DeepSeek, apresentou no final de dezembro um modelo de linguagem de código aberto, afirmando que o desenvolveu em apenas dois meses e com um orçamento inferior a US$ 6 milhões, utilizando chips da Nvidia de capacidade reduzida, conhecidos como H800.

Esses avanços levantaram preocupações sobre a possível redução da liderança global dos EUA em inteligência artificial, além de questionarem os altos investimentos das big techs no desenvolvimento de modelos de IA e data centers.

Leia também:

  • Brasil está entre os países que mais usam inteligência artificial, com 54% dos entrevistados
  • Davos: inteligência artificial e computação quântica também têm espaço nos debates do fórum econômico

Em uma série de testes independentes de benchmark, o modelo da DeepSeek superou o Llama 3.1, da Meta, o GPT-4o, da OpenAI, e o Claude Sonnet 3.5, da Anthropic, em métricas que avaliam precisão em resolução de problemas complexos, matemática e codificação.

Na segunda-feira, a DeepSeek lançou o r1, um modelo de raciocínio que também superou o modelo mais recente da OpenAI, o o1, em muitos desses testes independentes.

“Ver esse novo modelo da DeepSeek é extremamente impressionante, tanto pela eficiência no uso de recursos computacionais quanto pela forma como eles desenvolveram um modelo de código aberto altamente eficaz,” disse Satya Nadella, CEO da Microsoft, durante o Fórum Econômico Mundial em Davos, na Suíça, na quarta-feira. “Precisamos levar muito a sério os avanços vindos da China.”

A DeepSeek também enfrentou as rígidas restrições dos EUA à exportação de semicondutores, que cortaram o acesso da China a chips de alta potência, como os H100 da Nvidia.

Os avanços mais recentes sugerem que a DeepSeek encontrou uma forma de contornar essas limitações ou que os controles de exportação não tiveram o impacto esperado por Washington.

“Eles podem usar um modelo muito grande e bom para aplicar um processo chamado destilação,” explicou Chetan Puttagunta, sócio da Benchmark. “Basicamente, você utiliza um modelo maior para ensinar um modelo menor a se especializar naquilo que você quer. É um método muito eficiente em termos de custo.”

Pouco se sabe sobre o laboratório e seu fundador, Liang WenFeng. De acordo com reportagens, a DeepSeek nasceu de um fundo de hedge chinês chamado High-Flyer Quant, que administra cerca de US$ 8 bilhões em ativos.

No entanto, a DeepSeek não é a única empresa chinesa avançando no setor.

O renomado pesquisador de IA Kai-Fu Lee afirmou que sua startup, a 01.ai, foi treinada com um orçamento de apenas US$ 3 milhões. Na quarta-feira, a ByteDance, controladora do TikTok, anunciou uma atualização de seu modelo, alegando que ele superou o o1 da OpenAI em um importante teste de benchmark.

“A necessidade é a mãe da invenção,” disse Aravind Srinivas, CEO da Perplexity. “Por terem que descobrir soluções alternativas, eles acabaram construindo algo muito mais eficiente.”

O post Como o novo modelo de IA da China, DeepSeek, ameaça a liderança dos EUA apareceu primeiro em Times Brasil- Licenciado Exclusivo CNBC.

Adicionar aos favoritos o Link permanente.