Empresa chinesa DeepSeek lança novo modelo de IA
A startup chinesa DeepSeek apresentou nesta sexta-feira (24) um novo modelo de Inteligência Artificial (IA) com custos "drasticamente reduzidos", mais de um ano depois de surpreender o mundo com um "chatbot" barato que igualava em capacidades seus rivais americanos.
A indústria tecnológica mundial aguardava há várias semanas por este anúncio, um termômetro das ambições chinesas no setor.
No início de 2025, a startup de Hangzhou conseguiu mudar as regras do jogo da IA com o R1, um "modelo de raciocínio" que, afirmou, rivalizava com um preço menor com Gemini, ChatGPT e Claude, gigantes americanos que receberam investimentos bilionários para seu desenvolvimento.
O novo DeepSeek‑V4 apresentado nesta sexta‑feira "tem um contexto ultralongo de um milhão de palavras, o que lhe permite alcançar a liderança tanto no âmbito nacional como no de código aberto em termos de capacidades dos agentes, conhecimento do mundo e desempenho no raciocínio", afirmou a empresa em um comunicado.
Uma "versão preliminar" já está disponível, acrescentou a empresa.
Os especialistas afirmam que o lançamento do V4, baseado em um modelo de linguagem de grande escala, ou LLM, representa um "ponto de inflexão" em termos de hardware e custos.
"Isto aborda os problemas antigos de desempenho mais lento e custos mais elevados associados a janelas de contexto longas, marcando um verdadeiro ponto de inflexão para a indústria", disse Zhang Yi, fundador da empresa de pesquisa tecnológica iiMedia, à AFP.
"Para os usuários finais, isso trará benefícios amplos e acessíveis. Por exemplo, se o suporte de contexto ultralongo se tornar uma característica padrão, espera‑se que o processamento de textos longos vá além dos laboratórios de pesquisa de ponta e entre nos aplicativos comerciais", disse.
O novo modelo da DeepSeek tem duas versões, DeepSeek‑V4‑Pro e DeepSeek‑V4‑Flash, esta última "uma opção mais eficiente e econômica" por ter um número menor de parâmetros.
- "Momento Sputnik" -
O V4-Pro tem 1,6 trilhão de parâmetros, enquanto o V4-Flash tem 284 bilhões, o que refina a capacidade de tomada de decisões dos modelos.
"Nos testes de desempenho de conhecimento do mundo, o DeepSeek-V4-Pro supera significativamente outros modelos de código aberto e só é levemente superado pelo modelo de código fechado de primeira linha Gemini-Pro-3.1 (da Google)", destaca o comunicado da empresa.
A entrada súbita da empresa chinesa no mercado no ano passado, com o chamado "choque DeepSeek", desencadeou uma venda em larga escala de ações relacionadas com a IA, em particular em Wall Street, e uma revisão das estratégias empresariais.
O anúncio de 2025 foi descrito por alguns analistas como um "momento Sputnik" para o setor, uma expressão que faz referência ao instante em que uma indústria ou uma sociedade toma consciência, com inquietação, de que ficou tecnologicamente atrasada em relação a um concorrente.
O chatbot da DeepSeek tinha um desempenho similar ao do ChatGPT e de outras ferramentas de primeira linha, mas a empresa afirmou que seu desenvolvimento havia exigido uma potência computacional significativamente menor.
A popularidade repentina, no entanto, gerou dúvidas sobre a privacidade dos dados e a censura, já que o "chatbot" frequentemente se recusava a responder a perguntas sobre temas delicados, como a repressão da Praça Tiananmen (Paz Celestial) em 1989.
No país asiático, as ferramentas de IA da DeepSeek foram amplamente adotadas pelos municípios e pelas instituições de saúde chinesas, assim como pelo setor financeiro e por outras empresas.
Isto foi estimulado em parte pela decisão da DeepSeek de tornar os seus sistemas de código aberto, revelando o seu funcionamento interno, em contraste com os modelos patenteados vendidos pela OpenAI e por outros rivais ocidentais.
A Casa Branca acusou recentemente as empresas chinesas de competirem para "roubar" tecnologia americana, antes da reunião de cúpula prevista entre os presidentes Donald Trump e Xi Jinping em Pequim no próximo mês.
Na intensa concorrência de IA, a americana OpenAI, criadora do popular ChatGPT, também apresentou na quinta-feira um novo modelo que pretende ser o mais avançado do mercado.
姜-A.Jiāng--THT-士蔑報