Inteligência artificial chinesa DeepSeek passa ChatGPT em downloads e derruba ações de tecnologia
A comprovação de que a inteligência artificial generativa pode ser mais efetiva e barata do que se achava até agora provocou uma reviravolta no mundo da tecnologia e do mercado financeiro no dia 27/1.
A causadora da onda, que fez companhias tecnológicas perderem mais de US$ 1 trilhão (R$ 5,9 trilhões) em valor de mercado, foi a chinesa DeepSeek.
A maior queda foi da Nvidia, que lidera o mercado de chips para IA e perdeu US$ 592,6 bilhões em valor de mercado, com uma queda de 15% nas ações, a maior de sua história. A companhia terminou o dia valendo R$ 2,9 trilhões.
O aplicativo de inteligência artificial da empresa asiática saltou para o primeiro lugar na lista de downloads das lojas da Apple dos Estados Unidos e também da China nesta segunda.
A DeepSeek mexeu com o mercado ao apresentar resultados à altura, e em algumas ocasiões superiores, ao dos consagrados modelos de IA generativa americanos ChatGPT, Claude (da Anthropic) e Llama (da Meta).
A startup chinesa abriu sua tecnologia mais recente, o R1, ao público na semana passada e, desde então, ganha popularidade. E isso com custo declaradamente muito menor.
Os pesquisadores da empresa publicaram um artigo no mês passado afirmando que o modelo DeepSeek-V3, já anterior, lançado em 10 de janeiro, usou chips H800 da Nvidia para treinamento, gastando menos de US$ 6 milhões (R$ 35,6 milhões).
Esses chips não são ponta de linha no mercado. Foram inicialmente desenvolvidos como um produto de capacidade reduzida para contornar as restrições dos EUA de vendas para a China.
Os processadores foram posteriormente banidos por Washington para venda a Pequim.
Para comparação, o megaprojeto de datacenters encampado por Sam Altman para desenvolver IA, por exemplo, prevê US$ 100 bilhões (R$ 589 bilhões) de investimentos iniciais.
São ordens de grandeza de diferença em relação à operação chinesa.
O modelo R1 está sendo saudado pelo investidor e engenheiro americano Marc Andreessen, referência histórica do Vale do Silício e que assessora o presidente Donald Trump, como “o momento Sputnik da inteligência artificial”.
A expressão se refere ao lançamento do satélite soviético em 1957, que levou os EUA à corrida espacial.
A apresentação do modelo anterior de IA pelo DeepSeek, há cerca de um mês, já vinha provocando reação por parte de empresas americanas –e também chinesas, como Alibaba e ByteDance.
As ferramentas são disponibilizadas gratuitamente via site da DeepSeek, inclusive no Brasil e em português, e permitem ações como: tradução e geração de textos, análise de grandes volumes de dados e projeções, auxílio na pesquisa e “até na redação de trabalhos acadêmicos”, escrever códigos em linguagens como Python, automatizar suporte para atendimento a clientes etc.
O site The Information, hoje o principal veículo noticioso de tecnologia, informou que a Meta, de Mark Zuckerberg, criou grupos especializados de pesquisadores para entender como a DeepSeek cria seus modelos, para usar o conhecimento em seu próprio desenvolvimento.
O impacto da DeepSeek nas big techs americanas se evidenciou na entrevista de Zuckerberg ao podcast de Joe Rogan, no último dia 11/1.
Por iniciativa própria, o empresário falou que “tem esse ótimo modelo chinês que acabou de sair, dessa empresa, DeepSeek, eles estão fazendo um trabalho muito bom, é um modelo muito avançado”.
E partiu para o ataque: “se você pedir alguma opinião negativa sobre Xi Jinping, ele não lhe dará nada”.
Foi a primeira de uma série de tentativas de questionar a DeepSeek por parte das concorrentes americanas, seguidas de respostas na própria comunidade de tecnologia dos EUA.
O investidor americano de origem chinesa Kevin Xu, que foi da Casa Branca e do Departamento de Comércio no governo Barack Obama, testou e descobriu que, quando baixado no notebook, o modelo da DeepSeek responde ao ser questionado sobre o líder chinês:
“Em termos de direitos humanos, alguns críticos argumentam que Xi reprimiu de forma mais dura do que líderes chineses anteriores em várias áreas como liberdade de mídia”.
Ou seja, fora da China e da nuvem da empresa, os modelos de código aberto da DeepSeek sabem e podem oferecer tanto quanto seus concorrentes, inclusive sobre Xi.
No mercado de ações, papéis de empresas de tecnologia desabaram com a percepção de chegada de um forte concorrente.
“O DeepSeek mostra que é possível desenvolver modelos poderosos de IA que custam menos. Isso pode diminuir os gastos com toda a cadeia de suprimentos de IA”, comentou Vey-Sern Ling, diretor administrativo da Union Bancaire Privee em entrevista para a Bloomberg.
O índice Nasdaq, que reúne as ações de empresas do setor de tecnologia, teve queda de 3,07% nesta segunda, ficando praticamente US$ 1 trilhão mais baixo do que o fechamento de sexta-feira em valor.
As ações da Oracle caíram 13%, enquanto os papéis da Microsoft e Alphabet (dona do Google) desvalorizaram 2,9% e 4,1%, respectivamente.
Na Europa, a fabricante de máquinas para produção de chips ASML, que conta com TSMC, Intel e Samsung como seus clientes, viu suas ações recuarem 7%.
A Nvidia, que liderou as quedas, também se manifestou em nota nesta segunda.
A empresa afirmou que os avanços da Deepseek mostram a utilidade de seus chips para o mercado chinês e que, no futuro, serão necessários mais de seus produtos para atender à demanda pelos serviços da startup.
“O trabalho da DeepSeek ilustra como novos modelos podem ser criados usando essa técnica, aproveitando modelos amplamente disponíveis e computação que é totalmente compatível com o controle de exportação”, disse o comunicado.
Na semana passada, o fundador da empresa, Liang Wenfeng, foi a principal atração de um encontro de especialistas em tecnologia com o primeiro-ministro Li Qiang, que surgiu sorridente na conversa com o empresário, na transmissão da rede CCTV.
Paralelamente, a agência oficial Xinhua despachou um texto sobre a DeepSeek, destacando que “os avanços da inteligência artificial da China frustram a política de repressão dos EUA”.
É o que afirmam também especialistas americanos. Paul Triolo, vice para China e tecnologia na consultoria estratégica ASG, de Washington, diz que “a DeepSeek aponta para as fraquezas na abordagem do governo Joe Biden, que partia do pressuposto de que os modelos avançados só podem ser produzidos” com grande quantidade de chips de ponta —daí a proibição de sua venda à China.
A empresa chinesa agora “demonstra o potencial de um pequeno grupo de engenheiros, muito capazes, para alavancar recursos limitados e desenvolver IA avançada”.
E seus modelos de código aberto podem agora ser adotados por desenvolvedores ao redor do mundo, tirando mercado dos concorrentes americanos.
Patrick Zhang, ex-funcionário do Ministério do Exterior da China, hoje no setor de tecnologia e publicando análises na newsletter Geopolitechs, avalia que a DeepSeek acima de tudo “representa uma vitória do código aberto sobre o código fechado”.
Mas alerta que o custo dado como baixo, para o desenvolvimento de seus modelos, não representa integralmente o investimento feito.
Triolo também ressalva que a DeepSeek está nos primeiros passos e é preciso aguardar o teste do tempo, para saber se seu custo baixo será, de fato, viável.
Ele mesmo acrescenta, porém, que o modelo V2, em meados do ano passado, já causou impacto ao se aproximar do desempenho do Llama 3, da Meta.
Foi nessa época, em julho, que o fundador Liang Wenfeng deu uma rara entrevista que embasa até hoje o pouco que se sabe sobre a filosofia da DeepSeek, empresa que ainda vai completar dois anos, em maio.
Falando ao órgão noticioso Anyong, disse por que decidiu desenvolver modelo próprio, em vez de recorrer àqueles de código aberto então existentes: “o nosso objetivo é AGI [Artificial General Intelligence], IA que visa se equiparar à capacidade humana], o que significa que precisamos estudar novas estruturas de modelos para realizar uma mais forte, com recursos limitados”.
Sobre se concentrar em pesquisa e desenvolvimento, não em aplicação: “o mais importante agora é participar da onda global de inovação. Por anos, as empresas chinesas se acostumaram a deixar outros inovarem, enquanto nós focávamos em monetização da aplicação. Mas isso não é algo inevitável. Nosso objetivo é dirigir o desenvolvimento de todo o ecossistema”.
A chegada do modelo V2 havia mexido com o mercado chinês de modelos de IA, levando Zhipu, ByteDance, Alibaba, Baidu e outros a reduzirem preços.
Sobre isso, ele disse: “nosso princípio é que não subsidiamos nem buscamos lucros exorbitantes. Esse ponto de preço nos dá apenas uma pequena margem de lucro acima dos custos”.
Numa referência a “Blossoms Shanghai”, série de TV sobre a ascensão econômica de Xangai nos anos 1990, que descreve as novas empresas agressivas como peixes-gatos, Liang comentou: “nós não queríamos nos tornar um peixe-gato, apenas nos tornamos, acidentalmente”.
EMPRESA CRIADA EM 2023
O fundador da DeepSeek começou a comprar unidades de processamento gráfico da agora concorrente Nvidia em 2021, enquanto administrava um fundo de investimento chamado High-Flyer.
Segundo o jornal Financial Times, parceiros de negócios de Liang o classificam como uma pessoa que sempre falou em construir equipamentos para treinar os seus próprios modelos de inteligência artificial.
Ele obteve milhões de dólares com o High-Flyer, usando IA e algoritmos que identificavam padrões na mudança de preços das ações. Ele passou a usar os chips da Nvidia para obter a maior valorização possível.
Em 2023, a DeepSeek foi criada com o fundador passando a investir pesado para atrair os maiores talentos da China para desenvolver o próprio modelo de inteligência artificial.
A grande diferença, segundo analistas da indústria ouvidos pelo Financial Times, é que a empresa chinesa tem como objetivo compartilhar as descobertas, em vez de protegê-las para obter ganhos comerciais.
“(A DeepSeek) não tem pessoas que retornaram do exterior. Eles são todos locais… Temos que desenvolver os melhores talentos nós mesmo”, afirmou Liang em rara entrevista. Diferente dos rivais dos EUA, a empresa chinesa levantou capital com fundos externos ou grandes pedidos de monetização dos modelos.
expresso.arq sobre artigo de Nélson Sá / FSP com colaboração de Fernando Narazaki ,AFP, Bloomberg, Financial Times, New York Times e Reuters