Aquisição de US$ 2 bilhões por Huang Renxun vira caso não resolvido de "contratação via fusão", enquanto a startup de chips de IA Groq levanta nova rodada de US$ 49 bilhões: ataque direto à hegemonia em inferência
O mistério não resolvido da “not-acqui-hire” de US$ 20 bilhões de Jensen Huang, e Groq, o cavalo negro dos chips de IA, desencadeia uma tempestade de financiamento de US$ 6,5 bilhões: apontando diretamente para a hegemonia da inferência
Uma nuvem de suspeita sobre uma “not-acqui-hire” de 200 bilhões de dólares ainda não se dissipou totalmente, e um novo trovão já ecoa no campo de batalha dos chips de IA. Justamente quando a Nvidia foi exposta por usar métodos astronômicos para caçar equipes de ponta, a Groq, uma vez considerada uma rival em potencial, foi revelada pelo Axios que está realizando uma rodada de financiamento interno de até US$ 6,5 bilhões (cerca de 49 bilhões de yuans) e, simultaneamente, promove uma guinada estratégica de vida ou morte: apostar tudo em serviços de inferência de IA, abandonando a venda de hardware. Este jogo de poder do Vale do Silício é muito mais enigmático do que qualquer drama corporativo.
A “not-acqui-hire” de US$ 200 bilhões: a ansiedade da Nvidia e a teimosia da Groq
“not-acqui-hire”, essa nova gíria do Vale do Silício, descreve com precisão a investida agressiva da Nvidia — sem precisar adquirir toda uma empresa, basta recrutar e levar os talentos centrais do concorrente com uma oferta irrecusável, sufocando a concorrência em silêncio. O número de 200 bilhões de dólares que circula na indústria, embora não confirmado oficialmente, reflete a realidade sangrenta de que “quem detém os talentos, conquista o mundo” no setor de chips de IA. No entanto, a Groq claramente não se rendeu a esse ataque de dimensão superior. A escolha de iniciar uma rodada de financiamento de centenas de milhões de dólares neste momento, mesmo disposta a abandonar parte de sua obsessão pelo hardware, é a resposta mais contundente ao gigante. Esta empresa, fundada por veteranos do TPU do Google, precisa provar que não é um mero coadjuvante que só sabe vender placas.
Abandonando a obsessão pelo hardware, a aposta total da Groq na inferência
A LPU (Unidade de Processamento de Linguagem) da Groq impressionou a indústria com os parâmetros no papel, alegando atingir velocidades extremas de centenas de tokens por segundo ao executar grandes modelos de linguagem. Mas a arena do hardware sempre foi impiedosa; a Dell, a Supermicro e a própria Nvidia construíram fossos profundos. O anúncio da Groq de transferir o foco para a “inferência de IA” (a otimização da forma como o modelo responde às solicitações dos usuários) não é um mero ajuste técnico, mas uma reinvenção completa do modelo de negócios. Eles não esperam mais que os clientes comprem chips físicos caros, mas passam a vender diretamente, via serviços em nuvem, aquela impressionante “velocidade de resposta”. Esta é uma transição de “fabricar pás” para “minerar ouro diretamente”, apostando que a disposição das empresas em pagar por latências na casa dos milissegundos é muito maior do que o desejo de possuir transistores empilhados.
A batalha final do mercado de inferência por trás dos US$ 6,5 bilhões
Com o avanço vertiginoso da IA generativa, os investimentos globais anuais de centenas de bilhões de dólares em treinamento precisam, em última análise, ser monetizados por meio da inferência. Se a Groq conseguir oferecer, com sua arquitetura LPU, soluções de inferência mais baratas, mais rápidas e com maior eficiência energética do que as GPUs, esses US$ 6,5 bilhões serão o bisturi para abrir uma brecha no mercado. O capital será usado para construir clusters de computação de inferência em larga escala, permitindo que os desenvolvedores executem tarefas de agentes em milissegundos sem jamais tocar em um chip físico. Esta não é apenas a luta pela sobrevivência da Groq, mas um ponto de inflexão em que todo o mercado de computação de IA deixa o “reinado do treinamento” para inaugurar a “hegemonia da inferência”. Enquanto a Nvidia consolida suas vantagens abrangentes com as H200 e B200, a incursão vertical da Groq nos mostra: neste jogo de alto risco de deserção computacional, basta encontrar um ângulo de “ataque assimétrico” para fazer o gigante suar frio.