Energia: modelos de linguagem vs. busca na web

Resumo da Notícia

Contexto Geral

O conteúdo compara o consumo de energia necessário para satisfazer uma necessidade complexa de informação por sessão, contrapondo modelos de linguagem (LLMs) e busca na web. Em vez de avaliar apenas a energia do servidor por consulta, a análise considera todo o percurso do usuário, incluindo dispositivo, rede e infraestrutura publicitária, apresentando medições recentes de inferência de LLM e de navegação na web.

Principais Pontos

A comparação migra do cálculo “por consulta no servidor” para “por sessão completa do usuário”, incorporando energia do dispositivo, da rede e da publicidade programática, que não é medida no data center.
Medições de produção situam a inferência de LLM padrão em aproximadamente 0,2–0,4 Wh por prompt; um resultado reporta mediana de 0,24 Wh; outra estimativa indica 0,34 Wh.
A energia por consulta de busca foi divulgada em ~0,3 Wh em 2009 e manteve-se estável por 15 anos com melhorias de PUE; a energia fora do data center evoluiu de forma distinta.
O tamanho mediano de página móvel é 2,56 MB (p90 ~6,9 MB); em rede 4G a 0,17 kWh/GB, o download da página mediana consome ~0,44 Wh só de rede; uma sessão com três páginas soma ~0,78–1,32 Wh; respostas de LLM em texto têm ~2–10 KB, com razão de tráfego de ~500:1 em relação à página mediana.
Grande parte do tráfego dito 5G opera em modo NSA, roteado por núcleo 4G, mantendo características energéticas de 4G.
Dispositivos durante navegação: laptops consomem ~6–18 W; smartphones ~2–4 W; estudo experimental observou tarefas concluídas mais rapidamente e com menos consultas via LLM, reduzindo energia do dispositivo pelo menor tempo de tela ativa.
Cerca de 69% das buscas terminam sem clique; nesses casos, a energia aproxima-se do custo da consulta (~0,3 Wh), alinhado ao LLM; a vantagem de eficiência aparece nos ~31% que exigem visitas a sites.
Não há estudo revisado por pares que compare quantificadamente energia em nível de sessão entre LLM e busca incluindo a sobrecarga de publicidade programática; medições anteriores de campanhas e de impacto de bloqueadores não foram sintetizadas com unidade funcional comum; esta lacuna é endereçada.
Modelos de raciocínio de última geração podem consumir ~1,0–5,0 Wh por consulta (muitas vezes 30× acima da inferência padrão, chegando a 700× em casos extremos); este nível é considerado fora do escopo para consultas comparáveis à busca.
Energia de treinamento de LLM e de rastreamento/indexação de busca são processos contínuos de fundo e são omitidos do orçamento de sessão por simetria.
Medição detalhada de produção atribui, em mediana, 0,24 Wh por prompt de texto com composição aproximada: 0,14 Wh (aceleração), 0,06 Wh (CPU/DRAM), 0,02 Wh (provisionamento inativo) e 0,02 Wh (PUE).

Informações Essenciais

A análise mostra que avaliar a energia por sessão, incluindo dispositivo do usuário, rede e publicidade, altera substancialmente a comparação entre LLMs e busca. Enquanto a inferência padrão de LLM fica em ~~0,2–0,4 Wh por prompt, elementos da navegação web — como transferência de páginas móveis medianas (~~0,44 Wh só de rede por página) — podem superar esse valor. Para consultas sem clique, a busca aproxima-se do custo por consulta (~0,3 Wh), mas para sessões que exigem visitas a sites, os LLMs tendem a apresentar vantagem de eficiência energética dentro do escopo analisado.

Fonte: dupr.at

Resumo da Notícia

Contexto Geral

Principais Pontos

Informações Essenciais

Quer transformar sua gestão de marketing?