Pular para o conteúdo principal

Energia: modelos de linguagem vs. busca na web

dupr.at Wikky Wikky
Energia: modelos de linguagem vs. busca na web

Resumo da Notícia

Contexto Geral

O conteúdo compara o consumo de energia necessário para satisfazer uma necessidade complexa de informação por sessão, contrapondo modelos de linguagem (LLMs) e busca na web. Em vez de avaliar apenas a energia do servidor por consulta, a análise considera todo o percurso do usuário, incluindo dispositivo, rede e infraestrutura publicitária, apresentando medições recentes de inferência de LLM e de navegação na web.

Principais Pontos

  • A comparação migra do cálculo “por consulta no servidor” para “por sessão completa do usuário”, incorporando energia do dispositivo, da rede e da publicidade programática, que não é medida no data center.
  • Medições de produção situam a inferência de LLM padrão em aproximadamente 0,2–0,4 Wh por prompt; um resultado reporta mediana de 0,24 Wh; outra estimativa indica 0,34 Wh.
  • A energia por consulta de busca foi divulgada em ~0,3 Wh em 2009 e manteve-se estável por 15 anos com melhorias de PUE; a energia fora do data center evoluiu de forma distinta.
  • O tamanho mediano de página móvel é 2,56 MB (p90 ~6,9 MB); em rede 4G a 0,17 kWh/GB, o download da página mediana consome ~0,44 Wh só de rede; uma sessão com três páginas soma ~0,78–1,32 Wh; respostas de LLM em texto têm ~2–10 KB, com razão de tráfego de ~500:1 em relação à página mediana.
  • Grande parte do tráfego dito 5G opera em modo NSA, roteado por núcleo 4G, mantendo características energéticas de 4G.
  • Dispositivos durante navegação: laptops consomem ~6–18 W; smartphones ~2–4 W; estudo experimental observou tarefas concluídas mais rapidamente e com menos consultas via LLM, reduzindo energia do dispositivo pelo menor tempo de tela ativa.
  • Cerca de 69% das buscas terminam sem clique; nesses casos, a energia aproxima-se do custo da consulta (~0,3 Wh), alinhado ao LLM; a vantagem de eficiência aparece nos ~31% que exigem visitas a sites.
  • Não há estudo revisado por pares que compare quantificadamente energia em nível de sessão entre LLM e busca incluindo a sobrecarga de publicidade programática; medições anteriores de campanhas e de impacto de bloqueadores não foram sintetizadas com unidade funcional comum; esta lacuna é endereçada.
  • Modelos de raciocínio de última geração podem consumir ~1,0–5,0 Wh por consulta (muitas vezes 30× acima da inferência padrão, chegando a 700× em casos extremos); este nível é considerado fora do escopo para consultas comparáveis à busca.
  • Energia de treinamento de LLM e de rastreamento/indexação de busca são processos contínuos de fundo e são omitidos do orçamento de sessão por simetria.
  • Medição detalhada de produção atribui, em mediana, 0,24 Wh por prompt de texto com composição aproximada: 0,14 Wh (aceleração), 0,06 Wh (CPU/DRAM), 0,02 Wh (provisionamento inativo) e 0,02 Wh (PUE).

Informações Essenciais

A análise mostra que avaliar a energia por sessão, incluindo dispositivo do usuário, rede e publicidade, altera substancialmente a comparação entre LLMs e busca. Enquanto a inferência padrão de LLM fica em 0,2–0,4 Wh por prompt, elementos da navegação web — como transferência de páginas móveis medianas (0,44 Wh só de rede por página) — podem superar esse valor. Para consultas sem clique, a busca aproxima-se do custo por consulta (~0,3 Wh), mas para sessões que exigem visitas a sites, os LLMs tendem a apresentar vantagem de eficiência energética dentro do escopo analisado.

Fonte: dupr.at

Quer transformar sua gestão de marketing?

Junte-se a centenas de equipes que já organizam projetos, processos e conteúdo digital com a Wikimee. Comece gratuitamente hoje mesmo.

Conhecer Wikimee