O que as Notas de Avaliação Realmente Significam | Blog

Você passou dez minutos na página do Metacritic de um jogo. O Metascore é 76. Você verifica o OpenCritic e ele mostra 78. Um fórum diz que está bom; outro diz que qualquer coisa abaixo de 80 não vale seu tempo. Você ainda não tem ideia se deve gastar 70 dólares e, de alguma forma, está menos confiante do que antes de começar a pesquisar.

Essa confusão não é culpa sua. As notas de avaliação têm sido silenciosamente problemáticas por anos, e a forma como são reportadas dificulta a identificação do problema subjacente. Uma vez que você entende o que uma nota realmente codifica e de onde esses números vêm, você as usará de forma muito mais eficaz. Ou pelo menos parará de perder o sono por uma diferença de dois pontos.

A escala que fazia sentido antes

Quando as revistas impressas eram a principal fonte de crítica de jogos, as publicações eram francas sobre o que cada nota significava. A Electronic Gaming Monthly (EGM), uma das publicações mais influentes da década de 1990, dizia diretamente aos leitores: 10 era perfeito, 9 era excelente, 8 era ótimo, 7 era muito bom, 6 era acima da média e 5 era a média. Esse último ponto é o que mais importa. Um 5 não era uma desaprovação. Colocava um jogo exatamente no meio da escala, que é exatamente o que a palavra "média" significa.

Os críticos que seguiam essa rubrica usavam toda a gama. Um jogo ruim recebia um 2 ou 3. Um título funcional, mas sem emoção, recebia um 5. Uma nota alta significava algo porque uma nota baixa era uma possibilidade real. Todo o sistema tinha uma espécie de honestidade: a hierarquia refletia diferenças reais de qualidade.

Isso mudou quando a crítica de jogos migrou para a internet no final dos anos 1990 e início dos anos 2000.

Como 7 se tornou o novo "Aceitável"

À medida que os sites independentes se multiplicavam, os guias de pontuação se tornaram menos visíveis. Escritores chegavam sem rubricas claras. Uma mudança cultural silenciosa se instalou, em parte emprestada de como as escolas americanas avaliam: se 70% é uma nota "passável", então 7/10 deve significar "mal passável", e 5/10 deve significar falha. Mas um 5 em uma escala de 10 pontos não é reprovação. É para ser comum.

Os números subiram. De acordo com uma análise de 2014 publicada na Game Developer, a nota média de avaliação da IGN para jogos era de 8.0 de 10 em 2006. A média da GameSpot era de 7.0 no mesmo ano. Em toda a indústria, as notas se agruparam em uma faixa que deixou a metade inferior da escala essencialmente vazia. Os críticos ficaram relutantes em dar notas baixas porque uma nota abaixo de 6 soava agressiva, mesmo para jogos realmente ruins, e há uma pressão social real em uma pequena indústria para não ser a pessoa que afundou o lançamento de um pequeno estúdio.

É isso que os críticos às vezes chamam de problema do "8 preguiçoso": a faixa de pontuação prática colapsou de 1-10 para algo mais próximo de 7-10, com tudo abaixo de 7 tratado como um julgamento severo em vez de neutro. Quando a escala se comprime assim, as diferenças entre as notas começam a se confundir. Um 7.5 e um 8.5 representam uma lacuna significativa na rubrica original. Após a mudança, ambos são apenas "bons".

A tabela abaixo mostra o quanto o significado pretendido e o significado recebido se afastaram:

Nota	O que oficialmente deveria significar	O que a maioria dos leitores realmente entende
10/10	Perfeito, uma verdadeira obra-prima	Compra obrigatória imediatamente
9/10	Excelente, um marco	Quase imperdível
8/10	Muito bom, claramente vale seu tempo	Bom, provavelmente ok
7/10	Acima da média, vale a pena	Sinais mistos, alguns hesitam
6/10	Média, nem bom nem ruim	Frequentemente lido como uma avaliação negativa
5/10 ou abaixo	Falho, mas pode ter valor / ruim	Terrível, nunca toque nele

Essa lacuna entre o significado pretendido e o recebido é onde grande parte do discurso sobre jogos se desvia.

Uma ilustração de marca plana mostrando duas silhuetas idênticas de controle de jogo: uma rotulada com uma barra de escala completa de 1-10, outra com uma seta aglomerada apenas na terça parte superior da mesma barra, estética tecnológica limpa e escura

Dois agregadores, duas filosofias

A maioria dos jogadores não lê uma dezena de publicações. Eles consultam agregadores, e dois sites dominam esse espaço.

O Metacritic foi lançado em 1999, criado por Jason Dietz, Marc Doyle e Julie Doyle Roberts. Ele agrega notas de aproximadamente 140 publicações usando uma média ponderada: certas publicações contam mais do que outras com base em critérios que o Metacritic nunca divulgou publicamente. Você não pode ver quais são os pesos. Você não pode dizer, ao olhar um Metascore, se uma publicação importante impulsionou o número ou se ele reflete um consenso genuíno. O Metacritic também não atualiza as notas depois de publicadas, o que significa que uma avaliação de 2012 que não reflete a posição atual de uma publicação ainda molda o registro permanente de um jogo.

O OpenCritic foi lançado em 30 de setembro de 2015, construído por Matthew Enthoven, Charles Green, Richard Triggs e Aaron Rutledge diretamente em resposta a essa opacidade. Em vez de pesos ocultos, ele usa uma média aritmética simples: a nota de cada crítico conta igualmente após a normalização para uma escala de 0 a 100. Ele também mostra a porcentagem de críticos que recomendaram ativamente o jogo e classifica os títulos em níveis: Poderoso (top 10% de todos os jogos avaliados), Forte (próximos 30%), Razoável (do percentil 30 ao 60) e Fraco (inferior a 30%). A Valnet adquiriu o OpenCritic em julho de 2024, mas ele continua sendo a opção mais transparente para quem tenta entender de onde veio um número agregado.

Vale a pena notar: a métrica de "% recomendado" no OpenCritic muitas vezes diz mais do que a nota média. Um jogo com média de 74 e 85% dos críticos o recomendando está em uma posição muito diferente de um jogo com média de 74 e 55% o recomendando. O primeiro é um jogo que a maioria das pessoas gostou, mas não amou. O segundo é um título polarizador onde alguns críticos foram entusiastas e outros ficaram significativamente descontentes. O mesmo número, uma história completamente diferente.

Nenhum agregador diz se você vai gostar do jogo.

Quando as notas têm consequências reais

No momento em que as notas de avaliação foram vinculadas aos salários dos desenvolvedores, tudo sobre como a indústria as usa mudou.

O exemplo mais discutido é Fallout: New Vegas. A desenvolvedora Obsidian Entertainment tinha uma cláusula em seu contrato com a editora Bethesda Softworks vinculando um bônus de conclusão ao seu desempenho no Metacritic. O jogo foi lançado em 2010 com genuíno louvor da crítica e obteve um Metascore de 84. O limite do bônus era de 85. Toda a equipe da Obsidian perdeu um pagamento que Jason Schreier relatou no Kotaku que era em média 14.000 dólares por funcionário em um estúdio de 70 pessoas. Um ponto em um agregador usando uma fórmula de ponderação não divulgada.

Essa história se tornou famosa, mas a prática subjacente era comum. Uma vez que os desenvolvedores sabem que as notas afetam os bônus, os produtores começam a identificar o que os críticos historicamente recompensaram e a incorporar esses elementos no jogo, independentemente da adequação. As equipes de marketing elaboram estratégias de imprensa em torno de embargos de avaliação para maximizar as notas da semana de lançamento. As editoras retêm o acesso antecipado de publicações que provavelmente darão notas baixas. A nota se torna um alvo que influencia o design, não um resultado dele.

Nada disso torna o número resultante mais útil para ajudá-lo a decidir o que jogar. Pelo contrário, o torna menos representativo do que os jogadores reais experimentam.

O que o número realmente codifica

A versão simples é esta: uma nota de avaliação é a tentativa de uma pessoa de comprimir uma experiência complexa, de horas de duração, em um número que pode ser comparado a outros números de outras pessoas avaliando outros jogos. A versão agregada faz uma média dessas compressões individuais.

Essa compressão perde quase tudo o que é relevante:

Se o estilo de combate combina com o seu jeito de jogar
Se a história é o tipo que você pode se perder
Se o crítico terminou o jogo antes de publicar (mais comum do que a indústria admite)
Se o gosto geral da publicação se alinha com o seu
Se um patch significativo mudou a experiência após a publicação da avaliação
Se a comunidade do jogo é ativa, caso tenha componentes multiplayer

O que uma nota diz é onde a reação instintiva de um crítico se encaixou em sua hierarquia interna, em comparação com outros jogos que ele avaliou, no dia em que publicou. Essa é uma informação genuinamente útil. Apenas não é um veredito que você pode adotar por completo.

Como realmente ler as notas de avaliação

Obter valor das notas significa tratá-las como pontos de partida, não como conclusões. Algumas abordagens que funcionam na prática:

Encontre um crítico cujo gosto combine com o seu e siga o trabalho dele especificamente. Uma voz consistente que o direcionou para jogos que você amou (e o alertou sobre aqueles que você odiaria) vale muito mais do que uma média consensual. O 8 dele significa algo preciso para você. O 8 agregado significa algo com a média de dezenas de pessoas com preferências diferentes.

Olhe a distribuição das notas, não apenas a média. Um jogo com quarenta notas entre 80 e 90 é um caso diferente de um com trinta 85s e dez 45s. O jogo polarizado está lhe dizendo algo importante: algumas pessoas o consideram excelente e outras o consideram seriamente falho. Saber em qual campo você provavelmente se encaixará exige a leitura de algumas dessas avaliações extremas.

Use o número de "% recomendado" no OpenCritic junto com a nota. Isso elimina a confusão da escala de forma limpa. Dois jogos podem ter uma média de 74, enquanto um tem 82% dos críticos o recomendando e o outro tem 51%. A porcentagem mede algo mais simples e mais acionável do que a nota.

Leia pelo menos um texto de avaliação antes de confiar no número. A avaliação que deu um 9/10 a um jogo pode dedicar dois parágrafos mencionando que o último quarto desmorona. Se os finais são importantes para você, isso muda tudo. O número diz o que aconteceu; o texto diz o porquê. Somente o "porquê" o ajuda a tomar uma decisão.

Uma ilustração de um jogador inclinado sobre uma mesa iluminada por luz quente, uma tela mostrando um grande número de pontuação, a outra mostrando texto de revisão denso, lendo cuidadosamente com uma caneca de café por perto

Por que a nota que você dá é a que mais importa

Críticos profissionais estão fazendo algo genuinamente difícil: escrever de forma útil sobre jogos que jogam em prazos curtos, para públicos que eles só podem conhecer parcialmente, sob pressões institucionais que moldam o que eles dizem e como. As notas de avaliação são um atalho falho para esse esforço, e entender as falhas as torna mais úteis, não menos.

Mas a nota que determina se um jogo valeu seu tempo é a que você atribuiria depois de jogá-lo. Esse veredito considera sua história com jogos semelhantes, sua tolerância a escolhas de design específicas, se você jogou sozinho ou com amigos e se ele chegou em um momento da sua vida em que você estava pronto para ele. Nenhum agregador captura nada disso.

A história mais ampla de como passamos de rubricas claras de revistas para médias ponderadas opacas e cláusulas de bônus de desenvolvedores também vale a pena ser entendida. Faz parte de uma história mais longa sobre como a cultura de avaliação em jogos evoluiu desde a era em que um punhado de publicações ditava a pauta até o cenário fragmentado e disperso de plataformas de hoje.

Se você quer construir um registro real do que você realmente pensou sobre os jogos que jogou, e fazer com que esse registro signifique algo ao longo do tempo, ajuda mantê-lo em um lugar intencional. No The EndWiki, você pode registrar cada jogo, escrever suas próprias avaliações com tanta ou tão pouca profundidade quanto quiser, e construir um perfil que reflita seu gosto real. Sua nota, seu raciocínio, sua história. Não um consenso em que você não votou.

Crie sua conta gratuita no The EndWiki e comece a escrever as avaliações que realmente importam para você.