Ce que les notes de critiques signifient réellement | Blog

Vous avez passé dix minutes sur la page Metacritic d'un jeu. Le Metascore est de 76. Vous vérifiez OpenCritic et il indique 78. Un forum dit que c'est solide, un autre dit que tout ce qui est en dessous de 80 ne vaut pas votre temps. Vous n'avez toujours aucune idée si vous devriez dépenser 70$, et vous êtes d'une certaine manière moins confiant qu'avant de commencer vos recherches.

Cette confusion n'est pas de votre faute. Les notes de critiques sont discrètement "cassées" depuis des années, et la façon dont elles sont rapportées rend le problème sous-jacent plus difficile à détecter. Une fois que vous comprendrez ce qu'une note encode réellement et d'où proviennent ces chiffres, vous les utiliserez beaucoup plus efficacement. Ou du moins, vous cesserez de perdre le sommeil pour un écart de deux points.

L'échelle qui avait du sens autrefois

Lorsque les magazines imprimés étaient la principale source de critique de jeux, les publications étaient claires sur la signification de chaque note. Electronic Gaming Monthly (EGM), l'un des médias phares des années 1990, expliquait directement aux lecteurs: 10 était parfait, 9 exceptionnel, 8 excellent, 7 très bon, 6 au-dessus de la moyenne et 5 moyen. Ce dernier point est celui qui compte le plus. Un 5 n'était pas un rejet. Il plaçait un jeu au milieu de l'échelle, ce qui est exactement ce que le mot "moyen" signifie.

Les critiques qui suivaient cette grille utilisaient toute l'échelle. Un mauvais jeu obtenait un 2 ou un 3. Un titre fonctionnel mais peu excitant obtenait un 5. Une note élevée avait du sens car une note basse était une réelle possibilité. Le système entier avait une sorte d'honnêteté, la hiérarchie reflétait de réelles différences de qualité.

Cela a changé lorsque la critique de jeux s'est déplacée en ligne à la fin des années 1990 et début des années 2000.

Comment 7 est devenu le nouveau "bien"

À mesure que les sites web indépendants se sont multipliés, les guides de notation sont devenus moins visibles. Les rédacteurs arrivaient sans rubriques claires. Un changement culturel silencieux a pris racine, en partie emprunté au système de notation des écoles américaines: si 70% est une note "suffisante", alors 7/10 doit signifier "à peine passable", et 5/10 doit signifier échec. Mais un 5 sur une échelle de 10 n'est pas un échec. C'est censé être ordinaire.

Les chiffres ont dérivé vers le haut. Selon une analyse de 2014 publiée sur Game Developer, la note moyenne de IGN pour les jeux était de 8,0 sur 10 en 2006. La moyenne de GameSpot était de 7,0 la même année. Dans toute l'industrie, les scores se sont regroupés dans une bande qui laissait la moitié inférieure de l'échelle essentiellement vide. Les critiques sont devenus réticents à donner des notes basses car un score inférieur à 6 était perçu comme agressif, même pour des jeux réellement médiocres, et il y a une réelle pression sociale dans une petite industrie pour ne pas être la personne qui a torpillé la sortie d'un petit studio.

C'est ce que les critiques appellent parfois le problème du "8 paresseux": l'échelle de notation pratique s'est contractée de 1-10 à quelque chose comme 7-10, tout ce qui est en dessous de 7 étant traité comme un jugement sévère plutôt que neutre. Lorsque l'échelle se comprime ainsi, les différences entre les notes commencent à s'estomper. Un 7,5 et un 8,5 représentaient un écart significatif dans la grille originale. Après la dérive, ils sont tous les deux juste "bons".

Le tableau ci-dessous montre à quel point le sens voulu et le sens perçu ont divergé:

Note	Ce que cela est officiellement censé signifier	Ce que la plupart des lecteurs en retiennent réellement
10/10	Parfait, un véritable chef-d'œuvre	À acheter immédiatement
9/10	Exceptionnel, une réalisation marquante	Presque indispensable
8/10	Très bon, vaut clairement votre temps	Bon, probablement acceptable
7/10	Au-dessus de la moyenne, intéressant	Signaux mitigés, certains hésitent
6/10	Moyen, ni bon ni mauvais	Souvent lu comme une critique négative
5/10 ou moins	Imparfait mais pourrait avoir de la valeur / médiocre	Terrible, à ne jamais toucher

Cet écart entre le sens voulu et le sens perçu est la raison pour laquelle une grande partie du discours vidéoludique dérape.

A flat brand illustration showing two identical game controller silhouettes: one labeled with a full 1-10 scale bar, one with an arrow crowded into just the upper third of the same bar, clean dark tech aesthetic

Deux agrégateurs, deux philosophies

La plupart des joueurs ne lisent pas une douzaine de publications. Ils consultent des agrégateurs, et deux sites dominent cet espace.

Metacritic a été lancé en 1999, créé par Jason Dietz, Marc Doyle et Julie Doyle Roberts. Il agrège les scores d'environ 140 publications en utilisant une moyenne pondérée: certains médias comptent plus que d'autres en fonction de critères que Metacritic n'a jamais divulgués publiquement. Vous ne pouvez pas voir quels sont les poids. Vous ne pouvez pas savoir en regardant un Metascore si un média majeur a influencé le chiffre ou s'il reflète un véritable consensus. Metacritic ne met pas non plus à jour les scores une fois qu'ils sont publiés, ce qui signifie qu'une critique de 2012 qui ne reflète pas la position actuelle d'une publication continue d'influencer le dossier permanent d'un jeu.

OpenCritic a été lancé le 30 septembre 2015, construit par Matthew Enthoven, Charles Green, Richard Triggs et Aaron Rutledge directement en réponse à cette opacité. Plutôt que des pondérations cachées, il utilise une moyenne arithmétique simple: le score de chaque critique compte également après normalisation sur une échelle de 0-100. Il affiche également le pourcentage de critiques qui ont activement recommandé le jeu, et il classe les titres par niveaux: Mighty (top 10% de tous les jeux notés), Strong (les 30% suivants), Fair (du 30e au 60e percentile) et Weak (les 30% inférieurs). Valnet a acquis OpenCritic en juillet 2024, mais il reste l'option la plus transparente pour quiconque essaie de comprendre d'où vient un nombre agrégé.

Il est à noter que la métrique "% recommandé" sur OpenCritic vous renseigne souvent plus que le score moyen. Un jeu avec une moyenne de 74 et 85% de critiques le recommandant est dans une position très différente d'un jeu avec une moyenne de 74 et 55% de recommandations. Le premier est un jeu que la plupart des gens ont aimé mais n'ont pas adoré. Le second est un titre polarisant où certains critiques étaient enthousiastes et d'autres ont été considérablement rebutés. Même chiffre, histoire complètement différente.

Aucun agrégateur ne vous dit si vous aimerez le jeu.

Quand les notes ont de réelles conséquences

Dès l'instant où les notes de critiques ont été liées aux salaires des développeurs, tout a changé dans la façon dont l'industrie les utilise.

L'exemple le plus discuté est Fallout: New Vegas. Le développeur Obsidian Entertainment avait une clause dans son contrat avec l'éditeur Bethesda Softworks liant un bonus de fin de projet à sa performance Metacritic. Le jeu est sorti en 2010 avec de véritables éloges critiques et a obtenu un Metascore de 84. Le seuil du bonus était de 85. Toute l'équipe d'Obsidian a manqué un paiement que Jason Schreier a rapporté chez Kotaku s'élevait en moyenne à environ 14 000 $ par employé dans un studio de 70 personnes. Un point sur un agrégateur utilisant une formule de pondération non divulguée.

Cette histoire est devenue tristement célèbre, mais la pratique sous-jacente était courante. Une fois que les développeurs savent que les scores affectent les bonus, les producteurs commencent à identifier ce que les critiques ont historiquement récompensé et à intégrer ces éléments dans le jeu, quel que soit leur pertinence. Les équipes marketing élaborent des stratégies de presse autour des embargos de critiques pour maximiser les scores de la première semaine. Les éditeurs refusent l'accès aux aperçus aux publications susceptibles de donner des notes basses. Le score devient un objectif qui influence la conception, et non un résultat de celle-ci.

Rien de tout cela ne rend le chiffre résultant plus utile pour vous aider à décider à quoi jouer. Au contraire, il le rend moins représentatif de l'expérience réelle des joueurs.

Ce que le chiffre encode réellement

Voici la version simple: une note de critique est la tentative d'une personne de compresser une expérience complexe de plusieurs heures en un nombre qui peut être comparé à d'autres nombres d'autres personnes évaluant d'autres jeux. La version agrégée moyenne ces compressions individuelles.

Cette compression perd presque tout ce qui est pertinent:

Si le style de combat correspond à votre façon de jouer
Si l'histoire est le type dans lequel vous pouvez vous immerger
Si le critique a terminé le jeu avant de publier (plus courant que l'industrie ne l'admet)
Si le goût général du média correspond au vôtre
Si un patch significatif a changé l'expérience après la publication de la critique
Si la communauté du jeu est active s'il a des composants multijoueurs

Ce qu'un score vous dit, c'est où la réaction instinctive d'un critique est tombée sur sa hiérarchie interne, par rapport aux autres jeux qu'il a critiqués, le jour de la publication. C'est une information réellement utile. Ce n'est juste pas un verdict que vous pouvez adopter en bloc.

Comment lire réellement les notes de critiques

Obtenir de la valeur des scores signifie les traiter comme des points de départ, pas des conclusions. Quelques approches qui tiennent la route en pratique:

Trouvez un critique dont le goût correspond au vôtre et suivez spécifiquement son travail. Une voix constante qui vous a orienté vers des jeux que vous avez aimés (et vous a éloigné de ceux que vous auriez détestés) vaut bien plus qu'une moyenne consensuelle. Son 8 signifie quelque chose de précis pour vous. L'agrégat 8 signifie quelque chose de moyen sur des dizaines de personnes avec des préférences différentes.

Regardez la distribution des scores, pas seulement la moyenne. Un jeu avec quarante scores entre 80 et 90 est un cas différent de celui avec trente 85 et dix 45. Le jeu polarisé vous dit quelque chose d'important: certaines personnes le trouvent excellent et d'autres le trouvent sérieusement imparfait. Savoir dans quel camp vous êtes susceptible de tomber nécessite de lire quelques-unes de ces critiques aberrantes.

Utilisez le chiffre "% recommandé" sur OpenCritic en conjonction avec le nombre. Cela permet de contourner clairement la dérive de l'échelle. Deux jeux peuvent partager une moyenne de 74 tandis que l'un a 82% de critiques le recommandant et l'autre 51%. Le pourcentage mesure quelque chose de plus simple et de plus exploitable que le score.

Lisez au moins un texte de critique avant de faire confiance au chiffre. La critique qui a donné 9/10 à un jeu pourrait passer deux paragraphes à mentionner que le dernier quart s'effondre. Si les fins comptent pour vous, cela change tout. Le chiffre vous dit ce qui s'est passé, le texte vous dit pourquoi. Seul le "pourquoi" vous aide à prendre une décision.

An illustration of a gamer leaning toward a warm-lit desk, one screen showing a large score number, the other showing dense review text, reading carefully with a mug of coffee nearby

Pourquoi la note que vous donnez compte le plus

Les critiques professionnels font quelque chose de vraiment difficile: écrire utilement sur les jeux auxquels ils jouent dans des délais courts, pour des publics qu'ils ne connaissent que partiellement, sous des pressions institutionnelles qui façonnent ce qu'ils disent et comment ils le disent. Les notes de critiques sont un raccourci imparfait pour cet effort, et comprendre les défauts les rend plus utiles, pas moins.

Mais la note qui détermine si un jeu valait votre temps est celle que vous lui attribueriez après l'avoir joué. Ce verdict tient compte de votre historique avec des jeux similaires, de votre tolérance aux choix de conception spécifiques, si vous y avez joué seul ou avec des amis, et s'il est arrivé à un moment de votre vie où vous étiez prêt pour cela. Aucun agrégateur ne capture rien de tout cela.

Il est également utile de comprendre l'histoire plus large de la façon dont nous sommes passés des rubriques claires des magazines aux moyennes pondérées opaques et aux clauses de bonus pour les développeurs. Cela fait partie d'une histoire plus longue sur l'évolution de la culture des critiques dans le jeu vidéo depuis l'époque où une poignée de publications dictaient l'ordre du jour jusqu'au paysage fragmenté et dispersé d'aujourd'hui.

Si vous souhaitez bâtir un véritable registre de ce que vous avez réellement pensé des jeux auxquels vous avez joué, et que ce registre ait un sens au fil du temps, il est utile de le conserver quelque part de manière intentionnelle. Sur The EndWiki, vous pouvez enregistrer chaque jeu, écrire vos propres critiques avec autant ou aussi peu de profondeur que vous le souhaitez, et créer un profil qui reflète votre goût réel. Votre score, votre raisonnement, votre histoire. Pas un consensus auquel vous n'avez pas voté.

Créez votre compte gratuit sur The EndWiki et commencez à écrire les critiques qui comptent vraiment pour vous.