Jeu de données · Benchmark 2026

Benchmark des traductions LLM : polonais → vietnamien (2026)

Comparaison de la qualité de la traduction automatique (GPT 5.4, Claude 4.6 Sonnet, Google Translate, DeepL) pour la paire polonais → vietnamien. Étude menée par 100 AT.

Polonais → Vietnamien · 4 systems · 2 judges

Méthodologie

Chacun des 4 systèmes de traduction a traduit 4 textes sources du polonais vers le vietnamien. Les traductions ont été évaluées par 2 juges (GPT 5.4 XHigh et Claude 4.6 Sonnet) selon trois critères : Exactitude, Fluidité et Style, sur une échelle de 1 à 10. Le tableau présente les scores moyens.

Résultats : Polonais → Vietnamien

Scores moyens (échelle 1–10) attribués par 2 juges à 4 systèmes de traduction sur des textes polono‑vietnamiens.

Système de traduction GPT 5.4 (Juge) Claude 4.6 (Juge) Moyenne finale
GPT 5.4 (XHigh)
8.90 9.17 9.04
Claude 4.6 Sonnet
9.30 8.92 9.11
Google Translate ref
7.40 7.75 7.58
DeepL ref
8.10 7.83 7.97

Principales conclusions

  1. 1

    Les modèles IA (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) surpassent nettement les moteurs de traduction traditionnels.

  2. 2

    Google Translate (7.58) obtient le score le plus bas sur la paire PL→VI, notamment en style et en naturel.

  3. 3

    DeepL (7.97) se situe entre les deux — meilleur que Google mais nettement derrière les modèles IA.

  4. 4

    L’écart entre le meilleur modèle IA et le meilleur moteur traditionnel dépasse 1.1 point — une différence de qualité notable.