Dataset · Benchmark 2026

Бенчмарк перекладів LLM: польська → в'єтнамська (2026)

Порівняння якості перекладу: GPT 5.4, Claude 4.6 Sonnet, Google Translate і DeepL на парі польська → в'єтнамська. Бенчмарк 2026 від 100 AT Варшава.

Польська → В'єтнамська · 4 системи · 2 судді

Методологія

Кожна з 4 систем перекладу переклала 4 вихідних тексти з польської на в'єтнамську. Переклади оцінили 2 судді (GPT 5.4 XHigh і Claude 4.6 Sonnet) за трьома критеріями: Точність, Плавність та Стиль за шкалою 1–10. Таблиця показує усереднені результати.

Результати: Польська → В'єтнамська

Середні оцінки (шкала 1–10), виставлені 2 суддями 4 системам перекладу на польсько-в'єтнамських текстах.

Система перекладу GPT 5.4 (Суддя) Claude 4.6 (Суддя) Фінальне середнє
GPT 5.4 (XHigh)
8.90 9.17 9.04
Claude 4.6 Sonnet
9.30 8.92 9.11
Google Translate ref
7.40 7.75 7.58
DeepL ref
8.10 7.83 7.97

Ключові висновки

  1. 1

    Моделі AI (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) значно перевершують класичні системи перекладу.

  2. 2

    Google Translate (7.58) показує найнижчий результат на парі PL→VI, особливо в категорії стилю та природності.

  3. 3

    DeepL (7.97) посідає проміжне місце — кращий за Google, але значно поступається моделям AI.

  4. 4

    Різниця між найкращим AI та найкращим класичним рушієм становить понад 1.1 бала — суттєва різниця в якості.