Бенчмарк перекладів LLM: польська → в'єтнамська (2026)
Порівняння якості машинних перекладів (GPT 5.4, Claude 4.6 Sonnet, Google Translate, DeepL) на маршруті польська → в'єтнамська. Дослідження проведено 100 AT.
Методологія
Кожна з 4 систем перекладу переклала 4 вихідних тексти з польської на в'єтнамську. Переклади оцінили 2 судді (GPT 5.4 XHigh і Claude 4.6 Sonnet) за трьома критеріями: Точність, Плавність та Стиль за шкалою 1–10. Таблиця показує усереднені результати.
Результати: Польська → В'єтнамська
Середні оцінки (шкала 1–10), виставлені 2 суддями 4 системам перекладу на польсько-в'єтнамських текстах.
| Система перекладу | GPT 5.4 (Суддя) | Claude 4.6 (Суддя) | Фінальне середнє |
|---|---|---|---|
| GPT 5.4 (XHigh) | 8.90 | 9.17 | 9.04 |
| Claude 4.6 Sonnet | 9.30 | 8.92 | 9.11 |
| Google Translate ref | 7.40 | 7.75 | 7.58 |
| DeepL ref | 8.10 | 7.83 | 7.97 |
Ключові висновки
- 1
Моделі AI (Claude 4.6 Sonnet — 9.11, GPT 5.4 — 9.04) значно перевершують класичні системи перекладу.
- 2
Google Translate (7.58) показує найнижчий результат на парі PL→VI, особливо в категорії стилю та природності.
- 3
DeepL (7.97) посідає проміжне місце — кращий за Google, але значно поступається моделям AI.
- 4
Різниця між найкращим AI та найкращим класичним рушієм становить понад 1.1 бала — суттєва різниця в якості.