🗣 «Яндекс» научил нейросети говорить естественно
Исследователи «Яндекса» разработали метод оценки качества машинного перевода RATE (Refined Assessment for Translation Evaluation), который помогает совершенствовать модели, переводящие тексты точно, но неестественно.
Существующие системы игнорируют стилистические ошибки. Например, «sorry, my bad» может переводиться как излишне официальное «приношу извинения, это моя вина» вместо «извини, ошиблась».
Новая метрика оценивает перевод сразу по трем важным для пользователя критериям: точность передачи смысла, естественность языка и соответствие стилю оригинала.
RATE позволяет точно выявить, где современные модели ошибаются, чтобы их переводы стали точнее и естественнее. Метод применим к разным типам текстов: в новостях он проверит факты, а в постах соцсетей – выявит чрезмерную формальность. Система не просто отмечает ошибку, но и оценивает ее значимость.
В мире