«Google Переводчик» добавил 110 новых языков. Среди них есть осетинский, чеченский и крымскотатарский
Онлайн-переводчик Google Translate добавил 110 новых языков, на 13-ти из которых говорят в России. Это случилось в том числе благодаря языковым активистам из национальных республик РФ
27 июня компания Google сообщила, что она добавила в онлайн-переводчик Google Translate 110 новых языков — их используют более 614 млн человек, или около 8% населения мира.
В список вошли 13 языков, на которых говорят в России: аварский, башкирский, бурятский, чувашский, удмуртский, чукотский, тувинский, якутский, коми, луговомарийский, чеченский, осетинский и крымскотатарский.
По классификации ЮНЕСКО, чеченский, осетинский и крымскотатарский языки имеют статус уязвимых. Это означает, что на языке разговаривают многие дети, но его использование может быть ограничено (например, на языке говорят только дома или в кругу семьи).
Трудности перевода:
В компании отметили, что обучить систему помог искусственный интеллект — крупная языковая модель PaLM.
29 июня телеграм-канал «Чернозём. У шамана три беды» сообщил, что на Google также повлияли языковые активисты из национальных республик России. Они собирали необходимые для перевода данные, распознавали текст и отправляли десятки писем в Google. Первыми с компанией связались активисты из Уфы.
«В компании потом удивлялись, почему так много языков из России захотели добавиться и предоставили корпуса. Можно сказать, что мы их достали письмами, всё за них подготовили в максимально удобном виде и дали ссылки», — рассказал башкирский разработчик Айгиз Кунафин.
Вот что языковые активисты говорят о качестве нового гугл-переводчика:
«Он более или менее хорошо справляется с разговорным осетинским языком. О переводе художественными текстов не может быть и речи. Как сказал мой друг: «Пока это больше похоже на городской владикавказский суджик», — отметил автор подкаста Rajdian Алик Пухати.
«То, что язык появился, огромная заслуга обычных людей — носителей языка. Активисты выверяли переводы на специальной площадке Google.
Иногда выдает отсебятину, добавляет фамилии, не упоминающиеся в тексте, или путает название республик, — поделился переводчик, саха языковой активист Павлов-Халан Николай.
«Для чувашского языка гугл-переводчик пока лучший. Лишь один минус — чувствуется нехватка лексики», — сказал редактор Николай Плотников.
Как писали Юга.ру, на Северный Кавказ стали чаще ездить туристы с доходом от 120 тысяч рублей.