«Google Переводчик» добавил 110 новых языков. Среди них есть осетинский, чеченский и крымскотатарский

18:26, 1.07.24 Кабардино-Балкария, Карачаево-Черкесия, Северная Осетия, Чечня, Южная Осетия, Крым, Вся Россия, В мире

27 июня компания Google сообщила, что она добавила в онлайн-переводчик Google Translate 110 новых языков — их используют более 614 млн человек, или около 8% населения мира.

В список вошли 13 языков, на которых говорят в России: аварский, башкирский, бурятский, чувашский, удмуртский, чукотский, тувинский, якутский, коми, луговомарийский, чеченский, осетинский и крымскотатарский.

По классификации ЮНЕСКО, чеченский, осетинский и крымскотатарский языки имеют статус уязвимых. Это означает, что на языке разговаривают многие дети, но его использование может быть ограничено (например, на языке говорят только дома или в кругу семьи).

Трудности перевода:

В компании отметили, что обучить систему помог искусственный интеллект — крупная языковая модель PaLM.

29 июня телеграм-канал «Чернозём. У шамана три беды» сообщил, что на Google также повлияли языковые активисты из национальных республик России. Они собирали необходимые для перевода данные, распознавали текст и отправляли десятки писем в Google. Первыми с компанией связались активисты из Уфы.

«В компании потом удивлялись, почему так много языков из России захотели добавиться и предоставили корпуса. Можно сказать, что мы их достали письмами, всё за них подготовили в максимально удобном виде и дали ссылки», — рассказал башкирский разработчик Айгиз Кунафин.

Вот что языковые активисты говорят о качестве нового гугл-переводчика:

«Он более или менее хорошо справляется с разговорным осетинским языком. О переводе художественными текстов не может быть и речи. Как сказал мой друг: «Пока это больше похоже на городской владикавказский суджик», — отметил автор подкаста Rajdian Алик Пухати.

«То, что язык появился, огромная заслуга обычных людей — носителей языка. Активисты выверяли переводы на специальной площадке Google.

Иногда выдает отсебятину, добавляет фамилии, не упоминающиеся в тексте, или путает название республик, — поделился переводчик, саха языковой активист Павлов-Халан Николай.

«Для чувашского языка гугл-переводчик пока лучший. Лишь один минус — чувствуется нехватка лексики», — сказал редактор Николай Плотников.


Как писали Юга.ру, на Северный Кавказ стали чаще ездить туристы с доходом от 120 тысяч рублей.

Адрес в Интернете: https://www.yuga.ru/news/473696/