Мы в соцсетях:
«Проект создан на средства субсидии из бюджета города Москвы, полученной по итогам проводимого Комитетом общественных связей Конкурса для социально-ориентированных некоммерческих организаций»



Анонсы
ЗАЯВКА
НА ПРОВЕДЕНИЕ ЛЕКЦИИ
Заполнить заявку

Как этнические организации помогали разрабатывать «Яндекс.Переводчик»

12 января 2017

12 января 2017 года разработчик машинного перевода «Яндекса» Антон Дворкович рассказал о своей работе над проектом изданию N+1.

Как этнические организации помогали разрабатывать «Яндекс.Переводчик»

Антон Дворкович объяснил, как народы России помогали добавлять в переводчик малые языки. Первый этап работы над языками ничем не отличается: в машину загружается вся доступная информация, она анализирует параллельные тексты на разных языках и строит распределение вероятностей перевода для каждого слова. Так система самостоятельно учит новые слова.

Однако в случае с редкими языками необходим специалист, которые знает язык и может проанализировать, насколько точно машина выполняет перевод. Поэтому разработчики и обратились к региональным организациям, которые занимаются исследованием и сохранением малых языков в России.

Так, в создании марийско-русского перевода помогли сразу несколько организаций: Марийский научно-исследовательский институт языка, литературы и истории им. В.М. Васильева и Республиканский центр марийской культуры. Они обеспечили лингвистическую поддержку и подготовку эталонных марийско-русских переводов для оценки качества перевода.

"В регионах вообще достаточно неравнодушных к судьбе своих языков людей, которые готовы помочь в создании корректного переводчика. Учитывая размеры нашей страны и количество разных народностей, которые в ней живут, работы по машинному переводу с других языков еще очень много", — отметил Дворкович. 

Сейчас в "Яндекс.Переводчике" доступны несколько языков коренных народов России: башкирский, марийский и горномарийский, татарский, удмуртский.

Автор: Медиа-проект Гильдии межэтнической журналистики «Национальный акцент»
Все новости