Первый перевод удмуртской книги на русский с помощью нейросети

Мар 19, 2024 / 15:50

В Ижевске, столице Удмуртии, нейросеть впервые осуществила перевод удмуртской книги на русский язык. Об этом сообщила Анастасия Шумилова, главный редактор литературного журнала «Кенеш».

Начало этому необычному эксперименту было положено в начале марта, когда специалист по информационным технологиям и защитники удмуртского языка Егор Лебедев предоставил образцы перевода удмуртских текстов, выполненные нейросетью, из социальных сетей на русский язык.

Первый перевод удмуртской книги на русский с помощью нейросети

После успешной проверки передачи художественных текстов решено было перевести целую удмуртскую книгу. «Перепеч» Багая Аркаша стала выбором для этого эксперимента. В ходе работы Егор Лебедев выполнил переводы с помощью нейросети, а Анастасия провела редактирование, а затем дизайнер Вера Штыкова занималась версткой и оформлением текста.

Для перевода сборника использовалась одна из передовых языковых моделей на сегодняшний день — Claude 3 Opus от компании Anthropic. Эта модель способна обрабатывать большие текстовые объемы, но выводит лишь небольшую часть в качестве ответа, поэтому необходимо делать запросы по несколько абзацев за раз. Также следует обратить внимание на возможные потери знаков препинания, таких как кавычки, тире, перенос строк, и следить за их сохранностью в тексте.

Егор Лебедев также отметил, что в последнее время произошел существенный прогресс в области автоматического перевода текста благодаря развитию больших языковых моделей (large language models, LLM). Эти модели, обученные на огромных объемах текстовых данных, способны генерировать качественные переводы, приближаясь своими результатами к работе профессиональных переводчиков.

При обучении на больших объемах данных модели способны выявлять глубокие закономерности и связи как внутри языков, так и между ними. Это позволяет им не только просто переводить текст буквально, но и учитывать контекст, семантику, грамматику и стилистику.

Анастасия Шумилова отметила, что результаты применения нейросетей для перевода не всегда являются художественными, и многие удмуртские тексты теряют свои достоинства при переводе на русский язык. Однако опыт показывает, что нейросети могут стать отличным средством для ознакомления с удмуртскими текстами, которые еще не были переведены на русский язык.

Несколько слов о самом авторе оригинального текста. Аркадий Николаевич Клабуков (1904–1984), известный также как Багай Аркаш, был удмуртским писателем, переводчиком и фольклористом. Он получил образование в Ижевском педагогическом техникуме и Московском государственном университете имени М. В. Ломоносова. После окончания учебы вернулся в Ижевск, где работал в издательстве «Удмуртия» и в Удмуртском научно-исследовательском институте.

Его произведения, написанные для детей, до сих пор пользуются популярностью, и не одно поколение выросло на его поэме «Тютю Макси» (1936). Аркадий Николаевич также создавал юмористические произведения. Например, в 1926 году в газете «Гудыри» (ныне известной как «Удмурт дунне») публиковались его рассказы из серии «Локан Петырлэн верамъёсыз» («Рассказы Локана Петыры / Петра Лоханкина»).

В 1927 году четыре рассказа этой серии были изданы в отдельной книге под названием «Перепеч».

По материалам: news.rambler.ru