В Ижевске, столице Удмуртии, нейросеть впервые осуществила перевод удмуртской книги на русский язык. Об этом сообщила Анастасия Шумилова, главный редактор литературного журнала «Кенеш».
Начало этому необычному эксперименту было положено в начале марта, когда специалист по информационным технологиям и защитники удмуртского языка Егор Лебедев предоставил образцы перевода удмуртских текстов, выполненные нейросетью, из социальных сетей на русский язык.
После успешной проверки передачи художественных текстов решено было перевести целую удмуртскую книгу. «Перепеч» Багая Аркаша стала выбором для этого эксперимента. В ходе работы Егор Лебедев выполнил переводы с помощью нейросети, а Анастасия провела редактирование, а затем дизайнер Вера Штыкова занималась версткой и оформлением текста.
Для перевода сборника использовалась одна из передовых языковых моделей на сегодняшний день — Claude 3 Opus от компании Anthropic. Эта модель способна обрабатывать большие текстовые объемы, но выводит лишь небольшую часть в качестве ответа, поэтому необходимо делать запросы по несколько абзацев за раз. Также следует обратить внимание на возможные потери знаков препинания, таких как кавычки, тире, перенос строк, и следить за их сохранностью в тексте.
Егор Лебедев также отметил, что в последнее время произошел существенный прогресс в области автоматического перевода текста благодаря развитию больших языковых моделей (large language models, LLM). Эти модели, обученные на огромных объемах текстовых данных, способны генерировать качественные переводы, приближаясь своими результатами к работе профессиональных переводчиков.
При обучении на больших объемах данных модели способны выявлять глубокие закономерности и связи как внутри языков, так и между ними. Это позволяет им не только просто переводить текст буквально, но и учитывать контекст, семантику, грамматику и стилистику.
Анастасия Шумилова отметила, что результаты применения нейросетей для перевода не всегда являются художественными, и многие удмуртские тексты теряют свои достоинства при переводе на русский язык. Однако опыт показывает, что нейросети могут стать отличным средством для ознакомления с удмуртскими текстами, которые еще не были переведены на русский язык.
Несколько слов о самом авторе оригинального текста. Аркадий Николаевич Клабуков (1904–1984), известный также как Багай Аркаш, был удмуртским писателем, переводчиком и фольклористом. Он получил образование в Ижевском педагогическом техникуме и Московском государственном университете имени М. В. Ломоносова. После окончания учебы вернулся в Ижевск, где работал в издательстве «Удмуртия» и в Удмуртском научно-исследовательском институте.
Его произведения, написанные для детей, до сих пор пользуются популярностью, и не одно поколение выросло на его поэме «Тютю Макси» (1936). Аркадий Николаевич также создавал юмористические произведения. Например, в 1926 году в газете «Гудыри» (ныне известной как «Удмурт дунне») публиковались его рассказы из серии «Локан Петырлэн верамъёсыз» («Рассказы Локана Петыры / Петра Лоханкина»).
В 1927 году четыре рассказа этой серии были изданы в отдельной книге под названием «Перепеч».