Автор проекта по созданию сайта башкирско-русского и русско-башкирского переводчика Гульназ Юсупова рассказала о том, как создавался проект. Проблемами она поделилась с корреспондентом UFA1.RU сегодня, 9 ноября.
Гульназ Юсупова является директором некоммерческого фонда по сохранению и развитию башкирского языка. И для нее тема национального перевода очень близка.
— В нашем приложении всё еще идет процесс создания пар предложений. Всего их должно быть не менее 1 миллиона. Также мы хотим, чтобы была система синтеза башкирской речи, в ней применяется нейросетевой подход. С помощью него можно точнее переводить предложения, — рассказала о сайте Юсупова.
Как выяснилось, сайт-переводчик работает уже полтора года, однако до сих пор находится в тестовом режиме. При этом о проблемах с корректным переводом отдельных слов создатели знают уже давно.
— Сайт работает в тестовом режиме. Именно предложения он переводит хорошо. По крайней мере, для башкирской аудитории понятно. Конечно там еще можно кое-что подправить, но уже хорошо. Проблемы есть именно с отдельными словами. Над этим мы сейчас и работаем, дополнительно идет работа над озвучкой, — рассказала женщина.
В качестве примера она привела «Яндекс» и «Гугл», которые также внедряли свою голосовую систему поэтапно и до сих пор продолжают ее совершенствовать. Чем больше в системе будет новых слов и предложений, тем она, по рассказам Юсуповой, работает лучше. Поэтому работы будут идти еще долгие годы.
Сейчас в команде разработчиков всего 5 человек, все они из фонда по сохранению башкирского языка. Один из них — Искандер Шакиров. Он является сотрудником Академии наук в Уфе. Мужчина помогает проекту всё это время на чистом энтузиазме. Кроме того, стороннюю поддержку оказывает татарский фонд, у которого уже был опыт работы с подобным приложением по переводу с татарского языка. Пока их программа по сравнению с башкирским аналогом работает на 30% лучше.
— Сейчас в базе переводчика есть более 700 тысяч параллельных текстов. Для того чтобы переводчик работал хорошо, нужно заполнить более 1,5 миллиона параллельных текстов. Эта работа очень кропотливая, долгая работа. Вручную приходится сидеть и писать сначала «Мин һине яратам», а рядом также вручную вводить точный перевод на русском «Я тебя люблю», — рассказала о тонкостях создания Гульназ Юсупова.
Для озвучивания перевода пригласили ведущего утренней программы на местном телеканале Наиля Юнусова.
Что касается финансирования, то фонду удалось выиграть грант главы Башкирии в размере 2,5 миллиона рублей. Однако, так как работа над проектом будет длиться не один год, руководителю фонда нужно постоянно искать источники финансирования.
Ранее UFA1.RU протестировал онлайн-переводчик и убедился, что работы над совершенствованием системы предстоит еще много.