Культура Автор онлайн-переводчика с башкирского языка объяснила, почему его не смогли доработать

Автор онлайн-переводчика с башкирского языка объяснила, почему его не смогли доработать

На него уже потратили 2,5 миллиона. Деньги кончаются, а работы будут идти еще не один год

Автор проекта по созданию сайта башкирско-русского и русско-башкирского переводчика Гульназ Юсупова рассказала о том, как создавался проект. Проблемами она поделилась с корреспондентом UFA1.RU сегодня, 9 ноября.

Гульназ Юсупова является директором некоммерческого фонда по сохранению и развитию башкирского языка. И для нее тема национального перевода очень близка.

— В нашем приложении всё еще идет процесс создания пар предложений. Всего их должно быть не менее 1 миллиона. Также мы хотим, чтобы была система синтеза башкирской речи, в ней применяется нейросетевой подход. С помощью него можно точнее переводить предложения, — рассказала о сайте Юсупова.

Переводчик работает и на мобильных устройствах

Как выяснилось, сайт-переводчик работает уже полтора года, однако до сих пор находится в тестовом режиме. При этом о проблемах с корректным переводом отдельных слов создатели знают уже давно.

— Сайт работает в тестовом режиме. Именно предложения он переводит хорошо. По крайней мере, для башкирской аудитории понятно. Конечно там еще можно кое-что подправить, но уже хорошо. Проблемы есть именно с отдельными словами. Над этим мы сейчас и работаем, дополнительно идет работа над озвучкой, — рассказала женщина.

В качестве примера она привела «Яндекс» и «Гугл», которые также внедряли свою голосовую систему поэтапно и до сих пор продолжают ее совершенствовать. Чем больше в системе будет новых слов и предложений, тем она, по рассказам Юсуповой, работает лучше. Поэтому работы будут идти еще долгие годы.

Сейчас в команде разработчиков всего 5 человек, все они из фонда по сохранению башкирского языка. Один из них — Искандер Шакиров. Он является сотрудником Академии наук в Уфе. Мужчина помогает проекту всё это время на чистом энтузиазме. Кроме того, стороннюю поддержку оказывает татарский фонд, у которого уже был опыт работы с подобным приложением по переводу с татарского языка. Пока их программа по сравнению с башкирским аналогом работает на 30% лучше.

— Сейчас в базе переводчика есть более 700 тысяч параллельных текстов. Для того чтобы переводчик работал хорошо, нужно заполнить более 1,5 миллиона параллельных текстов. Эта работа очень кропотливая, долгая работа. Вручную приходится сидеть и писать сначала «Мин һине яратам», а рядом также вручную вводить точный перевод на русском «Я тебя люблю», — рассказала о тонкостях создания Гульназ Юсупова.

Для озвучивания перевода пригласили ведущего утренней программы на местном телеканале Наиля Юнусова.

Пока разработчикам еще есть над чем поработать

Что касается финансирования, то фонду удалось выиграть грант главы Башкирии в размере 2,5 миллиона рублей. Однако, так как работа над проектом будет длиться не один год, руководителю фонда нужно постоянно искать источники финансирования.

Ранее UFA1.RU протестировал онлайн-переводчик и убедился, что работы над совершенствованием системы предстоит еще много.

ПО ТЕМЕ
Лайк
LIKE0
Смех
HAPPY0
Удивление
SURPRISED0
Гнев
ANGRY0
Печаль
SAD0
Увидели опечатку? Выделите фрагмент и нажмите Ctrl+Enter
ТОП 5
Рекомендуем