Разработчик из Уфы Айгиз Кунафин представил прототип «умной» колонки, которая понимает запросы и отвечает по-башкирски. Видео опубликовано в Телеграм-канале проекта «Һомай» — такое название получила интеллектуальная станция.
На видео колонка отвечает на вопросы о времени, высоте башкирских гор и о том, сколько районов есть в республике.
Айгиз Кунафин рассказал корреспонденту «Миллиард татар», что прототип – это уже работающая колонка, которая при наличии интернета умеет отвечать на вопросы.
«Мы здесь отработали технологии, такие как запись звука, отправка на сервер и проигрывание полученного ответа. По колонке надо будет сделать еще три вещи (как их сделать, уже знаем): дизайн красивого корпуса, научить реагировать на голосовую команду “Һомай” и собрать ее на немного другом железе. Параллельно работали над мозгом “Һомай”. Пока умеем отличать четыре типа вопроса: все, что связано со временем (сколько время, поставь таймер, будильник, напоминалку), вопросы о погоде (где, когда на какой период), религии (здесь колонка понимает, что вопрос связан с религией, но ответы пока не дает, тут отдельно надо работать, чтоб чушь не нести) и болталка — тут уже всякая инфа из интернета, аналог гугления, только ответ получаешь сразу в трех-четырех предложениях», — говорит Кунафин.
Ранее в интервью «Миллиард татар» Айгиз Кунафин рассказал, что работа над проектом началась в 2020 году, во время всеобщей изоляции из-за пандемии коронавируса. Сначала программист хотел создать сайт, который бы автоматически обрабатывал выполненную домашнюю работу школьников (сам Кунафин – отец четверых детей). Но, когда изоляция закончилась, подобный сайт перестал быть актуальным. И тогда разработчик решил создать голосового помощника, который бы понимал запросы на башкирском языке и адекватно на них отвечал.
Программу «Һомай», как и другие подобные алгоритмы, обучали на дата-сетах. Проблемой в этом случае стала нехватка текстов и речевых образцов на башкирском языке, доступных в интернете. Тогда Айгиз Кунафин с единомышленниками привлек к проекту добровольцев: на специальной платформе Common Voice носители башкирского языка зачитывали отрывки текстов, и на этом материале обучали программу. Другие добровольцы оцифровывали башкирские книги, чтобы «Һомай» знакомилась с классической башкирской литературой.
Команда разработчиков продолжает периодически привлекать к работе волонтеров. Например, сейчас нужны расшифровщики числительных – те, кто сможет грамотно перевести разные способы записи цифр и чисел в слова.
Уже в ближайшее время первые «умные» колонки на башкирском языке станут доступны пользователям. Айгиз Кунафин также рассчитывает наладить их серийное производство в Китае. Разработчик утверждает, что после создания платформы на башкирском языке, ее можно будет при желании масштабировать для использования на любом другом языке народов России. В первую очередь разработчики хотят сделать такой же продукт на татарском языке.