«Сделать татарскую «Алису» вполне реально, мы уже ведем переговоры»

Как искусственный интеллект поможет в изучении татарского языка? Можно ли разработать «татарского голосового помощника»? Грозит ли развитие нейросетей исчезновением большей части языков? На эти и другие вопросы «Миллиард.Татар» ответил студент второго курса КНИТУ-КАИ, стажер института прикладной семиотики АН РТ Булат Гумеров.

«Ана теле» - лидер, но у него есть только сайт, который требует обновления»

- Нас заинтересовал ваш проект, с которым вы победили на Tatar.Бу Хакатоне. Это образовательная платформа для обучения татарскому языку, я правильно понимаю? 


Фото: из личного архива Булата Гумерова


- Все верно, это образовательная платформа, которая позволяет изучать татарский язык в формате взаимодействия с веб-ресурсами, то есть на сайте, через компьютер, или через мобильное приложение на телефоне. Там будет представлен различный контент, в зависимости от возраста и уровня владения языком. Данный проект сейчас находится в стадии разработки. 

В целом, проект представляет из себя обучающие курсы: тренажеры, аудирование, изучение слов и грамматики. В качестве примера мы проанализовали ряд приложений для изучения английского языка. Из пяти наиболее популярных отобрали лучшие решения и функционал с точки зрения эффективного обучения татарскому языку. 

- А чем оно отличается от других? Насколько я знаю, для татарского языка есть «Ана теле».

- «Ана теле» - это лидер, но у него есть только сайт. И, на мой взгляд, этот сайт требует обновления. А мы хотим сделать обновленный ресурс, плюс там будет мобильное приложение. К тому же «Ана теле» не рассчитан для детей младшего возраста, а в нашей платформе предусмотрен уровень «Бәләкәч». 

- Принцип изучения языка будет примерно таким же, как в «Ана теле»?

- Если честно, я отвечаю только за техническую реализацию проекта. За схему упражнений отвечает наша команда методистов и филологов на базе Института прикладной семиотики Академии наук РТ.  

- А сколько человек в вашей команде? 

- Со стороны студентов нас трое - я, Кирилл Пантелеев и Ильдар Валиев. Мы учащиеся второго курса КНИТУ-КАИ кафедры прикладной математики. А со стороны Института нам помогает практически весь его состав. 


Фото: из личного архива Булата Гумерова


- Расскажите про техническую часть проекта. Возможно, вы будете использовать какие-то новые фишки?

- Мы делаем интерфейс для создания авторских курсов, авторского контента. То есть, любой учитель татарского языка сможет на этой платформе создать свой курс из готовых блоков в интуитивно понятном интерфейсе. 

Мы не будем останавливаться только на наших курсах, у нас есть планы по взаимодействию со школами для изучения языка, и для того, чтобы помочь преподавателям в изучении татарского. Можно будет, к примеру, реализовать постоянный контроль успеваемости, потому что приложение всегда рядом, и оно получает информацию о том, усвоил ученик урок или нет. Преподаватель сможет адаптировать контент в приложении под свою группу – под уровень знаний языка или под другие факторы. 

- Приложение будет чем-то вроде Duolingo?

- Duolingo – это один из флагманов, на который мы ориентируемся. Оно так же, как и наше приложение, распространяется по бесплатному доступу. 

«Хотим, чтобы можно было русский и английский контент потреблять с татарской озвучкой»

- Сейчас популярна тема нейросетей, искусственного интеллекта…

- Это как раз то, на чем специализируется Институт прикладной семиотики, и, в том числе, наша команда. Нейросети там будут практически повсюду: машинный переводчик «Татсофт», синтез, распознавание речи. Все это – технологии Института. 


Источник изображения: предоставлено Булатом Гумеровым


С нашей стороны там будет рекомендательная система, которая будет показывать нужный контент. У каждого пользователя будет формироваться индивидуальная траектория обучения на основе рекомендательных систем на базе ИИ (TikTok и VK Клипы - это самые яркие примеры их использования). Мы будем знать слабые места пользователя, и будем давать ему контент, который его усилит. 

- А вы сами активно используете нейросети в жизни?

- ChatGPT сейчас обрел очень большую популярность. Он очень сильно помогает и по студенческим работам, и по основной работе. Нейросети экономят очень много времени, и, если научиться их правильно использовать, можно получить конкурентное преимущество. Нейросеть помогает искать информацию. Понятно, что ее нужно перепроверять, потому что она не дает ссылки на источники, но это все равно очень хороший инструмент. 

- Есть мнение, что из-за развития ИИ большинство языков исчезнут, и останутся только «крупные». То есть, тот же татарский – под угрозой исчезновения. 

- Практически весь контент про айти – нейросети, программирование, архитектура – все это сначала публикуется на английском языке. Тут даже русский проигрывает, не говоря о татарском. Возможно, наша задача – адаптировать контент, то есть, добавить переводчик с английского на татарский, чтобы можно было потреблять айтишный, технический контент на татарском или русском. 

В таком случае, наверное, языки не уйдут, а скорее, наоборот, будут развиваться, если сумеем быстро адаптироваться. Быстрый и качественный перевод любого контента – текстового, аудио и видео – это одно из решений, которое способно обогатить малоресурсные языки через доступ к ресурсам крупных языков мирового уровня.  


Источник изображения: предоставлено Булатом Гумеровым


Возможно, вы знакомы с функцией «Алисы», которая может переводить видеоролики с английского, китайского и других языков на русский с озвучкой? Мы хотели бы сделать такой же функционал и для татарского языка – чтобы можно было русский, английский контент потреблять с татарской озвучкой. 

- Есть ли какие-то примерные даты, когда можно будет попробовать, протестировать ваш продукт? 

- В данный момент доступен чат-бот внутри «Телеграма» и на нашем сайте. В «Телеграме» используется ChatGPT, а языковая модель от «Тинькофф» работает на нашем сайте. У ChatGPT есть ограничения, во-первых, оно недоступно для пользователей из России, а, во-вторых, там есть лимиты на запросы по API. Модель «Тинькофф», возможно, уступает по качеству, потому что она старее, чем ChatGPT, но ее преимущество в том, что она распространяется безлимитно по бесплатной лицензии. 

- Что со временем появится на вашем сайте?

- Проект разделен на этапы, и мы дорабатываем его по мере возможности. В этом году мы полностью обновили дизайн, поставили другую нейросеть в чат-бот. В будущем проект будет называться «Тел.Саф.Татар», а пока сохраняется старое название.

«Мы представляли проект на коллегии Минцифры, Рустам Нургалиевич положительно его оценил»

- Вы сказали про этапы реализации проекта, а когда все-таки пользователь сможет начать пользоваться этой платформой? 

- Повторю, что мы пока находимся на стадии разработки. Это масштабный проект, требующий участия различных специалистов и соответствующей финансовой поддержки. Когда появится возможность заниматься разработкой только этого портала (не работая параллельно в других компаниях и не думая о других задачах), думаю, нам хватит 3-4 месяца, чтобы вышел MVP (минимально готовый рабочий продукт) в мобильном приложении и на сайте. Год потребуется для появления готового продукта. В целом, конкретные сроки сейчас назвать сложно, потому что есть много разных переменных. 


Источник изображения: предоставлено Булатом Гумеровым


- А со стороны республики, Минцифры, может быть, есть какие-то обещания о поддержке?

- Мы запрашивали грант на финансирование этого проекта и на синхронный переводчик. Пока в ожидании.

- Это республиканские гранты?

- Да, татарстанские. Мы представляли этот проект в текущем году на коллегии Минцифры. Тогда Рустам Нургалиевич положительно его оценил. 

- На ваш взгляд, можно ли сделать татарскую «Алису»?

- Можно. Более того, мы связались с командой разработчиков умной колонки «Алия», и совместно с ними провели переговоры с одной из крупных российских компаний по производству подобных устройств. Детали мы пока раскрыть не можем, но это реализуемо. То есть, можно будет задавать умному помощнику вопросы на татарском и получать на нем же ответы. 

- Для этого уже есть технические разработки?

- С программной реализацией нам сильно поможет переводчик. Сейчас мы как раз активно занимаемся синтезом и распознаванием речи. А по поводу самой колонки и умного ассистента внутри нее – это уже будет представлено нашими партнерами. 

- Если мы в качестве примера возьмем сказки, надо же, чтобы их кто-то начитывал?

- Да, нужен человеческий, не синтезированный голос. Этим мы тоже сейчас активно занимаемся, ведем переговоры. В части финансирования пока ничего не ясно, конечных цифр мы не знаем. 

- А эта колонка будет разговаривать только на татарском? 

- В целом, это будет колонка, которой можно сказать: «Әйдә, татарча сөйләшәбез», и она включится. 

- То есть, можно общаться с ней на русском и можно переключиться на татарский режим?

- Это один из вариантов, который мы хотим развивать. 

 

Следите за самым важным и интересным в Telegram-канале