«Научить колонку «Алису» татарскому языку – задача сложная, но выполнимая»

Как татарин из Оренбурга Рустам Юсупов создал для эвенкийского языка библиотеку, словарь-бот и планирует разработать удобное приложение.

«Научить колонку «Алису» татарскому языку – задача сложная, но выполнимая»
«Все должно быть в телефоне», - говорит он. Еще один проект Рустама Юсупова связан с обучением тофаларскому языку, на котором говорит немногочисленный народ тофаларов. «Миллиард.Татар» поговорил с языковым активистом и выяснил, почему он заинтересовался редкими языками, как обстоит ситуация с обучением татарскому и можно ли создать татарскую «Алису».


Библиотека и словарь-бот для эвенкийского языка

- Вы создатель крупнейшей библиотеки по эвенкийской тематике «Эвенкитека». Расскажите, как и почему она создавалась? Почему вас заинтересовал именно эвенкийский язык? 

- Я родился в Сибири и интересовался краеведением. Если посмотреть на карту моего района, все названия либо русские, либо эвенкийские. Отсюда появился интерес – а что это означает, а как это переводится? Таким образом, я начал искать материалы по эвенкийскому языку. В то время их было мало. Речь идет, наверное, о конец нулевых годов - 2007-2008 гг. Я находил материалы и выкладывал их в интернет, чтобы поделиться с другими людьми, которым это тоже может понравиться. Постепенно выросла целая библиотека. 


Источник фото: скрин сайта «Эвенкитека


- Я так понимаю, вы создавали ее, еще будучи студентом, и что вы учились в Казани? 

- я учился в Казани. В КФУ. 

- Что сейчас с проектом? Много пользователей?
 
- По метрике могу сказать, что человек 50 в день бывает. Но для сайта с такой очень узкой тематикой это достаточно много. В основном заходят из Москвы, Республики Саха и Дальнего Востока. 

- Есть еще какие-то проекты, разработки, связанные с лингвистикой? Насколько я знаю, вы еще создали словарь-бот для эвенкийского языка.

- У меня есть сайт «Эвенгус». Правда, формально он мне сейчас не принадлежит, поскольку я поставил [проект] на паузу. Этот сайт посвящен изучению эвенкийского языка. У меня есть план перевести его в интерактивную языковую плоскость. То есть, сделать что-то подобное известным сервисам по изучению языков. Например, как Duolingo и т.д. 

Да, есть у меня словарный бот в «Телеграме». Он называется «Русско-эвенкийский словарь». Собираюсь еще сделать эвенкийско-русский словарь, и на этой основе думаю вырастить что-то похожее на переводчик. 


Фото: из открытых источников vk.com


- Почему создание таких сайтов, приложений важно для сохранения миноритарных языков? 

- Все должно быть в телефоне, потому что мы проводим в нем много времени. Я стараюсь сделать так, чтобы и эти языки были представлены в современных технологиях. 

«Можно сделать так, чтобы вы говорили по-татарски: «Исәнмесез”, а колонка отвечала: «Хәерле иртә”»

- Нет ли планов создать приложение или словарь для татарского языка? 

- Для татарского языка есть целые институты, которые занимаются этими вопросами.

- Несмотря на то, что много делается, такого словаря нет. Удобного приложения наподобие Duolingo тоже нет. Как думаете, почему не получается реализовать такие успешные проекты? 

- Я в свое время пытался учить татарский. Была большая проблема в методических материалах. Учебники просто отвратительно составлены. Первые два-три урока ты учишь слова «мама», «папа», «кушать», а на четвертом уроке тебя просят перевести поэму Мусы Джалиля, например. Я не понимаю, почему они так устроены. Но я не вдавался в преподавание татарского языка. 


Фото: из открытых источников vk.com


- Сейчас загорелись идеей создать умную колонку наподобие «Алисы» на татарском языке. Это реально? Что для этого нужно? 

- Для этого нужна технология распознавания татарской речи. Насколько я понимаю, такой технологии на текущий момент нет. Есть технология по распознаванию русской речи. Для эвенкийского языка есть проект Ayana, они используют разработки «Яндекса» для распознавания русской речи и выдачи информации, касающейся эвенков, на русском языке. Научить колонку татарскому языку – задача сложная, но выполнимая.

- В чем сложность?

- Во-первых, у вас должен быть рабочий переводчик, который понимает текстовую информацию на татарском языке. Такие вроде бы есть. Тот же «Яндекс» довольно неплохо переводит с русского на татарский, то есть, переводчики есть. Вы должны обучить компьютер понимать татарскую речь. Для этого в нее нужно довольно вложить звуковой информации. 

- Этим кто должен заниматься – филологи, программисты? 

- И филологи, и программисты вместе, и носители языка. Вы должны наговорить много татарского текста компьютеру и показать ему, что это за текст, то есть, перевести его в буквы. Дальше технологии искусственного интеллекта сами разберутся, какие звуки какому слову или каким буквам соответствуют. 

- И чтобы она ответ находила? 

- Ответ она будет находить, я так понимаю, в переводчике. Переводчиком можно пользоваться «яндексовским». Нужно связываться с компанией «Яндекс». Но насколько я понимаю, в Татарстане есть такая возможность. 

- То есть, я задаю вопрос (например, что такое китап?), колонка находит ответ и она переводит его на татарский? 

- Теоретически можно даже сделать так, чтобы вы говорили по-татарски: «Исәнмесез», а она отвечала: «Хәерле иртә» или «Хәерле көн». То есть, чтобы она не просто переводила, а понимала вашу речь и адекватно отвечала. 

- Расскажите о себе. У вас имя татарское, и вы учились в Казани. У вас есть татарские корни? 

- У меня отец татарин. Я жил и учился в Казани, какое-то время жил в Мензелинске. Сейчас я переехал в Оренбург. 

- Чем занимаетесь? 


Ассоциация коренных малочисленных народов Севера, Сибири и Дальнего востока вручила медаль "За верность Северу" — за языковые проекты "Эвенгус" и "Эвенкитека"
Фото: из открытых источников vk.com


- Дизайном. У меня еще есть проект «Тофастан». Он про язык тофаларов, это тюркский язык. Это небольшой народ, их осталось около 300 человек, а говрящих на тофаларском языке всего 3 челвоека. Это небольшой сайт, единственный в мире, посвященный тофаларскому языку. Со мной недавно связывались из концерна Виниокт, советотовлаись, не нужно ли добавить новую букву в таблицу Виникода – это ч с крючком такая. По этому языку тоже запустить сайт, он будет русско-тафаларскийй, тафаларско-русским. 

- А почему этим языком заинтересовались? 

- Тофалары – это тоже один из народов Сибири. 

- Какие у вас интересные проекты по дизайну? 

- В прошлом году я, например, оформлял Тунгусский конгресс. Это съезд эвенков и тунгуссо-язычных народов, первый в итории России. Он проходил на Байкале. Я делал им фирменный стиль, придумал логотип. 


Автор: Гуландам Фатхуллина
Фото на анонсе: из открытых источников vk.com

Следите за самым важным и интересным в Telegram-канале