Библиотека и словарь-бот для эвенкийского языка
- Вы создатель крупнейшей библиотеки по эвенкийской тематике «Эвенкитека». Расскажите, как и почему она создавалась? Почему вас заинтересовал именно эвенкийский язык?
- Я родился в Сибири и интересовался краеведением. Если посмотреть на карту моего района, все названия либо русские, либо эвенкийские. Отсюда появился интерес – а что это означает, а как это переводится? Таким образом, я начал искать материалы по эвенкийскому языку. В то время их было мало. Речь идет, наверное, о конец нулевых годов - 2007-2008 гг. Я находил материалы и выкладывал их в интернет, чтобы поделиться с другими людьми, которым это тоже может понравиться. Постепенно выросла целая библиотека.
- Я так понимаю, вы создавали ее, еще будучи студентом, и что вы учились в Казани?
- я учился в Казани. В КФУ.
- Что сейчас с проектом? Много пользователей?
- По метрике могу сказать, что человек 50 в день бывает. Но для сайта с такой очень узкой тематикой это достаточно много. В основном заходят из Москвы, Республики Саха и Дальнего Востока.
- Есть еще какие-то проекты, разработки, связанные с лингвистикой? Насколько я знаю, вы еще создали словарь-бот для эвенкийского языка.
- У меня есть сайт «Эвенгус». Правда, формально он мне сейчас не принадлежит, поскольку я поставил [проект] на паузу. Этот сайт посвящен изучению эвенкийского языка. У меня есть план перевести его в интерактивную языковую плоскость. То есть, сделать что-то подобное известным сервисам по изучению языков. Например, как Duolingo и т.д.
Да, есть у меня словарный бот в «Телеграме». Он называется «Русско-эвенкийский словарь». Собираюсь еще сделать эвенкийско-русский словарь, и на этой основе думаю вырастить что-то похожее на переводчик.
- Почему создание таких сайтов, приложений важно для сохранения миноритарных языков?
- Все должно быть в телефоне, потому что мы проводим в нем много времени. Я стараюсь сделать так, чтобы и эти языки были представлены в современных технологиях.
«Можно сделать так, чтобы вы говорили по-татарски: «Исәнмесез”, а колонка отвечала: «Хәерле иртә”»
- Нет ли планов создать приложение или словарь для татарского языка?
- Для татарского языка есть целые институты, которые занимаются этими вопросами.
- Несмотря на то, что много делается, такого словаря нет. Удобного приложения наподобие Duolingo тоже нет. Как думаете, почему не получается реализовать такие успешные проекты?
- Я в свое время пытался учить татарский. Была большая проблема в методических материалах. Учебники просто отвратительно составлены. Первые два-три урока ты учишь слова «мама», «папа», «кушать», а на четвертом уроке тебя просят перевести поэму Мусы Джалиля, например. Я не понимаю, почему они так устроены. Но я не вдавался в преподавание татарского языка.
- Сейчас загорелись идеей создать умную колонку наподобие «Алисы» на татарском языке. Это реально? Что для этого нужно?
- Для этого нужна технология распознавания татарской речи. Насколько я понимаю, такой технологии на текущий момент нет. Есть технология по распознаванию русской речи. Для эвенкийского языка есть проект Ayana, они используют разработки «Яндекса» для распознавания русской речи и выдачи информации, касающейся эвенков, на русском языке. Научить колонку татарскому языку – задача сложная, но выполнимая.
- В чем сложность?
- Во-первых, у вас должен быть рабочий переводчик, который понимает текстовую информацию на татарском языке. Такие вроде бы есть. Тот же «Яндекс» довольно неплохо переводит с русского на татарский, то есть, переводчики есть. Вы должны обучить компьютер понимать татарскую речь. Для этого в нее нужно довольно вложить звуковой информации.
- Этим кто должен заниматься – филологи, программисты?
- И филологи, и программисты вместе, и носители языка. Вы должны наговорить много татарского текста компьютеру и показать ему, что это за текст, то есть, перевести его в буквы. Дальше технологии искусственного интеллекта сами разберутся, какие звуки какому слову или каким буквам соответствуют.
- И чтобы она ответ находила?
- Ответ она будет находить, я так понимаю, в переводчике. Переводчиком можно пользоваться «яндексовским». Нужно связываться с компанией «Яндекс». Но насколько я понимаю, в Татарстане есть такая возможность.
- То есть, я задаю вопрос (например, что такое китап?), колонка находит ответ и она переводит его на татарский?
- Теоретически можно даже сделать так, чтобы вы говорили по-татарски: «Исәнмесез», а она отвечала: «Хәерле иртә» или «Хәерле көн». То есть, чтобы она не просто переводила, а понимала вашу речь и адекватно отвечала.
- Расскажите о себе. У вас имя татарское, и вы учились в Казани. У вас есть татарские корни?
- У меня отец татарин. Я жил и учился в Казани, какое-то время жил в Мензелинске. Сейчас я переехал в Оренбург.
- Чем занимаетесь?
- Дизайном. У меня еще есть проект «Тофастан». Он про язык тофаларов, это тюркский язык. Это небольшой народ, их осталось около 300 человек, а говрящих на тофаларском языке всего 3 челвоека. Это небольшой сайт, единственный в мире, посвященный тофаларскому языку. Со мной недавно связывались из концерна Виниокт, советотовлаись, не нужно ли добавить новую букву в таблицу Виникода – это ч с крючком такая. По этому языку тоже запустить сайт, он будет русско-тафаларскийй, тафаларско-русским.
- А почему этим языком заинтересовались?
- Тофалары – это тоже один из народов Сибири.
- Какие у вас интересные проекты по дизайну?
- В прошлом году я, например, оформлял Тунгусский конгресс. Это съезд эвенков и тунгуссо-язычных народов, первый в итории России. Он проходил на Байкале. Я делал им фирменный стиль, придумал логотип.
Автор: Гуландам Фатхуллина
Фото на анонсе: из открытых источников vk.com