«Эксперименты по машинному переводу с русского языка на татарский начались еще в 1960-х годах» 

Как современные IT-технологии могут быть использованы в сохранении и развитии татарского языка и культуры, какие идеи разрабатывают татарские специалисты и какие перспективы открывают эти проекты - в интервью газете «Шәһри Казан» рассказал доцент Института филологии и межкультурной коммуникации КФУ, научный сотрудник Института прикладной семиотики АН РТ Булат Хакимов.



– Булат Эрнестович, по образованию вы филолог, но в то же время занимаетесь IT-технологиями. Как пересекаются в вашей деятельности эти, на первый взгляд, очень разные сферы?

– Еще 22 года назад я писал дипломную работу, где татарский язык анализировал с помощью компьютерных технологий. Когда начал преподавать в университете, то продолжил эту тему, и будущим педагогам, филологам давал навыки применения современных технологий в своей области. Как видим, интерес к этим наукам растет с каждым годом.

– Наверняка в первых занятиях будущие филологи тоже не улавливают четкой связи.

– Да, на первом же занятии вместе со студентами мы ищем ответ на вопрос: «Какая связь между филологией и IT?». Язык - сам по себе самая первая информационная технология, именно с его помощью мы общаемся, объясняемся друг с другом. В этом и есть суть IT - получить какую-либо информацию, обработать, передать. А язык - естественный вид. Хотя сознание человека не имеет никаких ограничений, физически мы не совершенны: например, мы не можем запоминать гигабайты информации, это и не нужно. Мы не считаем и не обрабатываем информацию, как это делает компьютер. Конечно, человек и сам мог бы это делать, но это требует очень много времени, можно потратить всю свою жизнь. Поэтому человек на помощь себе придумывает технологии.

Если вернемся к языку, то в компьютерах есть языки программирования. Они тоже созданы на основе языка, того, на котором мы говорим, пишем и так далее. В языке программирования тоже есть символы, правила. Если ты, когда строишь предложения, слова поменяешь местами, смысл предложения может полностью измениться. Так же и с языком программирования - допустишь ошибку в коде, то система дает сбой.

– При слове «искусственный интеллект» перед глазами встают какие-то сложные механизмы, человекоподобные роботы. Можете простыми словами объяснить - что такое искусственный интеллект?

– Это технология, которая выполняет функции, которые свойственны только человеку, и считается, что только человек может выполнять эти функции. Мы можем поручать им какие-то небольшие задачи, а также решение каких-то более сложных задач. Например, перевод с одного языка на другой. Человек, исходя из контекста, понимает, в каком смысле использовано слово. Онлайн-переводчик тоже работает с контекстом и понимает, какое слово необходимо использовать именно в этом контексте. Еще один пример: беспилотные автомобили в Иннополисе. Они анализируют обстановку на дороге, и принимают решение, какой маневр необходимо сделать - повернуть направо, налево, или остановиться. Вроде бы, простые задачи, в то же время важные. 

«В нейросеть можно загружать миллионы единиц информации» 

– Теперь о тренде последних лет - нейросетях. Во многих сферах эта технология уже успешно внедряется. Итак, что такое нейросеть?

– Нейросети - это метод. Они по своему строению напоминают мозг, потому что внутри них есть структура и сложные взаимосвязи. Нейросети - это математические модели, которые способны большой объем информации анализировать с точки зрения множества параметров. Человек же многое забывает, ему сложно удержать в памяти большой объем информации. Даже если она сохранилась, то вытащить ее из каких-то укромных «ящиков» памяти сложно. А в нейросеть можно загружать миллионы единиц информации, она оттуда выберет нужную и даст подходящий твоему вопросу ответ. Изучая что-либо, она запоминает все его свойства. Я, например, смогу сказать 10-15 свойств кофейной чашки, которая сейчас стоит передо мной, а нейросеть увидит ее как под микроскопом и анализирует множество его свойств, запоминает и создает из этого структуру, и при необходимости использует.

– Какой пример более успешно расскажет о возможностях нейросети?

– Например, создание изображения по написанному тексту. Наверняка каждый уже видел в интернете рисунки, созданные нейросетью. Прежде, чем изображение (например, кошка) будет сгенерировано, создатели показали этой нейросети огромное количество рисунков кошек, а также ввели текст с описанием желаемого изображения. Нейросеть запомнит хоть миллион изображений кошек, сможет даже сравнить их между собой, а мы, люди, сколько изображений мы могли бы запомнить?



– Но люди, в отличие от машин, могут сделать это творчески.

– Да, но, как я уже сказал, нам свойственна и забывчивость. Иногда в голову приходит идея, вроде бы новая, а она уже давно озвучена другим человеком, может быть и реализована. В большинстве случаев мы слышим, видим что-то, но закидываем это в дальний угол сознания и забываем. Оно остается в подсознании. Приходит время, оно, конечно, всплывает, и мы это воспринимаем как что-то новое.

Часто встречаются повторения при создании сочинений или литературных произведений. Стиль одного писателя может быть похож на стиль другого. Конечно, это не делается специально, всего лишь результат влияния автора. То есть, не каждая озвученная нами мысль может оказаться оригинальной. А нейросеть способна запоминать все, что она видит.

«Эксперименты по машинному переводу с русского языка на татарский начались еще в 1960-х годах» 

– Насколько успешно используются IT-технологии в сохранении и развитии татарского языка? 

– Компьютерные технологии в этой области используются давно. Эксперименты по машинному переводу с русского языка на татарский начались еще в 1960-х годах. В то время электричество еще не во всех деревнях было, а в нашем Казанском университете уже пробовали делать переводы на ЭВМ (электронно-вычислительная машина - ред.). В 90-е годы с началом перемен в обществе эта работа ведется еще активнее. Именно в те годы газеты и журналы переходят на компьютерную верстку. А в компьютерах татарских шрифтов даже не было. Группа инициативных ученых - Раис Бухараев, Джаудат Сулейманов - организуют научно-исследовательский институт и начинают создавать разные программы для татарского языка.

Сегодня у нас есть приложения для переводов, которые мы спокойно можем использовать в нашей повседневной жизни. Тот же ТатSoft (ТатСофт, русско-татарский онлайн переводчик - ред.). Такие инструменты надо использовать. Конечно, хоть они не очень совершенны, по мере активного их использования разработчики, основываясь на обратную связь, его улучшают, и статистика повышается. А это показатель востребованности татарского языка. Другой пример - это татароязычные навигаторы. Это же хорошо, когда в дороге тебя сопровождает интересный и обладающий некоторым чувством юмора попутчик.

– Переводчик, татарский навигатор… Какие еще технологии нужно развивать?

– Необходимы технологии по распознаванию речи и наоборот - озвучивания текста. Это удобно для применения в видеоформатах. Это также хороший инструмент для людей с ограниченными возможностями, например, незрячих. Есть технология, которая распознает речь и превращает ее в текст, благодаря этому журналисты могут быстро расшифровать интервью с диктофона, например. Но татарской версии пока нет, она еще не доработана. Но, думаю, со временем будет.

Также надо думать об автоматическом синхронном переводе. Допустим, в государственных органах идет совещание. Поскольку часть присутствующих не понимает татарский, совещание идет на русском и звучит минимум татарской речи - “хәерле көн”, “рәхмәт”. А синхронный перевод решил бы этот вопрос. Не понимающие татарский язык могли бы надеть наушники и не отставали бы от повестки дня. Китайские студенты, которые учатся у нас в университете, такие переводчики полноценно используют. С одной стороны, материал осваивают, с другой - не могут выучить язык. Поэтому во всем надо находить баланс. Технологии не должны позволять лениться, а помогать человеку.

«Нейросети вполне могут взять на себя какие-то несложные задачи - это позволит журналисту больше времени освободить» 


Изображение сгенерировано нейросетью на основе текста «Миллиард.Татар»


– Сейчас уже в СМИ довольно смело используют возможности искусственного интеллекта. В то же время часть журналистов с осторожностью относятся к ИИ, возможно, видят в ней конкуренцию. 

– Времена изменились, мы не можем игнорировать новые технологии, которые внедряются в нашу жизнь. Я бы привел простой пример: если идет дождь, мы берем зонтик, в гололед выбираем соответствующую обувь и так далее. Если в примере журналистики, то нейросети вполне могут взять на себя какие-то несложные задачи - это позволит журналисту больше времени освободить для творческого подхода к своей работе. По правде говоря, много времени у журналиста отнимают вот эти шаблонные, “обязательные” тексты, а на серьезные материалы иногда руки не доходят. Может быть, если эту часть поручить машинам, то журналист получил бы больше времени на аналитическую, творческую работу.

Пока татарские нейросети совершенствуются, наверное, пройдет довольно много времени. Что касается страхов о том, якобы, технологии разовьются до такой степени, что, как в фантастических фильмах, выйдут из-под контроля, то вероятность этого очень маленькая. Практически невозможно. Мировые лидеры в области IT, учитывая очень быстро идущий прогресс, задумываются о том, чтобы его немного замедлить. Но все -таки, им еще расти и расти.

– Когда же нейросети прочно войдут в татарскую среду? Каковы ваши прогнозы?

– Прогнозировать сложно. Думаю, что быстро. Конечно, в зависимости от того, в какой области. В области текстов примерно через 3-4 года, может даже раньше, они станут чем-то очень естественным. Их спокойно можно будет использовать при создании научных, дипломных работ. Пусть не полностью написать, но в некоторых частях для формирования общих выводов очень удобный способ. А в будущем человек оставит себе творческие вопросы, компьютеру поручит более простые. Надо также помнить, что все эти технологии придумал сам человек. Значит он, несомненно, достоин видеть плоды своего труда. А человек по своей креативности в любом случае окажется выше.


Автор: Алсу Мансурова, перевод с татарского
Источник материалаshahrikazan.ru

Следите за самым важным и интересным в Telegram-канале