«Почему нет татарской колонки «Алисә»? Скорее всего потому, что никто этого пока не захотел»

Курс “Ясалма фәһем” (“Искусственный интеллект”) на татарском языке продолжается – уроки проходят в зуме каждый четверг. Их ведет Сайдаш Мифтахов. Он учится в “Сколково” и работает в компании “Яндекс”. Он использует свои знания для популяризации и развития татарского языка. Сайдаш уверен, что искусственный интеллект перевернет мир и что если татарского языка не будет в интернете, он превратится в язык фольклора. Подробнее – в интервью “Миллиард.Татар”.

«Если мы не будем нести знания на родном языке, люди будут получать их на других языках»


Фото: © «Миллиард.Татар»


- Сейчас в рамках проекта «Ачык университет» вы ведете курс «Ясалма фәһем» («Искусственный интеллект»). Что это за курс, какие темы будут изучаться? Для кого он будет полезен? 

- Это краткий рассказ про новую технологию. 2023 год – это год искусственного интеллекта. Очень многие признали «нейросеть» словом года. Это действительно огромнейший прорыв в технологиях, который можно сравнить с появлением айфонов, интернета или чего-то подобного. Это масштабное изменение, которое потрясло весь мир, заставило его подстраиваться под свои реалии и кажется, что открыло для нас новые грани развития. 

Мы с Райнуром Хасановым, который отвечает за «Ачык университет» и сейчас является руководителем Всемирного форума татарской молодежи, летом и осенью прошлого года уже проводили несколько вебинаров – делали общий обзор по искусственному интеллекту и пришли к мнению, что тема горячая и очень интересна нашей аудитории и всему миру вообще. И решили, что нужно сделать курс, потому что «Ачык университет» - это платформа, которая призвана нести актуальные знания в татарское общество.


Фото: © «Миллиард.Татар»


Если говорить о содержании курса, мы не лезем в теоретические основы, даем только самые базовые понятия. Наша цель - создать комьюнити, сообщество людей, готовых внедрять новые технологии в жизнь, которые смогут сделать углубленный курс или делать какие-то другие проекты. 

И самое главное для нас– поднять осведомленность нашего народа об этих технологиях и делать это через наш родной язык потому, что, если мы не будем нести знания на родном языке, люди будут получать их на других языках. И тогда татарский язык не сможет быть самостоятельным, самообеспечивающимся языком потому, что на татарском языке невозможно будет вести жизнь вообще. Чтобы язык был языком жизни, а не просто фольклора, нужно чтобы на нем в том числе велась научная или околонаучная деятельность. Этот вопрос мы тоже хотим закрыть с помощью нашего курса. 

- То есть, на курсе можно будет прям на татарском писать какие-то тексты с помощью искусственного интеллекта? 

- На самом деле это очень сложный вопрос. В целом у нас сейчас нет технологической базы, чтобы искусственный интеллект писал тексты на татарском. Пока технологически татарский язык очень сыро поддерживается большинством нейросеток. Самые продвинутые версии ChatGPT могут выдавать текст на татарском языке умеренного качества. Это уже хорошо, потому что когда обучали модель нейросети, они видели в интернете информацию на татарском, на самом деле это очень круто. Мне кажется, отчасти здесь большой вклад татарских википедистов, потому что «Википедия» часто служит базой для сбора информации.

Но одной «Википедии» недостаточно, чтобы хорошо обучить языку. Чтобы создавать сервисы, которые будут создавать качественные тексты, нужно приложить больше усилий. К сожалению, нашего присутствия в интернете недостаточно, чтобы модели хорошо обучились создавать тексты на татарском. 


Фото: © «Миллиард.Татар»


Курс не направлен на татароязычное применение искусственного интеллекта, а скорее имеет общеобразовательный характер. Мы рассказываем, что можно делать с татарским языком, проводим разные эксперименты. Например, генерируем текст на русском, а потом с помощью переводчика translate.tatar от Института прикладной семиотики переводим текст на татарский. Это уже хоть что-то, отправная точка. Насколько мне известно, связку нейросеть плюс переводчик применяли при разработке телеграм-бота «Татар чаты». И подобного рода сервис нужен, пока у нас нет своей собственной нейросети, которая хорошо пишет на татарском языке. 

Появился speech tatar, с помощью которого аудио можно переводить в текст, а текст озвучивать с помощью аудио. Он работает очень качественно для татарского языка, и очень радует, что такие сервисы появляются. Это показатель того, что такие исследования ведутся. 

«Не стоит бояться того, что людям не останется работы»

- На этом курсе будете учить как писать тексты? Как рисовать? Как делать запросы? 

- Сейчас в обществе принято считать, что искусственный интеллект нужен в первую очередь для написания текстов. Первое – хочется развеять этот миф. Искусственный интеллект не только про тексты, это про все. Курс разделен на блоки. Мы уже учились писать тексты, общаться с нейросетью, задавать вопросы ChatGPT. Сейчас мы будем переходить на другие блоки. Мы будем создавать изображения, с помощью нейросетей можно менять стиль изображения, генерировать изображение с нуля, создавать изображение по текстовому описанию. 

Развитие искусственного интеллекта привело к тому, что обычный человек не может отличить изображение, сгенерированное нейросетью, от фотографии реального человека. Мне кажется, что мы вступили в новый этап развития человечества. Мы уже перестали отличать то, что создал искусственный интеллект от того, что создает человек. 


Фото: © «Миллиард.Татар»


- Но в этом же кроется опасность.

- Скорее в этом кроется изменение общества. Действительно, нейросеть может говорить человеческим голосом.  Есть техническая возможность сделать так, чтобы сейчас с вами моим голосом, моим обликом разговаривал не я, а искусственный интеллект, чтобы ответы на ваши вопросы генерировала нейросеть. Недавно была новость о том, что один парень поставил в «Тиндере» ChatGPT-бот и с его помощью пообщался с кучей девушек и среди них выбрал себе жену. И девушки не понимали, что они общаются с ботом, а не человеком. 

И таких анекдотичных примеров возникает все больше и больше. И именно в этом кроется переходная точка развития человечества. Технология появилась, она очень хорошая, но человечество еще не придумало, как ее использовать.
 Например, сейчас все блогеры используют телефоны, чтобы записывать ролики. Технологическая база для этого условно появились лет 15-20 назад. Люди поняли, что их можно использовать таким образом и привыкли это делать лет 5 назад. То есть понадобилось 10-15 лет, чтобы обрести технологическую базу, ее применить и внедрить в жизнь. То же самое сейчас с искусственным интеллектом. 

Хочется с помощью этого курса показать возможности искусственного интеллекта потому, что у нас собрались специалисты в разных сферах. Сейчас на курс зарегистрировано более 220 человек. Всего в нашем чате с учетом старой когорты около тысячи человек. Это достаточно большая и разношерстная аудитория. И если каждый человек возьмет для себя что-то новое и как-то это применит в своей жизни, это уже огромная победа. Мы помогаем друг другу понять, как использовать технологии, и помогаем друг другу выйти на другой уровень.


Фото: © «Миллиард.Татар»


Появление искусственного интеллекта – это такая же веха в развитии человечества, как появление интернета или первого смартфона. Я верю в то, что это многое меняет, поэтому нашей экономике и людям важно перестроиться на то, что многие наши задачи будут решаться с помощью технологий. Если условно 100 лет назад для того, чтобы держать ферму, нужно было тысячу человек. Сейчас этой же фермой заведуют и управляют человек 20. Низкоквалифицированный труд человека поменяли технологии. 

И я думаю, что сейчас произойдет то же самое. Не стоит бояться того, что людям не останется работы. Все человеческое развитие показывало, что человеческий труд заменялся технологиями, и при этом людей становилось больше, и работы не убавлялось. Просто людям нужно немного перестроиться и привыкнуть к новому укладу жизни.

На курсе мы хотим проложить мостик между разными модальностями. Мы будем показать, как можно работать с изображением, звуком, анимацией, видео и использовать все это, чтобы получать что-то абсолютно новое. 

«У языка нет будущего, если его нет в интернете»

- То есть, сейчас это воспринимается как развлечение – люди пробуют что-то нарисовать, написать. А лет через 10-15 лет нейросети станут частью нашей жизни? 

- Я думаю, это произойдет гораздо раньше. Скорость принятия технологий растет. Американские корпорации тысячами увольняют сотрудников с позиций, которые легко заменяются искусственным интеллектом. До нас технологии доходят с некоторым опозданием. И я думаю, что в нашей экономике тоже следует ожидать подобных изменений. 

Всегда есть две позиции: можно ждать, пока нас это все настигнет, а можно эту технологию обуздать и начать с ее помощью менять мир. В прошлом году технология прогремела, о ней услышали практически все, все попробовали, получили вау эффект, ничего не получили и забыли. Сейчас люди начинают учиться применять эту технологию. 

- Кто не успел вступить в группу, записаться на курс, но хочет его пройти, еще может это сделать? 

- Да, конечно. Можно заполнить анкету docs.google.com/forms и вступить в группу. Хочется развивать ее как группу единомышленников. Наш курс – толчок, для возникновения сообщества заинтересованных в технологии. Сообщество – саморазвивающаяся сущность, и мы будем делать много интересного и в рамках курса, и после курса. Мы будем двигаться вместе, и вступать не поздно. 

- Мы уже затронули этот вопрос. Можно ли использовать нейросети, чтобы развивать татарский языук, культуру? 

- Не только можно, но нужно. Если у нас в интернете не будет материала на татарском, татарского языка не будет в интернете. Соответственно в будущем цифровом мире (хотя его можно назвать настоящим) если нас нет в интернете, нас нет и языка нет. Татарский останется языком фольклора. Пока у нас нет ресурсов, которыми пользуются миллионы людей, с помощью искусственного интеллекта татарский язык продвинуть в интернете. 

Институт прикладной семиотики занимается разработкой переводчика, технологиями синтеза речи, расшифровки речи. Но это никак не отменяет того, что у нас должна быть не только одна организация, которая всем этим занимается. Больше людей должны создавать контент, и этот вопрос стоит остро. Сейчас татарский контент в интернете — это либо формат новостных изданий, либо формат лайфстайл блогов. Все-таки формат классических медиа кажется уже не настолько массовым, как 20-30 лет назад. Лайфстайл блогинг это все-таки не про развитие. С точки зрения языка, его сохранения, развития, это все-таки примитивный контент. Это уже фольклор. Контенту надо уделять особое внимание, этим заниматься. 

«Прототип татарской колонки можно собрать за несколько вечеров»


Фото: © «Миллиард.Татар»


- Есть колонка «Һомай», которая говорит на башкирском. Почему нет татарской колонки? Чего не хватает – денег, технологий, данных или энтузиазма?

- Мне сложно сказать, потому что я не видел башкирскую колонку. Почему нет татарской колонки «Алисә», например? Скорее всего потому, что никто этого пока не захотел. Решение по синтезу речи, разработанные в Институте семиотики, есть. Достаточно хороший переводчик у нас уже есть. Технологическая база есть, и достаточно нескольких вечеров, если есть человек, который разбирается в этом вопросе. 

Я уверен, что на башкирском языке это все есть только потому, что нашелся деятельный башкирский активист. Я практически уверен, что на этапе прототипа нужен один человек, который соберет все идеи и все сделает. Дальше – вопрос развития технологии, масштабирования, и здесь уже нужна какая-то системность. Если кто-то решит сделать прототип, уже через два дня может появиться первая татарская колонка.  

- Нет ощущения, что татарские активисты стали пассивны? Если да, в чем причина? Потому что за это не платят? Или это особенность нашего менталитета? 

- Влияет совокупность факторов. Финансы действительно играют большую роль. Если говорить о разработке базовых технологий – переводчика, ChatGPT на татарском, сервиса генерации или синтеза речи, это достаточно затратные технологии. Например, нужны дорогие компьютеры, видеокарты. Но если есть финансы, но нет желающих что-то делать, ничего не будет создаваться. 

Для того, чтобы создавалось что-то большое, нужны идейные активисты и финансовые ресурсы. И для этих людей нужно сообщество, потому что идеи, которые остаются в одной голове, быстро утухают. 

Я думаю, что проблема системная. Это не значит, что мы какие-то не такие или что у нас нет ресурсов. Скорее всего это констатация факта, что раньше этим никто не занимался. Возможно, на нашем курсе у кого-то возникнут великолепные идеи, и появится татарская колонка или какое-то суперинновационное или просто полезное решение на основе искусственного интеллекта. 

Пока я хочу начать с информирования, потому что если сразу начать  что-то делать, ничего из это не выйдет, потому что никто об этом не узнает. 

- Расскажите о себе. Откуда вы? Чем занимаетесь? 

- Я из Кукморского района деревни Уразаево. В 11 классе я стал призером Всероссийской олимпиады по экономике, которая проходила в Москве. Как я люблю говорить, из деревни в 200 человек я уехал в город с населением 20 млн человек практически без знания русского. Я поступил в Высшую школу экономики. На первом курсе, многие презентации просто заучивал, чтобы не забыть перевод какого-то слова потому, что я привык думать на татарском. Я учился по очень сильной программе, на которую могли поступить только победители всероссийских олимпиад, по результатам ЕГЭ почти никто не мог попасть. 

После второго курса я заинтересовался ИТ, начал работать в сфере искусственного интеллекта. 3-4 года разрабатывал решения для бизнеса, заводов, финансовых компаний. 

Сейчас заканчиваю магистратуру в Сколково, работаю руководителем маркетинга в аналитике в международном направлении Яндекса. 

Полтора года назад переехал из Москвы в Казань, душа потянула. Приехал на год и не смог уехать, вижу себя, свою полезность. В курсе «Искусственный интеллект» наработки и знания, которые приобрел в Москве использую, чтобы приносить пользу для общества.  

P.S. Сайдаш Мифтахов также завел телеграм-канал t.me/saydash_ai, в котором рассказывает об искусственном интеллекте, нейросетях и других современных технологиях. 

Если вы хотите пройти курс «Ясалма фәһем», заполните форму docs.google.com/forms и вступайте в группу. Там вы найдете ссылки на новые уроки и записи прошлых занятий. 


Автор: Гуландам Фатхуллина


 

Следите за самым важным и интересным в Telegram-канале