Специалисты из Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) представили первую методику, которая позволяет объективно оценивать сложность текстов на нескольких языках коренных народов России. Разработка адаптирована для татарского, адыгейского, башкирского, бурятского, осетинского и удмуртского языков.
Созданный учёными онлайн-инструмент анализирует текст по нескольким ключевым параметрам: длина и частотность слов, лексическое разнообразие, плотность и описательность. Система использует базу из 5 тысяч наиболее употребительных слов в каждом языке, что повышает точность оценки.
Инструмент поможет преподавателям подбирать учебные материалы и может быть использован для поддержки государственной языковой политики. В будущем систему планируют расширить на другие малоресурсные языки.