В России говорят более чем на 160 разных языках, при этом около ста языков малочисленных народов страны могут исчезнуть в течение следующих десятилетий. Ко Дню народного единства Сбербанк подготовил культурно-образовательную инициативу по сохранению исчезающих языков.
В рамках реализации пилотной версии было выбрано три языка. Среди них нганасанский — это язык коренного населения полуострова Таймыр в Красноярском крае. Число говорящих на нем по данным переписи 2010 года — 125 человек. Также ульчский язык, на котором говорят жители Хабаровского края. По данным переписи 2010 года — 154 человека. И ижорский — это язык народности, населяющей южный берег Финского залива в Ленинградской области. Число говорящих по данным той же переписи — 123 человека.
Изучать язык с помощью чат-бота
На специальном сайте sberbank0411.ru пользователи могут изучать выбранные языки с помощью чат-ботов. Они работают на базе самообучающихся нейросетей, объединяющих в себе методы математической лингвистики и машинного обучения. Пользователи могут воспользоваться тремя чат-ботами, каждый из которых поможет им изучить один из выбранных языков. Общение строится в игровой форме, а коммуницировать можно с помощью иконок или выбирать слова и фразы из предложенного списка.
При разработке проекта применялись дедуктивный и индуктивный метод машинного обучения. С привлечением лингвистов был собран языковой материал от носителей, определены общие закономерности и разработаны обучающиеся алгоритмы.
Напомним, что ко Дню России 12 июня Сбербанк предложил всем желающим выбрать поздравление на одном из 30 языков народов страны и поделиться им в социальных сетях с хештегом #этовсеРоссия. Идея акции была в том, чтобы не только напомнить о многоязычности России, но и дать возможность в этих языках попрактиковаться.
На правах рекламы