Нейросети хотят научить работать с языками коренных народов Сахалина

В правительстве РФ планируют комплекс мер для сохранения и развития языков народов РФ

В правительстве РФ утвердили план мероприятий по реализации в 2026–2028 годах Стратегии государственной национальной политики России на период до 2036 года. Он включает несколько разделов, один из которых направлен на сохранение и поддержку этнокультурного и языкового многообразия России, сообщает пресс-служба правительства.

Так, в рамках стратегии запланировано создание центров этнокультурного и языкового образования на базе образовательных организаций, внедрение единых образовательных программ и учебников для преподавания языков народов России, проведение фольклорных экспедиций по выявлению объектов нематериального этнокультурного достояния.

Кроме того, предполагается разработать нейросетевые модели для автоматической обработки языков коренных малочисленных народов Севера, Сибири и Дальнего Востока (синтез и распознавание речи, машинный перевод, голосовой помощник), издать учебные и методические пособия по таким языкам, проводить форумы, посвященные коренным народам и их языкам.

Также в России планируют поддерживать и развивать народные художественные промыслы, фольклорные коллективы и национальные театры, продвигать национальную литературу народов России.

О том, как переводят языки в "цифру" ИА SakhalinMedia писало в этом материале. В 2020 году языковые активисты составили первый языковой корпус нивхского языка (16+). Это электронное собрание текстов с параллельным переводом на русский язык. 

Такие корпусы используются для обучения искусственного интеллекта статистическому машинному переводу. Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучше результат машинного перевода. Если корпус продолжат пополнять данными, то переводу на нивхский язык возможно будет научить и ИИ, что может продлить жизнь языку еще на долгие годы.

Смотрите полную версию на сайте >>>