В честь 95-летия Ханты-Мансийского автономного округа создан новый корпус мансийского языка, включающий 146 тыс. пар предложений. Как сообщили на телеканале «Югра», материалы уже направлены в Федеральное агентство по делам национальностей.
Корпус языка – это подобранная определенным образом коллекция текстов, которая используется для базы знаний для исследования языка. В Национальном корпусе русского языка содержатся тексты, включающие 2 млрд слов.
Новый корпус мансийского языка передан компании «Яндекс» для интеграции в цифровые сервисы, пишет ugra-news.ru. Дополнительно разработан портал мансийского языка с автоматическим переводчиком и словарем для упрощения его изучения и практического использования.
Губернатор Югры Руслан Кухарук сообщил, что идет работа над корпусом хантыйского языка — уже собрано более 10 тыс. пар параллельных предложений на русском и хантыйском.

Как теперь живет манси Костя, названный в честь свердловского туриста18 декабря 2024 в 17:30
