Цифровое будущее осетинского языка

В Северной Осетии активно реализуется проект по цифровизации осетинского языка – один из приоритетных шагов в сохранении и развитии родной речи в эпоху цифровых технологий. Работа началась ещё в 2023 году: тогда осетинский язык был интегрирован в крупнейшие языковые платформы – Яндекс и Google.

«Для обучения искусственного интеллекта (ИИ) потребовался так называемый языковой корпус – массив текстов и речевых образцов. Для сравнения: в романе «Война и мир» – около 35 тысяч фраз, тогда как для качественного синтеза и распознавания речи требуется миллионы фраз. На первом этапе в Яндекс передали 100 тысяч фраз, что позволило создать первую версию ИИ, способного воспроизводить речь на осетинском языке», – рассказал Александр Нартиков, советник главы республики по вопросам развития и цифровизации осетинского языка.

Однако качество требует улучшения. В этой связи в республике учреждён Фонд цифрового развития осетинского языка, на базе которого запущена специализированная платформа для совместной работы над расширением языкового корпуса. В проекте примут участие переводчики, филологи, музыковеды и носители языка. Реализация рассчитана до двух лет, но первые результаты станут заметны уже на промежуточных этапах. «Особое внимание уделяется созданию голоса осетинского языка. Планируется объявить открытый конкурс на лучший голос – аналогично голосу «Алисы» в Яндексе.

Компания готова бесплатно организовать профессиональную студийную запись выбранного голоса в Москве, чтобы ИИ мог синтезировать естественную, эмоциональную речь», – подчеркнул Александр Нартиков.

Не менее важна и задача распознавания устной речи: для этого всех желающих приглашают записывать фразы на диктофон или смартфон – даже с шумом улицы или фоновыми помехами. Это позволит ИИ научиться понимать разные акценты, диалекты и интонации, обеспечивая точное взаимодействие с пользователями. Важный принцип проекта – некоммерческая, общественная собственность на результаты. Все наработки станут достоянием республики и будут использоваться в образовательных, культурных и туристических целях. «В частности, ведётся работа по развитию туристического приложения, изначально разработанного резидентом ИТ-отрасли – компанией «Цифровая Алания» (включённой в реестр российских IT-компаний и получившей государственный грант).

По решению правительства Северной Осетии, приложение будет передано республике – в ведение Министерства культуры, которое возглавит его развитие с акцентом на культурное наследие: исторические памятники, музеи, традиции.

Приложение уже доступно для скачивания и будет обновлено: появятся новые сервисы, актуализированные маршруты и мультимедийный контент», – пояснил Алек-сандр Нартиков.

Проект объединяет усилия Министерства культуры, Министерства экономики и ИТ-сообщества – с целью не только сохранить язык, но и сделать его живым, востребованным инструментом в цифровой среде: от онлайн-обучения до умных туристических гидов.

По материалам информагентств