Общество |
17 января 2012 года |
Коми-русский электронный словарь создан в лаборатории при академии госслужбы
Свой первый продукт – проект по созданию коми-русского электронного словаря – представила на прошлой неделе открывшаяся в конце минувшего года при Коми республиканской академии государственной службы и управления Межрегиональная лаборатория информационной поддержки функционирования финно-угорских языков. Словарь подготовлен в рамках совместного проекта с университетом города Тромсе (Норвегия) при финансовой поддержке Министерства национальной политики РК. Проект представили руководитель лаборатории Марина Федина и ее сотрудники – сыктывкарец Алексей Иванов, Андрей Чемышев из Марий Эл, полиглот Öньö Лав (Вячеслав Степанов) из Перми. О своем участии в проекте рассказали приехавшие на презентацию профессор университета Хельсинки (Финляндия) Джек Рютер и профессор университета Тромсе Тронд Тростеруд. Как сообщила Марина Федина, в рамках проекта идет работа в трех направлениях: по созданию электронного словаря, морфоанализатора коми языка и корпуса текстов на коми-зырянском языке. О работе над текстами, которые вошли в словарь, подробно рассказал Öньö Лав. Он уже не первый год самостоятельно сканирует и переводит в электронный вид тексты коми-пермяцкой литературы. В его архиве сейчас всего почти 200 тысяч словоформ и более четырех миллионов вариантов употребления слов. Сейчас идет «оцифровка» коми-зырянских текстов. А их в четыре раза больше, чем коми-пермяцких. Лингвист продемонстрировал, как с помощью словаря можно найти любое коми слово в текстах, узнать его значение и частоту употребления в языке данного слова. Например, самым используемым коми-пермяцким словом оказалось «морт» – человек. Как отметил Öньö Лав, сейчас он столкнулся с нехваткой коми-зырянских текстов в электронном формате. Лингвист призвал всех своих коллег объединить усилия в пополнении электронного коми архива. Новые возможности сканирования коми текстов без искажений с помощью усовершенствованной им программы FineReader показал специалист по локализации программного обеспечения на финно-угорские языки Андрей Чемышев. Коми-русский электронный словарь уже сейчас включает 15 тысяч лексем и доступен на сайте центра Giellatekno университета Тромсе http://giellatekno.uit.no. Кстати, всеми интеллектуальными продуктами, произведенными лабораторией, можно будет пользоваться в рамках свободной лицензии. Первый вице-спикер Госсовета Коми, председатель Международного консультативного комитета финно-угорских народов Валерий Марков отметил, что создаваемый словарь будет хорошим учебным пособием для всех уровней изучения коми языка. Как рассказала Нина Нестерова, работа лаборатории получила всестороннюю поддержку. Глава Коми Вячеслав Гайзер подписал письмо в адрес Министерства регионального развития России о включении финансирования лаборатории в программу поддержки коренных народов России на 2013-2017 годы. Артур Артеев. |