Российская академия наук    
     
   

Общая информация


 
Login Print view Help 

Поиск атрибутный
  Организаций
  Персон

Структура учреждений РАН




RUSSLAN-2002: демонстрационная версия экспериментальной системы русского синтеза RUSSLAN

 Аннотация

    Система RUSSLAN-2002 представляет собой демонстрационную версию экспериментальной системы русского синтеза RUSSLAN, разрабатываемой в Институте востоковедения РАН (см. проект "Создание системы русского синтеза RUSSLAN).
    RUSSLAN-2002 включает два модуля: модуль морфологического синтеза RUMORS, завершенный в 1999 г., и модуль лексико-синтаксического синтеза RULES, разработка которого ведется с 2000 г. при частичной финансовой поддержке РФФИ (грант No. 01-01-00598)и RSS (Research Support Scheme of the Open Society Support Foundation, grant No. 458/2000).
    RUMORS строит графические русские словоформы по их входным спецификациям в предположении, что эти спецификации отвечают требованиям правильности и полноты входящих в их состав морфологических категорий, а также требованию их реализуемости в виде синтетических русских словоформ.
    RULES получает на входе спецификации единиц, предположительно соответствующих русским словоформам и сопровождаемых сведениями об их синтаксическом контексте. В ходе работы данного модуля осуществляется верификация и коррекция этих входных спецификаций, вплоть до локальных трансформаций в случаях, когда требуемая спецификацией единица не может быть реализована в виде правильной синтетической словоформы русского языка.
    Благодаря широкому использованию механизмов умолчаний, опирающихся на свойства языковой избыточности, система RUSSLAN позволяет во многих случаях получать приемлемый русский текст даже при некорректном вводе.
    В качестве полного текста публикации дан архив russlan.zip, в котором представлена действующая версия системы в той ее конфигурации, которая построена к июню 2002 г. Она включает две исполнительных программы: russlan0.exe и russlan1.exe, необходимые вспомогательные файлы, а также экспериментальные грамматики и словари русского языка.
    Общие правила работы с системой RUSSLAN-2002 содержатся в файлах readme.doc (readme.txt) указанного архива, условия, на которых допускается ее использование, - в файлах license.doc (license.txt).

 Ключевые слова

    русский язык, морфологический синтез, лексико-синтаксический синтез, локальные трансформации
  Полный текст
Полный текст публикации     в формате zip


Последние изменения: 19.06.2002


119991 Москва, Ленинский просп., 14
Телефон: (495) 938-0309 (Справ. бюро); Факс: (495) 954-3320 (Лен.пр.14), (495) 938-1844 (Лен.пр,32а)
На главную страницу
В начало страницы
© РАН 2007