RUSSLAN-2002: демонстрационная версия экспериментальной системы русского синтеза RUSSLAN

Общая информация

 Аннотация

    Система RUSSLAN-2002 представляет собой демонстрационную версию экспериментальной системы русского синтеза RUSSLAN, разрабатываемой в Институте востоковедения РАН (см. проект "Создание системы русского синтеза RUSSLAN).
    RUSSLAN-2002 включает два модуля: модуль морфологического синтеза RUMORS, завершенный в 1999 г., и модуль лексико-синтаксического синтеза RULES, разработка которого ведется с 2000 г. при частичной финансовой поддержке РФФИ (грант No. 01-01-00598)и RSS (Research Support Scheme of the Open Society Support Foundation, grant No. 458/2000).
    RUMORS строит графические русские словоформы по их входным спецификациям в предположении, что эти спецификации отвечают требованиям правильности и полноты входящих в их состав морфологических категорий, а также требованию их реализуемости в виде синтетических русских словоформ.
    RULES получает на входе спецификации единиц, предположительно соответствующих русским словоформам и сопровождаемых сведениями об их синтаксическом контексте. В ходе работы данного модуля осуществляется верификация и коррекция этих входных спецификаций, вплоть до локальных трансформаций в случаях, когда требуемая спецификацией единица не может быть реализована в виде правильной синтетической словоформы русского языка.
    Благодаря широкому использованию механизмов умолчаний, опирающихся на свойства языковой избыточности, система RUSSLAN позволяет во многих случаях получать приемлемый русский текст даже при некорректном вводе.
    В качестве полного текста публикации дан архив russlan.zip, в котором представлена действующая версия системы в той ее конфигурации, которая построена к июню 2002 г. Она включает две исполнительных программы: russlan0.exe и russlan1.exe, необходимые вспомогательные файлы, а также экспериментальные грамматики и словари русского языка.
    Общие правила работы с системой RUSSLAN-2002 содержатся в файлах readme.doc (readme.txt) указанного архива, условия, на которых допускается ее использование, - в файлах license.doc (license.txt).

 Ключевые слова

    русский язык, морфологический синтез, лексико-синтаксический синтез, локальные трансформации
  Полный текст
Полный текст публикации     в формате zip

Home page
Наш адрес:
119991 ГСП-1 Москва В-71, Ленинский просп., 14
Телефон: 938-0309 (Справ. бюро)
Факс: (495)954-3320 (Лен.пр.,14), (495)938-1844 (Лен.пр.,32а)
Назад