21 ноября 2006 года состоялось очередное заседание Президиума Российской академии наук

21.11.2006

Научное сообщение: "Национальный корпус русского языка и проблемы русистики" Докладчик - член-корреспондент РАН Молдован Александр Михайлович, директор института русского языка им. В.В. Виноградова

Сообщение для прессы

21 ноября 2006 года 

состоялось очередное заседание Президиума Российской академии наук

Члены Президиума заслушали научное сообщение «Национальный корпус русского языка и проблемы русистики».

Докладчик – член-корреспондент РАН Молдован Александр Михайлович, директор Института русского языка им. В.В.Виноградова РАН.

Национальный корпус русского языка – это новая справочно-информационная система по русскому языку, созданная большим коллективом специалистов из разных академических институтов (Институт русского языка им. В.В.Виноградова, ВИНИТИ, Институт проблем передачи информации, Институт языкознания, Институт лингвистических исследований в Санкт-Петербурге), а также университетов Москвы, Санкт-Петербурга, Воронежа, Саратова, Казани и других городов России. В настоящее время эта система размещена в Интернете в свободном доступе на сайте www.ruscorpora.ru, созданном при технической поддержке компании «Яндекс».

Работа осуществляется в рамках программ Отделения историко-филологических наук РАН «Филология и информатика» (2003-2005 гг.) и «Русский язык, литература и фольклор в информационном обществе: формирование электронных научных фондов» (2006-2008 гг.).

Созданная система опирается на огромный массив текстов русского языка XIX–XXI вв., включающий все виды художественных произведений (проза и драматургия) и нехудожественных (мемуары, публицистика, наука, образование и др., а также религиозные, юридические и другие тексты и документы); письменные тексты, не предназначенные для публикации (дневники, частные письма и т.п.). К каждому тексту и каждому слову присоединен научный аппарат («разметка») – особая информация о характеристиках и свойствах каждого текста и грамматических параметрах каждого слова. Благодаря этому система предоставляет пользователю в ответ на его запрос, сведения о фактах употребления слов, грамматических значений или конструкций.

В настоящее время большинство крупных языков мира уже имеет свои национальные корпуса. Общепризнанным образцом является, в частности, Британский национальный корпус (BNC). Своими национальными корпусами располагают Америка, Германия, Италия, Испания, Венгрия, Литва, Эстония, Ирландия и другие (в том числе славянские) страны. Национальный корпус русского языка сопоставим с этими корпусами по объему текстов (объем НКРЯ сегодня составляет 120 млн. словоупотреблений, и он продолжает пополняться), но при этом НКРЯ значительно превосходит большинство зарубежных по детальности разметки и, следовательно, по возможностям поиска. В частности, в НКРЯ есть возможность точного грамматического поиска по очень большому массиву в 5 млн. словоупотреблений. Кроме того, осуществляется семантический поиск по классам слов (части тела, имена родства, глаголы движения, оценочная лексика, слова со значением уменьшительности и др.). Уникальной особенностью НКРЯ является то, что в нем возможен сложный поиск, т. е. поиск языковых конструкций длиной до 10 слов с заданной комбинацией характеристик для каждого компонента такой конструкции и заданным расстоянием между словами.

В НКРЯ допускает работу корпуса со своим индивидуальным корпусом, выбранным по таким параметрам, как: автор текста (имя, пол, возраст), название текста, дата создания, объем (в словах), а также для художественных текстов: жанр (юмор, детская литература и т.п.), тип текста (рассказ, роман, очерк, сказка и т.п.), место и время описываемых событий (о революции в России, современной Японии и под.), а

для нехудожественных текстов: функциональная сфера (реклама, производственно-технические тексты, публицистика и др.), тип и тематика текста (наука, медицина, транспорт, спорт и под.).

Грамматический поиск осуществляется в НКРЯ как по точной форме слова, так и с учетом всех его словоформ; возможен и поиск самих грамматических форм (например, дательный падеж каких-то определенных типов существительных или прилагательных); есть возможность получить примеры употреблений имен, фамилий, отчеств, аномальных форм и др.

НКРЯ является мощным инструментом лингвистических исследований, позволяющим ставить и решать проблемы, которых лингвистика прошлого почти не касалась. Одновременно он служит источником технологий и продуктов для прикладных задач автоматической обработки текстов. Он может использоваться и как ресурс для обучения русскому языку, особенно дистанционного; и как средство создания новых (в том числе и электронных) учебных пособий по русскому языку.

Создание корпуса по-новому ставит одну из актуальных задач современной русистики – составление нового поколения академических словарей и грамматик русского языка.

В ближайшей перспективе на базе данных Корпуса предполагается создание полного словника современного русского языка, а также создание серии частотных словарей русского языка, серии словарей новых слов, словарей сочетаемости и др.

Грамматические описания нового поколения должны будут не только учитывать изменения, произошедшие в русском языке за последние тридцать лет, не только использовать новые теоретические достижения лингвистической мысли, но и содержать новые обобщения, отражающие всесторонний анализ материалов Корпуса.

 

Президиум РАН рассмотрел вопрос о присуждении премий имени выдающихся ученых 2006 года: имени Н.И. Кареева (представление Экспертной комиссии и Бюро Отделения историко-филологических наук), имени А.Н. Несмеянова (представление Экспертной комиссии и Бюро Отделения химии и наук о материалах) и имени С.А. Лебедева (представление Экспертной комиссии и Бюро Отделения информационных технологий и вычислительных систем).

Президиум РАН постановил:

- присудить премию имени Н.И. Кареева 2006 года доктору исторических наук Хвостовой Ксении Владимировне (Институт всеобщей истории РАН) за монографию «Особенности византийской цивилизации».

Представленный фундаментальный труд, вышедший в свет в 2005 г. (Издательство «Наука»), является итогом многолетних исследований автора как в области византиноведения, так и в теоретической сфере. Работа отличается многогранной новизной глубоко обоснованных выводов по ряду, в том числе ранее не разрабатывавшихся вопросов. В монографии используется обширный материал византийских источников и наиболее значимые труды ученых разных стран, созданные в различные исторические эпохи. Показана самобытность государственных и социальных институтов Византии, их связь и взаимозависимость с восточным христианством – православием, причинность изменений и характерные черты, меняющиеся в своем многовековом развитии. Впервые в науке о Византии автор исследует утвердившееся в империи прецедентное право. Монографию отличает эффективное использование прогрессивной методологии, включая математические методы. Книга – весьма заметное научное событие не только в отечественном, но и в мировом византиноведении.

- присудить премию имени А.Н. Несмеянова 2006 года академику Бубнову Юрию Николаевичу и доктору химических наук Гурскому Михаилу Евгеньевичу (Институт органической химии им. Н.Д. Зелинского РАН) за цикл работ «Аллилбораны. Принципы реагирования и применение в органическом синтезе».

Авторами теоретически обоснована и предложена систематизация реакционной способности аллилборанов, позволяющая предсказывать протекание реакций аллилборанов с конкретным реагентом по одному из пяти возможных для аллилборанов реакционных центров; открыта реакция аллилборирования соединений с кратными связями, аллилбор-ацетиленовой конденсации и восстановительного моно- и диаллилирования азотных ароматических гетероциклов и органических соединений с различными функциональными группами. В работе впервые обнаружена характерная для аллилборанов перманентная аллильная перегруппировка (быстрый внутримолекулярный переход аллильной связи С-В из положения 1 в положение 3) и выявлены и изучены основные структурные и электронные факторы, влияющие на скорость процесса; установлены относительная термодинамическая устойчивость изомеров и активационные барьеры для несимметричных аллильных фрагментов при сигматропной миграции борильной группы. На основе этих результатов авторами разработаны новые синтетические методы, получившие впоследствии широкое применение в органическом синтезе. Цикл работ Бубнова Ю.Н. и Гурского М. Е. представляет собой большое фундаментальное исследование, внесшее значительный вклад в органическую и элементо- органическую химию.

- присудить премию имени С.А. Лебедева 2006 года члену-корреспонденту РАН Королеву Льву Николаевичу за цикл работ «Архитектура вычислительных машин».

Л.Н. Королев является создателем программ для первых отечественных ЭВМ, он выполнял пионерские работы по созданию первых программ машинного перевода, руководил созданием управляющих программ для ЭВМ М-40, М-50. У Л.Н. Королева создание программ, в том числе, системных и управляющих, было тесно связано с архитектурой ЭВМ. Это особенно ярко проявилось при создании операционной системы БЭСМ-6 – «Диспетчер-68», в разработке которой под руководством академика С.А. Лебедева активно участвовал член-корреспондент РАН Л.Н. Королев. В цикле работ Л.Н. Королева рассматриваются вопросы создания архитектур ЭВМ, а также принципы разработки математического обеспечения и для следующих поколений вычислительной техники. В частности, в книге «Архитектура ЭВМ» (изд. «Научный мир», М., 2005 г.) содержится обзор архитектур процессоров и многопроцессорных вычислительных систем. Она может служить пособием для студентов кафедр и факультетов прикладной математики и информатики, на которых читаются основные и специальные курсы, посвященные устройству вычислительных машин (компьютеров) и организации процессов обработки данных на мультипроцессорных системах, а также при подготовке специалистов по разработке новой вычислительной техники.

На заседании был рассмотрен вопрос о присвоении имени академика Е.М. Сергеева Институту геоэкологии РАН (представление Отделения наук о Земле).

Президиум РАН постановил: присвоить имя академика Е.М. Сергеева Институту геоэкологии РАН и впредь именовать его - Институт геоэкологии РАН им. Е.М. Сергеева Российской академии наук.

 

Члены Президиума обсудили и приняли решения по ряду других научно-организационных вопросов.

 

Информация предоставлена Пресс-службой РАН.

 

Пресс-служба РАН: Руководитель - Преснякова Ирина Васильевна

тел./факс: 954 11 45 E-mail - irina@presidium.ras.ru

Главный специалист - Бадо Анна Ефимовна тел: 237 90 02; E-mail – novo@presidium.ras.ru

Главный специалист – Каменева Валентина Сергеевна. Тел. 237-81-15 E-mail – vskameneva@presidium.ras.ru

Главный специалист Колесникова Марина Валерьевна т/ф.: 718 17 55

E-mail - mvel@mail.ru; marina@presidium.ras.ru

 

©РАН 2024