Устройство словаря

Материал из OpenCorpora Вики
Перейти к: навигация, поиск

Устройство словаря OpenCorpora

Повелительное наклонение

Вместо лиц в повелительном наклонении в словаре действует категория включённости.

Объяснение, что за категория ниже и здесь.

Почему мы ее ввели? Проблема возникла c распределением форм по лицу и числу в повелительном наклонении.

Возможны следующие варианты: иди, идите, идем, идемте.

В Академической грамматике считается, что 2 л., ед.ч. - иди, 2 л., мн. ч. - идите, 1 л., мн. ч.- идем, идемте (ссылка). Рассмотрим формы второго лица (иди, ед. ч. - идите, мн. ч.), очевидно, что число в этом случае показывает, к какому количеству собеседников обращается автор. Тогда, идем - должно быть ед. ч.

Что касается первого лица у форм идем, идемте, то можем найти следующую критику:

"Формы типа напишем, напишемте толкуются обычно с генетической точки зрения как формы первого лица мн. ч. императива. По своей функции (по своему современному значению) эти формы, однако, имеют значение второго лица (обоих чисел), ибо они служат для выражения обращения к собеседнику, а форма обращения к собеседнику связана именно с формой 2 л. Формами напишем!, напишемте! говорящий выражает именно призыв к собеседнику (собеседникам)" (А. В. Исаченко. Грамматический строй русского языка в сопоставлении со словацким. М.: 2003, стр. 409)

Таким образом, можно признать, что и формы идем, идемте - 2 л. Если далее использовать идеи А. В. Исаченко, то можно заметить, что иди от идем и идите от идемте отличается только тем, что в первых членах пар "исключается говорящий из действия", а во вторых включается. Таким образом, получается стройная система:

ед. ч. мн.ч.
включённость говорящего в действие идем идемте
исключённость говорящего из действия иди идите

Категория рода

Иерархия граммем в категории рода (GNdr).

GNdr: род / род не выражен

  • neut: средний род
  • ms-f: общий род
    • masc: мужской род
    • femn: женский род

Общий род (ms-f)

К категории ms-f относятся:

  • одушевлённые существительные, которые могут согласовываться по женскому и по мужскому роду (пьяница, дорогуша, душенька, задира, жадина, невежда, судья, коллега, сирота);
  • неизменяемые одушевлённые существительные, обозначающие представителей народов (коми, саами, кечуа, манси, майя);
  • неизменяемые одушевлённые существительные (профи, протеже, визави, парвеню, рамоли) за исключением существительных, обозначающих животных;
  • уменьшительно-ласкательные имена, образованные от мужского и женского имени и совпадающие по форме (Саша, Валя, Паша, Женя);
  • фамилии во множественном числе (Ивановы, Оболенские) и неизменяемые фамилии (Гюго, Шевченко);
  • одушевлённые существительные адъективного склонения во множественном числе (вожатые, подсудимые, телеведущие);
  • инициалы.

GNdr

Существительным pluralia tantum (ножницы, деньги, штаны, суточные, данные), у которых явным образом невозможно определить род вследствие того, что они не имеют форм единственного числа, приписывается метка GNdr (род неизвестен, категория рода не выражена).

Помета Ms-f

Помета Ms-f (не путать с ms-f!) приписывается существительным, у которых может наблюдаться колебание по роду. Эту помету могут иметь:

  • неодушевлённые существительные (кофе, ауди, фио, Сочи);
  • одушевлённые существительные, обозначающие животных (колибри, кенгуру, шимпанзе);

Таким словам выбирается базовый род (кофе, masc) и ставится Ms-f, чтобы показать, что это слово может быть другого рода.

Неустойчивый общий род

В русском языке есть ряд существительных, формально принадлежащих к мужскому роду, но имеющих тенденцию употребляться в общем роде (молодец, врач, учитель, министр, заммэра, завмаг, управделами). На данный момент в словаре OpenCorpora принято решение не приписывать им никакой дополнительной пометы. Основным фактором этого решения является невозможность употребления таких существительных в женском роде в косвенных падежах в отличие от слов общего рода типа пьяница.

Что мне делать с этим (этой) горьким (горькой) пьяницей / с моей (моим) визави (*безобразной врачом, *новой министром, *большой молодцом)?

Ноль, один, первый, тысяча

В этих случаях решение, к какой части речи отнести слово, принималось, исходя из его грамматических характеристик.

Так как окончания у слова один совпадают с окончаниями обычных прилагательных, то оно относится к части речи прилагательное (ADJF). Это отличается от школьной грамматики, где один считается количественным числительным. То же относится к "школьным" порядковым числительным (второй, пятый, десятый и т.д.) -- они также считаются прилагательными из-за их типа словоизменения. Им всем добавлена граммема Anum.

Ноль, тысяча, миллион и др. считаются существительными (NOUN) по ряду причин:

  • У них отсутствует свойство числительных (NUMR) одновременно управлять и согласовываться с последующими существительными.
   доволен новой тысячью рублЕЙ
   доволен новыми ста рублЯМИ
  • Они функционируют как другие существительные собирательной семантики (куча рублей).
  • Также как и у обычных существительных, у этих слов есть множественное число (нули, миллионы), у числительных этой характеристики нет.

Субстантивированные прилагательные

В словаре OpenCorpora специально сделано так, что все субстантированные прилагательные/причастия, у которых есть формы в мужском и женском роде, не считаются существительными. Например, больной/больная, совершеннолетний/совершеннолетняя, ведущий/ведущая являются прилагательными. Это сделано для того, чтобы не было омонимии во множественном числе. Если в словаре будут две лексемы ведущий и ведущая как существительные, то непонятно, к какой начальной форме приводить существительное во множественном числе ведущие.

Всем подобным словам приписана помета Subx (возможна субстантивация).