Модерация морфологической разметки

Материал из OpenCorpora
Перейти к навигации Перейти к поиску

Что модерировать

Если мы решим в какой-то момент проверять только несогласованные варианты, то модератору все равно необходимо просмотреть пулы и проверить следующие моменты:

1. Посмотреть все примеры с комментариями

2. Просмотреть слова, написанные с большой буквы, на предмет имен собственных. Проверить, что лемма (таких слов) присутствует в словаре.

3. Просмотреть пулы на предмет сложных случаев

Прил

1. Просмотреть пул на предмет субстантивации

Сущ

1. Посмотреть, что слов суть разобрано верно

2. Посмотреть, что число у сущ в конструкции числ + сущ разобрано верно

Прич

1. Просмотреть пул на предмет адъективации

Как модерировать

Вариант разбора Дополнительные опции модератора Частые случаи Примеры
Один из предложенных ОК - -
Частично правильно Субстантивированные прилагательные она доступна и целесообразна для занятий в школьных мастерских .
Частично правильно Суть (форма 3sg от глагола быть) это суть одно и то же
Частично правильно Адъективация причастия вдовствующая императрица
Нет правильного разбора Нужная лемма отсутствует в словаре агент Кис ван Ньювенхейзен

Общее правило

Мы везде, где возможно, разрешаем неоднозначность примера относительно задания пула.

Возможны следующие неблагоприятные ситуации:

Снять неоднозначность возможно, но будет приписан неправильный разбор: Правильный вариант + "Нет правильного разбора"/"Частично правильно"/"Опечатка"

Частично правильно

"Частично правильно" значит "правильно определенная лемма используется в какой-то несловарной форме"

Пример:
Задание: сущ / глагол
Контекст: "это суть одно и то же"
Останется вариант (если не исправить): есть, VERB, impf, intr, plur, 3per, pres, indc
Решение: выбираем разбор, где суть - глагол + ставим "Частично правильно" (здесь форма мн. ч. употреблена как ед.)

Случаи использования "Частично правильно"

1. Субстантированные прилагательные ("тяжелый больной", "больной" в словаре прил.)

2. Слово суть в ед.ч. ("это суть одно и то же", "суть" в словаре форма мн.ч.)

3. Адъективация причастия ("вдовствующая императрица", "вдовствующий" в словаре прич)

Нет правильного разбора

"Нет правильного разбора" означает правильной леммы нет в словаре, но неоднозначность снять можно

Пример:
Задание: сущ / глагол
Контекст: агент Кис ван Ньювенхейзен
Решение: выбираем сущ + ставим "Нет правильного разбора"

Опечатка

Пример:
Задание: сущ / глагол
Контекст: По правил ФИДЕ шахматист
Останется вариант (если не исправить): правило, NOUN, inan, neut, plur, gent
Решение: выбираем сущ + "Опечатка"

Снять неоднозначность невозможно (нет правильного разбора): "Другое" + "Нет правильного разбора"

Невозможно разрешить неоднозначность, поскольку правильного ответа нет среди возможных ответов на задание пула

Пример1
Задание: сущ / глагол
Контекст: понимание , сами , чай , литераторы
Разборы:
чай, NOUN, inan, masc, sing, nomn
чай, NOUN, inan, masc, sing, accs
чаю, VERB, impf, tran, sing, impr, excl
Решение: ставим "Другое" + "Нет правильного разбора"
Пример2
Задание: сущ / глагол
Контекст: 6-е изд . , стер . — СПб .
Разборы:
стер, NOUN, inan, masc, sing, nomn
стер, NOUN, inan, masc, sing, accs
стёр, VERB, perf, tran, masc, sing, past, indc
стер - это скоращение от "стереотипное"
Решение: ставим "Другое" + "Нет правильного разбора"

Снять неоднозначность невозможно (неснимаемая омонимия): "Другое" + "Неснимаемая омонимия"

Пример
Задание: вин / род
Контекст: я не боюсь брата
Разборы:
брат, NOUN, anim, masc, sing, gent
брат, NOUN, anim, masc, sing, accs

Решение: ставим "Другое" + "Неснимаемая омонимия"

Сложные случаи разбора

Конструкция типа "судя по всему": [ср]

При субстантивации местоименного прилагательного, не связанного с одушевленны объектом, считаем его среднего рода:

cудя по всему [ср]

Конструкция типа "все до единого + сущ [ср/жр]": другое + неснимаемая омонимия

Перед нами неснимаемая омонимия. Ставим "Другое" + "Неснимаемая омонимия"

Пример:

армия проиграла все до одного сражения <-> армия проиграла все до одного боя / бои

При проверке существительным м.р. видимо оказываются приемлемы оба варианта (по крайней мере я нашла двоих лингвистов, которые считают, что только один из них правильный). Корпусные данные также дают разнородный материал.

Второй винительный (пойти в солдаты): им, мн + "Частично правильно"

В конструкция типа пойти в солдаты оставляем разбор им, мн + ставим "Частично правильно"

Е/Ё

Отмечаем здесь омонимичные случаи, которых не было бы если бы ё не равнялась е.

В текстах слова пишутся с ё

полет - полёт
подъем (подъесть) - подъём
стёр - стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)


Это можно сделать автоматически GranD 13:44, 9 июля 2012 (MSK)

Чтобы ё не равнялась е и не было лишних разборов?

Да, при условии, что в словаре ё стоит везде, где надо. GranD 12:12, 13 июля 2012 (MSK)

Слова типа "из" (от имени Иза)

Не должны разбираться как глаголы

боли (императив)
гвозди (императив)
покой (императив)
случай (императив)
цели (императив)
чести (императив)
секретарь (императив) - таких примеров много (в словаре от aot), у меня где-то есть список, могу выложить весь.
тени (имп)
времени (имп)

Не должны разбираться как существительные

дай (мн. род от имени Дая)
живете (название буквы)
стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)
творил (сущ творило)
давил (мн. род. от имени Давила) - но может быть разобрано как мн.род. от сущ. давило

Дописать в общую инструкцию

1. Вводные конструкции (как правило) [Дописала]

2. Вводные конструкции (типа в общем, судя по всему): какой род указываем? [В общем - инструкция для разметчиков, Судя по всему - Сложные случаи здесь выше)