Модерация морфологической разметки
Что модерировать
Если мы решим в какой-то момент проверять только несогласованные варианты, то модератору все равно необходимо просмотреть пулы и проверить следующие моменты:
1. Посмотреть все примеры с комментариями
2. Просмотреть слова, написанные с большой буквы, на предмет имен собственных. Проверить, что лемма (таких слов) присутствует в словаре.
3. Просмотреть пулы на предмет сложных случаев
Прил
1. Просмотреть пул на предмет субстантивации
Сущ
1. Посмотреть, что слов суть разобрано верно
2. Посмотреть, что число у сущ в конструкции числ + сущ разобрано верно
Прич
1. Просмотреть пул на предмет адъективации
Как модерировать
Вариант разбора | Дополнительные опции модератора | Частые случаи | Примеры |
Один из предложенных | ОК | - | - |
Частично правильно | Субстантивированные прилагательные | она доступна и целесообразна для занятий в школьных мастерских . | |
Частично правильно | Суть (форма 3sg от глагола быть) | это суть одно и то же | |
Частично правильно | Адъективация причастия | вдовствующая императрица | |
Нет правильного разбора | Нужная лемма отсутствует в словаре | агент Кис ван Ньювенхейзен |
Общее правило
Мы везде, где возможно, разрешаем неоднозначность примера относительно задания пула.
Возможны следующие неблагоприятные ситуации:
Снять неоднозначность возможно, но будет приписан неправильный разбор: Правильный вариант + "Нет правильного разбора"/"Частично правильно"/"Опечатка"
Частично правильно
"Частично правильно" значит "правильно определенная лемма используется в какой-то несловарной форме"
- Пример:
- Задание: сущ / глагол
- Контекст: "это суть одно и то же"
- Останется вариант (если не исправить): есть, VERB, impf, intr, plur, 3per, pres, indc
- Решение: выбираем разбор, где суть - глагол + ставим "Частично правильно" (здесь форма мн. ч. употреблена как ед.)
Случаи использования "Частично правильно"
1. Субстантированные прилагательные ("тяжелый больной", "больной" в словаре прил.)
2. Слово суть в ед.ч. ("это суть одно и то же", "суть" в словаре форма мн.ч.)
3. Адъективация причастия ("вдовствующая императрица", "вдовствующий" в словаре прич)
Нет правильного разбора
"Нет правильного разбора" означает правильной леммы нет в словаре, но неоднозначность снять можно
- Пример:
- Задание: сущ / глагол
- Контекст: агент Кис ван Ньювенхейзен
- Решение: выбираем сущ + ставим "Нет правильного разбора"
Опечатка
- Пример:
- Задание: сущ / глагол
- Контекст: По правил ФИДЕ шахматист
- Останется вариант (если не исправить): правило, NOUN, inan, neut, plur, gent
- Решение: выбираем сущ + "Опечатка"
Снять неоднозначность невозможно (нет правильного разбора): "Другое" + "Нет правильного разбора"
Невозможно разрешить неоднозначность, поскольку правильного ответа нет среди возможных ответов на задание пула
- Пример1
- Задание: сущ / глагол
- Контекст: понимание , сами , чай , литераторы
- Разборы:
- чай, NOUN, inan, masc, sing, nomn
- чай, NOUN, inan, masc, sing, accs
- чаю, VERB, impf, tran, sing, impr, excl
- Разборы:
- Решение: ставим "Другое" + "Нет правильного разбора"
- Пример2
- Задание: сущ / глагол
- Контекст: 6-е изд . , стер . — СПб .
- Разборы:
- стер, NOUN, inan, masc, sing, nomn
- стер, NOUN, inan, masc, sing, accs
- стёр, VERB, perf, tran, masc, sing, past, indc
- Разборы:
- стер - это скоращение от "стереотипное"
- Решение: ставим "Другое" + "Нет правильного разбора"
Снять неоднозначность невозможно (неснимаемая омонимия): "Другое" + "Неснимаемая омонимия"
- Пример
- Задание: вин / род
- Контекст: я не боюсь брата
- Разборы:
- брат, NOUN, anim, masc, sing, gent
- брат, NOUN, anim, masc, sing, accs
- Разборы:
Решение: ставим "Другое" + "Неснимаемая омонимия"
Сложные случаи разбора
Конструкция типа "судя по всему": [ср]
При субстантивации местоименного прилагательного, не связанного с одушевленны объектом, считаем его среднего рода:
- cудя по всему [ср]
Конструкция типа "все до единого + сущ [ср/жр]": другое + неснимаемая омонимия
Перед нами неснимаемая омонимия. Ставим "Другое" + "Неснимаемая омонимия"
Пример:
- армия проиграла все до одного сражения <-> армия проиграла все до одного боя / бои
При проверке существительным м.р. видимо оказываются приемлемы оба варианта (по крайней мере я нашла двоих лингвистов, которые считают, что только один из них правильный). Корпусные данные также дают разнородный материал.
Второй винительный (пойти в солдаты): им, мн + "Частично правильно"
В конструкция типа пойти в солдаты оставляем разбор им, мн + ставим "Частично правильно"
Е/Ё
Отмечаем здесь омонимичные случаи, которых не было бы если бы ё не равнялась е.
В текстах слова пишутся с ё
- полет - полёт
- подъем (подъесть) - подъём
- стёр - стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)
Это можно сделать автоматически GranD 13:44, 9 июля 2012 (MSK)
Чтобы ё не равнялась е и не было лишних разборов?
Да, при условии, что в словаре ё стоит везде, где надо. GranD 12:12, 13 июля 2012 (MSK)
Слова типа "из" (от имени Иза)
Не должны разбираться как глаголы
- боли (императив)
- гвозди (императив)
- покой (императив)
- случай (императив)
- цели (императив)
- чести (императив)
- секретарь (императив) - таких примеров много (в словаре от aot), у меня где-то есть список, могу выложить весь.
- тени (имп)
- времени (имп)
Не должны разбираться как существительные
- дай (мн. род от имени Дая)
- живете (название буквы)
- стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)
- творил (сущ творило)
- давил (мн. род. от имени Давила) - но может быть разобрано как мн.род. от сущ. давило
Дописать в общую инструкцию
1. Вводные конструкции (как правило) [Дописала]
2. Вводные конструкции (типа в общем, судя по всему): какой род указываем? [В общем - инструкция для разметчиков, Судя по всему - Сложные случаи здесь выше)