Модерация морфологической разметки
Что обязательно проверять в пулах
Если мы решим в какой-то момент проверять только несогласованные варианты, то модератору все равно необходимо просмотреть пулы и проверить следующие моменты
Сущ vs. Глагол
1. Посмотреть, что слов суть разобрано верно
2. Просмотреть слова, написанные с большой буквы, на предмет имен собственных. Проверить, что лемма (таких слов) присутствует в словаре.
Прил
1. Просмотреть пул на предмет субстантивации
Сущ
1. Просмотреть пул на предмет второго винительного
Сложные случаи разбора
Конструкция типа "судя по всему": [ср]
При субстантивации местоименного прилагательного, не связанного с одушевленны объектом, считаем его среднего рода:
- cудя по всему [ср]
Второй винительный (играть в куклы): #_2ac
В конструкция типа играть в куклы оставляем разбор им, мн, в комментарии пишем #_2ac (используется как винительный (2-ой))
Нет правильного разбора
В комментариях отмечаем ошибки в разборах. При этом используем такие же сокращения граммем[1], как у нас в словаре
Нет правильного разбора (несловарная форма, правильная лемма в словаре есть): #_sng, #_sub
В этом случае в комментарии необходимо указать граммему типа "Использовано как...", которая впоследствии будет приписана к основному разбору
Типы помет "Использовано как ...":
- ед. ч. -> #_sng ("это суть одно и то же", "суть" в словаре форма мн.ч.)
- сущ -> #_sub ("тяжелый больной", "больной" в словаре прил.)
- Пример:
- Задание: сущ / глагол
- Контекст: "это суть одно и то же"
- Останется вариант (если не исправить): есть, VERB, impf, intr, plur, 3per, pres, indc
- Комментарий: #_sng
Нет правильного разбора (несловарная форма, правильной леммы в словаре нет): #retg + правильный разбор
В идеале нужно сразу же добавлять лемму (со всеми формами) в словарь и тогда в комментарии ставить помету "Переразобрать" #retg (Обсудим это на ближайшей встрече)
Пока будем писать эту помету и правильный разбор
- Пример:
- Задание: сущ / глагол
- Контекст: агент Кис ван Ньювенхейзен
- Разборы:
- киса, NOUN, anim, femn, plur, gent
- киса, NOUN, anim, femn, plur, accs
- киса, NOUN, inan, femn, plur, gent
- кисну, VERB, impf, intr, masc, sing, past, indc
- Разборы:
- Комментарий: #retg Кис, NOUN, masc, sing, nomn, anim, Name
Неоднозначность снимаем (выбираем сущ)
Если неоднозначность снять невозможно (отсутствие леммы влияет на задание), пишем такой же комментарий и выбираем вариант "Другое"
- Пример
- Задание: сущ / глагол
- Контекст: понимание , сами , чай , литераторы
- Разборы:
- чай, NOUN, inan, masc, sing, nomn
- чай, NOUN, inan, masc, sing, accs
- чаю, VERB, impf, tran, sing, impr, excl
- Разборы:
- Комментарий: #retg чай, CONJ, Prnt
Нет правильного разбора (сокращение от слова, лемма которого в словаре есть): #abbr + правильный разбор
- Пример
- Задание: сущ / глагол
- Контекст: 6-е изд . , стер . — СПб .
- Разборы:
- стер, NOUN, inan, masc, sing, nomn
- стер, NOUN, inan, masc, sing, accs
- стёр, VERB, perf, tran, masc, sing, past, indc
- Разборы:
- Комментарий: #abbr стереотипный, ADJF, Qual, neut, sing, nomn
Опечатки (на уровне формы, лемма есть в словаре): #erro [#vars] + правильная форма
В этом случае в комментарии необходимо поставить помету "Опечатка" (#erro) и указать правильную форму.
Если возможны несколько правильных форм добавляем помету "Вариант" (#vars), формы перечисляем через запятую.
- Пример:
- Задание: сущ / глагол
- Контекст: По правил ФИДЕ шахматист
- Останется вариант (если не исправить): правило, NOUN, inan, neut, plur, gent
- Комментарий (то, что должно быть): #erro #vars правилу, правилам
Е/Ё
Отмечаем (здесь) здесь омонимичные случаи, которых не было бы если бы ё не равнялась е.
В текстах слова пишутся с ё
- полет - полёт
- подъем (подъесть) - подъём
- стёр - стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)
Это можно сделать автоматически GranD 13:44, 9 июля 2012 (MSK)
Слова типа "из" (от имени Иза)
Не должны разбираться как глаголы
- боли (императив)
- гвозди (императив)
- покой (императив)
- случай (императив)
- цели (императив)
- чести (императив)
- секретарь (императив) - таких примеров много (в словаре от aot), у меня где-то есть список, могу выложить весь.
- тени (имп)
- времени (имп)
Не должны разбираться как существительные
- дай (мн. род от имени Дая)
- живете (название буквы)
- стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)
- творил (сущ творило)
- давил (мн. род. от имени Давила) - но может быть разобрано как мн.род. от сущ. давило
Дописать в общую инструкцию
1. Вводные конструкции (как правило) [Дописала]
2. Вводные конструкции (типа в общем, судя по всему): какой род указываем? [В общем - инструкция для разметчиков, Судя по всему - Сложные случаи здесь выше)