Модерация морфологической разметки: различия между версиями

Материал из OpenCorpora
Перейти к навигации Перейти к поиску
Строка 110: Строка 110:
:полет - полёт
:полет - полёт
:подъем (подъесть) - подъём  
:подъем (подъесть) - подъём  
:стёр - стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)  
:стёр - стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)
 
 
Это можно сделать автоматически [[Участник:GranD|GranD]] 13:44, 9 июля 2012 (MSK)
 
= Слова типа "из" (от имени Иза) =
= Слова типа "из" (от имени Иза) =



Версия от 09:44, 9 июля 2012

Что обязательно проверять в пулах

Если мы решим в какой-то момент проверять только несогласованные варианты, то модератору все равно необходимо просмотреть пулы и проверить следующие моменты

Сущ vs. Глагол

1. Посмотреть, что слов суть разобрано верно

2. Просмотреть слова, написанные с большой буквы, на предмет имен собственных. Проверить, что лемма (таких слов) присутствует в словаре.

Прил

1. Просмотреть пул на предмет субстантивации

Сущ

1. Просмотреть пул на предмет второго винительного

Сложные случаи разбора

Конструкция типа "судя по всему": [ср]

При субстантивации местоименного прилагательного, не связанного с одушевленны объектом, считаем его среднего рода:

cудя по всему [ср]

Второй винительный (играть в куклы): #_2ac

В конструкция типа играть в куклы оставляем разбор им, мн, в комментарии пишем #_2ac (используется как винительный (2-ой))

Нет правильного разбора

В комментариях отмечаем ошибки в разборах. При этом используем такие же сокращения граммем[1], как у нас в словаре

Нет правильного разбора (несловарная форма, правильная лемма в словаре есть): #_sng, #_sub

В этом случае в комментарии необходимо указать граммему типа "Использовано как...", которая впоследствии будет приписана к основному разбору

Типы помет "Использовано как ...":

  • ед. ч. -> #_sng ("это суть одно и то же", "суть" в словаре форма мн.ч.)
  • сущ -> #_sub ("тяжелый больной", "больной" в словаре прил.)
Пример:
Задание: сущ / глагол
Контекст: "это суть одно и то же"
Останется вариант (если не исправить): есть, VERB, impf, intr, plur, 3per, pres, indc
Комментарий: #_sng

Нет правильного разбора (несловарная форма, правильной леммы в словаре нет): #retg + правильный разбор

В идеале нужно сразу же добавлять лемму (со всеми формами) в словарь и тогда в комментарии ставить помету "Переразобрать" #retg (Обсудим это на ближайшей встрече)

Пока будем писать эту помету и правильный разбор

Пример:
Задание: сущ / глагол
Контекст: агент Кис ван Ньювенхейзен
Разборы:
киса, NOUN, anim, femn, plur, gent
киса, NOUN, anim, femn, plur, accs
киса, NOUN, inan, femn, plur, gent
кисну, VERB, impf, intr, masc, sing, past, indc
Комментарий: #retg Кис, NOUN, masc, sing, nomn, anim, Name

Неоднозначность снимаем (выбираем сущ)

Если неоднозначность снять невозможно (отсутствие леммы влияет на задание), пишем такой же комментарий и выбираем вариант "Другое"

Пример
Задание: сущ / глагол
Контекст: понимание , сами , чай , литераторы
Разборы:
чай, NOUN, inan, masc, sing, nomn
чай, NOUN, inan, masc, sing, accs
чаю, VERB, impf, tran, sing, impr, excl
Комментарий: #retg чай, CONJ, Prnt

Нет правильного разбора (сокращение от слова, лемма которого в словаре есть): #abbr + правильный разбор

Пример
Задание: сущ / глагол
Контекст: 6-е изд . , стер . — СПб .
Разборы:
стер, NOUN, inan, masc, sing, nomn
стер, NOUN, inan, masc, sing, accs
стёр, VERB, perf, tran, masc, sing, past, indc
Комментарий: #abbr стереотипный, ADJF, Qual, neut, sing, nomn

Опечатки (на уровне формы, лемма есть в словаре): #erro [#vars] + правильная форма

В этом случае в комментарии необходимо поставить помету "Опечатка" (#erro) и указать правильную форму.

Если возможны несколько правильных форм добавляем помету "Вариант" (#vars), формы перечисляем через запятую.

Пример:
Задание: сущ / глагол
Контекст: По правил ФИДЕ шахматист
Останется вариант (если не исправить): правило, NOUN, inan, neut, plur, gent
Комментарий (то, что должно быть): #erro #vars правилу, правилам

Е/Ё

Отмечаем (здесь) здесь омонимичные случаи, которых не было бы если бы ё не равнялась е.

В текстах слова пишутся с ё

полет - полёт
подъем (подъесть) - подъём
стёр - стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)


Это можно сделать автоматически GranD 13:44, 9 июля 2012 (MSK)

Слова типа "из" (от имени Иза)

Не должны разбираться как глаголы

боли (императив)
гвозди (императив)
покой (императив)
случай (императив)
цели (императив)
чести (императив)
секретарь (императив) - таких примеров много (в словаре от aot), у меня где-то есть список, могу выложить весь.
тени (имп)
времени (имп)

Не должны разбираться как существительные

дай (мн. род от имени Дая)
живете (название буквы)
стер (не употребляющееся в настоящее время название кубического метра, обозначение st.)
творил (сущ творило)
давил (мн. род. от имени Давила) - но может быть разобрано как мн.род. от сущ. давило

Дописать в общую инструкцию

1. Вводные конструкции (как правило) [Дописала]

2. Вводные конструкции (типа в общем, судя по всему): какой род указываем? [В общем - инструкция для разметчиков, Судя по всему - Сложные случаи здесь выше)