Инструкция для модераторов

Материал из OpenCorpora
Перейти к навигации Перейти к поиску

Как только вы получаете права модератора, на главной странице внизу справа появляются ссылки на интерфейс модерации:


Main page.png


По ссылке "опубликованные задания" находятся все задания, которые сейчас размечаются:


Tasks page.png


С этой страницы вы можете сразу перейти к списку пулов, которые размечены, модерируются, отмодерированы, возвращаются в корпус и возвращены в корпус:


Other tasks.png


Выбирать задания можно в снятых с публикации (см.табличку выше), но удобнее делать это через пункт "Графики" (на главной странице), где вы можете посмотреть, сколько пулов какого типа уже размечено, модерируется и уже ушло в корпус.


Graphic.png

Внимание: перед модерацией обязательно прочитайте инструкцию для разметчиков про пул этого типа!

Допустим, мы хотим взять на модерацию пул "Существительное единственное/множественное число". Для этого мы нажимаем на ссылку NOUN&sing@NOUN&plur и попадаем в таблицу со всеми неотмодерированными пулами этого типа. Там мы выбираем конкретный пул (любой по вашему вкусу), например, пул номер 380.

Далее необходимо нажать на кнопку "Начать модерацию". После этого мы смотрим на цвет ссылки "список для модерации": если она выделена зелёным, то можно перейти по ней и модерировать только те примеры, которые находятся в данном списке (нажав на кнопку "согласиться со всеми однозначными" для остальных примеров), если красным, то перейти по ссылке "к расширенному виду" и проверять все примеры:


First.png


При модерации вы можете согласиться со всеми разметчиками, выбрать другой вариант (даже если все разметчики согласны между собой) или указать, что правильного разбора нет или перед вами неснимаемая омонимия, выбрав вариант "Other".


Choice.png

Важно не только снимать омонимию, но и проверять разборы!

Кроме того, к любому ответу можно добавить примечание:


Notes.png


1. Нет правильного разбора выбирается, когда правильной леммы нет в автоматическом разборе.

2. Опечатка:

Пример:

 Задание: сущ / глагол
   Контекст: По правил ФИДЕ шахматист

Если не указать, что это опечатка, слову будет приписан следующий разбор: правило, NOUN, inan, neut, plur, gent

Решение: выбираем сущ + "Опечатка"

3. Неснимаемая омонимия:

Пример:

 Задание: вин / род
   Контекст: я не боюсь брата
   Разборы:
   брат, NOUN, anim, masc, sing, gent
   брат, NOUN, anim, masc, sing, accs

В этом примере мы наблюдаем неснимаемую омонимию, потому что при замене на существительное женского рода мы получаем два варианта:

я не боюсь сестру

я не боюсь сестры

4. Частично правильно значит "правильно определенная лемма используется в какой-то несловарной форме"

Пример:

 Задание: сущ / глагол
   Контекст: это суть одно и то же

Если не указать, что здесь это форма единств.числа, то останется разбор: есть, VERB, impf, intr, plur, 3per, pres, indc

Решение: выбираем разбор, где суть - глагол + ставим "Частично правильно" (здесь форма мн. ч. употреблена как ед.)

Случаи использования "Частично правильно"

1. Субстантированные прилагательные ("тяжелый больной", "больной" в словаре прил.)

2. Слово суть в ед.ч. ("это суть одно и то же", "суть" в словаре форма мн.ч.)

3. Адъективация причастия ("вдовствующая императрица", "вдовствующий" в словаре прич)

Обычно при выборе вариантов "Частично правильно" и "Другое" пишется комментарий, объясняющий, что не так с примером. Так, например, в случае субстантивированного прилагательного принято писать #subst.

Вы можете в любой момент прервать модерацию (не нажимая никаких кнопок) и снова вернуться к ней, нажав "непроверенные". Для этого с главной страницы нужно перейти по ссылке "В работе" и выбрать там нужный вам пул. Кроме того, вы можете просмотреть все несогласованные примеры, примеры с комментариями и примеры с примечаниями.

More.png

После того, как вы отмодерировали все примеры, нужно нажать кнопку "Закончить модерацию".

Finish.png

Если после нажатия кнопки "Закончить модерацию" на экран выводится ошибка, то возможны два случая:

1. Вы проверили не все примеры. Вернитесь к пулу и нажмите на ссылку "Непроверенные", чтобы отмодерировать оставшиеся.

2. Вы выбрали Other со вторым полем ОК. Вариант Other можно выбирать только с "Нет правильного разбора", "Неснимаемая омонимия" или "Опечатка". Нажмите на ссылку "примеры с опечатками и т.п.", чтобы проверить примеры с Other.

Поскольку даже модераторы совершают ошибки, проверенный пул попадает к постмодератору, который его просматривает перед тем, как вернуть в корпус. В результате он может написать комментарий, попросив вас что-нибудь исправить - обычно письмом по почте. Если в вашем пуле будет найдена неточность, то пул не попадет в корпус (не появится в пункте "В архиве") и для того, чтобы исправить её, нужно выбрать пункт "Готовые" на главной странице, найти этот пул и снова нажать "Начать модерацию" (постмодератор может прислать вам ссылку на те примеры, которые нужно исправить - тогда кнопку нужно нажать там). Не переживайте, если у вас нашли ошибку - хорошо, что её нашли!

Спасибо, что помогаете нам!

Примеры с "Нет правильного разбора" и "Частично правильно"

Как было сказано выше, при модерации пула важно проверять разборы слова. В словаре много слов, но он всё равно не полный. Например, на момент написания этой инструкции в словаре не было верных разборов для следующих слов:

  • Пенёк в примере ниже одушевлённое существительное в винительном падеже, тогда как разборы предлагают только неодушевлённый вариант в родительном. В этом случае мы снимаем неоднозначность (это существительное мужского рода, а не женского), ставим "Нет правильного разбора" и пишем комментарий.

Penek-anim.png

  • Г сокращение от господин, это одушевлённое существительное. В разборах только неодушевлённые.

Gospodin-animate.png

Когда для токена выбирается вариант "Нет правильного разбора", то после модерации этот токен уйдет в корпус как незнакомое слово -- UNK. Так как большое количество UNK не делает корпус привлекательным, то мы ставим "Частично правильно", когда погрешность в разборах несущественна, и обязательно пишем комментарий: Например,

  • Джонс фигурирует в разборах как имя, в то время как это фамилия. Мы считаем это различие несущественным, так как все остальные морфологические характеристики определены верно: существительное, одушевлённое, мужской род, и т.п.

Name-surname.png

  • Зубровка в данном контексте это топоним, но тега Geo в разборах нет. Так как все остальные характеристики верны: это неодушевлённое существительное и т.п., то мы ставим "Частично правильно" и пишем комментарий.

Geo.png

Инструкции для модераторов для некоторых типов пулов

  1. Инструкция для модераторов ADJF femn gent datv ablt loct
  2. Инструкция для модераторов ADJF masc neut
  3. Инструкция для модераторов ADJS ADVB
  4. Инструкция для модераторов NOUN nomn gent datv loct accs ablt loct
  5. Инструкция для модераторов Noun sing plur
  6. Инструкция для модераторов gent accs
  7. Инструкция для модераторов PRTF
  8. Инструкция для модераторов CONJ INTJ
  9. Инструкция для модераторов ADJF NPRO
  10. Инструкция для модераторов nomn accs‎
  11. ...

Что ещё можно почитать

  1. Рассылку opencorpora-dev, там можно найти ответы на сложные вопросы.
  2. Старую инструкцию по модерации, на основе которой была сделана нынешняя инструкция.
  3. Личную страницу участника АК, там много разных заметок, в том числе и по модерации.