Участник:Andrey Kruglov/Инструкция по разметке NER: различия между версиями

Материал из OpenCorpora
Перейти к навигации Перейти к поиску
м (→‎Разметка персон: убрал из упоминания митрополита)
м (ушло в продакшн)
Строка 1: Строка 1:
== Введение. Интерфейс разметки NER ==
Все изменения влиты в инструкцию Виктора, этот документ оставлен под черновые заметки
Интерфейс разметки именованных сущностей выглядит следующим образом:
[[Файл:Ner common 01.png]]
 
Абзац - минимальная единица разметки. Для того, чтобы начать размечать абзац нужно щёлкнуть мышью в любом месте этого абзаца. Справа от абзаца находятся зоны (закладки, табы) спанов и абзацев.
 
Необходимо в каждом абзаце выделить следующие именованные сущности:
* Персоны (Владимир Ленин, министр финансов Алексей Улюкаев и т.п.)
* Организации (Викиликс, газета Ведомости, международный фонд ICAAN)
* Локации (Италия, Москва и т.п.)
* Локация в организационном контексте (президент Америки)
 
Разметка именованой сущности состоит из двух шагов:
1. Создание спана сущности
2. Создание упоминания сущности
 
Если в предложении больше одной именованной сущности - повторить процесс необходимое число раз.
 
Пример. Владимир Ильич Ленин встретился в Горках с...
 
В данном предложении две именованные сущности:
* Владимир Ильич Ленин (именованная сущность "персона")
* Горках (именованная сущность "локация")
 
Размечаем первую именованную сущность:
* кликаем на слово "Владимир" в тексте абзаца, выбираем Name во всплывающей панели
* кликаем на слово "Ильич" в тексте абзаца, выбираем Patr во всплывающей панели
* кликаем на слово "Ленин" в тексте абзаца, выбираем Surn во всплывающей панели
 
В панели спанов оказалось три новых спана: (тут надо картинку влепить)
 
Затем в панели спанов выделям все три слова и во всплывающей панели спана "собираем" спан в единое упоминание c типом Person.
 
Размечаем вторую именованную сущность:
 
(дописать завтра по аналогии)
 
== Разметка персон ==
Самые очевидные именованные сущности типа Person состоят из имени-фамилии (Владимир Ленин), имени-отчества или полного ФИО.
 
Другой типовой случай - упоминание персон с должностью.
 
Пример.
 
{{ПримерЗадания|Митрополит Кирилл провёл... |}}
 
Спаны:
* митрополит - job
* Кирилл - Name
Упоминания:
* Person Кирилл
 
== Разметка организаций ==
 
{{ПримерЗадания|Новый скандал вокруг дела Викиликс поднялся после... |}}
 
Спаны:
* Викиликс - org_name
Упоминания:
* Org Викиликс
 
=== Родовое понятие ===
{{ПримерЗадания|Газета "Ведомости" пишет, что... |}}
 
Спаны:
* Газета - org_descr
* Ведомости- org_name
Упоминания:
* Org Газета+Ведомости
 
Важно: кавычки не выбирать!
 
=== ??? ===
{{ПримерЗадания|Международная организация ICAAN. |}}

Версия от 08:01, 24 ноября 2015

Все изменения влиты в инструкцию Виктора, этот документ оставлен под черновые заметки