Участник:Andrey Kruglov/Инструкция по разметке NER: различия между версиями

Материал из OpenCorpora
Перейти к навигации Перейти к поиску
(Новая страница: «== Введение. Как пользоваться интерфейсом разметки NER == Интерфейс разметки именованных с…»)
 
Строка 1: Строка 1:
== Введение. Как пользоваться интерфейсом разметки NER ==
== Введение. Интерфейс разметки NER ==
Интерфейс разметки именованных сущностей выглядит следующим образом:
Интерфейс разметки именованных сущностей выглядит следующим образом:
[[Файл:Ner common 01.png]]
[[Файл:Ner common 01.png]]
Строка 10: Строка 10:
* Локации (Италия, Москва и т.п.)
* Локации (Италия, Москва и т.п.)
* Локация в организационном контексте (президент Америки)
* Локация в организационном контексте (президент Америки)
Разметка именованой сущности состоит из двух шагов:
1. Создание спана сущности
2. Создание упоминания сущности
Если в предложении больше одной именованной сущности - повторить процесс необходимое число раз.
Пример. Владимир Ильич Ленин встретился в Горках с...
В данном предложении две именованные сущности:
* Владимир Ильич Ленин (именованная сущность "персона")
* Горках (именованная сущность "локация")
Размечаем первую именованную сущность:
* кликаем на слово "Владимир" в тексте абзаца, выбираем Name во всплывающей панели
* кликаем на слово "Ильич" в тексте абзаца, выбираем Patr во всплывающей панели
* кликаем на слово "Ленин" в тексте абзаца, выбираем Surn во всплывающей панели
В панели спанов оказалось три новых спана: (тут надо картинку влепить)
Затем в панели спанов выделям все три слова и во всплывающей панели спана "собираем" спан в единое упоминание c типом Person.
Размечаем вторую именованную сущность:
(дописать завтра по аналогии)

Версия от 22:08, 16 ноября 2015

Введение. Интерфейс разметки NER

Интерфейс разметки именованных сущностей выглядит следующим образом: Ner common 01.png

Абзац - минимальная единица разметки. Для того, чтобы начать размечать абзац нужно щёлкнуть мышью в любом месте этого абзаца. Справа от абзаца находятся зоны (закладки, табы) спанов и абзацев.

Необходимо в каждом абзаце выделить следующие именованные сущности:

  • Персоны (Владимир Ленин, министр финансов Алексей Улюкаев и т.п.)
  • Организации (Викиликс, газета Ведомости, международный фонд ICAAN)
  • Локации (Италия, Москва и т.п.)
  • Локация в организационном контексте (президент Америки)

Разметка именованой сущности состоит из двух шагов: 1. Создание спана сущности 2. Создание упоминания сущности

Если в предложении больше одной именованной сущности - повторить процесс необходимое число раз.

Пример. Владимир Ильич Ленин встретился в Горках с...

В данном предложении две именованные сущности:

  • Владимир Ильич Ленин (именованная сущность "персона")
  • Горках (именованная сущность "локация")

Размечаем первую именованную сущность:

  • кликаем на слово "Владимир" в тексте абзаца, выбираем Name во всплывающей панели
  • кликаем на слово "Ильич" в тексте абзаца, выбираем Patr во всплывающей панели
  • кликаем на слово "Ленин" в тексте абзаца, выбираем Surn во всплывающей панели

В панели спанов оказалось три новых спана: (тут надо картинку влепить)

Затем в панели спанов выделям все три слова и во всплывающей панели спана "собираем" спан в единое упоминание c типом Person.

Размечаем вторую именованную сущность:

(дописать завтра по аналогии)