Обсуждение:Nermanual/2

Материал из OpenCorpora
Перейти к навигации Перейти к поиску

Сюда нужно писать комментарии и вопросы.

Для того, чтобы создать новый вопрос, нажмите кнопку "Добавить тему" вверху страницы. Если вы не видите этой кнопки, то вам нужно залогиниться на этой вики. Логины и пароли не синхронизированы с opencorpora.org. Чтобы писать на вики нужен отдельный логин.

Внимание! Если вы начали размечать абзац и не понимаете, как его разметить
...то не нажимайте пока на кнопку "Закончить разметку абзаца".
Вместо этого задайте вопрос на этой странице (обязательно скопируйте предложение) и дождитесь ответа. Торопиться не нужно.


Часть закончившихся обсуждений убрана в архив
Обсуждение:Nermanual/2/Архив



job + организация без имени + name + surname

в семье владельца сахарной плантации Анхеля Кастро-и-Аргиса

Владелец кафе Йохен Шарф не только принял под своё крыло необычных посетителей ...

Вариант разметки:

Пример


в семье владельца сахарной плантации Анхеля Кастро-и-Аргиса ...
Спаны:
  • владелец — job
  • сахарной плантации — org_descr
  • Анхеля — name
  • Кастро-и-Аргиса — surname
Упоминания:
  • Анхеля + Кастро-и-Аргиса — Person
  • сахарной плантации — Org
  • название компании внутри должности

    Пример


    со ссылкой на исполнительного директора компании Google по развивающимся рынкам ( Европа , Ближний Восток и Африка ) Мохамада Гавдата ...
    Спаны:
    • исполнительного директора — job
    • исполнительного директора компании Google по развивающимся рынкам — job
    • компании — org_descr
    • Google — org_name
    • Европа — loc_name
    • Ближний Восток — loc_name
    • Африка — loc_name
    • Мохамада — name
    • Гавдата — surname
    Упоминания:
  • Мохамада + Гавдата — Person
  • компании + Google — Org
  • Европа — Location
  • Ближний Восток — Location
  • Африка — Location
  • имеет ли смысл выделять дескриптор "представительство" без уточняющего слова, когда оно есть в тексте?

    Пример


    украинское представительство Google ...
    Спаны:
    • украинское представительство — org_descr
    • Google — org_name
    Упоминания:
  • украинское представительство + Google — Org
  • Google — Org
  • Кажется, что добавлять спан org_descr( представительство ) не нужно, т.к. он малоинформативен.

    Полное и сокращённое наименование организации

    Если я правильно понял такой пример:

    Пример


    ... которая предоставлена Международным телекоммуникационным союзом ( International Telecommunications Union ( ITU ) ) для ...
    Спаны:
    • Международным телекоммуникационным союзом — org_name
    • International Telecommunications Union — org_name
    • ITU — org_name
    Упоминания:
  • Международным телекоммуникационным союзом — Org
  • International Telecommunications Union — Org
  • ITU — Org
  • то случай когда после полного наименования организации в скобках упоминается сокращённое, аббревиатура -- то нужно скобки прерывают спан, верно?

    Ну то есть, можно либо сделать непрерывный спан из ПолногоИмени+СокращённогоИмени, либо засчитать два упоминания (одной и той же организации, но это пока не учитываем) - полное упоминание (из одного спана в три слова) и сокращённое наименование (из одного односложного спана).

    Название латиницей и аббревиатура в сбоках - это отдельные упоминания. Не нужно делать непрерывного спана, перекрывающего скобки. Картинка верна (но текст под ней я не смог однозначно понять, поэтому говорю только про картинку). --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)

    Руководитель Роскосмоса

    В тексте не хватает примера на должность + организация: сначала слишком долго мусолятся простые примеры, потом резко очень сложные долго идут, а среднего уровня примеров очень не хватает.

    Я вот такой подобрал:

    Пример


    По словам руководителя Роскосмоса Анатолия Николаевича Перминова , уже идёт подготовка к ...
    Спаны:
    • руководителя — job
    • Роскосмоса — org_name
    • Анатолия — name
    • Николаевича — patronymic
    • Перминова — surname
    Упоминания:
  • Роскосмоса — LocOrg
  • Анатолия + Николаевича + Перминова — Person
  • (можно убрать ФИО для простоты, но я полагаю, что как раз это некритично, пусть потихоньку привыкает держать всё более реальные примеры (т.к. некоторые примеры, которые Виктор привёл в обсуждениях сложно понять с непривычки)

    Спасибо. Хороший пример. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)

    Когда Россия - это Loc, а когда - LocOrg

    Интуитивно думаю, что в первом примере Loc, а во втором - LocOrg. Но хочу более ясные критерии, помимо "революционного чутья".

    • Спутник AMOS-5 изготовлен в России, его вес — 600
    • По словам руководителя Роскосмоса Анатолия Николаевича Перминова , Россия готовит соглашения

    Сначала я понял, что LocOrg - это когда должность+страна (президент РФ, посол Италии); потом понял, что LocOrg - это когда "организации, управляющей указанной территорией" (первый случай: Россия - это чисто страна, во втором случае это и страна и организация, которая управляет территорией Россия); потом я запутался.

    Первый - Loc (аналогично: в Москве, в лесу, на соседней поляне, в Африке), второй - LocOrg (аналогично: ЦКБ Рубин, правительство России). Страна (в ней есть должности, руководящие организации, она может совершать действия) - это организация. Местоположение не может готовить, говорить, выступать, разрабатывать, забивать гол, выигрывать, атаковать и т.д. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)


    Профессии: Пользователь ЖЖ zlyatt сообщает...

    Что считать профессией? Блоггер Петров - это профессия или неинтересное родовое понятие, которое мы не учитываем при разметке? Или вот Сергей Калугин -- по профессии музыкант, есть своя рок-группа - но если в тексте будет написано "Известный мистик Сергей Калугин" (а его причисляют к мистикам, да) то "мистик + Сергей Калугин" считается как род деятельности, профессия или не размечать?

    пользователь ЖЖ, блоггер и прочие можно игнорировать. Из них факт "Работа" не соберёшь. Если ты их выделил - хуже не станет, т.к. в сущностях они не участвуют. Только в фактах как значения поля "должность". А вот если "оркестр нанял музыканта Сергея Калугина" - тут "музыкант" будет нужен, т.к. там будет факт "Работа" и должность "музыкант". --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)

    Площадь у памятника Юрию Долгорукому

    Ммммм... Вот реальный пример:


    Пример


    ... занимать площадь у памятника Юрию Долгорукому ещё с ...
    Спаны:
    • Юрию — name
    • Долгорукому — surname
    Упоминания:
  • Юрию + Долгорукому — Person
  • В общем-то, это совершенно конкретная локация, но как её верно разметить? Пока понимаю только как ФИО разметить. Andrey Kruglov (обсуждение) 01:20, 26 ноября 2015 (MSK)

    памятник - loc_descr, Юрию - name, Долгорукому - surname, упоминания: Person (ты всё правильно сделал) и Location (все три спана). --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)

    Нехорошо на один спан вешать два типа?

    Юрий Долгорукий -- здесь Юрий это имя. А вот Долгорукий -- это толи чисто прозвище (никнейм по-нашему), толи и прозвище и фамилия. Интерфейс разметки затрещал, но дал навесить на Долгорукий и никнейм и фамилию.

    Ставь оба. Это ок. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)

    Насколько это правильно с точки зрения интерфейса? (Баг, фича?)

    Насколько это плохо с точки зрения разметки? Есть ли ещё случаи, когда слово имеет два типа одновременно?

    Это ок. Были в других версиях инструкции. Специально не выключали для таких случаях. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)

    Насколько плохо, если в случаях неочевидных (Лок или ЛокОрг) я тупо буду набрасывать сразу оба варианта, а там модератор умный, пусть сам лишнюю снимет? (Вопрос не праздный, а шибко практический. Пощупать бы интерфейс модератора разметки NER, чтобы кожей почувствовать, каково оно. Согласен на скриншот хотя бы)

    У типов упоминания не делали множественные типы. Интерфейса модератора пока нет. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)

    Не Loc, а Location

    Нужно поправить в шаблонах (это особенно критично: не показывается вообще тип упоминания) и в текстах (не забыть про заголовки) Andrey Kruglov (обсуждение) 13:54, 3 декабря 2015 (MSK)