Обсуждение:Nermanual/2: различия между версиями
мНет описания правки |
мНет описания правки |
||
Строка 12: | Строка 12: | ||
| text = [[Обсуждение:Nermanual/2/Архив]] | | text = [[Обсуждение:Nermanual/2/Архив]] | ||
}} | }} | ||
== job + организация без имени + name + surname == | == job + организация без имени + name + surname == |
Версия от 21:07, 27 ноября 2015
Сюда нужно писать комментарии и вопросы.
Для того, чтобы создать новый вопрос, нажмите кнопку "Добавить тему" вверху страницы. Если вы не видите этой кнопки, то вам нужно залогиниться на этой вики. Логины и пароли не синхронизированы с opencorpora.org. Чтобы писать на вики нужен отдельный логин.
Внимание! Если вы начали размечать абзац и не понимаете, как его разметить
|
Часть закончившихся обсуждений убрана в архив
|
job + организация без имени + name + surname
в семье владельца сахарной плантации Анхеля Кастро-и-Аргиса
Владелец кафе Йохен Шарф не только принял под своё крыло необычных посетителей ...
Вариант разметки:
Пример
в семье владельца сахарной плантации Анхеля Кастро-и-Аргиса ...
Спаны:
| Упоминания:
|
название компании внутри должности
Пример
со ссылкой на исполнительного директора компании Google по развивающимся рынкам ( Европа , Ближний Восток и Африка ) Мохамада Гавдата ...
Спаны:
| Упоминания:
|
имеет ли смысл выделять дескриптор "представительство" без уточняющего слова, когда оно есть в тексте?
Пример
украинское представительство Google ...
Спаны:
| Упоминания:
|
Кажется, что добавлять спан org_descr( представительство ) не нужно, т.к. он малоинформативен.
Полное и сокращённое наименование организации
Если я правильно понял такой пример:
Пример
... которая предоставлена Международным телекоммуникационным союзом ( International Telecommunications Union ( ITU ) ) для ...
Спаны:
| Упоминания:
|
то случай когда после полного наименования организации в скобках упоминается сокращённое, аббревиатура -- то нужно скобки прерывают спан, верно?
Ну то есть, можно либо сделать непрерывный спан из ПолногоИмени+СокращённогоИмени, либо засчитать два упоминания (одной и той же организации, но это пока не учитываем) - полное упоминание (из одного спана в три слова) и сокращённое наименование (из одного односложного спана).
- Название латиницей и аббревиатура в сбоках - это отдельные упоминания. Не нужно делать непрерывного спана, перекрывающего скобки. Картинка верна (но текст под ней я не смог однозначно понять, поэтому говорю только про картинку). --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)
Руководитель Роскосмоса
В тексте не хватает примера на должность + организация: сначала слишком долго мусолятся простые примеры, потом резко очень сложные долго идут, а среднего уровня примеров очень не хватает.
Я вот такой подобрал:
Пример
По словам руководителя Роскосмоса Анатолия Николаевича Перминова , уже идёт подготовка к ...
Спаны:
| Упоминания:
|
(можно убрать ФИО для простоты, но я полагаю, что как раз это некритично, пусть потихоньку привыкает держать всё более реальные примеры (т.к. некоторые примеры, которые Виктор привёл в обсуждениях сложно понять с непривычки)
- Спасибо. Хороший пример. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)
Когда Россия - это Loc, а когда - LocOrg
Интуитивно думаю, что в первом примере Loc, а во втором - LocOrg. Но хочу более ясные критерии, помимо "революционного чутья".
- Спутник AMOS-5 изготовлен в России, его вес — 600
- По словам руководителя Роскосмоса Анатолия Николаевича Перминова , Россия готовит соглашения
Сначала я понял, что LocOrg - это когда должность+страна (президент РФ, посол Италии); потом понял, что LocOrg - это когда "организации, управляющей указанной территорией" (первый случай: Россия - это чисто страна, во втором случае это и страна и организация, которая управляет территорией Россия); потом я запутался.
- Первый - Loc (аналогично: в Москве, в лесу, на соседней поляне, в Африке), второй - LocOrg (аналогично: ЦКБ Рубин, правительство России). Страна (в ней есть должности, руководящие организации, она может совершать действия) - это организация. Местоположение не может готовить, говорить, выступать, разрабатывать, забивать гол, выигрывать, атаковать и т.д. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)
Профессии: Пользователь ЖЖ zlyatt сообщает...
Что считать профессией? Блоггер Петров - это профессия или неинтересное родовое понятие, которое мы не учитываем при разметке? Или вот Сергей Калугин -- по профессии музыкант, есть своя рок-группа - но если в тексте будет написано "Известный мистик Сергей Калугин" (а его причисляют к мистикам, да) то "мистик + Сергей Калугин" считается как род деятельности, профессия или не размечать?
- пользователь ЖЖ, блоггер и прочие можно игнорировать. Из них факт "Работа" не соберёшь. Если ты их выделил - хуже не станет, т.к. в сущностях они не участвуют. Только в фактах как значения поля "должность". А вот если "оркестр нанял музыканта Сергея Калугина" - тут "музыкант" будет нужен, т.к. там будет факт "Работа" и должность "музыкант". --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)
Площадь у памятника Юрию Долгорукому
Ммммм... Вот реальный пример:
Пример
... занимать площадь у памятника Юрию Долгорукому ещё с ...
Спаны:
| Упоминания:
|
В общем-то, это совершенно конкретная локация, но как её верно разметить? Пока понимаю только как ФИО разметить. Andrey Kruglov (обсуждение) 01:20, 26 ноября 2015 (MSK)
- памятник - loc_descr, Юрию - name, Долгорукому - surname, упоминания: Person (ты всё правильно сделал) и Location (все три спана). --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)
Нехорошо на один спан вешать два типа?
Юрий Долгорукий -- здесь Юрий это имя. А вот Долгорукий -- это толи чисто прозвище (никнейм по-нашему), толи и прозвище и фамилия. Интерфейс разметки затрещал, но дал навесить на Долгорукий и никнейм и фамилию.
- Ставь оба. Это ок. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)
Насколько это правильно с точки зрения интерфейса? (Баг, фича?)
Насколько это плохо с точки зрения разметки? Есть ли ещё случаи, когда слово имеет два типа одновременно?
- Это ок. Были в других версиях инструкции. Специально не выключали для таких случаях. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)
Насколько плохо, если в случаях неочевидных (Лок или ЛокОрг) я тупо буду набрасывать сразу оба варианта, а там модератор умный, пусть сам лишнюю снимет? (Вопрос не праздный, а шибко практический. Пощупать бы интерфейс модератора разметки NER, чтобы кожей почувствовать, каково оно. Согласен на скриншот хотя бы)
- У типов упоминания не делали множественные типы. Интерфейса модератора пока нет. --Bocharov (обсуждение) 01:24, 27 ноября 2015 (MSK)