Синтаксическая разметка

Материал из OpenCorpora
Версия от 18:04, 31 марта 2014; Lazyfrog (обсуждение | вклад) (Новая страница: «Уверждения, которые, вероятно, не вызывают вопросов: # Объектом синтаксического разбора …»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Уверждения, которые, вероятно, не вызывают вопросов:

  1. Объектом синтаксического разбора является одно предложение или его часть. Но не более одного предложения.
  2. Синтаксический разбор отвечает на вопрос о том, как связаны между собой слова в предложении.
  3. Токены, вместе с их однозначной морфологической интерпретацией, являются минимальными элементами синтаксической структуры, чем бы она ни была.
    1. Это значит, что в одной синтаксической гипотезе используется только одна морфологическая гипотеза для каждого токена. Если у нас несколько правильных морфологических гипотез, то предложение имеет и несколько синтаксических гипотез. Иначе бы мы сняли морфологическую неоднозначность и морфологических гипотез не было бы.
    2. Единицы, меньшие чем один токен, не могут быть элементами синтаксической структуры. Здесь есть контрпримеры (я их не помню), нужно найти их в блоге mitrius.

Для того, чтобы начать синтаксическую разметку, нам нужно ответить ещё на несколько вопросов:

  1. из каких сущностей состоит синтаксическая разметка (одна синтаксическая гипотеза)?
    1. слово - токен, имеющий граммему из поддерева POST (т.е. токен, для которого указана часть речи). Словами не являются знаки препинания.
    2. синтаксический элемент - слово, синтаксическая группа или мультиворд.
    3. синтаксические отношения. Предлагаемое определение - связь, образуемая парой синтаксических единиц и имеющая тип. Отношением могут быть связаны и не контактные слова.
    4. тип синтаксического отношения. Предлагаемое определение - название типа и логическая функция, аргументами которой являются грамматические характеристики связываемых элементов. Согласование - некоторое подмножество граммем должно пересекаться. Возможна омонимия, когда несколько функций с разными названиями типа возвращают 1?
    5. синтаксические группы. Предлагаемое определение - неразрывная цепочка синтаксических элементов, между которыми есть синтаксическое отношение, и один из которых является вершиной группы, грамматические свойства которой наследуются всей группой. Примеры: ПРИЛАГАТЕЛЬНОЕ + СУЩЕСТВИТЕЛЬНОЕ, СУЩЕСТВИТЕЛЬНОЕ + СУЩЕСТВИТЕЛЬНОЕ(В РОД. ПАДЕЖЕ), ПРЕДЛОГ + СУЩЕСТВИТЕЛЬНОЕ.
    6. многословные целые мультиворды. Предлгагаемое определение - неразрывная цепочка слов, между которыми есть синтаксическое отношение. При этом главное слово не выделяется и о наследовании свойств речи не идёт. Примеры: составные предлоги.
    7. если синтаксические элементы объединены в группу, то между ними есть синтаксическое отношение. Но если есть синтаксическое отношение, но элементы, которые оно связывает, стоят не контактно, то группа не получается. Описывает ли этот случай всю непроективность?