Инструкция по делению на предложения

Материал из OpenCorpora
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Границы предложений проставляются после следующих знаков препинания (точки, восклицательного знака, вопросительного знака) перед заглавной буквой или концом абзаца.


NB: Далее для наглядности границы предложений обозначены вертикальной чертой красного цвета ( | ). В поле ввода на странице http://opencorpora.org/add.php не нужно вводить вертикальную черту. Достаточно поставить перевод строки (нажать Enter).

Прямая речь, оформленная без использования кавычек

Если прямая речь отделена от слов автора нетипографским переводом строки, то граница предложения между словами автора и прямой речью ставится.

Пример: {{#if:http://ru.wikisource.org/wiki/%D0%A1%D0%B5%D0%BC%D1%8C%D1%8F_%D0%B2%D1%83%D1%80%D0%B4%D0%B0%D0%BB%D0%B0%D0%BA%D0%B0_%28%D0%90._%D0%9A._%D0%A2%D0%BE%D0%BB%D1%81%D1%82%D0%BE%D0%B9%29%7C|}}

В эту минуту кашлянул ребёнок, и я различил голос Горчи, он спрашивал: |

— Ты, малый, не спишь? |

— Нет, дедушка, — отвечал мальчик, — мне бы с тобой поговорить. |

— А, поговорить со мной? | А о чём поговорить? | {{#if:|

Примечания к примеру:
|}}

Если прямая речь не отделёна от слов автора нетипографским переводом строки, то граница предложений не ставится.

Пример: {{#if:http://ru.wikisource.org/wiki/%D0%9A%D0%B0%D0%BF%D0%B8%D1%82%D0%B0%D0%BD%D1%81%D0%BA%D0%B0%D1%8F_%D0%B4%D0%BE%D1%87%D0%BA%D0%B0_%28%D0%9F%D1%83%D1%88%D0%BA%D0%B8%D0%BD%29/%D0%93%D0%BB%D0%B0%D0%B2%D0%B0_I%7C|}}

— Не забудь, Андрей Петрович, — сказала матушка, — поклониться и от меня князю Б.; я, дескать, надеюсь, что он не оставит Петрушу своими милостями. | {{#if:|

Примечания к примеру:
|}}

Внутри прямой речи ставятся границы предложений.

Пример: {{#if:http://ru.wikipedia.org/w/index.php?title=%D0%90%D0%BD%D0%B4%D0%B5%D1%80%D1%81%D0%BE%D0%BD,_%D0%90%D0%BD%D0%BD%D0%B0&oldid=34069611%7C|}}

Мы все просим вас, — писала она, — не теряя времени поехать в Берлин вместе с господином Жильяром, чтобы увидеть эту несчастную. | А если вдруг это, и впрямь, окажется наша малышка! | Одному Богу известно! | И представьте себе: если это она, там одна, в нищете, если всё это правда… | Какой кошмар! | Умоляю вас, умоляю вас, отправляйтесь как можно скорее. | (…) Самое ужасное, что она говорит, что одна из её тетушек — она не помнит, кто именно — называла ее Schwibs. | Да поможет вам Бог. | Обнимаю вас от всего сердца. | P.S. Если это действительно она, телеграфируйте мне, я приеду тотчас… {{#if:|

Примечания к примеру:
|}}

Прямая речь и цитаты, оформленные с использованием кавычек

Если часть текста заключена в кавычки, то необходимо ответить на следующие вопросы:

  • Разделять ли слова в кавычках от слов вне кавычек на разные предложения?
  • Разделять ли слова внутри кавычек на разные предложения, если внутри есть знаки препинания и прочие признаки, обозначающие границу предложения?

Как ответить на первый вопрос?

Надо проверить, являются ли слова в кавычках членами того же предложения, что и слова вне кавычек.

Если являются, то между словами в кавычках и словами вне кавычек не нужно ставить границу предложения.

Пример: {{#if:http://ru.wikipedia.org/wiki/Прямая_речь%7C|}}

Справедливо сказал Гоголь, что «в Пушкине, как будто в лексиконе, заключилось все богатство, гибкость и сила нашего языка». | {{#if:|

Примечания к примеру:
|}}


Пример: {{#if:http://ru.wikipedia.org/wiki/Прямая_речь%7C|}}

Судьям хорошо известно, «кто есть кто», и обмануть их не удастся. | {{#if:|

Примечания к примеру:
|}}


Пример: {{#if:http://ru.wikipedia.org/w/index.php?title=%D0%90%D0%BD%D0%B4%D0%B5%D1%80%D1%81%D0%BE%D0%BD,_%D0%90%D0%BD%D0%BD%D0%B0&oldid=34069611%7C|}}

По воспоминаниям самого капитана, «…больная ответила, что эта дама ей не знакома…» {{#if:|

Примечания к примеру:
|}}

Если не являются и слова в кавычках находятся внутри предложения (до и после кавычек есть ещё какие-то слова), то отделять слова вне кавычек от слов в кавычках не нужно.

Пример: {{#if:http://ru.wikisource.org/wiki/%D0%9A%D0%B0%D0%BF%D0%B8%D1%82%D0%B0%D0%BD%D1%81%D0%BA%D0%B0%D1%8F_%D0%B4%D0%BE%D1%87%D0%BA%D0%B0_%28%D0%9F%D1%83%D1%88%D0%BA%D0%B8%D0%BD%29/%D0%93%D0%BB%D0%B0%D0%B2%D0%B0_I%7C|}}

<Когда я вошла в комнату>, женщина, лежавшая на постели спросила у сиделки: «Ist das die Tante?»(Это <моя> тётя), что повергло меня в полное смятение. | {{#if:|

Примечания к примеру:
|}}

Если не являются и одна из кавычек (открывающая или закрвающая) находится в начале или конце предложения, то между словами внутри кавычек и словами вне кавычек надо поставить границу предложения.

Пример: {{#if:http://ru.wikipedia.org/w/index.php?title=%D0%90%D0%BD%D0%B4%D0%B5%D1%80%D1%81%D0%BE%D0%BD,_%D0%90%D0%BD%D0%BD%D0%B0&oldid=34069611%7C|}}

Перед отъездом она беседовала с датским послом: | «Мой разум не позволяет мне поверить, что это Анастасия, но сердцем я чувствую, что это она. | А поскольку я воспитана в религии, которая учит слушать прежде всего доводы сердца, а не рассудка, я не в силах оставить это несчастное дитя…» {{#if:|

Примечания к примеру:
|}}


Пример: {{#if:http://www.chaskor.ru/news/chasy_raboty_stolichnyh_setevyh_magazinov_mogut_ogranichit%7C|}}

«Принять закон непрямого действия, с одной стороны, логично, а с другой — практически за всеми сетями стоят серьёзные люди из центрального и федерального руководства. | Поэтому вряд ли закон будет иметь позитивное отношение к малому бизнесу — всё равно лоббисты от крупных ритейлеров получат нужную трактовку закона», | — цитирует председателя всероссийского объединения «За честный бизнес» Илью Хандрикова Infox.ru. {{#if:|

Примечания к примеру:
|}}

Как ответить на второй вопрос?

Разделять ли на предложения текст в кавычках, если внутри него есть признаки границы предложения (знаки препинания + заглавные буквы)?

Если ранее было решено отделять слова вне кавычек от слов в кавычках, то слова в кавычках тоже разделяются на предложения.

Пример: {{#if:http://ru.wikipedia.org/wiki/Несобственно-прямая_речь%7C|}}

| Но вот его комната. | Ничего и никого, никто не заглядывал. | Даже Настасья не притрагивалась. | Но, господи! | Как мог он оставить давеча все эти вещи в этой дыре? | Он бросился в угол, запустил руку под обои и стал вытаскивать вещи и нагружать ими карманы. | Ф. Достоевский | {{#if:|

Примечания к примеру:
|}}


Если слова в кавычках не были на предыдущем шаге отделены от слов вне кавычек, то думаем дальше.

Если текст в кавычках не является членом внешнего предложения и текст в кавычках находится не на границе предложения, то текст внутри кавычек не делим на предложения.

Пример: {{#if:|
[ Источник]
|}}

… {{#if:|

Примечания к примеру:
|}}


Если все слова внутри кавычек являются одним членом с точки зрения внешнего предложения (слов вне кавычек), то разделять на предложения текст в кавычках не надо.

Пример: {{#if:|
[ Источник]
|}}

Роман “Опасные связи. Или письма собранные в одном частном кружке лиц и опубликованные господином Ш.де Л.в назидание некоторым другим” увидел свет в 1782 году. | {{#if:|

Примечания к примеру:
|}}

Если слова внутри кавычек являются членами внешнего предложения по отдельности, то внутри кавычек надо делить на предложения. NB (lazyfrog): есть критерий осмысленности отрезанных кусков.

Пример: {{#if:http://www.chaskor.ru/article/holodnaya_vanna_vozvrashchaet_sily_14%7C|}}

Накалив печь в деревянных банях, «туда входили нагими и там обливались водой. | Потом брали розги (веник) и начинали себя бить, и до того секли, что едва выходили живыми. | Но потом, окатившись холодной водой, оживали». | {{#if:Тут три предложения. Открывающая кавычка - в первом, закрывающая - в третьем|

Примечания к примеру:
Тут три предложения. Открывающая кавычка - в первом, закрывающая - в третьем|}}


Пример: {{#if:http://ru.wikipedia.org/wiki/Несобственно-прямая_речь%7C|}}

| Но вот его комната. | Ничего и никого, никто не заглядывал. | Даже Настасья не притрагивалась. | Но, господи! | Как мог он оставить давеча все эти вещи в этой дыре? | Он бросился в угол, запустил руку под обои и стал вытаскивать вещи и нагружать ими карманы. | Ф. Достоевский | {{#if:это восемь предложений|

Примечания к примеру:
это восемь предложений|}}


Многоточия и разделение на предложения

Если многоточие встретилось на границе предложений после знака конца предложения, то его (многоточие) относим ко следующему предложению (см. ниже первую границу предложений). Если знака конца предложения нету, то многоточие относим к предыдущему предложению (см. вторую границу).

Пример: {{#if:http://ru.wikipedia.org/w/index.php?title=%D0%90%D0%BD%D0%B4%D0%B5%D1%80%D1%81%D0%BE%D0%BD,_%D0%90%D0%BD%D0%BD%D0%B0&oldid=34069611%7C|}}

У него как и у отца чёрные волосы, а глаза того же цвета, что у матери. | (…) В 1920 году, когда Чайковский был убит в уличной перестрелке, она, не сказав никому ни слова, бежала из Бухареста и добралась до Берлина (…) | Ребенок по её словам, остался у Чайковских, и она умоляла помочь найти его… {{#if:|

Примечания к примеру:
|}}

Списки

Если элементы нумерованных или не нумерованных списков разделены нетипографским переводом строки, то вместо него нужно поставить границу предложения. При этом маркеры списка (цифры или буквы, чёрточки, точки, …) нужно сохранить в начале каждого предложения, если они были в исходном тексте.

Пример: {{#if:http://ru.wikipedia.org/wiki/Белки%7C|}}

Существуют несколько видов защитных функций белков: | 1. Физическая защита. | В ней принимает участие коллаген — белок, образующий основу межклеточного вещества соединительных тканей (в том числе костей, хряща, сухожилий и глубоких слоев кожи)дермы); кератин, составляющий основу роговых щитков, волос, перьев, рогов и др. производных эпидермиса. | Обычно такие белки рассматривают как белки со структурной функцией. | Примерами этой группы белков служат фибриногены и тромбины[32], участвующие в свёртывании крови. | 2. Химическая защита. | {{#if:|

Примечания к примеру:
|}}


Пример: {{#if:http://ru.wikipedia.org/wiki/Белки%7C|}}

Для определения количества белка в образце используется ряд методик: | Биуретовый метод | Микробиуретовый метод | Метод Бредфорда | Метод Лоури | Спектрофотометрический метод {{#if:|

Примечания к примеру:
|}}

Заголовки

Заголовок является отдельным абзацем. Это касается и заголовков разделов, глав и пр.. Заголовок может состоять из нескольких предложений.

Псевдографика и другие украшения

1. псевдографические разделители абзацев, горизонтальные линии и пр. - удаляем перед заливкой.

Пример: {{#if:http://www.chaskor.ru/article/11_22105%7C|}}

Вы пытаетесь всё повесить на него, на самом деле понимая, что он просто дал вам возможности, которых у вас до него никогда не было. Вы просто их про@@@ли. По глупости, по лености, из-за гордыни. И теперь вы вините его. Ничего. Он был готов.

***

Последний день путча. Помните? Знаменитые кадры — толпа несёт огромный трёхцветный флаг от Белого дома к Лубянке. Перед флагом идёт группка людей со свечами. Среди этих людей был я. {{#if:Звёздочки убираем. Границы предложений тут не обозначены.|

Примечания к примеру:
Звёздочки убираем. Границы предложений тут не обозначены.|}}

2. Постскриптум (“P.S”., “PS”, “ЗЫ”, … ) не выделяем в отдельное предложение.

Ошибки в источнике и разделение на предложения

Случайный перевод строки посередине предложения

В случае если автор текста непреднамеренно поставил перевод строки в середине предложения - то в корпусе предложение не разрываем на части. Примеры см. в рассылке

Пропущенные знаки препинания на конце предложения

Не восстанавливаем. Но считаем ошибкой. Пока непонятно, как её отметить явно. А отмечать надо бы, т.к. токенизатор будет учиться плохому.

Пример: {{#if:http://ru.wikipedia.org/w/index.php?title=%D0%90%D0%BD%D0%B4%D0%B5%D1%80%D1%81%D0%BE%D0%BD,_%D0%90%D0%BD%D0%BD%D0%B0&oldid=34069611%7C|}}

Никто из них не носил фамилию Чайковский, вопреки утверждениям Анны Андерсон | Никаких доказательств существования людей, которых она объявила своими спасителями, найдено не было. {{#if:|

Примечания к примеру:
|}}