Инструкция по добавлению текстов: различия между версиями
Перейти к навигации
Перейти к поиску
Lazyfrog (обсуждение | вклад) (Исходная версия инструкции) |
GranD (обсуждение | вклад) Нет описания правки |
||
Строка 1: | Строка 1: | ||
# Выбрать | # Выбрать никем ещё не выбранный (белая строчка) документ из [http://opencorpora.org/sources.php списка документов для заливки] и указать себя (нажать “я хочу”) в качестве ответственного за заливку. | ||
# В колонке “Провязка” нажать “добавить”, а потом “создать”. | # В колонке “Провязка” нажать “добавить”, а потом “создать”. | ||
# Вместо слова “Название” ввести правильное название раздела. Как правильно называть раздел - см. “Источник” / Метаинформация / Название раздела. Нажать “Ок” (при этом произойдёт две вещи: создастся новый раздел и ссылка на него появится в колонке “Провязка” вместо слова “добавить”). Перейти по ссылке в колонке “Провязка”. | # Вместо слова “Название” ввести правильное название раздела. Как правильно называть раздел - см. “Источник” / Метаинформация / Название раздела. Нажать “Ок” (при этом произойдёт две вещи: создастся новый раздел и ссылка на него появится в колонке “Провязка” вместо слова “добавить”). Перейти по ссылке в колонке “Провязка”. | ||
# Скопировать текст из источника (в браузере) в поле ввода на странице http://opencorpora.org/add.php | # Скопировать текст из источника (в браузере) в поле ввода на странице [http://opencorpora.org/add.php add.php] | ||
# Удалить из текста: | # Удалить из текста: | ||
#* картинки и подписи под картинками | #* картинки и подписи под картинками | ||
Строка 9: | Строка 9: | ||
# В документах, взятых из первоисточника, опечатки оставляем как есть. Является ли данный источник первоисточником написано в соответствующем разделе (см. ниже). Если документ не является первоисточником, нужно сверять с авторитетным печатным изданием и заливать как там написано (= как было написано у автора). | # В документах, взятых из первоисточника, опечатки оставляем как есть. Является ли данный источник первоисточником написано в соответствующем разделе (см. ниже). Если документ не является первоисточником, нужно сверять с авторитетным печатным изданием и заливать как там написано (= как было написано у автора). | ||
# Когда разделение на предложения и абзацы завершено. нажать “Проверить” и подождать, пока слова ищутся в словаре. | # Когда разделение на предложения и абзацы завершено. нажать “Проверить” и подождать, пока слова ищутся в словаре. | ||
# Проверить, правильно ли предложения разбиты на токены (см. | # Проверить, правильно ли предложения разбиты на токены (см. “[[Правила разделения на токены]]”). | ||
# Если разделение на токены выполнено неверно, то нажать на ссылку “внести исправления”. Развернётся поле ввода. В нём граница токенов обозначена двойной крышкой (^^). Лишние границы токенов нужно удалить. Недостающие - проставить. | # Если разделение на токены выполнено неверно, то нажать на ссылку “внести исправления”. Развернётся поле ввода. В нём граница токенов обозначена двойной крышкой (^^). Лишние границы токенов нужно удалить. Недостающие - проставить. | ||
# Когда все границы токенов проверены и исправлены, выбрать название ранее созданного раздела и нажать “Добавить”. | # Когда все границы токенов проверены и исправлены, выбрать название ранее созданного раздела и нажать “Добавить”. | ||
# На странице добавленного раздела проставить теги так, как указано в “Источник” / Метаинформация / Теги. | # На странице добавленного раздела проставить теги так, как указано в “Источник” / Метаинформация / Теги. | ||
# После того, как будет указан url (один | # После того, как будет указан url (один или несколько), около каждого url надо нажать на ссылку “скачать” и дождаться пока текст ссылки сменится на “сохранённая копия”. Проверить, что по клику на на ссылке “сохранённая копия” открывается именно копия добавленного документа, а не что-то ещё и не сообщение об ошибке. NB: визуально закачанный документ чаще всего отличается от оригинала, т.к. слетают css и картинки. Это нормально. | ||
Копия оригинального документа сохраняется на тот случай, если кто-то захочет совместить типографскую разметку (шрифты, цвета, подчёркнутость, ссылки, …) и лингвистическую. Поскольку всю типографику при заливке мы удаляем, эта задача решается только обращением к оригиналу. Оригинал же может измениться или вообще исчезнуть (иной раз и вместе с сайтом). Чтобы это не угрожало пригодности наших данных, мы сохраняем оригинал при заливке указанным выше способом. Через некоторое время эти сохранённые копии тоже будут доступны для скачивания отдельным архивом. | Копия оригинального документа сохраняется на тот случай, если кто-то захочет совместить типографскую разметку (шрифты, цвета, подчёркнутость, ссылки, …) и лингвистическую. Поскольку всю типографику при заливке мы удаляем, эта задача решается только обращением к оригиналу. Оригинал же может измениться или вообще исчезнуть (иной раз и вместе с сайтом). Чтобы это не угрожало пригодности наших данных, мы сохраняем оригинал при заливке указанным выше способом. Через некоторое время эти сохранённые копии тоже будут доступны для скачивания отдельным архивом. |
Версия от 11:49, 29 декабря 2011
- Выбрать никем ещё не выбранный (белая строчка) документ из списка документов для заливки и указать себя (нажать “я хочу”) в качестве ответственного за заливку.
- В колонке “Провязка” нажать “добавить”, а потом “создать”.
- Вместо слова “Название” ввести правильное название раздела. Как правильно называть раздел - см. “Источник” / Метаинформация / Название раздела. Нажать “Ок” (при этом произойдёт две вещи: создастся новый раздел и ссылка на него появится в колонке “Провязка” вместо слова “добавить”). Перейти по ссылке в колонке “Провязка”.
- Скопировать текст из источника (в браузере) в поле ввода на странице add.php
- Удалить из текста:
- картинки и подписи под картинками
- таблицы и подписи под таблицами
- Проставить границы абзацев (двойной перевод строки) и предложений (одинарный перевод строки). См. “Правила разделения на предложения”.
- В документах, взятых из первоисточника, опечатки оставляем как есть. Является ли данный источник первоисточником написано в соответствующем разделе (см. ниже). Если документ не является первоисточником, нужно сверять с авторитетным печатным изданием и заливать как там написано (= как было написано у автора).
- Когда разделение на предложения и абзацы завершено. нажать “Проверить” и подождать, пока слова ищутся в словаре.
- Проверить, правильно ли предложения разбиты на токены (см. “Правила разделения на токены”).
- Если разделение на токены выполнено неверно, то нажать на ссылку “внести исправления”. Развернётся поле ввода. В нём граница токенов обозначена двойной крышкой (^^). Лишние границы токенов нужно удалить. Недостающие - проставить.
- Когда все границы токенов проверены и исправлены, выбрать название ранее созданного раздела и нажать “Добавить”.
- На странице добавленного раздела проставить теги так, как указано в “Источник” / Метаинформация / Теги.
- После того, как будет указан url (один или несколько), около каждого url надо нажать на ссылку “скачать” и дождаться пока текст ссылки сменится на “сохранённая копия”. Проверить, что по клику на на ссылке “сохранённая копия” открывается именно копия добавленного документа, а не что-то ещё и не сообщение об ошибке. NB: визуально закачанный документ чаще всего отличается от оригинала, т.к. слетают css и картинки. Это нормально.
Копия оригинального документа сохраняется на тот случай, если кто-то захочет совместить типографскую разметку (шрифты, цвета, подчёркнутость, ссылки, …) и лингвистическую. Поскольку всю типографику при заливке мы удаляем, эта задача решается только обращением к оригиналу. Оригинал же может измениться или вообще исчезнуть (иной раз и вместе с сайтом). Чтобы это не угрожало пригодности наших данных, мы сохраняем оригинал при заливке указанным выше способом. Через некоторое время эти сохранённые копии тоже будут доступны для скачивания отдельным архивом.