Инструкция по добавлению текстов: различия между версиями

Материал из OpenCorpora
Перейти к навигации Перейти к поиску
(Исходная версия инструкции)
 
Нет описания правки
Строка 1: Строка 1:
# Выбрать ни кем ещё не выбранный (белая строчка) документ из списка документов для заливки и указать себя (нажать “я хочу”) в качестве ответственного за заливку. Список документов для заливки: http://opencorpora.org/sources.php
# Выбрать никем ещё не выбранный (белая строчка) документ из [http://opencorpora.org/sources.php списка документов для заливки] и указать себя (нажать “я хочу”) в качестве ответственного за заливку.
# В колонке “Провязка” нажать “добавить”, а потом “создать”.
# В колонке “Провязка” нажать “добавить”, а потом “создать”.
# Вместо слова “Название” ввести правильное название раздела. Как правильно называть раздел - см. “Источник” / Метаинформация / Название раздела. Нажать “Ок” (при этом произойдёт две вещи: создастся новый раздел и ссылка на него появится в колонке “Провязка” вместо слова “добавить”). Перейти по ссылке в колонке “Провязка”.
# Вместо слова “Название” ввести правильное название раздела. Как правильно называть раздел - см. “Источник” / Метаинформация / Название раздела. Нажать “Ок” (при этом произойдёт две вещи: создастся новый раздел и ссылка на него появится в колонке “Провязка” вместо слова “добавить”). Перейти по ссылке в колонке “Провязка”.
# Скопировать текст из источника (в браузере) в поле ввода на странице http://opencorpora.org/add.php
# Скопировать текст из источника (в браузере) в поле ввода на странице [http://opencorpora.org/add.php add.php]
# Удалить из текста:
# Удалить из текста:
#* картинки и подписи под картинками
#* картинки и подписи под картинками
Строка 9: Строка 9:
# В документах, взятых из первоисточника, опечатки оставляем как есть. Является ли данный источник первоисточником написано в соответствующем разделе (см. ниже). Если документ не является первоисточником, нужно сверять с авторитетным печатным изданием и заливать как там написано (= как было написано у автора).
# В документах, взятых из первоисточника, опечатки оставляем как есть. Является ли данный источник первоисточником написано в соответствующем разделе (см. ниже). Если документ не является первоисточником, нужно сверять с авторитетным печатным изданием и заливать как там написано (= как было написано у автора).
# Когда разделение на предложения и абзацы завершено. нажать “Проверить” и подождать, пока слова ищутся в словаре.
# Когда разделение на предложения и абзацы завершено. нажать “Проверить” и подождать, пока слова ищутся в словаре.
# Проверить, правильно ли предложения разбиты на токены (см. “Правила разделения на токены”).
# Проверить, правильно ли предложения разбиты на токены (см. “[[Правила разделения на токены]]”).
# Если разделение на токены выполнено неверно, то нажать на ссылку “внести исправления”. Развернётся поле ввода. В нём граница токенов обозначена двойной крышкой (^^). Лишние границы токенов нужно удалить. Недостающие - проставить.
# Если разделение на токены выполнено неверно, то нажать на ссылку “внести исправления”. Развернётся поле ввода. В нём граница токенов обозначена двойной крышкой (^^). Лишние границы токенов нужно удалить. Недостающие - проставить.
# Когда все границы токенов проверены и исправлены, выбрать название ранее созданного раздела и нажать “Добавить”.
# Когда все границы токенов проверены и исправлены, выбрать название ранее созданного раздела и нажать “Добавить”.
# На странице добавленного раздела проставить теги так, как указано в “Источник” / Метаинформация / Теги.
# На странице добавленного раздела проставить теги так, как указано в “Источник” / Метаинформация / Теги.
# После того, как будет указан url (один, или несколько), около каждого url надо нажать на ссылку “скачать” и дождаться пока текст ссылки сменится на “сохранённая копия”. Проверить, что по клику на на ссылке “сохрнённая копия” открывается именно копия добавленного документа, а не что-то ещё и не сообщение об ошибке. NB: визуально закачанный документ чаще всего отличается от оригинала, т.к. слетают css и картинки. Это нормально.
# После того, как будет указан url (один или несколько), около каждого url надо нажать на ссылку “скачать” и дождаться пока текст ссылки сменится на “сохранённая копия”. Проверить, что по клику на на ссылке “сохранённая копия” открывается именно копия добавленного документа, а не что-то ещё и не сообщение об ошибке. NB: визуально закачанный документ чаще всего отличается от оригинала, т.к. слетают css и картинки. Это нормально.


Копия оригинального документа сохраняется на тот случай, если кто-то захочет совместить типографскую разметку (шрифты, цвета, подчёркнутость, ссылки, …) и лингвистическую. Поскольку всю типографику при заливке мы удаляем, эта задача решается только обращением к оригиналу. Оригинал же может измениться или вообще исчезнуть (иной раз и вместе с сайтом). Чтобы это не угрожало пригодности наших данных, мы сохраняем оригинал при заливке указанным выше способом. Через некоторое время эти сохранённые копии тоже будут доступны для скачивания отдельным архивом.
Копия оригинального документа сохраняется на тот случай, если кто-то захочет совместить типографскую разметку (шрифты, цвета, подчёркнутость, ссылки, …) и лингвистическую. Поскольку всю типографику при заливке мы удаляем, эта задача решается только обращением к оригиналу. Оригинал же может измениться или вообще исчезнуть (иной раз и вместе с сайтом). Чтобы это не угрожало пригодности наших данных, мы сохраняем оригинал при заливке указанным выше способом. Через некоторое время эти сохранённые копии тоже будут доступны для скачивания отдельным архивом.

Версия от 11:49, 29 декабря 2011

  1. Выбрать никем ещё не выбранный (белая строчка) документ из списка документов для заливки и указать себя (нажать “я хочу”) в качестве ответственного за заливку.
  2. В колонке “Провязка” нажать “добавить”, а потом “создать”.
  3. Вместо слова “Название” ввести правильное название раздела. Как правильно называть раздел - см. “Источник” / Метаинформация / Название раздела. Нажать “Ок” (при этом произойдёт две вещи: создастся новый раздел и ссылка на него появится в колонке “Провязка” вместо слова “добавить”). Перейти по ссылке в колонке “Провязка”.
  4. Скопировать текст из источника (в браузере) в поле ввода на странице add.php
  5. Удалить из текста:
    • картинки и подписи под картинками
    • таблицы и подписи под таблицами
  6. Проставить границы абзацев (двойной перевод строки) и предложений (одинарный перевод строки). См. “Правила разделения на предложения”.
  7. В документах, взятых из первоисточника, опечатки оставляем как есть. Является ли данный источник первоисточником написано в соответствующем разделе (см. ниже). Если документ не является первоисточником, нужно сверять с авторитетным печатным изданием и заливать как там написано (= как было написано у автора).
  8. Когда разделение на предложения и абзацы завершено. нажать “Проверить” и подождать, пока слова ищутся в словаре.
  9. Проверить, правильно ли предложения разбиты на токены (см. “Правила разделения на токены”).
  10. Если разделение на токены выполнено неверно, то нажать на ссылку “внести исправления”. Развернётся поле ввода. В нём граница токенов обозначена двойной крышкой (^^). Лишние границы токенов нужно удалить. Недостающие - проставить.
  11. Когда все границы токенов проверены и исправлены, выбрать название ранее созданного раздела и нажать “Добавить”.
  12. На странице добавленного раздела проставить теги так, как указано в “Источник” / Метаинформация / Теги.
  13. После того, как будет указан url (один или несколько), около каждого url надо нажать на ссылку “скачать” и дождаться пока текст ссылки сменится на “сохранённая копия”. Проверить, что по клику на на ссылке “сохранённая копия” открывается именно копия добавленного документа, а не что-то ещё и не сообщение об ошибке. NB: визуально закачанный документ чаще всего отличается от оригинала, т.к. слетают css и картинки. Это нормально.

Копия оригинального документа сохраняется на тот случай, если кто-то захочет совместить типографскую разметку (шрифты, цвета, подчёркнутость, ссылки, …) и лингвистическую. Поскольку всю типографику при заливке мы удаляем, эта задача решается только обращением к оригиналу. Оригинал же может измениться или вообще исчезнуть (иной раз и вместе с сайтом). Чтобы это не угрожало пригодности наших данных, мы сохраняем оригинал при заливке указанным выше способом. Через некоторое время эти сохранённые копии тоже будут доступны для скачивания отдельным архивом.