Задачи для разработчиков: различия между версиями

Материал из OpenCorpora
Перейти к навигации Перейти к поиску
мНет описания правки
Нет описания правки
Строка 13: Строка 13:
* '''Инструменты''': PHP, HTML, CSS, JavaScript?
* '''Инструменты''': PHP, HTML, CSS, JavaScript?
* '''Тикет''': http://code.google.com/p/opencorpora/issues/detail?id=43
* '''Тикет''': http://code.google.com/p/opencorpora/issues/detail?id=43
== Документация ==
== Perl/Python ==
=== Синхронизация с Викисловарём ===
Наш [http://opencorpora.org/dict.php морфологический словарь] хотелось бы иногда пополнять. Например, с помощью [http://ru.wiktionary.org Викисловаря].
* '''Задача''': написать программу, выдающую список лемм, отсутствующих у нас и присутствующих в Викисловаре.
* '''Исходные данные''': экспорт нашего словаря [http://opencorpora.org/?page=downloads здесь]; дамп Викисловаря берётся [http://dumps.wikimedia.org/backup-index.html где-то здесь] под названием ruwiktionary.
* '''Тикет''': http://code.google.com/p/opencorpora/issues/detail?id=157
== Другое ==
== Другое ==
=== Составить XML Schema ===
=== Составить XML Schema ===

Версия от 19:41, 21 сентября 2012

Ниже приводится список задач, которые любой желающий может помочь нам сделать. Сюда попадает то, что, как нам кажется, легко сделать, не закапываясь глубоко в наш код.

Предварительно прочтите, пожалуйста, страницу Разработчикам.

Если вы хотите взять себе задачу — напишите на рассылку opencorpora-dev@ и/или на [email protected].

PHP

Читаемое отображение отличий

Наша разметка и словарь версионированы, т.е. мы храним для них историю изменений. Иногда хочется посмотреть разницу между двумя версиями. Сейчас это выглядит как-то так и это очень сложно читать. Предположительно, должны существовать библиотеки для таких задач.

  • Задача: сделать такую страницу более читаемой.
  • Исходные данные: два текста в XML-формате, структуру см. по ссылке выше.
  • Инструменты: PHP, HTML, CSS, JavaScript?
  • Тикет: http://code.google.com/p/opencorpora/issues/detail?id=43

Perl/Python

Синхронизация с Викисловарём

Наш морфологический словарь хотелось бы иногда пополнять. Например, с помощью Викисловаря.

  • Задача: написать программу, выдающую список лемм, отсутствующих у нас и присутствующих в Викисловаре.
  • Исходные данные: экспорт нашего словаря здесь; дамп Викисловаря берётся где-то здесь под названием ruwiktionary.
  • Тикет: http://code.google.com/p/opencorpora/issues/detail?id=157

Другое

Составить XML Schema

Наши данные экспортируются в формате XML, хочется иметь XML Schema для экспорта словаря и для экспорта разметки.