Задачи для разработчиков: различия между версиями
GranD (обсуждение | вклад) мНет описания правки |
GranD (обсуждение | вклад) Нет описания правки |
||
Строка 13: | Строка 13: | ||
* '''Инструменты''': PHP, HTML, CSS, JavaScript? | * '''Инструменты''': PHP, HTML, CSS, JavaScript? | ||
* '''Тикет''': http://code.google.com/p/opencorpora/issues/detail?id=43 | * '''Тикет''': http://code.google.com/p/opencorpora/issues/detail?id=43 | ||
== | == Perl/Python == | ||
=== Синхронизация с Викисловарём === | |||
Наш [http://opencorpora.org/dict.php морфологический словарь] хотелось бы иногда пополнять. Например, с помощью [http://ru.wiktionary.org Викисловаря]. | |||
* '''Задача''': написать программу, выдающую список лемм, отсутствующих у нас и присутствующих в Викисловаре. | |||
* '''Исходные данные''': экспорт нашего словаря [http://opencorpora.org/?page=downloads здесь]; дамп Викисловаря берётся [http://dumps.wikimedia.org/backup-index.html где-то здесь] под названием ruwiktionary. | |||
* '''Тикет''': http://code.google.com/p/opencorpora/issues/detail?id=157 | |||
== Другое == | == Другое == | ||
=== Составить XML Schema === | === Составить XML Schema === |
Версия от 19:41, 21 сентября 2012
Ниже приводится список задач, которые любой желающий может помочь нам сделать. Сюда попадает то, что, как нам кажется, легко сделать, не закапываясь глубоко в наш код.
Предварительно прочтите, пожалуйста, страницу Разработчикам.
Если вы хотите взять себе задачу — напишите на рассылку opencorpora-dev@ и/или на [email protected].
PHP
Читаемое отображение отличий
Наша разметка и словарь версионированы, т.е. мы храним для них историю изменений. Иногда хочется посмотреть разницу между двумя версиями. Сейчас это выглядит как-то так и это очень сложно читать. Предположительно, должны существовать библиотеки для таких задач.
- Задача: сделать такую страницу более читаемой.
- Исходные данные: два текста в XML-формате, структуру см. по ссылке выше.
- Инструменты: PHP, HTML, CSS, JavaScript?
- Тикет: http://code.google.com/p/opencorpora/issues/detail?id=43
Perl/Python
Синхронизация с Викисловарём
Наш морфологический словарь хотелось бы иногда пополнять. Например, с помощью Викисловаря.
- Задача: написать программу, выдающую список лемм, отсутствующих у нас и присутствующих в Викисловаре.
- Исходные данные: экспорт нашего словаря здесь; дамп Викисловаря берётся где-то здесь под названием ruwiktionary.
- Тикет: http://code.google.com/p/opencorpora/issues/detail?id=157
Другое
Составить XML Schema
Наши данные экспортируются в формате XML, хочется иметь XML Schema для экспорта словаря и для экспорта разметки.
- Исходные данные: файлы экспорта можно найти на странице Downloads
- Тикет: http://code.google.com/p/opencorpora/issues/detail?id=71