Идеи/Промяна вътрешния формат на текстовете

От Уики на Читанка
Направо към: навигация, търсене

Идеята в едно изречение

Замяна на сегашното представяне на текстовете (SFB) с XML.

Пълно описание

В момента текстовете в Читанка се съхраняват във формат SFB. Това налага средно сложен анализ на файла, преди да се конвертира към някой от крайните формати (TXT, FB2, ePub), като този анализ се извършва винаги, когато исканият краен формат не съществува в кеша на сайта. Предложението е текстовете да се съхраняват в XML-блокове; дори не е необходимо да е пълноценен XML-файл. Това дава следните предимства:

  • Еднократен (сложен) анализ на изходния SFB-файл;
  • Възможност за (почти) директно конвертиране на вътрешния XML файл в някой от изходните формати, например чрез XSLT.
  • Възможност за усложняване на SFB-парсера по такъв начин, че да улавя повече невалидни конструкции; в момента това е непрактично.

При тази организация на текстовете SFB-форматът ще се превърне в още един от изходните формати за конвертиране, който е интересен само за коректорите.

Необходими умения за реализацията й

Уеб-програмиране (PHP, MySQL); познаване на модулите за конвертиране.

Приоритет

(направо не искам да предполагам :-)

Забележки

  • „Пакетните“ файлове, които описват книгите и сборните издания, също ще се представят чрез XML.

Коментари

Сегашното конвертиране не е сложно и не мисля, че XSLT ще опрости много процеса. Така или иначе може да се направи отделен валидатор, с който ще се проверява изходния SFB. — Борислав 12:20, 18 април 2011 (EEST)