Идеи/Промяна вътрешния формат на текстовете

От Уики на Читанка
< Идеи
Версия от 08:24, 17 април 2011 на Борислав (беседа | приноси) (от основната страница)
(разл) ← По-стара версия | Текуща версия (разл) | По-нова версия → (разл)
Направо към: навигация, търсене

Идеята в едно изречение

Замяна на сегашното представяне на текстовете (SFB) с XML.

Пълно описание

В момента текстовете в Читанка се съхраняват във формат SFB. Това налага средно сложен анализ на файла, преди да се конвертира към някой от крайните формати (TXT, FB2, ePub), като този анализ се извършва винаги, когато исканият краен формат не съществува в кеша на сайта. Предложението е текстовете да се съхраняват в XML-блокове; дори не е необходимо да е пълноценен XML-файл. Това дава следните предимства:

  • Еднократен (сложен) анализ на изходния SFB-файл;
  • Възможност за (почти) директно конвертиране на вътрешния XML файл в някой от изходните формати, например чрез XSLT.
  • Възможност за усложняване на SFB-парсера по такъв начин, че да улавя повече невалидни конструкции; в момента това е непрактично.

При тази организация на текстовете SFB-форматът ще се превърне в още един от изходните формати за конвертиране, който е интересен само за коректорите.

Необходими умения за реализацията й

Уеб-програмиране (PHP, MySQL); познаване на модулите за конвертиране.

Приоритет

(направо не искам да предполагам :-)

Забележки

  • „Пакетните“ файлове, които описват книгите и сборните издания, също ще се представят чрез XML.