LaTeXML конвертује LaTeX документа у XML, HTML и EPUB.[1][2][3]

Процес рада uredi

LaTeXML примарни изворни формат је XML репрезентација (La)TeX's документ модела. Постпроцесор може претварати ове XML документе у формате попут HTML са математичким формулама као сликама или XHTML, HTML5, и EPUB са формулама као MathML. У поређењу са другим LaTeX-to-XML процесорима, LaTeXML има за циљ да сачува семантичке структуре LaTeX ознака. То га чини добром основом за семантичке услуге као што су Math search.

Конверзија у распону 30 милисекунде у једноставним формулама (у LaTeXML daemon-у) до минута за документ величине књиге.

Историја uredi

LaTeXML је почео у контексту дигиталне библиотеке математичке функције у NIST, где је LaTeX документима потребно да се припреме за објављивање на вебу. Систем је био под активним развојем за више од једне деценије, и привукао мали, али посвећени број програмера и корисника усмерени на Bruce Miller, LaTeXML.

Садашња верзија је објављена као LaTeXML 0.8.1. То је објављено у фебруару 2015. године, али развој је био активан на јавном складишту од тада.

LaTeXML је коришћен за конвертовање 90% (60% без грешака) од 530.000 докумената из arXiv у XML.[4] Као резултат ових напора, LaTeXML одржава велики распон LaTeX пакета. ACL 2014 је користио LaTeXML за конвертовање пристиглих радова у XML.[5] Овај постојећи посао је покушавао да конвертује ACL Anthology папире у високо-квалитетну семантичку ознаку за даље анализе.[6] Од фебруара 2013. године, LaTeXML је коришћен да донесе веб странице на математичке производе на сајту.

Имплементација uredi

Језгро LaTeXML је Perl реимплементација TeX рашчлањивања и дигестије алгоритма са прилагодљивим XML емитером. Ковертовање семантичке структуре у LaTeX ознаку, LaTeXML има XML повезивање за LaTeX пакете. LaTeXML дистрибуција тренутно пружа XML повезивања за преко 200 обично коришћењем LaTeX пакета као што су AMSTeX, Бабел или PGF/TikZ (који има само експерименталну подршку).[7] Додатни (непотпуни али корисни) повези су добијени од стране заједнице.

LaTeXML конверзија се састоји из две фазе:

  • прво рашчлањавање LaTeX и конвертује LaTeX близу XML тип документа, и
  • друга (пост-процесирање) ствара из тог једног излазног формата XHTML, HTML5, HTML са сликама, EPUB.

LaTeXML 0.8 је додао daemon функционалност која је омогућила више конвертобање и једноставно уклапање веб сервиса.

Референце uredi

  1. "Gecko-based EPUB Readers and LaTeXML" Arhivirano 2014-08-22 na Wayback Machine-u.
  2. "Tools for Converting LaTeX to XML".
  3. "Free Techno Blog: LaTeXML" Arhivirano 2015-05-11 na Wayback Machine-u.
  4. Stamerjohanns, Heinrich; Kohlhase, Michael; Ginev, Deyan; David, Catalin; Miller, Bruce (2010).
  5. "ACL 2014 Publication - Papers in XML format".
  6. Schäfer, Ulrich; Read, Jonathon; Oepen, Stephan (2012).
  7. "LaTeXML: Localization with Babel".

Спољашње везе uredi