Einen Bericht aus formatierten BEx-Kommentaren stellt man am besten in einem Dokumentenformat wie PDF oder Word zusammen. ABRACON zeigt, wie das mit einem HTML-nach-DOCX-Konvertierungswebdienst zu erreichen ist.
Im Rahmen des Projektes MIP Key Products Insights - einer als BARC-Finalist bereits ausgezeichneten Kommentarerfassungsanwendung bei Roche - wurde auch ein HTML-zu-DOCX Konvertierungsservice entwickelt. Obwohl der Dienst vordergründig dazu entwickelt wurde, Reports mit qualitativen wie auch quantitativen Daten zu generieren, stellt er im Grunde aber eine allgemeine Technologie zur Verfügung, semantisches HTML in das DOCX-Format zu überführen.
Hierzu wird ein DOCX-Template mit vordefinierten Formatvorlagen auf dem Server hinterlegt. Das HTML wird dann im Rahmen des Webservice semantisch analysiert und die HTML-Tags entsprechend in die Word-Formate abgebildet.
Technisch schwierig gestaltet sich hierbei das grundlegend verschiedene Block-Modell von XHTML und WordML. Zum Beispiel können Blöcke (Absätze, Tabellen etc.) in HTML geschachtelt sein, in WordML jedoch nur sequentiell aufeinander folgen. Der von ABRACON entwickelte Algorithmus wandelt das komplizierte Block-Modell in HTML aber elegant in das sehr viel einfachere WordML-Format um, ohne dabei die Blockstruktur wesentlich zu verändern. Auf das Analysieren von CSS-Styles etc. in HTML wird dabei weitestgehend verzichtet. Aus gutem Grund: ausschlaggebend sind am Ende die Formatvorlagen (Styles) des Word-Templates.
Auf diese Weise ist eine Änderung des Report-Designs ohne weitere Entwicklung möglich: einfach durch Hinterlegen eines neuen Word-Templates. Bilder, Titelseite, Header, Footer und Formatierungen - all das kann wie üblich in Microsoft Word vorher definiert werden.
Klar ist, wenn man erst einmal ein Word-Dokument zur Hand hat, ist seit den letzten Office-Versionen auch das PDF nicht weit, da dieses Format bei "Speichern unter..." ab Microsoft Word 2007 als Option mitangeboten wird.