Crossmediales Publizieren · April 2007

Informationen und Tipps zum Electronic Publishing und zur Anwendung von XML

Editorial
In dieser Ausgabe beschäftigen wir uns vor allem mit Microsoft Word – und zwar zum einen mit dem Dateiformat der neuen 2007er Ausgabe und zum anderen mit dem optimalen Einsatz von Word bei der Manuskriptbearbeitung.
Außerdem stellen wir Ihnen ein Buch vor, das sich mit dem Word-internen XML-Dialekt WordML beschäftigt.
Ihre Ursula Welsch

Inhalte
–   MS Word 2007 und XML:
    Das neue Dateiformat
–   MS Word in der Praxis:
    Workflow-Optimierung durch professionellen Word-Einsatz
–   Buchrezension:
    „Professionelle XML-Verarbeitung mit Word“

Seminartermine der XML-Schule:
     07.-10.05.2007 Satz, Umbruch und PDF-Generierung mit XSL (XSL-T und XSL-FO), MID/Heidelberg

Seminartermine bei der Akademie des deutschen Buchhandels:
     10./11.05.2007 „Workflow-Optimierung in Redaktion und Herstellung“

Seminartermine beim Landesverband Bayern des Börsenvereins:
     24.05.2007 „Datenübernahme aus MS Word in Quark XPress“

<<<<< MS Word 2007 und XML: >>>>>
Das neue Dateiformat

MS Word 2007 setzt komplett auf das neue XML-basierte Dateiformat. Wir haben uns angesehen, was passiert, wenn man eine relativ einfache DOC-Datei von Word 2003 in Word 2007 konvertiert.
Die Testdatei enthielt nur einfache Absatzformate wie Überschrift2, Überschrift3, Standard, Aufzählungszeichen, Kopfzeile und Fußzeile. Darüber hinaus waren Kommentare enthalten. Nach dem Speichern in Word 2007 heißt das Dateiformat nun DOCX und ist ein ZIP-Container. In dieser ZIP-Datei befinden sich in unserem Fall 20 Dateien – alles XML-Dateien! Relativ rasch hat man dabei das eigentliche Dokument identifiziert: document.xml, das den Text des Dokuments in WordML-Notation (siehe unsere Buchbesprechung weiter unten) enthält und somit auch die Formatvorlagennamen als Eigenschaften (Properties) mitführt.
Die Informationen über die konkrete Gestaltung der „ehemaligen“ Formatvorlagen findet sich in der Datei styles.xml. Darüber hinaus gibt es eigene Dateien für die Kommentare (comments.xml), die Kopfzeile (header1.xml, header2.xml), die Fußnoten (footnotes.xml) und die Endnoten (endnotes.xml) und noch etliche weitere. Die Information, welche Dateien zu diesem Dokument gehören, steht in document.xml.rels – wobei „rels“ für „relationships“ steht.
So weit so gut – und so logisch: Der eigentliche Schreck findet beim Öffnen der Datei document.xml statt, denn nun finden sich z.B. in den Fließtextabsätzen in WordML Unterbrechungen des Textflusses, die im Ausgangsdokument (der DOC-Datei) nicht vorhanden waren – schon gar nicht so wahllos mitten in einem Wort ... Worauf Word da wohl reagiert hat? Spontan ist das nicht nachvollziehen – und glücklicherweise müssen wir es als Normalnutzer auch nicht!
Für den Fall, dass Sie Dateien von Word 2007 mit älteren Word-Versionen öffnen und bearbeiten müssen, hat Microsoft ein so genanntes Compatibility Pack bereit gestellt. Es ist zu finden unter www.microsoft.com/downloads.

<<<<< MS Word in der Praxis: >>>>>
Workflow-Optimierung durch professionellen Word-Einsatz

Die meisten Autor(inn)en und Lektor(inn)en arbeiten mit Microsoft Word, um Manuskripte zu erfassen und zu bearbeiten. Und nicht selten wird das Programm nur als „Schreibmaschine“ eingesetzt – weit davon entfernt, mithilfe von Formatvorlagen eine eindeutige Auszeichnung von Textelementen vorzunehmen. Dabei ist der konsequente Einsatz von Formatvorlagen bei der Manuskriptarbeit ein wichtiger Faktor, um bei der anschließenden Weiterverarbeitung der Word-Daten die Produktionskosten möglichst gering zu halten. Vor allem bei standardisierten (Reihen-)Titeln zahlt sich dieses Vorgehen für Verlage schnell aus.
In der Praxis kann es jedoch Probleme geben: Zwar existieren in der Regel verlagseigene Dokumentvorlagen für die einzelnen Titel oder Reihen, aber Redakteur(inn)en und Korrektor(inn)en fehlen die nötigen Word-Kenntnisse, um die Manuskripte professionell zu bearbeiten und auf den benötigten technischen Stand zu bringen.
Im Seminar „Manuskriptbearbeitung mit MS Word“ werden die für die Manuskriptbearbeitung notwendigen Fertigkeiten am Rechner eingeübt. Als maßgeschneidertes Inhouse-Seminar werden dabei auch Ihre eigenen Dokument- und Formatvorlagen einbezogen.
Dieses Seminar ist buchbar bei der Akademie des deutschen Buchhandels.
Nähere Informationen erhalten Sie direkt bei Susanne Franz oder bei der XML-Schule!

<<<<< Buchrezension: >>>>>
Professionelle XML-Verarbeitung mit Word

Als Microsoft mit der Office-Version 2003 die Integration von XML in Word und andere Office-Tools realisierte, war die Hoffnung groß, dass nun endlich die aufwändige Migration von Word-Dokumenten in XML und wieder zurück im Autoren-Workflow ein Ende haben würde. Jedoch ist die XML-Implementierung vor allem Software-intern – nämlich im Dateiformat – realisiert worden. Und das führt in der Praxis dazu, dass eine XML-Anwendung, die MS Word im Workflow benutzt, von einem Entwickler professionell eingerichtet werden muss – und genau dies ist die Zielgruppe dieses Buchs.
Das erste Kapitel beschäftigt sich mit der Erstellung und Bearbeitung von XML-Dokumenten mit MS Word. Darin kommt vor allem zur Sprache, dass die strukturkonforme Bearbeitung vorhandener XML-Dokumente in MS Word nicht so einfach funktioniert, dass man ein Dokument öffnen und die Strukturführung assoziieren könnte – wie das mit einer Word-eigenen Dokumentvorlage möglich ist. Daher muss diese Art Workflow von einem XML-erfahrenen Entwickler eingerichtet werden.
Die weiteren Kapitel befassen sich mit der Beschreibung von WordML, das die flache Word-Formatvorlagenstruktur unmittelbar abbildet, mit seiner Umwandlung in benutzerdefiniertes XML und mit der Konvertierung von XML in WordML. Die Tipps, die immer wieder eingestreut werden, sind dabei sehr praxisnah und zeugen von aufwändigen Tests, deren Erfahrungen weitergegeben werden.
Darüber hinaus findet sich in diesem Buch eine ausführliche Beschreibung von SmartDocuments und ihrer Erstellung. SmartDocuments sind Word-Dokumente, die mit Hilfe von semantischen XML-Elementen für automatisierte Prozeduren vorbereitet werden können, z.B. für Berechnungsformeln oder die Integration von Adressen aus einer Datenbank.
Vom Thema her ist „Professionelle XML-Verarbeitung mit Word“ der einzige deutschsprachige Titel, der sich mit dem Einsatz der XML-Schnittstelle von MS Word beschäftigt – ein Buch von Profis für Profis, auch wenn man sich an mancher Stelle etwas ausführlichere Beschreibungen oder einen Ausblick auf Word 2007 gewünscht hätte. Sämtliche Codebeispiele können von der Website der Autoren herunter geladen werden.
Manuel Montero Pineda, Jürgen Sieben: Professionelle XML-Verarbeitung mit Word. WordML und SmartDocuments, Heidelberg: dpunkt 2006, ISBN 089-3-89864-415-0, 39 € (D), 40,10 € (A)


Impressum
Ursula Welsch
Tachenseestr. 2
D-83373 Taching am See
Tel. +49-(0)8681-47 18 52
E-Mail: mailto:ursula.welsch@welschmedien.de
Dies ist der monatliche Newsletter von <ursula welsch.neue medien> und der XML-Schule.
Im Newsletter "Crossmediales Publizieren" berichten wir für Sie über neueste Entwicklungen und Erfahrungen aus der crossmedialen Verlagspraxis und weisen auf die aktuellen Termine der XML-Schule hin.

Abbestellen: Wenn Sie diesen kostenlosen Newsletter nicht mehr erhalten möchten, dann senden Sie einfach eine E-Mail mit dem Hinweis „Abbestellen NL Crossmediales Publizieren“!