Vom Manuskript als Word-Datei zum vollautomatischen Publishing (WTH‑01)
technik
Schriftsteller, Journalisten, Texter und Wissenschaftler — sie alle sind Autoren, deren Arbeit auf das Veröffentlichen von Texten hinausläuft. Sie schreiben ihre Texte in Textverarbeitungsprogrammen wie Word oder Libre Office und geben sie weiter an Redakteure, Übersetzer, Schriftsetzer oder Content-Management-Systeme. Ist es nicht erstaunlich, daß wir uns für das wichtigste Werkzeug unseres Broterwerbs erst interessieren, wenn Word eine Datei für unrettbar kaputt erklärt? In diesem Video als Auftakt zur Woche der Textdateihygiene erkunden wir zunächst das Innenleben der Textverarbeitungsformate DOCX und ODT, extrahieren den Inhalt und erstellen daraus eine Masterdatei in sauberem XML, das unseren Bedürfnissen angepasst ist.
Dauer: 72 Minuten.
- 04:40 Wie Word Text und Layout speichert
- 06:50 Textverarbeitungsdateien sind gezippte Datei-Container
- 10:34 Das Prinzip von XML
- 10:20 XML-Tags
- 13:50 XML-Elemente sind Geschwister, Kinder oder Eltern
- 16:20 Erstes Gebot von XML: Wohlgeformtheit
- 18:20 Zweites Gebot: Alle Elemente müssen Kinder eines Root-Elements sein; es stellt die XML-Struktur nach außen als kompaktes Objekt dar.
- 20:30 Kommentare in XML
- 21:00 Die XML-Deklaration
- 22:00 Die Doctype-Deklaration und DTD-Dateien
- 23:00 XML und seine Varianten sind die Träger unseres Informationszeitalters
- 29:45 Attribut versus Element
- 32:50 HTML als kondensiertes XML
- 38:15 Open-Document-XML für Textverarbeitungsdateien (ODT)
- 38:45 Microsoft-Word-XML für Word-Dateien (DOCX)
- 42:00 Textverarbeitungsprogramme schreiben dreckiges XML
- 43:30 ODT-Syntax
- 45:00 Wozu man aufwendige Texte mit eigenem XML strukturieren sollte
- 48:00 Automatisierter Publishing-Workflow
- 49:00 Export in Textverarbeitsformate und PDF
- 51:00 Export in HTML und EPUB für E-Books
- 52:20 Direkter Import von XML in Indesign für den Print-Schriftsatz
- 56:50 Vollautomatischer XML-Publishing-Workflow für Bücher im Überblick