Barrierefreie Dokumente mit Markdown, LaTeX und PDF erstellen
Barrierefreie Dokumente mit Markdown, LaTeX und PDF erstellen
03.11.20PDF-Dokumente sind schon lange mehr als die digitale Vorschau analoger Druckerzeugnisse. Mittlerweile ist es möglich, PDF-Dokumente barrierefrei zu gestalten und somit einen weiteren Schritt hin zu einer inklusiveren digitalen Lehre zu machen. Welche Kniffe bei der Erstellung von Dokumenten mit Markdown, LaTeX und PDF umgesetzt werden können, erläutert Dr. Björn Fisseler in diesem Beitrag.
Dieser Blogbeitrag gehört zu einer Reihe zum Thema Barrierefreiheit in der digitalen Lehre von Dr. Björn Fisseler. Sie können alle weiteren Artikel in unserem Dossier Diversität und Barrierefreiheit finden.
Im Blogbeitrag zu den Grundlagen digitaler Barrierefreiheit wurde das Prinzip der Wahrnehmbarkeit vorgestellt. Dieses Prinzip gilt sowohl für Audio- und Videoinhalte als auch für Dokumente. Barrierefreie Dokumente sind essentiell für eine inklusionsorientierte Digitalisierung in der Hochschule. Mit Office-Dokumenten, die mit Microsoft Office oder Libre-/OpenOffice erstellt werden, ist viel möglich. Aber in naturwissenschaftlich-technischen Fächern haben sich andere Formate etabliert. Oft wird LaTeX genutzt, um Dokumente zu erstellen, die später im PDF-Format weitergegeben werden. Markdown ist eine Auszeichnungssprache, die vor allem leicht lesbar ist. Markdown-Dokumente können mit passenden Werkzeugen in nahezu beliebige Formate umgewandelt werden.
In diesem Beitrag erläutert Dr. Björn Fisseler, wie mit Markdown und LaTeX barrierefreie Dokumente erstellt werden können. Weil damit oft PDF-Dokumente erzeugt werden, wird auch auf die Anforderungen barrierefreier PDF-Dokumente eingegangen. Man darf nicht vergessen, dass Studierende auch Dokumente erstellen. LaTeX ist zwar textbasiert, hat aber eine steile Lernkurve. Das macht es auch für Studierende mit gesundheitlichen Beeinträchtigungen nicht einfach, damit Dokumente zu erzeugen. Im Abschnitt zu Markdown wird auch aufgezeigt, welche Möglichkeiten Markdown dafür bietet.
PDF-Dokumente
Barrierefreie PDF-Dokumente sind ein Thema für sich. PDF wurde für den Druckbereich entwickelt. PDF-Dokumente sollten genau abbilden, wie der Inhalt auf der Seite platziert und das Dokument gedruckt wird. Erst später hat die Firma Adobe das PDF als Lösung für das “papierlose Büro” vermarktet. Während es früher nur schwer möglich war, PDF-Dokumente barrierefrei zu gestalten, ist das heute durchaus möglich – wenn man ein paar Dinge beachtet.
- PDF-Dokumente brauchen eine Tag-Struktur, damit sie zugänglich sind. Diese Tags sind vergleichbar mit HTML-Tags. Mit PDF-Tags können assistive Technologien den Inhalt eines PDF auslesen. Ohne Tag-Struktur kann ein PDF nicht barrierefrei sein.
- Darüber hinaus gelten alle Anforderungen der WCAG 2.1 analog für PDF-Dokumente, soweit dies in der EU-Norm EN 301 549 in Kapitel 10 zu Nicht-Web-Dokumenten vermerkt ist. Nicht-Textinhalte brauchen einen Alternativtext, es muss ein eindeutiger Dokumententitel vorhanden sein, die Lesereihenfolge muss sinnvoll sein usw. Eine deutschsprachige Prüfliste findet sich u.a. in der Anleitung des PAC und auf den Webseiten des Schweizer Projekts Zugang für alle.
- Gibt es Probleme mit der Zugänglichkeit, kann ein PDF nachträglich bearbeitet werden. Das ist aber sehr mühsam. Besser ist es, ein PDF-Dokument aus einem barrierefreien Quelldokument zu erstellen. Grundsätzlich nicht geeignet sind sog. “PDF-Drucker”, denn sie erzeugen nur PDF ohne Tag-Struktur.
- Microsoft Word erlaubt recht einfach die Erstellung barrierefreier PDF. Hier habe ich leider keine aktuelle deutschsprachige Anleitung finden können, aber Microsoft bietet in englischer Sprache Informationen zur Erstellung barrierefreier PDF-Dokumente.
- Die University of Washington erläutert detailliert, wie aus verschiedenen Programmen barrierefreie PDF erstellt werden.
- Auch das WebAIM-Projekt erläutert, wie barrierefreie PDF aus Word– oder PowerPoint-Dokumenten erstellt werden. Die nachträgliche Bearbeitung von PDF wird anhand Adobe Acrobat und Foxit Phantom PDF erläutert.
- Deutschsprachige Anleitungen sind selten und oft veraltet. Adobe stellt im deutschsprachigen Acrobat-Benutzerhandbuch ausführliche Informationen zu barrierefreien PDF-Dokumenten zur Verfügung.
- Manche Dokumente liegen nur als Scan vor. Auch wenn es das PDF-Format hat, bestehen diese Dokumente nur aus vielen Bildseiten. Diese müssen dann aufwändig bearbeitet werden, was mit einer Texterkennung (OCR) beginnt. Falls die Bildqualität des Dokuments sehr schlecht ist, sollte es qualitativ hochwertig neu eingescannt werden.
Die Barrierefreiheit von PDF-Dokumenten kann mit Prüfwerkzeugen getestet werden:
- In Acrobat Pro kann die Barrierefreiheit mit dem integrierten Prüfwerkzeug getestet werden. Dabei erhält man auch Hinweise, wie die ermittelten Fehler korrigiert werden können.
- Wer den Acrobat Pro nicht hat, aber mit Windows arbeitet, kann den PDF Accessibility Checker – PAC verwenden, um die Barrierefreiheit eines vorhandenen PDF zu ermitteln.
- Das WAI hat eine Übersicht mit weiteren PDF-Prüfwerkzeugen. Hier muss man aber beachten, welche Standards überprüft werden.
- Solche automatischen Prüfwerkzeuge können nicht alle Aspekte eines barrierefreien PDF erfassen können. Z.B. lässt sich ein ausreichender Farbkontrast nicht auf diese Weise ermitteln. Daher gilt, das PDF-Dokumente idealerweise mit verschiedenen assistiven Technologien getestet werden sollten. Oder Sie bitten die Nutzer*innen um Rückmeldung, ob und welche Probleme sie bei der Nutzung der Dokumente haben.
LaTeX
LaTeX ist eine Seitenbeschreibungssprache, d.h. nicht die LaTeX-Dokumente selbst werden gelesen, sondern die daraus erstellten Dokumente. Meistens werden mit LaTeX PDF-Dokumente erstellt, es können aber auch HTML-Dokumente und andere Formate erzeugt werden. Die Stärken von LaTeX liegt vor allem im Formelsatz, weshalb LaTeX besonders im naturwissenschaftlich-technischen Bereich populär ist. Damit ein mit LaTeX erzeugtes Dokument barrierefrei ist, muss das erzeugte Zieldokument barrierefrei sein. Für die Zieldokumente gelten dann die gleichen Anforderungen wie für andere barrierefreie HTML- oder PDF-Dokumente.
- Die TeX User Group (TUG) hat Informationen zu LaTeX und barrierefreien PDF zusammengestellt.
- Es gibt auf CTAN, einem Archiv für Material rund um TeX, eine ganze Reihe an Paketen für LaTeX, welche die Barrierefreiheit adressieren. Die meisten Pakete sorgen für ein getaggtes und strukturiertes PDF. Andere Pakete verbessern die Zugänglichkeit von mathematischen Formeln oder konvertieren diese in Nemeth Braille, eine spezielle Braillenotation für mathematische Inhalte.
- Das accessibility-Paket verbessert die Zugänglichkeit von mit LaTeX PDF-Dokumenten. Das Paket erzeugt getaggte sowie strukturierte PDF-Dokumente und ermöglicht es, Sprachwechsel oder die Hauptsprache eines Dokuments anzugeben.
- Das axessibility-Paket erzeugt für mathematische Formeln automatisch eine Art Alternativtext, den Assistiven Technologien lesen können.
- Wie aus LaTeX-Dokumenten mit mathematischen Formeln zugängliche HTML-Dokumente erstellt werden können, erläutert ein Tutorial der CSU Northridge.
- Auch Pandoc kann aus LaTeX barrierefreie HTML-Dokumente erzeugen.
Formeln mit MathML
MathML wurde entwickelt, um mathematische Inhalte im Web darzustellen. Lange war wurde MathML mit seiner komplexen Semantik nicht von allen Browsern gleichermaßen unterstützt. Und immer noch unterstützen nicht alle Browser MathML im vollen Umfang.
Deshalb ist vor ein paar Jahren das Projekt MathJax angetreten, die Darstellung mathematischer Inhalte in Webbrowsern zu verbessern. MathJax kann nicht nur verschiedene Eingabeformate verarbeiten und so z.B. auch in LaTeX gesetzte Formeln in HTML-Seiten ausgeben, sondern auch verschiedene Darstellungen vornehmen. Mit MathJax können mathematische Formeln auch vorgelesen werden. Im Hintergrund arbeitet MathJax mit Heuristiken, um zu ermitteln, wie bestimmte Inhalte vermutlich korrekt gelesen werden. Wer sich also mit der barrierefreien Darstellung mathematischer Inhalte im Web beschäftigt, kommt um MathJax nicht herum. Und MathJax arbeitet auch mit LaTeX, Markdown und epub zusammen.
- Aber auch in Lernmanagementsystemen wie Moodle können mit MathJax barrierefreie Formelinhalte erstellt werden, wenn die entsprechenden Erweiterungen installiert sind.
- Sehr ausführlich sind die Hinweise der PennState zum Thema barrierefreie mathematisch-naturwissenschaftliche Inhalte.
- Und auch das Universal Design Center der CSU Northridge hat sehr gute Hinweise zur barrierefreien Gestaltung von Formeln.
Markdown
Markdown ist eine Auszeichnungssprache die mit dem Ziel entwickelt wurde, bereits bei der Erstellung leicht lesbar zu sein. Markdown-Dokumente sind, wie LaTeX-Dokumente auch, reine Textdokumente. LaTeX-Quelltext ist aber deutlich komplexer als Markdown.
- Die ursprüngliche Markdown-Syntax wurde im Jahr 2004 von John Gruber und Aaron Swartz veröffentlicht. Mittlerweile gibt es aber viele Weiterentwicklungen und Varianten.
- Ursprünglich wurde aus Markdown-Dokumenten HTML erzeugt. Daher auch die Bezeichnung Markdown in Kontrast zum komplexeren HTML-Markup.
- Mittlerweile gibt es Werkzeuge, mit denen aus Markdown nahezu beliebige Formate erzeugt werden können. Das bekannteste ist vielleicht Pandoc, ein universeller Dokumentenkonverter. Mit Pandoc ist es möglich, aus einem Quelldokument viele verschiedene Zieldokumente zu erzeugen, darunter auch EPUB, PDF sowie zahlreiche Textverarbeitungs- und Präsentationsformate.
- Diese Flexibilität und Einfachheit macht Markdown zu einem beliebten Werkzeug für blinde Nutzer*innen. Mit Markdown können sie auf einfache Weise größere strukturierte Dokumente schreiben.
- Markdown wird auch als Werkzeug für die Inhaltserstellung für Menschen mit gesundheitlichen Beeinträchtigungen und für die Anpassung von Studienmaterialien genutzt.
- Mathematische Inhalte werden in Markdown in LaTeX-Syntax eingefügt. Wie diese Inhalte dann später angezeigt werden, hängt vom gewählten Ausgabeformat ab. Für Pandoc gibt es dafür eine ausführliche Dokumentation.
- Markdown hat durch die Statistiksoftware R und die Entwicklungsumgebung RStudio eine weiter Verbreitung in der Statistik und dem wissenschaftlichen Publizieren gefunden. Mit RMarkdown werden barrierefreie wissenschaftliche Dokumente erstellt.
- Markdown bietet viele Möglichkeiten, um aus einem Quelldokument flexible verschiedene Zieldokumente zu erzeugen. Diese sind aber nicht automatisch barrierefrei. Sie müssen einige Aspekte zu beachten, insbesondere auch für die Zugänglichkeit von Bildern. Gleichwohl steckt in der Flexibilität viel Potential für die Erstellung barrierefreier Inhalte, die automatisch in vielen Formaten bereitgestellt werden können.