BITi 07 Ausgewiesene natürliche Sprache

Aus BIT inklusiv Wiki und Test-Case-Datenbank
Version vom 10. November 2016, 11:41 Uhr von Petra (Diskussion | Beiträge) (Prüfung)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

Bezieht sich auf folgende Fehlerbedingungen im Matterhorn-Protokoll

Testbarkeit Mensch

  • MP 11-007 Die natürliche Sprache ist nicht geeignet.

Testbarkeit Software

  • MP 11-001 Die natürliche Sprache für Text im Seiteninhalt kann nicht ermittelt werden.
    • PAC Fehlermeldung:
      • Natürliche Sprache eines Textobjekts nicht definiert
      • Natural language of text object cannot be determined
  • MP 11-002 Die natürliche Sprache für Text in den Attributen Alt, ActualText und E kann nicht ermittelt werden.
    • PAC Fehlermeldung:
      • Natürliche Sprache eines [X] textes nicht definiert
      • Natural language of [X] cannot be determined.
        X ist Alternativtext (alternative text), Originaltext (actualtext) oder Erweiterungstext (expansion text)
  • MP 11-003 Die natürliche Sprache für Gliederungseinträge (Lesezeichen) kann nicht ermittelt werden.
    • PAC Fehlermeldung:
      • Natürliche Sprache eines Lesezeichens nicht definiert
      • Natural language of an outline item cannot be determined
  • MP 11-004 Die natürliche Sprache für Contents-Einträge bei Annotationen kann nicht ermittelt werden.
    • PAC Fehlermeldung:
      • Natürliche Sprache eines Contents-Eintrags nicht definiert
      • Natural language of Contents entry cannot be determined
  • MP 11-005 Die natürliche Sprache der TU-Schlüssel für Formularfelder kann nicht ermittelt werden.
    • PAC Fehlermeldung:
      • Natürliche Sprache eines Formularfeldnamens nicht definiert
      • Natural language of an alternate name of a form field cannot be determined
  • MP 11-006 Die natürliche Sprache für Dokumentmetadaten kann nicht ermittelt werden.
    • PDFaPilot Fehlermeldung:
      • Die natürliche Sprache für die Dokument-Metadaten und deren XMP Metadaten kann nicht ermittelt werden (kein Lang-Attribut im Katalog)
      • Natural Language for document metadata in it’s XMP metadata stream not defined )No Lang attribute in the Catalog)

Was wird geprüft?

Die natürliche Sprache des Dokuments muss korrekt angegeben sein (z.B. “Deutsch” für deutschsprachige Dokumente). Diese Sprache ist dann automatisch die Sprache für den textlichen Inhalt, die Metadaten und zusätzlichen textlichen Passagen wie z. B. einem Alternativtext. Findet im Dokument ein Sprachwechsel (anderssprachige Wörter oder Abschnitte) statt, muss dieser Sprachwechsel mittels des „Lang“- Attributs (üblicher Weise ein mit <Span> ausgewiesener inhaltlicher Bereich) ausgezeichnet sein und ist so für den definierten inhaltlichen Bereich anstelle der im Dokument hinterlegten Sprache hinterlegt.

Warum wird das geprüft?

Die Festlegung der im Dokument verwendeten Sprache ist für eine korrekte Ausgabe im Screenreader notwendig. Bei einer falschen Festlegung kann es z. B. passieren, dass deutscher Text mit englischer Betonung vorgelesen wird.

Wie wird geprüft?

Hinweis zu Sprachwechsel

  • Keinen praktischen Nutzen hat die Auszeichnung von Wörtern, die ohne Auszeichnung üblicherweise nicht anders ausgesprochen werden. Sie müssen nicht ausgezeichnet werden.
    • Beispiele für solche Wörter: Web, Link, Top, Enter, Helpdesk.
  • Ebenfalls nicht ausgezeichnet werden sollten gemischte Wörter.
    • Beispiele für solche Wörter: Webauftritt, Checkpunkt.

Einordnung im PAC-Tool

PDF/UA → Basic requirements → PDF syntax → Natural language →

  • Natural language of text objects
  • Natural language of alternative text
  • Natural language of actual text
  • Natural language of expansion text
  • Natural language of outlines can be determined
  • Natural language of Contents entries in annotations
  • Natural language of alternate names of form fields

Prüfung

  • Die hinterlegte Dokumentsprache können Sie im PAC auf der Hauptseite unter dem Dateinamen sehen.
  • Die Sprachen-Auszeichnung einzelner Wörter können Sie im PAC - Logical Structure sehen, indem Sie im linken Fenster "Structure Elements" das Element markieren und im rechten Fenster "Properties" unter Language die Sprachauszeichnung überprüfen.
  • Sind viele anderssprachige Wörter im Dokument vorhanden, lassen Sie sich das Dokument mit einem Screenreader vorlesen.
MP 11-001 – MP 11-005

Diese Fehlerkonditionen werden automatisch im PAC geprüft.

MP 11-006

Öffnen Sie das Dokument in pdfaPilot. Sofern das Switchboard nicht geöffnet ist, öffnen Sie es über Werkzeuge -> Switchboard. Wählen Sie dort /UA für die maschinelle Validierung.

Vorschlag zur Korrektur

Acrobat

  • Legen Sie die Dokumentsprache in Acrobat Pro über Datei – Eigenschaften – Erweitert fest (am Ende des Fensters)
  • Sie können einzelnen Segmenten (z.B. Erweiterungstext) eine andere Sprache als die Dokumentsprache über die Eigenschaften des Tags geben.

zurück zur Liste der Prüfschritte