PDF/A Archivformat

Das Dokumentenformat PDF wurde Anfang der neunziger Jahre von der Firma Adobe auf Basis der Seitenbeschreibungssprache “Postscript” entwickelt. Es war zuerst ein proprietäres, aber offen gelegtes Dateiformat und wurde dann im Jahr 2008 an die ISO übergeben und bildet seither in Version 1.7 den ISO Standard 32000.

PDF/A – Das PDF für die Archivierung:

PDF/A ist die Bezeichnung für die ISO-Norm 19005 und definiert ein Standard-Dokumentenformat für die Langzeitarchivierung elektronischer Dokumente. Die Norm legt fest welche PDF-Funktionen enthalten sein müssen bzw. welche nicht verwendet werden dürfen um Dokumente langfristig zu archivieren.

Wichtig: Der PDF/A Standard ist “aufbauend” – d.h. ist ein Dokument PDF/A-1 konform so ist es automatisch auch durch den PDF/A-2 und PDF/A-3 Standard abgedeckt – die höheren Standards erlauben mehr an PDF-Funktionen. Es gibt aber keinen “besseren” und “schlechteren” PDF/A Level sondern man stimmt den geforderten Level und Standard an die erforderlichen und gewünschten Funktionen an.

PDF/A-1 (ab 2006)

Für PDF/A-1 gibt es 2 Level:

  • PDF/A-1b: basic – dieser dient der eindeutigen visuellen Reproduzierbarkeit von PDF/A Dokumenten
  • PDF/A-1a: accesible – wie 1b – muss jedoch auch die inhaltlichen Strukturierung des Dokuments enthalten (Tagged PDF) – dieser Level kann nicht automatisiert durch direkte Konvertierung, Scan, OCR oder über Druckertreiber erzeugt werden – technisch ja, aber die inhaltliche Strukturierung muss üblicherweise bereits in der Ursprungsapplikation “manuell” erzeugt und ergänzt werden.

PDF/A-2  (ab Juni 2011)

Für PDF/A-2 gibt es 3 Level:

  • PDF/A-2b: basic – entspricht dem 1b – mit Erweiterungen des Level 2
  • PDF/A-2a: accessible – entspricht dem 1a – mit Erweiterungen des Level 2
  • PDF/A-2u: unicode - hierzu gibt es keine Entsprechung im Level 1 – entspricht dem Level 2b – jedoch muss der eingebettete Text im UniCode Standard abgebildet sein.

Erweiterungen gegenüber PDF/A-1 :

  • JPEG2000 Kompression
  • Transparenz
  • Ebenen
  • OpenType-Schriften
  • digitale Signaturen als PAdes (PDF Advanced Electronic Signatures)
  • Container: PDF/A-1 Dateien können in PDF/A-2 Dateien eingebettet werden
  • das Seitenlimit wurde erweitert auf 381 x 381 km

PDF/A-3 (ab Oktober 2012)

Die wesentliche Erweiterung des PDF/A Level 3 ist, dass es damit möglich wird beliebige Dateien und Dokumente direkt in das PDF/A einzubetten. Dadurch kann für die Archivierung eine PDF/A Datei für Suche, Anzeige und Ausdruck mit der Archivierung der originären digitalen Quell Datei kombiniert werden. Würde man für ein MS-EXCEL nur die PDF Datei archivieren, würden eventuell wichtige Zusatzinformationen wie z.b. die darauf basierenden Formeln verloren gehen. Die eingebetteten (Quell) Dateien lassen sich jederzeit wieder aus dem PDF extrahieren.

Weitere ISO normierte PDF Standards sind:

  • PDF/E – PDF forEngineering:ISO 24517PDF/E-Dokumente können insbesondere enthalten: Ebenen für Installations- und Konstruktionspläne sowie dreidimensionale Modelle inklusive vordefinierter 3D-Ansichten.
  • PDF/H (Healthcare) – PDF im Gesundheitswesen (Best Practice) für die bildgebenden Diagnostik und für die Speicherung von Patientendaten und medizinischen Befunden.
  • PDF/X (Exchange) für Druckvorlagen: ISO 15929 / 15930 – Der PDF/X-Standard wurde für den Austausch von Anzeigendaten für Zeitungen und Zeitschriften sowie für die Übermittlung von Druckvorlagen für Druckaufträge entwickelt. PDF/X gibt es in folgenden Levels: 1a, 2, 3, 4, 5, 5g, 5gp, 5n
  • PDF/UA (Universal Accessibility) – ISO 14289 – für universell zugängliche Dokumente, z. B. als Lesehilfe für sehbehinderte Menschen.
  • PDF/VT (Variable Transactional) – ISO 16612-2 – für den “Druck von variablen oder transaktionalen Dokumenteninhalten”
  • PDF Level 1,7 – ISO 32000: Die ISO hat das Portable Document Format (PDF) 1.7 als internationalen Standard verabschiedet.