Richtlinien für Transkription von Archivgut

Diese Seite ausdrucken
Allgemein, Digitale Edition

Das Staatsarchiv Basel-Stadt digitalisiert Archivgut, um es zu schonen und um die Benutzung zu erleichtern. In der Regel heisst Digitalisierung: Herstellen eines digitalen Abbilds. Die Vorlagen werden also nicht in Volltext transkribiert, dazu fehlt dem Archiv schlicht und einfach die nötige Zeit.

Aber man muss ja nicht alles selber machen. Fast täglich sitzen Benutzerinnen und Benutzer im Lesesaal vor Akten und erstellen Abschriften. Diese können die Archiv-Digitalisate ideal ergänzen. Es kann nun in der Volltextsuche ein Einzeldokument durchsucht werden. Und wer der alten Handschriften nicht kundig ist, kann die Informationen aus der handschriftlichen Vorlage dennoch nutzen.

Um Benutzende zu unterstützen, veröffentlicht das Staatsarchiv nun seine Richtlinien hier im Auszug und vollständig auf seiner Website.

Grundsätze

Die Richtlinien verstehen sich als Mindestanforderungen, die bei einzelnen Transkriptions- und Editionsvorhaben erweitert werden können.

Bei der Erstellung der Transkriptionen sind die allgemeinen Anforderungen wissenschaftlicher Forschung – Genauigkeit, Verlässlichkeit, Verifizierbarkeit, Unparteilichkeit
und Unabhängigkeit – zu erfüllen.

Die Richtlinien gelten für die Transktiption handschriftlicher Texte.

Die Volltexterfassung gedruckter Texte folgt konsequent der Druckvorlage. Die Erfassung von in Fraktur gesetzten Drucken folgt konsequent der Druckvorlage. Dabei sind die Buchstabenformen zu normalisieren.

Transkriptionen werden, sofern im StABS ein Digitalisat der Archivalien vorhanden ist, nicht nur in das Archivinformationssystem integriert, sondern auch in die Metadatendatei des Digitalisats integriert.

Ein Digitalisat besteht aus folgenden Komponenten:

  • Pro Seite der Archivalie eine Bilddatei
  • Für die Archivalie eine XML-Metadatendatei nach dem METS-Standard.
  • In die Metadatendatei wird das Transkript als XML-Struktur integriert.

Nutzungsrechte des StABS an der Transkription

Damit die angestrebten Ziele auch realisiert werden können, ist neben der Einhaltung der nachstehenden Editions- und Transkriptionsregeln seitens der Herausgeber auch die Übertragung von Nutzungsrechten an das Staatsarchiv notwendig. Das Staatsarchiv kann Transkriptionen sowohl im Archivinformationssystem als auch in den Digitalisaten nachnutzen, wenn ihm diese unter einer Creative Commons Namensnennung – Nicht-kommerziell -Weitergabe unter gleichen Bedingungen 3.0 Schweiz Lizenz überlassen werden. Die wesentlichen Bestimmungen dieser Lizenz lauten:

Das Werk bzw. der Inhalt darf vervielfältigt, verbreitet und öffentlich zugänglich gemacht werden und es dürfen Abwandlungen und Bearbeitungen des Werkes bzw. Inhaltes erstellt
werden, solange folgende Bedingungen eingehalten werden:

  • Namensnennung — Der Name des Autors/Rechteinhabers ist in der von ihm festgelegten Weise zu nennen.
  • Keine kommerzielle Nutzung — Dieses Werk bzw. dieser Inhalt darf nicht für kommerzielle Zwecke verwendet werden.
  • Weitergabe unter gleichen Bedingungen — Wenn das lizenzierte Werk bzw. den lizenzierten Inhalt bearbeitet oder in anderer Weise erkennbar als Grundlage für eigenes
    Schaffen verwendet wird, dürfen die daraufhin neu entstandenen Werke bzw. Inhalte nur unter Verwendung von Lizenzbedingungen weitergeben, die mit denen dieses Lizenzvertrages identisch oder vergleichbar sind.

Anforderungen an die Übergabe der Transkription

Bei der Übergabe an das Staatsarchiv ist auch eine knappe Beschreibung der Transkription notwendig, die folgende Angaben enthält:

  • Name, Adresse und Emailadresse des Herausgebers,
  • Angabe des Kontextes, in dem die Transkription entstanden ist,
  • Erklärung des Herausgebers, dass er die Transkription dem Staatsarchiv unter einer Creative Commons Namensnennung – Nicht-kommerziell – Weitergabe unter gleichen Bedingungen 3.0 Schweiz Lizenz zur Nutzung überlässt.
  • Dateinamen und Dateiformat der gelieferten Objekte,
  • die Archivsignatur der transkribierten Archivalie,
  • ggf. Angabe der URL des verwendeten Digitalisats des Staatsarchivs, Nennung der bei der Erstellung der Transkription verwendeten Anwendungen (inkl.Versionsangabe) und des Betriebssystems,
  • Angabe, ob die Unicode-Text-Fassung Zeilenumbrüche enthält und wenn ja, wie diese markiert sind,
  • Hinweis, ob die Transkriptionsregeln angepasst worden sind,
  • ggf. Nennung der Abweichungen von den Transkriptionsregeln oder Angabe der Online-Ressource, falls ein anderes Regelwerk verwendet wurde.
  • ggf. Angabe, welche Anwendungen und Regelwerke/Style Sheets bei der Erstellung von XML-Dateien gemäss dem TEI- oder ALTO-Standard verwendet wurden.

Anforderungen an das digitale Objekt

  • Der transkribierte Text muss in der definitiven Fassung in dem für die Erstellung verwendeten Dateiformat vorliegen.
  • Es muss die verwendete Applikation inkl. Versionsangabe und das genutzte Betriebssystem angegeben werden.
  • Der transkribierte Text muss zudem als Unicode Text-Datei in der UTF-8-Kodierung vorliegen. Diese Datei enthält die definitive Fassung des Transkripts und soll aus dem Dateiformat, das für die Erstellung verwendet wurde, heraus generiert werden.
  • Alternativ zur Unicode-Text-Fassung kann die Transkription auch als XML-Datei gemäss dem TEI- oder ALTO-Standard vorliegen. Auch in diesem Fall ist Unicode UTF-8 für die Zeichenkodierung zu verwenden.
  • Der transkribierte Text kann zudem in als PDF-Datei, vorzugsweise PDF/A, vorliegen.
  • Fussnoten und Anmerkungen müssen in der Unicode-Text-Fassung des Transkripts wiedergegeben werden können. Nach der Umwandlung ist dies zu überprüfen.
  • Die Unicode-Text-Fassung der Transkription darf keine Elemente aus der Kopf- und Fusszeile von gängigen Officeanwendungen enthalten. Dies ist nach der Umwandlung zu überprüfen und ggf. durch Nachbearbeitung zu erreichen.
  • Wird die Transkription zeilenidentisch erstellt, muss bei der Umwandlung in die Unicode-Text-Fassung der Zeilenumbruch beibehalten werden. Es soll in diesem Fall auch angegeben werden, wie der Zeilenumbruch definiert ist: Mit Wagenrücklauf/carriage return (CR) oder Zeilenvorschub/line feed (LF) oder mit beiden und wenn letzteres, in welcher Reihenfolge.

Anforderungen an den digitalen Text

  • Die Überführung des handschriftlichen in einen digitalen Text ist möglichst genau vorzunehmen. Es soll eine weitgehend diplomatische Umschrift erfolgen, d. h. Normalisierung
    und Modernisierung des Textes sollen möglichst gering ausfallen.
  • Abweichungen von den nachstehenden Transkriptionsregeln sind zu benennen.
  • Das verwendete Regelwerk ist über den gesamten Text einheitlich anzuwenden.
  • Die verwendete Vorlage ist eindeutig zu bezeichnen; insbesondere ist die Archivsignatur, ggf. die URL des Digitalisats anzugeben.
  • Bildet ein Digitalisat des Staatsarchivs die Vorlage für die Edition resp. Transkription, ist dies anzumerken.
  • Bei der Seitenzählung ist neben der Seitenzählung (inkl. ergänzte Seiten durch den Herausgeber) auch die Scannummer anzugeben. Dabei steht die Scannummer nach der Seitenzählung in eckigen Klammern [scan_xxx].

Anforderungen an die Transkription

Textgestaltung

  • Die Seitenzählung ist beizubehalten; fehlende Paginierung ist zu ergänzen und die ergänzten Seitenzahlen in eckige Klammern [ ] zu setzen.
  • Seitenzahlen werden zu Beginn einer neuen Seite der Vorlage auf der ersten Zeile platziert.
  • Der Seitenwechsel der Vorlage wird durch doppelten Schrägstrich // gefolgt von einer Zeilenschaltung markiert.
  • Der Zeilenwechsel der Vorlage wird durch einfachen Schrägstrich / markiert.
  • Die Markierungen für Seite- und Zeilenwechsel werden auch gesetzt, wenn die Transkriptions seiten- und zeilenidentisch erfolgt.
  • Titelblätter werden zeilenidentisch wiedergegeben.
  • Wenn eine Zeilenzählung verwendet wird, soll diese durch eckige Klammern als Zusatz des Herausgebers gekennzeichnet sein und als eindeutiges Kennzeichen als erstes Zeichen innerhalb der Klammer ein kleines z enthalten.

Buchstaben, Zahlen und Zeichen

  • Grundregel ist die buchstabengetreue Wiedergabe.
  • Verschreibungen und Fehler werden wiedergegeben und im Kommentar vermerkt.
  • Schreibvarianten einzelner Buchstaben werden nicht wiedergegeben.
  • Diakritische Zeichen und übergeschriebene Buchstaben werden buchstabengetreu wiedergegeben. Alternativ können diese wie folgt normalisiert werden:
    Übergeschriebene Buchstaben werden nachgestellt und durch vorangestelltes # gekennzeichnet.
    Übergeschriebene zweiteilige Zeichen werden als ¨ wiedergegeben,
    Übergeschriebene einteilige Zeichen werden buchstabengetreu wiedergegeben.
  • Nicht eindeutig identifizierbare Ligaturen können wiedergegeben oder aufgelöst werden. Das verwendete Verfahren ist anzugeben.
  • Kurzes oder rundes und langes oder Schaft- s werden nicht differenziert.
  • ß wird wiedergebenen und von sz unterschieden. Im Zweifelsfall wird sz verwendet.
  • Die Buchstabenkombinationen cz und tz werden gemäss Vorlage wiedergegeben. Im Zweifelsfall wird tz verwendet.
  • Die Buchstabenkombinationen dz, dc, wz werden gemäss Vorlage wiedergegeben oder aufgelöst. Das verwendete Verfahren ist anzugeben.
  • Zwei Punkte (ÿ) oder ein Strich über y werden weggelassen; der Buchstabe wird als y wiedergegeben.
  • u und v werden gemäss der Vorlage wiedergegeben.
  • i und j werden gemäss der Vorlage wiedergegeben.
  • Der Geminationsstrich bei n und m wird in nn und mm aufgelöst.
  • Distinktionszeichen über u, die eine Verwechselung mit n verhindern sollen, werden nicht wiedergegeben.
  • Römische und arabische Zahlen werden gemäss der Vorlage wiedergegeben. Römische Zahlen werden dabei stets klein geschrieben.
  • Gedankenstrich (–), Trennungsstrich (-), Bis-Strich (–) entsprechen dem heutigen Zeichenbestand.
  • Ein doppelter Abkürzungspunkt ist durch einen einfachen Punkt wiederzugeben.
  • Anführungs- und Schlusszeichen sind durch gerade Anfühungs- und Schlusszeichen wiederzugeben. Typografische Anführungs- und Schlusszeichen dürfennicht verwendet werden.

Interpunktion

  • Die Interpunktion der Vorlage – auch im Wortinneren und bei Ordinal- und Kardinalzahlen – ist unverändert zu übernehmen.
  • Die Virgel ist durch Komma zu ersetzen.

Wortabstand

  • Ein vorhandener Wortabstand wird durch ein Leerzeichen wiedergegeben.
  • Die Variabilität des Wortabstands in der Handschrift ist bei der Transkription zu berücksichtigen.

Gross- und Kleinschreibung

  • Es wird die Schreibung der Vorlage übernommen.
  • Wenn die Buchstabenformen nicht eindeutig zu unterscheiden sind, ist Kleinschreibung zu verwenden.
  • Grosschreibung erfolgt abweichend immer am Satzanfang und bei Eigennamen.
  • Unsicherheiten sind anzumerken.

Zusammen- und Getrenntschreibung

  • Die Schreibung der Vorlage wird übernommen.
  • In Zweifelsfällen kann die heutige Schreibweise verwendet werden; Zweifelsfälle sind anzumerken.

Hervorhebungen

  • Verlängerte Buchstaben, Unterstreichungen, Sperrungen, Farben werden nicht
    dargestellt. sie können in Anmerkungen nachgewiesen werden.
  • Bei einer Erfassung mittels TEI oder ALTO sind Hervorhebungen über Auszeichnungselemente
    wiederzugeben.

Lateinische Schrift (antiqua)

  • In Texten mit deutscher Kurrentschrift als Grundschrift werden Inhalte in lateinischer
    Schrift kursiv wiedergegeben.
  • Bei der Umwandlung in Unicode-Text-Datei kann die Auszeichnung als kursiv resp. Antiqua über die Einfügung der folgenden Auszeichnungseelement erfolgen: <kursiv> zu Beginn der entsprechenden Textpassage und </kursiv> am Ende der entsprechenden Textpassage.
  • Bei einer Erfassung mittels TEI oder ALTO sind kursiv wiedergegebene Textpassagen über Auszeichnungselemente wiederzugeben.

Abkürzungen

  • Abkürzungen, die das Textverständnis nicht erschweren, werden wiedergegeben.
  • Alle anderen Abkürzungen werden aufgelöst.
  • Unsichere Auflösungen werden durch eckige Klammern gekennzeichnet, wobei zwecks Volltextsuche das gesamte Wort in eckige Klammern gesetzt wird und
    nicht nur der aufgelöste Teil.
  • Der Abkürzungspunkt entfällt bei der Auflösung.
  • Konventionelle Kürzungszeiche am Wortende werden stillschweigend aufgelöst.

Korrekturen Ergänzungen, Streichungen oder Anmerkungen

  • Streichungen in der Vorlage werden transkribiert und in geschweifte Klammern { } gesetzt.
  • Ergänzungen, auch Korrekturen, in der Vorlage werden in spitze Klammern gesetzt < >.
  • Ergänzungen am Rande (Marginalien) werden ebenfalls in spitze Klammern < > gesetzt und in den Text aufgenommen. Mittels Kommentar wird nachgewiesen, dass es sich um eine Marginalie handelt.
  • Streichungen und Ergänzungen von späterer Hand sind im Kommentar als solche nachzuweisen.
  • Fussnoten und Anmerkungen der Vorlage sind als solche wiederzugeben. Die originale Nummerierung ist wiederzugeben. Sie sind als originale Fussnoten und Anmerkungen zu kennzeichnen, sofern Fussnoten und Anmerkungen durch den Herausgeber vorhanden sind.
  • Bearbeitungsspuren auf der Vorlage sind als Ergänzungen oder Streichungen zu behandeln.

Lücken, Mängel und Leerstellen in der Vorlage

  • Lücken in der Vorlage, die auf Textverderbnis zurückzuführen sind, sind mit [xxx] zu kennzeichnen und können in einer Anmerkung genauer beschrieben werden (Rasur, Frassspuren, Brandloch, Tintenfleck).
  • Unleserliche Passagen sind mit [unleserlich] zu kennzeichnen und können in einer Anmerkung genauer beschrieben werden.
  • Leerstellen und Leerblätter in der Vorlage sind durch drei Punkte … zu kennzeichnen und der Umfang in einer Anmerkung festzuhalten.

Zusätze des Herausgebers

  • Alle Zusätze des Herausgebers sind in eckige Klammern [ ] zu setzen.
  • Unsichere Lesarten von Wörtern können durch nachgestelltes [?] gekennzeichnet und in Anmerkungen genauer beschrieben werden.
  • Auslassungen werden durch […] gekennzeichnet. Der Umfang der Auslassung ist in einer Anmerkung nachzuweisen. In der Vorlage fehlende Buchstaben können ergänzt werden. Die ergänzten Buchstaben müssen durch eckige Klammern gekennzeichnet werden.
  • Fussnoten und Anmerkungen durch den Herausgeber werden in eckige Klammern gesetzt. Die Fussnotenzeichen sind ebenfalls in eckige Klammern zu setzen