Beispiele für die Volltextdigitalisierung komplexer Vorlagen

Oekonomische Encyklopädie von Johann Georg Krünitz

Datenvolumen: 242 Bände mit ca. 240.000.000 Zeichen, davon 90% in Fraktur

Erfassungskosten: 0,65 Euro pro 1.000 Zeichen; ca. 150.000 Euro

Erfassungszeit: ca. 12 Monate

In der Frakturschrift sind beispielsweise „langes s“ und „f“ sowie „u“ und „n“ nicht leicht zu unterscheiden. Daher wurde die Vorlage teilweise im Triple-Keying-Verfahren erfasst. Außerdem waren umfangreiche Prüf- und Korrekturarbeiten erforderlich. Um Fehllesungen aufzuspüren, wurde ein kombinatorischer Buchstabenvergleich durchgeführt. Dabei wurden auch zahlreiche Verschreibungen des Originals gefunden, deren Korrekturen als zusätzliche Angaben in den digitalisierten Text einfließen konnten.

zur Projektseite

Open

Open

Briefkorrespondenz von Johann I. Bernoulli

Datenvolumen: 5.000 Seiten maschinenschriftliche Transkriptionen der Originalbriefe, ca. 10% mathematische Formeln

Erfassungskosten: 0,65 Euro pro 1.000 Zeichen; ca. 9.200 Euro

Erfassungszeit: ca. 2 Monate

Codierung: Sonderzeichen in UNICODE, mathematische Formeln mit Hilfe von LaTeX, Transformation in TEI-XML mit eingebettetem MathML

zur Projektseite

 

Uigurisches Wörterbuch

Datenvolumen: 6 Lieferungen mit ca. 2.630.000 Zeichen

Erfassungskosten: 0,60 Euro pro 1000 Zeichen; ca. 1.800 Euro

Erfassungszeit: 2 Monate

Codierung: chinesische Schriftzeichen in UNICODE, zahlreiche Sonderzeichen aus den wissenschaftlichen Transkriptionen und Transliterationen sind noch nicht standardisiert

zur Projektseite

Open