Für den diesjährigen Open Cultural Data Hackathon stellt das Staatsarchiv Basel-Stadt das Adressbuch der Stadt Basel als Datensample zur Verfügung – eine verlockende Herausforderung für kluge Fragestellungen und für Datamining.
Um diese Frage zu beantworten, scheuten die Datenjournalisten der Tageswoche keine Mühe. Sie haben recherchiert, korrespondiert, Datenauszüge aus dem Grundbuch erworben und mussten schliesslich die Strasse auch physisch ablaufen, um herauszufinden, an wen die Ladenlokale vermietet wurden.
Die meisten dieser Fragen hätten mit einem Blick in das aktuelle Adressbuch (allerdings mit Daten aus dem Vorjahr) beantwortet werden können.
Das Strassenverzeichnis weist nämlich für jedes Haus pro Strasse die Eigentümer und die Mieter aus. Das Adressbuch der Stadt Basel ist eine vortreffliche Datenbasis für unzählige Fragestellungen mit Bezug zur Stadt Basel. In Kürze stellen wir exemplarisch drei Jahrgänge (1887, 1899, 1910) als PDF, Bilddaten und XML/ALTO (aus OCR Texterkennung) vor. Im Rahmen des Projekts Sicherung und Nutzbarmachung werden die Jahrgänge 1789-1954 digitalisiert. Am Hackathon möchten wir herausfinden, wie sich diese umfangreiche und dichte Informationsquelle am besten nutzbar machen lässt. Denn es ist klar, am liebsten hätte man nicht nur ein OCR, sondern korrekt strukturierte Daten. Aber ich bin mal gespannt, was mit diesem Rohmaterial bereits gemacht werden kann.
Neueste Kommentare