Datamining im Adressbuch

Diese Seite ausdrucken
Anlässe, Digitalisierung, Projekt Sicherung & Nutzbarmachung

Adressbuch der Stadt Basel

Für den diesjährigen Open Cultural Data Hackathon stellt das Staatsarchiv Basel-Stadt das Adressbuch der Stadt Basel als Datensample zur Verfügung – eine verlockende Herausforderung für kluge Fragestellungen und für Datamining.

Wie viel Information im Basler Adressbuch steckt, wurde mir erst bewusst, als die Tageswoche den Artikel „Wem gehört die Freiestrasse?“ veröffentlichte. Der Artikel beleuchtete die Besitzverhältnisse der Basler Innenstadt. Wie viele Liegenschaften sind noch in Basler Händen? Wie viele gehören auswärtigen oder internationalen Investoren?

Um diese Frage zu beantworten, scheuten die Datenjournalisten der Tageswoche keine Mühe. Sie haben recherchiert, korrespondiert, Datenauszüge aus dem Grundbuch erworben und mussten schliesslich die Strasse auch physisch ablaufen, um herauszufinden, an wen die Ladenlokale vermietet wurden.

Die meisten dieser Fragen hätten mit einem Blick in das aktuelle Adressbuch (allerdings mit Daten aus dem Vorjahr) beantwortet werden können.

Das Strassenverzeichnis weist nämlich für jedes Haus pro Strasse die Eigentümer und die Mieter aus. Das Adressbuch der Stadt Basel ist eine vortreffliche Datenbasis für unzählige Fragestellungen mit Bezug zur Stadt Basel. In Kürze stellen wir exemplarisch drei Jahrgänge (1887, 1899, 1910) als PDF, Bilddaten und XML/ALTO (aus OCR Texterkennung) vor. Im Rahmen des Projekts Sicherung und Nutzbarmachung werden die Jahrgänge 1789-1954 digitalisiert. Am Hackathon möchten wir herausfinden, wie sich diese umfangreiche und dichte Informationsquelle am besten nutzbar machen lässt. Denn es ist klar, am liebsten hätte man nicht nur ein OCR, sondern korrekt strukturierte Daten. Aber ich bin mal gespannt, was mit diesem Rohmaterial bereits gemacht werden kann.