2.3 Kommunales Open-Data-Wiki als eine Form von Open Source (Stefan Kaufmann)

Kurzfassung: Open Data ist ein aktuell häufig gebrauchter Begriff, wenn es um Transparenz und Bürgerbeteiligung geht. Einer Kom­mune, die offene Daten veröffentlichen möchte, stellen sich aber einige Fragen: Was sind eigentlich offene Daten? Wie sollte man sie am besten veröffentlichen? Welche Lizenzfragen sind zu beachten? Und kommt man von reinen Urdaten zu tatsächlichen Angeboten für Information und Beteiligung?

Über den Autor: Stefan Kaufmann, geboren 1985, studiert Medieninformatik an der Universität Ulm und ist Mitgründer der Arbeitsgrup­pe datalove ulm, die hinter http://ulmapi.de und weiteren Open-Data-Anstrengungen in Ulm und für das Land Baden-Württemberg steht.      Kontaktadresse: datalove[at]uni-ulm.de

 

Wozu überhaupt die Öffnung von Daten?

Anna ist nachdenklich. In der Mittagspause hatte sie sich mit Kolleg*innen über die Ausgaben ihrer Stadt unterhalten: Patrick war der Ansicht, dass das meiste Geld in Prestigebauten im Stadtzentrum gesteckt werde, während jedes Frühjahr auf den Straßen seines Stadtteils die Schlaglöcher sprössen und nicht repariert würden. Anna hielt dagegen; in ihrem Stadtteil werden Straßenschäden zügig beseitigt, und sie glaubt sich zu erinnern, dass die meisten von Patrick angeführten Bauten gar nicht von der Stadt ausgeführt werden.

Anna beschließt, auf der Website ihrer Stadt nach Antworten zu suchen. Zu ihrer Freude findet sie dort verschiedenste Informationen ihrer Stadt nicht nur wie bisher als schwer durchsuchbare PDF-Dateien, sondern auch die zugehörigen Rohdaten nebst Links auf verschiedene Darstellungsformen dieser Daten – zum Teil von der Stadt selbst bereitgestellt, zum Teil von Bür­ger*innen und Journalist*innen. Anhand einer Tree-Map hat Anna mit weni­gen Klicks einen Eindruck von den Größenverhältnissen der verschiedenen städtischen Ausgaben gewonnen, und auf einer Karte kann sie nachvollziehen, welche Arbeiten der städtische Bauhof im vergangenen Jahr wann und wo gemacht hat und welche Bauvorhaben durch welche Bauträger durchgeführt werden.

Anna kann Patrick nun hinsichtlich der Investitionsmengen widersprechen – weiß nun aber auch, dass in seinem Stadtviertel tatsächlich deutlich weniger Straßenschäden instand gesetzt werden.

Dieses Szenario zeigt kurz, welche Möglichkeiten sich einer Kommune eröffnen, wenn sie möglichst viele ihrer Daten als Open Data veröffentlicht: Einerseits kann somit Transparenz gegenüber den Bürger*innen hergestellt werden, andererseits werden Bürgerinnen und Bürger dadurch aber auch aus ihrer passiven Rolle herausgedrückt und zur aktiven Teilnahme an Gestaltungsprozessen eingeladen. In Dobusch (2011) wird beispielhaft beschrieben, wie es ab hier weitergehen könnte: Ein Ticketsystem ermöglicht es in unserer fiktionalen Stadt allen Bürger*innen, Straßenschäden, ausgefallene Straßenbeleuchtung oder überquellende Müllbehälter direkt an die Kommune zu melden. Die Tickets werden wiederum direkt an die zuständigen Stellen zur Bearbeitung verteilt und die Melder*innen über ihre Eingabe auf dem Laufenden gehalten. In Patricks Stadtteil könnte nun einfach die Meldequote für Straßenschäden zu gering sein – oder aber der Bauhof hat hier Optimierungs­potenzial in seinem Betriebsablauf, das bislang noch niemandem aufgefallen war. Diese Transparenz auch nach innen hin ist der dritte Vorteil offener Daten.

Unser Beispiel zeigt jedoch deutlich, dass es mit der reinen Bereitstellung von Daten nicht getan ist. Dritte haben die Urdaten verknüpft und ausgewertet; reine Daten zu Information gemacht, aufgrund derer Schlussfolgerungen gezogen werden können. Neben Fackelträgern in der Verwaltung, die sich für die Öffnung der Daten einsetzen, bedarf es also auch Fackelträgern aus der Bevölkerung: Datenjournalist*innen, Entwickler*innen, Studierende, die die Urdaten quasi „veredeln“. Diese beiden Gruppen zu finden und zusammenzuführen ist einer der wichtigsten Schritte in einer Open-Data-Strategie. In Ulm beispielsweise hatten sich interessierte Entwickler*innen und Studierende 2010 zur datalove-Arbeitsgruppe zusammengeschlossen und waren auf eine Stadt mit offenen Ohren gestoßen – dieses Zusammenspiel erlaubte es, bedarfsgerecht interessante Datensätze zu identifizieren und aus diesen Anwendungen zu entwickeln, die tatsächliche eigene Probleme lösten.

 


Was sind offene Daten?

„Offene Daten sind Daten, die von jedermann frei genutzt, wiederverwendet und weitergegeben werden können und dies höchstens mit der Maßgabe einer Namensnennung des Urhebers sowie der Forderung einer Weitergabe unter gleichen Bedingungen.“ (opendatamanual 2011)

In Bezug auf Kommunen heißt dies: Offene Daten sind alle Daten, die von der öffentlichen Hand erhoben werden und gegen deren Veröffentlichung keine Persönlichkeitsrechte sprechen. Es geht also nicht um personenbezogene Daten, sondern beispielsweise Raumordnungspläne, Haushaltsdaten, Geoinformationen und vergleichbare Datensätze. Viele dieser Daten werden ohne­hin im Rahmen der Transparenzpflicht veröffentlicht, jedoch meistens nur verdichtet, in Form eigener Jahrbücher und so gut wie nie in maschinenlesbaren Formaten.

Eine genauere Definition

Es gab über die Zeit verschiedene Formaldefinitionen mit (weitgehend übereinstimmenden) Kriterien, die an offene Daten gestellt werden. Die aktuellste Fassung ist die „Open Definition“ (http://opendefinition.org/okd/deutsch), die hier zitiert werden soll:

  • Ein Werk ist offen, wenn die Art und Weise seiner Verbreitung folgende Bedingungen erfüllt:
  • Zugang: Das Werk soll als Ganzes verfügbar sein, zu Kosten, die nicht höher als die Reproduktionskosten sind, vorzugsweise zum gebührenfreien Download im Internet. Das Werk soll ebenso in einer zweckmäßigen und modifizierbaren Form verfügbar sein.
  • Weiterverbreitung: Die Lizenz darf niemanden hindern, das Werk entweder eigenständig oder als Teil einer Sammlung aus verschiedenen Quellen zu verschenken oder zu verkaufen. Die Lizenz darf keine Lizenzzahlungen oder andere Gebühren für Verkauf oder Verbreitung erfordern.
  • Nachnutzung: Die Lizenz muss Modifikationen oder Derivate erlauben, ebenso wie deren Weiterverbreitung unter den Lizenzbedingungen des ursprünglichen Werks.
  • Keine technischen Einschränkungen: Das Werk muss in einer Form zur Verfügung gestellt werden, die keine technischen Hindernisse für die Durchführung der oben genannten Nutzungen beinhaltet. Dies kann durch die Bereitstellung des Werks in einem offenen Datenformat erreicht werden, dessen Spezifikation öffentlich und frei verfügbar ist und das keine finanziellen oder anderen Hindernisse bezüglich der Nutzung auferlegt.
  • Namensnennung: Die Lizenz kann als Bedingung für Weiterverbreitung und Nachnutzung des Werkes die Nennung der Namen seiner Urheber und Mitwirkenden verlangen. Sollte diese Bedingung gestellt werden, darf sie nicht behindernd wirken. Zum Beispiel sollte, sofern eine Namensnennung verlangt wird, dem Werk eine Liste derjenigen Personen beigefügt sein, deren Namen zu nennen sind.
  • Integrität: Die Lizenz kann als Bedingung für die Verbreitung des Werkes in modifizierter Form verlangen, dass das Derivat einen anderen Namen oder eine andere Versionsnummer als das ursprüngliche Werk erhält.
  • Keine Diskriminierung von Personen oder Gruppen: Die Lizenz darf keine Einzelpersonen oder Personengruppen diskriminieren.
  • Keine Einschränkung der Einsatzzwecke: Die Lizenz darf niemanden daran hindern, das Werk zu einem beliebigen Zweck einzusetzen. Zum Beispiel darf die Nutzung des Werkes für kommerzielle Zwecke oder zur Genforschung nicht ausgeschlossen werden.
  • Lizenzvergabe: Die rechtlichen Bedingungen, denen ein Werk unterliegt, müssen bei der Weiterverteilung an alle Empfangenden übergehen, ohne dass diese verpflichtet sind, zusätzliche Bedingungen zu akzeptieren.
  • Die Lizenz darf nicht an eine spezifische Sammlung gebunden sein: Die rechtlichen Bedingungen, denen ein Werk unterliegt, dürfen nicht davon abhängen, ob das Werk Teil einer spezifischen Sammlung ist. Wenn das Werk der Sammlung entnommen und innerhalb deren Lizenzbestimmungen verwendet oder verbreitet wird, müssen alle Parteien, an die das Werk weiterverteilt wird, sämtliche Rechte erhalten, mit denen auch die ursprüngliche Sammlung ausgestattet war.
  • Die Lizenz darf die Verbreitung anderer Werke nicht einschränken: Die Lizenz darf anderen Werken, die mit dem lizensierten Werk gemeinsam weitergegeben werden, keine Beschränkungen auferlegen. Die Lizenz darf beispielsweise nicht dazu verpflichten, dass alle Werke, die auf demselben Medium enthalten sind, offen sind.

 

Argumente für offene Daten

Die Daten auf den Speichern der öffentlichen Hand sind wertvoll. Eine aktive und informierte Öffentlichkeit kann ihre Informationrechte einfach und schnell selbst wahrnehmen, wenn sie selbst darauf Zugriff hat. Die Umsetzung ihrer Transparenzanforderungen erzeugt dann auch auch keine überdimensionalen manuellen Zusatzaufwand bei den IT-Abteilungen der Kom­munen.

Öffentliche Daten können die Triebkraft für innovative Dienstleistungen sein, wenn z.B. kleine Unternehmen auf aus den Daten erkennbare Bedürfnisse der Bürger*innen reagieren: Beispielhaft stehen Erfüllungen von Informationsbedürfnissen, für die die öffentliche Hand keine eigenen Dienst­leistungen anbieten kann.

Daten zu erheben und zu pflegen, ist darüber hinaus kostspielig – verwendet werden sie innerhalb der Behörden in der Regel jedoch nur von Wenigen, im schlimmsten Fall sogar nur ein einziges Mal. Man kann also argumentieren, dass die Daten durch Steuergelder finanziert und für das Allgemeinwohl erhoben und erstellt wurden – und somit quasi den Steuerzahler*innen gehören, nicht der erstellenden Behörde.

 

Lizenzfragen

Selbst wenn Daten „nur“ als PDF auf dem kommunalen Webauftritt veröffentlicht werden, können diese theoretisch für Visualisierungen und Auswertungen verwendet werden: Auch PDF-Dateien können mehr oder weniger automatisiert ausgewertet und zur Weiterverarbeitung in ein Rohdatenformat überführt werden. Daten sind also nicht vor einer weiteren Auswertung „geschützt“, wenn sie sozusagen in einem PDF „versteckt“ sind, lediglich der Aufwand für Interessierte steigt. Das gewichtigere Problem in diesem Fall liegt bei der Lizenzdefinition für solch einen Datensatz. Falls eine Kommune anstrebt, ihre Daten zur weiteren Verwertung als offene Daten freizugeben, sollte sie dies unbedingt auch durch die Wahl einer geeigneten freien Lizenz unterstützen, um rechtliche Unklarheiten auszuräumen.

 

Lizenz passend für by sa
Creative Commons Namensnennung (cc-by) Allgemeine Inhalte Ja Nein
Creative Commons Namensnenung-Weiter­gabe unter gleichen Bedingungen (cc-by-sa) Allgemeine Inhalte Ja Ja
Creative Commons CCZero (cc-0) Inhalte, Daten(banken) Nein Nein
Open Data Commons Attribuierung (odc-by) Daten(banken) Ja Nein
Open Database License (ODbL) Daten(banken) Ja Ja

Von Creative Commons bis ODbL

Analog zu den deutlich älteren, verschiedenen Lizenzformen für Freie und Open-Source-Software wurden in den letzten Jahren mehrere Lizenzmodelle entwickelt, die unter anderem auch auf Texte, Bilder und Datenbanken anwendbar sind und für die Veröffentlichung offener Daten herangezogen werden können. Wichtig ist hier, gemäß der Open-Data-Definition maximal die Attribuierung (also die Nennung der Datenquelle) und die Wiedergabe zu gleichen Bedingungen („Share-alike“) als Lizenzbedingung zu fordern. Die Freigabe nur zu nichtkommerziellen Zwecken wie bei der Creative-Com­mons-NC-Lizenz entspricht nicht den Prinzipien von Open Data.

CC-0 und gemeinfreie Daten: Wenn alles erlaubt sein soll

Einen Sonderfall stellen gemeinfreie Daten dar, also beispielsweise historische Werke, deren Urheber vor mehr als 70 Jahren verstorben sind, oder of­fene Daten, bei denen die veröffentlichende Stelle selbst die Namensnennung nicht verbindlich vorschreiben möchte. Für gemeinfreie Daten gibt es keine einheitliche Kennzeichnung, vielfach wird hierfür ein durchgestrichenes
Co­py­right-Symbol verwendet. Für theoretisch noch urheberrechtlich ge­schütz­te Daten, die zur freien Verwendung ohne weitere Bedingungen frei­gegeben wer­den sollen, ist die Lizenzierung unter der Creative-Commons-Lizenz CC-0 möglich.

 

Behördendaten zu offenen Daten machen – aber wie?

Für eine Kommune, die erste Schritte mit offenen Daten unternehmen möch­te, stellt sich zunächst die Frage, was denn überhaupt veröffentlicht werden soll. Die naheliegenste Strategie ist es, Daten bereitzustellen, die ohnehin in irgendeiner Form veröffentlicht werden sollen, beispielsweise statistische Daten, die bislang in einem gedruckten Jahresbericht erschienen. Solche „niedrig hängenden Früchte“ können als Experimentalfeld dienen, um einen Prozess für die eigene Open-Data-Strategie zu definieren und im Laufe der Zeit zu verfeinern. Die folgenden Beispiele orientieren sich am Fünf-Sterne-Modell von Sir Tim Berners-Lee, das er auf der gov2.0 expo 2010 zur Klassifizierung offener Daten vorschlug (Summers 2010).


Ein Stern: Daten, egal wie

Die simpelste Variante ist die Bereitstellung der betreffenden Daten auf der eigenen Website, egal in welchem Format. Dies bedeutet, dass die betreffen­de Information überhaupt irgendwie von interessierten Bürger*innen gefunden und verwendet werden kann. Diese Variante bedeutet den geringsten Arbeitsaufwand für die Kommune, ist aber mit einigen Nachteilen für mögliche Nutzer*innen verbunden: Eine Weiterverarbeitung der Daten ist nur mühselig möglich, und auch für Suchmaschinen stellen PDF-Dateien oder gar gescannte Dokumente in Form von Bilddateien gewisse – womöglich un­überwindbare – Hürden dar. Um diese Daten zu offenen Daten zu machen, muss unbedingt schon an dieser Stelle eine passende Lizenzform gewählt werden, die die Weiterverarbeitung ausdrücklich gestattet.

Zwei und Drei Sterne: Strukturierte Daten und offene Formate

Eine Stufe höher auf der Fünf-Sterne-Skala rangiert die Veröffentlichung von Daten in strukturierter Form – also einer Excel-Datei anstelle eines Tabel­lenscans, oder ein Protokoll im Office-Format anstelle einer PDF-Datei. Diese Variante ist für die bereitstellende Kommune ebenfalls relativ unkompliziert, bringt jedoch immer noch Probleme mit sich: Proprietäre Dateiformate sind möglicherweise nicht mit freier Software korrekt darstellbar oder führen zu Kompatibilitätsproblemen. Zudem ist speziell eine automatisierte Auswer­tung und Verwendung mit Scripten mit den meisten der verwendeten Formaten nur erschwert möglich.

Folgerichtig führt erst die Veröffentlichung in einem nicht-proprietären Format zum dritten Stern. Tabellen im CSV-Format sind auch automatisiert auf einfache Weise verwertbar und fesseln potenzielle Anwender*innen nicht an bestimmte Softwarepakete. Gegebenenfalls muss die Kommune hierzu intern Plugins oder Converter bereitstellen.

Vier und Fünf Sterne: URI, Semantik und Verknüpfungen

Wenn Daten immer an derselben eindeutigen URI in einem offenen Industrie-Standard zu finden sind, können sie automatisiert weiterverarbeitet werden: Entwickler*innen könnten beispielsweise unter http://daten.bei­spiel­stadt.de/haushalt/gesamt/2012 die gewünschten Daten in RDF- oder JSON-Notation entgegennehmen. Diese maschinenlesbaren strukturierten Daten kön­­­nen durch Transformation in (X)HTML auf einfache Weise auch für Menschen lesbar gemacht werden. Durch die Verwendung geeigneter Vokabulare können die Daten semantisch angereichert und Querbezüge zwischen Datensätzen hergestellt werden.

Zur schnellen Erschließbarkeit, welche Daten welchem Modell folgen, können passende Icons verwendet werden. Auf http://opendefinition.org fin­den sich allgemeine „Open Data“-Labels; zur Kennzeichnung der Fünf-Ster­ne-Klassifizierung finden sich Icons auf http://lab.linkeddata.deri.ie/2010/lod-badges/.

Und danach?

Egal ob nur CSV oder komplette Datenbank: Die Daten wollen natürlich auch gefunden werden – und sie warten auf ihre Anwendung durch Interessierte gleich welcher Art. Datenkataloge wie das Freie/Open-Source-System CKAN sorgen für eine Indizierbarkeit und Durchsuchbarkeit der offengelegten Daten. Einzelne Datensätze können durch ihre Metadaten wie „Veröffent­lichungsjahr“ gefiltert werden, und die Wahl eines geeigneten Katalogs sorgt dafür, dass das Datenangebot der Kommune nicht zu einem „Datensilo“ wird, sondern beispielsweise auf Kreis-, Regierungsbezirks-, Landes- oder Bundesebene mit anderen Katalogen föderiert werden kann, um die Daten einem größeren Publikum zugänglich zu machen.

Zum Mitmachen animieren

Eben dieses Publikum sollte auch so früh wie möglich in den Veröffentlichungsprozess einbezogen werden. Letztlich sind es Bürger*innen, Open-Da­ta-Aktivist*innen, örtliche Unternehmen und Journalist*innen, die die Daten durch ihre Ideen und Anwendungen zum Leben erwecken. Minikonferenzen und Barcamps bringen Interessierte aus Verwaltung und Öffentlichkeit zu­sammen und befördern den Austausch von Ideen und Anregungen; Pro­grammierwettbewerbe und Hackdays sorgen dazu auch für „greifbare“ Er­geb­nisse. Ganz im Sinne der Open-Data-Bewegung eröffnen viele Augen viele mögliche Blickwinkel: “The coolest thing to do with your data will be thought of by someone else” (Walsh 2007).

 

Quellen

Weitergehende Definitionen und eine tiefere Beleuchtung weiterer Aspekte, als dieser Rahmen erlaubt, finden sich im Handbuch „Freiheit vor Ort“ (Dobusch 2011) und dem Abschlussbericht „Offene Staatskunst“ (co:llaboratory 2010). Ein reich­haltiger Fundus an Links findet sich zudem in der Knowledge Base der Open Know­ledge Foundation unter http:///KnowledgeBase.

 

Dobusch, L.; Forsterleitner, C.; Hiesmair, M. (Hrsg.) (2011): Freiheit vor Ort. Handbuch kommunale Netzpolitik. Wien: Open Source Press.

Internet & Gesellschaft Co:llaboratory (Hrsg.) (2010): Offene Staatskunst. Bessere Politik durch „Open Government“? Hamburg.

Open Knowledge Foundation (2011): Was genau meint Offenheit?; http://opendata­manual.org/de/what-is-open-data/what-is-open-data.html.

Summers, E. (2010): The 5 stars of open linked data; http://inkdroid.org/jour­nal/2010/06/04/the-5-stars-of-open-linked-data/.

Dieser Beitrag wurde unter 2. Anwendbarkeit, Alle Texte, Anwendungsgebiete, E-Government, Implementierung, Plattform, Standards, Vorteile, Wirtschaftlichkeit abgelegt und mit , , , , , , , , , , , , , , , , , , , verschlagwortet. Setzen Sie ein Lesezeichen auf den Permalink.

Eine Antwort auf 2.3 Kommunales Open-Data-Wiki als eine Form von Open Source (Stefan Kaufmann)

  1. Pingback: OpenCityCamp 2012