Skip to content

Open Data

Open Data sind Daten, die ohne Einschränkungen genutzt, weiterverbreitet und weiterverwendet werden dürfen. Einschränkungen sind nur zur Sicherung von Ursprung und Offenheit erlaubt, beispielsweise durch die Nennung des Urhebers. Diese Daten fördern Transparenz und Innovation und unterliegen freien Lizenzen. Sie finden Anwendung in Bereichen wie Verwaltung, Wissenschaft und Wirtschaft.

Lernziele

Dieser Artikel vermittelt Kenntnisse zu:

  • dem Begriff Open Data und seiner Abgrenzung von verwandten Konzepten.
  • der Anwendung der Qualitätskriterien des 5-Sterne-Schemas.
  • technischen Formaten und Standards für Open Data.
  • rechtlichen Rahmenbedingungen und Ausschlüssen in Deutschland und der Schweiz.
  • der Rolle von Metadatenkatalogen.

Kurzueberblick

Open Data bezeichnet Daten, die frei zugänglich und wiederverwendbar sind. Im Gegensatz zu proprietären Daten unterliegen sie minimalen Beschränkungen und dienen der Förderung von Transparenz, Innovation und Partizipation. Häufige Anwendungsbereiche sind Verwaltungsdaten, wissenschaftliche Datensätze und statistische Informationen.

Kontext und Einordnung

Open Data ist Teil der Wissensallmende und steht in Verbindung mit Themen wie Datenqualität, Datenschutz und Compliance. Während Open Source sich auf Software-Quellcode bezieht, fokussiert Open Data auf Daten selbst. Open Government Data (OGD) ist eine spezifische Form von Open Data, die sich auf Daten aus öffentlichen Verwaltungen bezieht. Allgemeine Open Data können auch aus Wirtschaft, Wissenschaft oder Nichtregierungsorganisationen stammen.

Begriffe und Definitionen

Open Data

Daten, die ohne Einschränkungen genutzt, weiterverbreitet und weiterverwendet werden dürfen. Einschränkungen sind nur zur Sicherung von Ursprung und Offenheit zulässig, beispielsweise durch die Nennung des Urhebers.

Open Government Data (OGD)

Eine Teilmenge von Open Data, die spezifisch Daten aus öffentlichen Verwaltungen umfasst. Diese werden proaktiv und kostenfrei zur Verfügung gestellt, um Transparenz und Bürgerbeteiligung zu fördern.

Metadatenkatalog

Eine Plattform, die Metadaten zu Datensätzen sammelt und bereitstellt, ohne die Daten selbst zu hosten. Beispiele sind GovData.de und opendata.swiss.

Vorgehen

Zur Bewertung der Qualität von Open Data dient das 5-Sterne-Schema von Tim Berners-Lee:

  • ★ (1 Stern): Daten im Web verfügbar (unabhängig vom Format).
  • ★★ (2 Sterne): Strukturierte Daten (z. B. CSV statt Bild-Scan).
  • ★★★ (3 Sterne): Nicht-proprietäre Formate (z. B. CSV statt Excel).
  • ★★★★ (4 Sterne): URIs zur Identifikation und Verlinkbarkeit.
  • ★★★★★ (5 Sterne): Verlinkung mit anderen Daten zur Schaffung von Kontext.

Für die technische Umsetzung werden Formate wie CSV (tabellarisch), JSON und XML (strukturiert) verwendet. Metadatenstandards wie DCAT beschreiben Datensätze.

Beispiele

Ein Datensatz mit Verkehrsinformationen liegt als CSV-Datei vor und ist unter einer Creative Commons Attribution-Lizenz verfügbar. Dies ermöglicht die Weiterverwendung in Anwendungen zur Routenplanung. Ein weiteres Beispiel sind statistische Daten zu Bevölkerungsentwicklung, die in JSON-Format bereitgestellt und mit URIs verlinkt sind, um eine höhere Sternzahl zu erreichen.

Häufige Fehler und Best Practices

Häufige Fehler umfassen die Veröffentlichung datenschutzrelevanter Informationen als Open Data. Stattdessen sind Geschäftsgeheimnisse und personenbezogene Daten ausgeschlossen, da diese rechtlichen Beschränkungen unterliegen. Bei der Auswahl von Formaten sollten proprietäre Formate vermieden und offene Standards wie CSV bevorzugt werden, um die Wiederverwendbarkeit zu maximieren.

Schlüsselaspekte

  • Open Data unterscheiden sich von proprietären Daten durch ihre freie Zugänglichkeit und Wiederverwendbarkeit ohne wesentliche Beschränkungen.
  • Das 5-Sterne-Schema dient der Bewertung der Qualität von Open Data anhand von Kriterien wie Verfügbarkeit, Struktur und Verlinkbarkeit.
  • Technische Formate für Open Data umfassen CSV, JSON und XML.
  • Daten, die nicht als Open Data veröffentlicht werden dürfen, sind solche, die Datenschutzrelevante Informationen, Geschäftsgeheimnisse oder personenbezogene Daten enthalten.

Weiterfuehrendes

Weitere Informationen finden sich in den Handbüchern von GovData und opendata.swiss sowie in der Openness Rating des kanadischen Governments.