Das oft propagierte „Betriebssystem Internet“ und die damit verbundene, intensive globale Nutzung stellen heute eine schier unerschöpfliche Datenquelle dar. Immer mehr Unternehmen beginnen, die damit verbundenen Potentiale und Herausforderungen zu erkennen und sie darüber hinaus auch tatsächlich zu nutzen. Eins der Stichworte in diesem Zusammenhang ist Big Data, wo es darum geht aus großen Datenmengen die verwertbaren Daten herauszufiltern, mit anderen vergleichbar gewonnen Daten anzureichern und so wertvolle Informationen zu gewinnen.
Klar, dass Big Data auch im Rahmen der CeBIT ein Thema ist – Datenschutz hin oder her. Fragen nach neuen Geschäftsmodellen und Konzepten zur Datengewinnung und -Nutzung werden zunehmend gestellt. Natürlich gilt es dabei auch die Grenzen abzustecken. Was ist vertretbar und wo wird der berühmte Bogen überspannt?
Positionsbestimmung für die Datenernte
Im Rahmen eines Expertenpanels wird auf der CeBIT webciety diskutiert, wo Datenschutz und die Nutzung gewonnen Daten an die Grenzen stoßen. Dabei ist gerade die Frage danach, welche Modelle wirklichen Nutzen für Unternehmen bieten interessant, ganz nach Clive Humby’s Ausspruch: “Data is the new oil”.
Das Panel beginnt am 7.3.2013 um 13:20 Uhr in der webciety mit einem kurzen Impulsvortrag von Russell Perry, CEO von Kompany und mündet schließlich in einer Podiumsdiskussion mit Ravin Mehta, Geschäftsführer von Unbelievable Machine, Joachim Stark, Leiter IBM Smarter Analytic bei IBM Deutschland und Uli Heimann, Director Data Solutions bei Nugg.ag. Wir erwarten eine lebendige Diskussion, die sich intensiv mit Ideen und Strategien für realitätsnahe Big Data-Ansätze beschäftigt.
Russell Perry: Der Wunsch nach Informationsgewinnung ist keine ethische Frage.
Bereits im Vorfeld der webciety konnten wir Russell Perry einige Fragen zu dem Thema stellen und haben die Antworten im folgenden Interview für Sie festgehalten:
1. Daten sind das neue Öl, wie schwierig ist es dieses Öl zu heben?
Öl hat erst einen Wert, wenn es raffiniert wurde. Das Gleiche gilt für Daten. Die Rohdaten haben erst einen Informationswert, wenn sie veredelt – raffiniert – wurden. Außerdem muss nach Öl oft lange und sehr sorgfältig, unter Einsatz hochentwickelter Technologie, gesucht werden. Ähnlich verhält es sich bei der Suche nach sinnvollen und Wert schaffenden Zusammenhängen von großen Datenmengen. Man könnte somit sagen, Öl und Daten haben eine Gemeinsamkeit.
2. Das Erheben und Auswerten von Daten erfordert geeignete Infrastrukturen, wie kann man diese für sein Unternehmen etablieren?
Um Rohdaten erheben und auswerten zu können ist klarerweise eine technische Infrastruktur und ein maßgebliches IT-Know-how notwendig. Mit zahlreich angebotenen Cloud-Services kann ein Unternehmen einen großen Teil auslagern und das meist zu sehr attraktiven Kosten. Wenn ein Open-Data Ansatz gewählt wird, gibt es auch bereits Cloud-Services, die den Zugriff managen oder aber bei der Veredelung der Rohdaten zu anwendbaren Informationen unterstützen.
Bei kompany haben wir als IT-Unternehmen beispielsweise eine eigene Technologie mit der Bezeichnung ‚Real Time Semantic Search (ARTSS)’ entwickelt, um in Echtzeit aus mehreren Rohdatenquellen Informationen mit einem sehr hohen Qualitätsgrad zu erzeugen.
3. Welche neuen Geschäftsmodelle und -konzepte werden durch die intensive Auswertung von erhobenen Daten möglich?
Die Datenwelt ist in zwei Lager geteilt. Das Lager der Datenbesitzer und das Lager der Technologieunternehmen. Das Geschäftsmodell der Datenbesitzer basiert auf der Restriktion der Verfügbarkeit ihrer Daten. Das Geschäftsmodell der Technologieunternehmen ist es, die Daten so weit wie möglich verfügbar zu machen.
Wie wir aus der jüngsten Vergangenheit wissen, werden die traditionellen Datenbesitzer verlieren, wenn sie sich nicht schnell genug anpassen. Film- und Musikverlage haben gegen iTunes oder Spotify klar verloren. Sie haben es verabsäumt, neue Technologien in der Distribution und im Produktangebot zu forcieren.
Der Wert von Daten entsteht erst durch deren Verwendung. Mein liebstes Beispiel sind Wetterdaten: die Rohdaten werden meist durch staatliche Institutionen generiert. Die Verwendung und die Distribution ist jedoch nicht eingeschränkt und deswegen hat sich nicht nur ein milliardenschwerer Wetterinformationssektor in den letzten drei Jahrzehnten entwickelt, sondern auch eine gesunde Konkurrenz und eine ständige Weiterentwicklung des Angebots. Das ist eine internationale Erfolgsgeschichte, wie große Mengen von Basis-Daten kommerziell verwendet werden können.
Das Konzept von Big Data verlangt sicherlich neue, angepasste Geschäftsmodelle. Der Zugang zu Daten sollte immer offen und, wenn möglich, zu Grenzkosten angeboten und erst nach der Veredelung und der eigentlichen Verwendung inkrementell oder partiell verrechnet werden. Denn erst nach der Umwandlung von Rohdaten in Informationen wird ein Wert geschaffen. Meist sind die Datenbesitzer nicht so gut in dieser Umwandlung – das können Technologieunternehmen wesentlich besser.
4. Stichwort Big Data: Wo sind die Grenzen für die Informationsgewinnung aus Daten?
In erster Linie würde ich keine Grenzen setzen, denn dann ist die Möglichkeit der Informationsgewinnung von Anfang an eingeschränkt. Wer wäre sonst auf die Idee gekommen, dass es einen Wert hat, die anonymisierten Handydaten einer Stadtautobahn zu analysieren um den Verkehrsstrom in Echtzeit zu messen und den Verkehr zu steuern? Technisch sehe ich die Bearbeitung der massiven Datensätze nicht im Speicherbereich oder unbedingt in der verfügbaren Prozessorleistung. Technisch sind wir derzeit durch fehlende Analysetools, also einer Schicht oberhalb der Rohdatensätze, noch sehr eingeschränkt. Eine viel, viel größere Einschränkung, die wir durchbrechen müssen, ist das Fehlen von Data-Scientists – das menschliche Element. Experten, die Anforderungen an neue Analysetools bestimmen und riesige Datensätze humangerecht aufarbeiten können. Sonst sind die Rohdaten wertlos und es kann keine brauchbare Information daraus gewonnen werden.
Für mich ist die Informationsgewinnung per se keine ethische Frage. Die Menschheit hat einen intrinsischen Wissensdrang und das ist auch der bestimmende Faktor für den Lebensstandard der heutigen Zivilisation.
Eine Frage, auf die ich mich jedoch konzentriere, ist die Interoperabilität von Daten und wie veredelte Rohdaten wieder recycelt werden können, um daraus wieder neue, brauchbare Information gewinnen zu können.
5. Der Datenschutz in Deutschland scheint eine große Hürde zu bedeuten. Ist das wirklich so? Wie kann man damit umgehen?
Der Datenschutz in Deutschland ist aus gutem Grund streng. Ein Vorteil, speziell gegenüber der US-amerikanischen Regelung: die privaten Daten gehören dem Bürger und es gibt eine einheitliche bundesweite Regelung. Ich sehe die Rolle des Staates darin, dafür zu sorgen, dass das rechtliche Umfeld einerseits den Datenschutz verteidigt aber genauso sicherstellt, dass Rahmenbedingungen geschaffen werden, die neue Big Data Technologien und Innovation forcieren. Das ist im Sinne der Wirtschaft und somit auch der Bürger. Zusätzlich kann und muss der Staat auch die rechtlichen Rahmenbedingungen dafür schaffen, dass der Zugang zu Daten aus Regierungsdatenbanken der Privatwirtschaft zugänglich gemacht werden kann. Die Rolle sollte sich nicht auf Einschränkung konzentrieren, sondern darauf, den Zugang und die Verwendung zu reglementieren und weitgehend zu öffnen. Leider ist es ein globales Problem, dass der Gesetzgeber meist nur reaktiv auf neue Technologien reagiert. Mit einer klaren Open-Government und Open-Data Regelung könnte man sich jedoch proaktiv der Zukunft stellen.