Noch in diesem Jahr prognostizieren die Marktforscher von IDC einen weltweiten Datenbestand von 2.7 Zettabyte und diese Menge verzehnfacht sich im Moment ca. alle 5 Jahre. Überwiegend handelt es sich hierbei um Bilder, Filme, Dokumente, vielerlei maschinell erzeugte Mess- und Protokolldaten, welche mehr oder weniger (meist weniger) strukturiert gespeichert Ihr Dasein fristen.

Was für den Privatanwender in der Regel mit einem alle Jahre wiederkehrenden Frühjahrsputz auf den Festplatten und dem Aussortieren alter Sicherungs-CDs getan ist, stellt Unternehmen vor eine schwierige Aufgabe. Zum einen müssen per Gesetz viele der Daten 10 Jahre oder länger aufbewahrt werden und zum anderen schlummert in manch dieser alten und auch stetig neu hinzu kommenden Dateien ungeahntes Kapital. Die Auswertung oder Klassifizierung dieser Information und damit eine Kapitalisierung dieses schlummernden Vermögens ist die Kür diverser Business-Intelligence-Anbieter.

Was verbirgt sich denn eigentlich hinter dem Schlagwort Big Data? Eigentlich kennen wir die Grundzüge schon lange aus größeren CRM-Systemen, denn es geht im Groben und Ganzen hierbei um die Auswertung von Unternehmensdaten, nur halt im großen Stil. Hieraus versprechen einem die Anbieter Kunden und Lieferanten besser zu verstehen oder die Bewegung des Marktes zügiger zu analysieren und aus allem zusammen eine höhere Effizienz zu gewinnen und Geschäftsentscheidungen gezielter treffen zu können.

Während neue Daten recht einfach und in Echtzeit analysiert werden können, besteht die Herausforderung in der Nutzbarmachung der Daten alter Systeme, denn diese müssen mühsam identifiziert und den entsprechenden Funktionen zugeordnet werden. Die Kunst dabei ist Daten differenziert aufzubereiten, ohne vorweg die Abfrage zu kennen. Hierbei kann dann jeder Datensatz in einer Datenbank eine Vielzahl von zusätzlichen Spalten erhalten, um letztendlich alle vorhandenen Informationen abfragbar zu machen.

Die Nutzung ist so vielfältig, wie die Daten die wir sammeln. Hier werden zum Beispiel die in Supermärkten von Kameras aufgezeichneten Kundenbewegungen ausgewertet, um Produkte besser in den Regalen zu platzieren oder etwa RFID-Daten dazu genutzt Lieferketten zu optimieren. Telekommunikationsdaten werden durchleuchtet um neue Tarifmodelle zu entwerfen oder Börsentransaktionsdaten für Marktprognosen herangezogen und vieles mehr. Ein ganz großes Thema ist zurzeit auch die Auswertung der Social Media-Kanäle, welche Datenschutzbeauftragten und Netzaktivisten regelmäßig auf die Barrikaden ruft. Hier wollte zum Beispiel die Schufa Facebook-Nutzer durchleuchten und die dadurch gewonnenen Informationen zur Beurteilung der Kreditwürdigkeit heranziehen.

Doch aus welcher Ecke kommt Big Data, wenn die Einsatzgebiete so mannigfaltig sind? Oder ist es doch einfach nur wieder nur eine neue Marketingsau, die durch’s Dorf getrieben wird?

Schaut man sich die Fahnenträger des Big Data Hypes einmal genauer an, fällt neben der Business Intelligence als weiteres großes Lager die Storage-Anbieter auf, bieten sich hier doch massenhaft ungenutzte Daten, die jetzt wieder migriert und zugänglich gemacht werden wollen. Die massive Menge an Daten, die hier in Frage kommt und dann -gerade in großen Unternehmen- weltweit zur Verfügung gestellt werden muss, eignet sich natürlich hervorragend um die Cloud zu befüllen und das bisher noch etwas schleppende Geschäft zu befördern.

Big Data ist definitiv mehr als nur eine Marketing-Phrase, jedoch kommt es wahrscheinlich nur für wenige Unternehmen wirklich in Frage. Gerade im IT Bereich haben sich Nutzer- und Kaufverhalten, sowie auch die Vertriebskanäle derart schnell geändert, dass Daten älter als 2-3 Jahre für eine wirkliche Businessanalyse kaum mehr eine wirkliche Aussagekraft haben und in vielen anderen Branchen wird es ähnlich sein, so dass die Auswertung dieser Informationen in vielen Bereichen eher dem Anbieter als dem User nutzt.