Big Data Ocean

Daten werden in der heutigen Zeit im Millisekunden-Takt verarbeitet und gesammelt.

Jetzt fragt sich der ein oder andere Leser vielleicht, ob Daten sammeln im Millisekunden-Takt ein übertriebenes Wording oder doch Realität ist? Ganz klar Realität und keine Fiktion. Ich werde im Laufe dieses Blog-Beitrages näher darauf eingehen und versuchen die Thematik, "Big Data, Small Data und allgemeine Daten" - so verständlich wie möglich zu erklären.

Nun, für was braucht man so einen gigantischen Haufen an Daten überhaupt? 

Zum Einen hat natürlich jeder Staat selbst Interesse daran, soviel als nur möglich für die "Sicherheit im Land / für das Land" in Erfahrung zu bringen und versucht man außerdem die gesamten gesammelten Daten (Big Data) in sinnvollen vorsortierten Pools als Small Data-Sätze dann zur Verfügung zu stellen bspw. alle meldebezogenen Daten der Wohnorte einzelner Personen für das staatliche Melderegister, Behörden und sonstige Institutionen die durch diese Daten qualitativere Arbeit leisten können.

Zum Anderen werden Daten für sämtliche wirtschaftliche Belangen immer wichtiger, um die gewünschten Zielgruppen so spitz als möglich, mit dem passenden Produkt / Dienstleistungen zu erreichen.

Natürlich könnte ich jetzt Tage über Big Data, Datenquellen und Co. einen Blog-Beitrag verfassen, doch dann würde den Beitrag vermutlich gar niemand mehr lesen. Daher werde ich versuchen mich auf die Mehrwerte für das Marketing zu begrenzen, mit Schwerpunkt / Verbindung zu Social Media, programmatischer Werbe-Ausspielung (RTA/RTB) und natürlich für Profilierungen durch Daten-Management-Plattformen über Index-Verhalten (kann man sich ein wenig grob vorstellen, wie ein Chart Stichwort Aktien). Da selbst diese Themen sehr weitreichend sind, werde ich es versuchen, es aus Sicht der Meta-Ebene darzustellen.

Möglichkeiten und Verfahren die bereits zur Anwendung kommen werde ich mir genauso als Beispiel heranziehen, wie einige Szenarien die vielleicht noch nicht explizit angewendet werden, aber jederzeit könnten.

Rückblick: die Entstehung der Daten von Babylon bis zu den Vereinigten Staaten

Beginnen wir mit einer "kleinen Reise in die Vergangenheit" seit Beginn der Zeitrechnung bis zum Jahr 2003: würde man alle Mechaniken der Erfassung von Inhalten berücksichtigen, hat die Menscheit ca. 5. Mrd. Gigabyte an Daten gesammelt. Begonnen hat die systematische Datenerfassung bereits im 3. Jahrtausends v. Chr., wie uns die ersten Überlieferungen Babylons aus heutiger Sicht wissen lassen.

Bild: Stephen Wolfram; Quelle: wikipedia.org

Daher behauptet nicht zu Unrecht der Suchmaschinen-Spezialist und britische Mathematiker Stephen Wolfram, dass "in der Geschichte systematischer Datenerfassung, die beiden größten Datensammler Babylon und die Vereinigten Staaten" gewesen sind.

Seit Bestehen der Menschheit bis 2003 ca. 5. Mrd. Gigabyte an Daten 

  • 2011 häufte sich die gleiche Datenmenge bereits in 45 Stunden
  • 2013 bereits alle zehn Minuten

die mehr als 3 Mrd. Webnutzer auf der Erde, mit mehreren Milliarden vernetzten Geräten (Device IDs), sammeln heute jeden Tag etwa 2,5 Trillionen Byte an Daten.

Um sich das Ganze Datenbiest symbolisch darzustellen, verinnerliche doch eine Blu-Ray-CD-Hülle.

Diese Blu-Rays-Hülle stapeln wir jetzt 4x so hoch, als der Eiffelturm ist. (Eiffelturm 324 Meter)

Wir hätten also eine vorstellbare Datenhöhe an Blu-Ray-Hüllen von 1296 Metern.

Nun bleibt folgender Schluss zu ziehen: die insgesamt etwa 90% aller jemals zusammengetragenen Daten wurden in den vergangenen Jahren erzeugt.

Wenn man sich genauer ansieht was sich in den vergangenen Jahren so getan hat, ist der auf den ersten Blick gigantisch wirkende Daten-Ozean ein wenig nachvollziehbarer.

Wo kommen die Daten her, von welchen Daten sprechen wir?

  • jede SMS
  • jeder angeklickte Link
  • hoch geladene Fotos auf Instagram, Facebook & Co
  • jeder Posts im Social Eco-System
  • gesammelte Flugmeilen / Bonuspunkte (Stichwort: Kundenkarte)
  • getätigte Online-Käufe
  • Plattform übergreifendes Tracking (Google Analytics, Facebook Pixel usw.)
  • GPS-Koordinaten
  • sonstige Sensordaten von Handy / SmartWatch
  • Daten von Überwachungskameras und Smart Home-Anlagen
  • und viele weitere mögliche Datenquellen 

alle diese Bit-Tröpfchen lassen den Ozean aus Daten weiter ansteigen.

Diesen Ozean abzuspeichern und nach relevanten + brauchbaren Informationen zu filtern / durchsuchen und am Ende aus den gesammelten + angezeigten Ergebnissen sinnvolle Verwendungen zu finden, nennt man dann Big Data. bzw. benötigt den Runterbruch auf Simple Data Plattformen. 

Der Big Data Ozean ist mittlerweile soweit angewachsen, dass es spezielle Tools braucht, um die notwendigen Metadaten überhaupt nach Relevanz auslesen zu können.

Die sortierten Metadaten nach Relevanz ausgelesen / geordnet - nennt man dann Small Data.

Big Data definiert sich in folgender Grundregel:
Volumen, Vielfalt und Geschwindigkeit

Diese Grundregel verrät uns schon die vielseitigen Anwendungsmöglichkeiten. Um es ein wenig einfacher zu halten, werde ich am Beispiel der Device ID ein kurzes Beispiel der Zuordnungen geben.

Eine Device ID ist eine eindeutige Geräte-Zuordnung / Gerätekennung (Handy, Tablets, Fernsehers, Smart Watch uvm.), welche mit in den meisten Fällen mit einer sogenannten Advertising ID gematcht wird. Mit gematcht meine ich, es wird in Verbindung gebracht - eindeutig zugeordnet.

Die Advertising ID ist auf mehreren Geräten einheitlich und kann über eindeutige Browser-Kennungen (bspw. in Chrome durch Verbindung des Google-Accounts) komplett gepaart werden, so ist eine eindeutige Auswertung der Zielperson im Hintergrund zumindest theoretisch möglich.

Wobei ich hier darauf hinweisen möchte, dass diese Daten wie bereits im Vorfeld erwähnt, auf sinnvolle Datensätze runter gebrochen werden um bspw. eine komplette Zielgruppe die für mein Produkt passt zu, bewerben.

Sollten nun ggf. mehrere Benutzer (Google-Konten) unterschiedlich zur Anwendung gebracht werden - weil sich mehrere Personen bspw. einen PC teilen - kann man im Weiteren alle Personen im Haushalt und näheren Umfeld bestimmen. 

Die zusätzlichen Advertising IDs und somit Geräte auswendig zu machen inkl. der Personen im eigenen Haushalt ist somit technisch möglich.

Anreicherung der Datensätze mittels Daten aus der Sensorik

Werden nun zusätzlich Daten aus der Sensorik zur Anwendung gebracht (bspw. aus dem Protokoll der Smart Watch) hat man alle notwendigen Daten zusammen, um auf eindeutige Personen rück zu schließen. Falls sich jetzt jemand freut keine Smart Watch zu besitzen, neuartige Handys haben bereits ab Werk unzählige Sensoren verbaut und fragen nicht ob und wie Sie verwendet werden.

Dass das generelle Mindsetting hier gerade im DACH-Raum noch eher mau ist, möchte ich nun ein wenig auf die Sensorik eines Smart Phones eingehen.

Sensorik eines iPhones:

  • Beschleunigungsmesser
  • Annäherungssensor
  • Lichtsensoren für die Umgebung
  • Fingerscanner
  • um die wichtigsten Funktionen zu erwähnen, ja es gäbe noch mehr.

Neu in Planung: 3D Gesichtsscanner, welche den Fingerscanner ablösen werden.

Manche Apps hören sogar eure Umgebungsgeräusche regelmäßig per verbauten Mikrofon ab und senden sämtliche Daten an einen Hauptserver weiter, ihr wolltet das laut AGBs auch so.

Am Beispiel des Quit Control 30 Headsets von BOSE

Eher aus der neueren Headset-Generation von BOSE (QuitControl 30 -wirless, In-ear Kopfhörer), dieses Headset verwaltet / analysiert die gehörten Songs / Umgebungsgeräusche in Profilen und gibt diese gewonnenen Daten an Partnerfirmen weiter. Welche Daten Bose hier im Detail zieht und dann für Partner zur Verfügung stellt, weiß keiner mit Sicherheit.

Ich bin mir jedenfalls sicher

Diese Daten werden für zusätzliche Profil-Dichten und noch genauere Analysen des Nutz-Verhaltens auf Personen / Zielgruppen umgelegt. Selbstverständlich werden diese Daten auch an sämtliche Dritte, die zahlungswillig sind und mit diesen Daten etwas anfangen können, verkauft! 

Dieses Verhalten bzw. diese Technologie ist nichts Neues auch andere Hersteller verwenden ähnliche Prozesse für die "Produktentwicklung / Verbesserung und Fehlerbeseitigung". Spotify verwendet ebenso Analysen unseres Musikgeschmacks - wertvolle Daten, für die zielgerichtete Markenkommunikation und aus Sicht vieler Unternehmen natürlich Gold wert sind.

Die Zusammenführung vieler solcher Metadaten in der Big Data Cloud-Struktur, bietet nie dagewesene Möglichkeiten.

Werden Smart Phones in den nächsten Jahren Old School sein?

und wird die Menschheit zu BORGs (fiktives Volk Star Trek) mutieren.

Nun gut der Weg zum BORG wird wohl noch länger brauchen, doch Kybernetik-Technologie, wird sich im Mainstream Schritt für Schritt etablieren. Nicht in 2 Jahren oder 5, aber wie es in 10 Jahren aussieht, traue ich mich jetzt noch nicht zu erahnen. Einzelne Headset-Hersteller haben vor Kurzem schon Kopfhörer (Headsets) präsentiert, welche zusätzlich mittels Gesichts- / Nackenbewegung gesteuert werden können.

Auch tut sich einiges im Umfeld der Virtual Reality, 3D-Darstellung generell. Kurz: Breit über die komplette Internet of Things (IoT)-Palette gestreut, werden Innovationen geboren und vorgestellt.

Das virtuelle Umfeld verbindet sich also immer mehr mit der realen Welt und somit auch dem Menschen.

Im Jahr 2010 ist medial die größte wirksame Cyberattacke aufgedeckt worden.

Der Computerwurm Stuxnet, der speziell für Überwachungs- und Steuerungssysteme der Firma Siemens entworfen worden war. Die als Simatic S7 bezeichnete Automatisierungstechnik kommt in der Regel in Industrieanlagen wie bspw. Wasserwerken zum Einsatz.

Spätestens im Herbst 2007 wurde begonnen, diese Anlagen mit Stuxnet zu infizieren.

Stuxnet zeigt ganz gut, welche Auswirkungen die Industrie 4.0 auf uns Menschen haben kann.

Was Angry Birds mit der NSA zutun hatte und weshalb bei Pokemon Go ein fader Beigeschmack bleibt

Um wieder zur Gegenwart zurückzukommen, greife ich ein etwas aktuelleres Thema auf.

Eine der beliebtesten Apps auf dem Smartphone-Markt ist zweifelsfrei das Artilleriespiel Angry Birds. Dort werden Vögel gesteuert, deren Eier von Schweinen geklaut werden. Einfaches Spielprinzip ist es, mithilfe einer Schleuder die Verstecke der Schweine zu bombardieren. Wurfgeschosse sind natürlich die erzürnten Vögel. Sie wollen ja Ihre Eier wieder. LOGISCH!

Gut jetzt ist Angry Birds vielleicht auch nicht das aktuellste Beispiel, hat uns Karl Katz erst vor kurzem vor Augen geführt - wie knapp wir nicht der POKEMON-EVOLUTION entgangen sind.

Bild: Facebook-Post von Karl Katz am 25.02.2018 00:52 - dient zur Darstellung / Verdeutlichung

So viel Spaß uns diese Spiele auch bereiten oder damals bereitet haben: Der Schutz unserer Privatsphäre wird dadurch nicht berücksichtigt.

Der finnische Hersteller von Angry Birds, Rovio Entertainment, hat nahezu uneingeschränkten Zugriff auf unsere Daten, sofern die Nutzungsbedingungen akzeptiert wurden.

Aber wer liest die schon?

Wie gehst du mit Nutzungsbedingungen um, wenn zum Beispiel das neuste iTunes-Update oder Windows-Service-Upgrade kommt? Tust du dir die Textberge wirklich an? Hast du generell schon mal Nutzungsbedingungen komplett gelesen?

Wir stoßen in diesem Fall wieder auf die gängige Praxis des schnellen Denkens.

Wir downloaden Angry Birds / Pokemon Go schließlich nicht, um zunächst eine halbe Stunde Geschäftsbedingungen zur Nutzung digitaler Inhalte zu lesen. Wir wollen es sofort spielen, weswegen es dem Großteil der Nutzer schlichtweg egal ist, welchen Praktiken sie gerade wissenslos zugestimmt haben.

Im Falle von Rovio erfahren wir, dass die Firma nicht nur Ihren Nutzernamen und Passwort, sondern auch alle Kontakte, den aktuellen Aufenthaltsort und die UDID (Unique Device Identifier) Ihres Smartphones speichern.

Damit wissen die Finnen mehr von dir als dein Arbeitgeber und natürlich mehr, als du preisgeben willst.

Anfang 2014 wurde bekannt:

  • NSA
  • GCHQ (Government Communications Headquarters - Regierungskommunikationszentrale der Briten) 

auf diese Daten zugreifen können.

Whistleblower Edward Snowden höchstpersönlich hatte dies geflüstert.

Im Grunde gilt für jede App folgendes Grundprinzip: Ist sie kostenlos, zahlst Du mit deinen Daten!

Das selbe Prinzip greift natürlich bei auch mobilen Webseiten und generell allen Webservices und genau an diesem Punkt kommen wir wieder zurück zum eigentlichen Thema, dem massiven Mehrwert für Unternehmen, wenn Daten richtig angewendet werden.

Selbstverständlich klingt es für jemanden, der sich nicht Tag für Tag mit dieser Thematik auseinandersetzt, befremdlich oder sogar beängstigend. Daher ist der sensible Umgang mit euren/deinen Daten meiner Meinung euch selbst überlassen.

Ich hoffe mit diesem Blog-Artikel ein wenig Licht in die Thematik Big Data hinein gebracht zu haben.

"The world is now awash in data and we can see consumers in a lot clearer ways" - Max Levchin, PayPal co Founder.