Die personalisierte Datenerfassung ermöglichte in der Folge vor allem Google ganz neue Geschäftsfelder: Man konnte jetzt Suchergebnisse datenbasiert an die Vorlieben des jeweiligen Nutzers anpassen und damit Werbung noch zielgerichteter ausspielen. Das Smartphone als universelles Gerät bot mit seiner eingebauten Sensorik dafür die ideale Ausgangsplattform. Ziel musste sein, möglichst viele Informationen zu erhalten, um die Trefferquote der Werbeanzeigen zu steigern. Daher erstaunt es nicht, dass sehr bald mit Androidhandys ein zum iPhone mehr als konkurrenzfähiges Produkt von Google geradezu in den Markt gedrückt wurde. Niedrige Lizenzkosten und ein quelloffenes Betriebsystem waren der Grundstein für die Produktion von Geräten unterschiedlicher Preisklassen. Die offensichtlichen Nachteile - etwa eine im Vergleich zu Applegeräten weitaus unzuverlässigere Updatefähigkeit - gingen in der Euphorie des Marktes zunächst einfach unter.
Die Datensammlung ließ sich im Kontext neuer Dienste hervorragend verschleiern. Als Beispiel kann der Routenplaner (Maps) von Google dienen: Haben Sie sich schon einmal gefragt, wie Google so zuverlässig und nahezu in Echtzeit Verkehrsdaten generieren kann? Jedes Handy enthält eine umfangreiche Sensorik, die sich mit bestimmten Apps sichtbar machen lässt.
In fast jedem Auto fährt ein modernes Handy mit, das u.a. über Sensoren zur Erfassung des Standorts verfügt, etwa GPS-Sensoren. Kombiniert mit einer Zeiterfassung lässt sich so die Geschwindigkeit jedes Autos erfassen. Fährt eine bestimmte Anzahl von Autos sehr langsam (= es ändern sich die GPS-Daten der Handys langsam), ist das ein Hinweis auf dichten Verkehr. Im Vergleich zu den Bewegungsdaten der Handys auf Alternativrouten lässt sich nun die optimale Wegstrecke berechnen - ein toller Dienst, oft besser und aktueller als jeder Verkehrsfunk.
Zur reinen Stauvorhersage wäre es aber ausreichend, diese Daten „roh“ zu verarbeiten, d.h. ohne sie mit einer bestimmten Person zu verknüpfen. Das geschieht aber nicht, sondern Google setzt noch eines drauf und kann u.a. durch personalisierte Verarbeitung dieser Daten sogar Aussagen zu z.B. unserem Arbeitsweg machen und und per Pushnachricht „mahnen“, an einem Tag früher aufzustehen, weil die Verkehrslage kritisch ist.
Die Datenerhebungsmöglichkeiten sind nahezu unbegrenzt. Moderne Handys haben u.a. Sensoren für Abstand, Licht- und Lautstärke, Lagebestimmung des Handys u.v.m. mit an Bord.
Ein geradezu prototypisches Beispiel dafür, wie sich Datenverarbeitung unter dem Einfluss von Personalisierung verändert hat, sind die CAPTCHAs. CAPTCHAs sollten ursprünglich in Webformularen nachweisen, dass tatsächlich ein Mensch und nicht etwa ein Programm gerade Daten eingibt. Sie kennen solche Sicherungen alle:
Daraus entwickelte sich mit der Firma reCAPTCHA schon früh eine Geschäftsidee: Man präsentierte dem Nutzer ein bekanntes Wort und eines, welches Texterkennungsprogramme aus Digitalisierungsprojekten (z.B. in Archiven) nicht erkennen konnten.
Man „trainierte“ also unter Ausnutzung von Menschen unauffällig die eigene Texterkennungssoftware! Es wurde dabei jedoch nur die Eingabe verwertet, keine anderen Daten. Google kaufte 2009 reCAPTCHA und der Dienst machte daraufhin ein bemerkenswerte Entwicklung durch. Heute sehen CAPTCHAs ganz anders aus:
Sie klicken einfach auf ein Feld „Ich bin kein Roboter“ - und die Trennung zwischen Mensch und Programm funktioniert trotzdem perfekt. Was geschieht da? Ein Hacker namens „neuroradiology“ 1) hat sich die Mühe gemacht, den dahinterliegenden JavaScript-Code zu analysieren. Google verwendet unter anderem folgende Daten, um zu bestimmen, ob ein Mensch die Checkbox klickt:
Man muss nicht alle diese Punkte verstehen, um zu begreifen, dass hier personalisierte Daten in großem Umfang an Google fließen - beim Klick auf eine simple Checkbox! Und das nicht nur auf dem Handy - bei jedem Endgerät, mit dem das Internet genutzt wird! Bei einigen Daten ist es sogar denkbar, dass sich Benutzer über verschiedene Geräte hinweg wiedererkennen lassen - trotz Adblocker und anderer Sicherheitsmaßnahmen - solange JavaScript aktiv ist (und ohne JavaScript ist fast kein Surfen möglich). Google arbeitet im Übrigen daran, selbst diese Checkbox verschwinden zu lassen und Menschen allein auf Basis von Daten wiederzuerkennen, die ihre Endgeräte beim Surfen liefern.
Die Entwicklung von reCAPTCHA zeigt für mich beispielhaft, wie sich das kommerzielle Netz von der Phase der Kommerzialisierung zur Phase der Überwindung des Marktes hin verändert hat.