URI: 
       # taz.de -- Debatte Big Data und Datenschutz: Das Unbehagen im Datenhaufen
       
       > Große Datensätze sind toll für die Forschung, doch der Rückschluss auf
       > Personen wird immer einfacher. Unser Umgang mit persönlichen Daten muss
       > sich ändern.
       
   IMG Bild: Vollständig vermessen und immer noch erkennbar
       
       Derzeit gibt es einen Hype um das Buzzword „Big Data“, letzte Woche sprach
       die taz vom „[1][nächsten großen Ding].“ Tatsächlich sind große Datenmengen
       nur die logische Konsequenz der fortschreitenden Digitalisierung unserer
       Gesellschaft. Kaum ein Lebensbereich wird nicht durch vernetzte
       Computersysteme durchdrungen, und dabei fallen immer mehr Daten an, die
       natürlich auch verarbeitet werden.
       
       Geheimdienste und Großkonzerne machen das schon länger. Banken wenden
       statistische Verfahren auf die Finanztransaktionen ihrer Kunden an, um
       Unregelmäßigkeiten zu entdecken. Die amerikanische Einzelhandels-Kette
       Walmart verarbeitete schon vor zwei Jahren [2][eine Million
       Kunden-Transaktionen], pro Stunde. Facebook speichert mehr als [3][200
       Milliarden Fotos] seiner Nutzer, täglich kommen zehn Millionen neue dazu.
       Die scannt es nach Gesichtern – und trainiert damit seinen Algorithmus zur
       Gesichtserkennung. Und der amerikanische Geheimdienst NSA baut gerade im
       abgelegenen Utah das [4][größte Spionage-Rechenzentrum der Welt], zum
       Sammeln und Rastern von Datenmengen in unvorstellbaren Ausmaßen.
       
       Das neue ist nur, dass große Datensätze auch immer mehr Forschern und sogar
       Endanwendern zur Verfügung stehen. Teilweise lassen sich daraus tolle
       Erkenntnisse ziehen. Forscher der Elite-Uni Harvard haben die Handydaten
       von 15 Millionen Kenianern über den Zeitraum von einem Jahr
       //www.sciencemag.org/content/338/6104/267:ausgewertet und mit Karten über
       die Ausbreitung von Malaria verglichen. Damit konnten die den Ursprung der
       Tropenkrankheit sowie ihren Ausbreitungsweg [5][nachvollziehen] – und dass
       Menschen ebenso zur Verbreitung beitragen wie Moskitos.
       
       Auch Polio soll mit Big Data bekämpft werden. Eine private
       Datenanalyse-Firma will [6][mit Handydaten Impfpläne verbessern] und bisher
       nicht verzeichnete Dörfer einbeziehen. In Großbritannien sollen die
       [7][Krankenakten aller Einwohner zentral gesammelt] und mit anderen
       Datenbanken verknüpft werden. Das wird als Revolution der medizinischen
       Forschung gefeiert.
       
       ## Drei Daten, eine Identität
       
       Dabei wird immer versprochen, dass die Datensätze natürlich anonymisiert
       sind. Doch die Kehrseite von Big Data ist auch, dass eine herkömmliche
       Anonymisierung, also das Entfernen von eindeutig identifizierbaren
       Informationen wie Name und Anschrift, nicht ausreichend ist und immer
       leichter rückgängig gemacht werden kann. Bereits in den Neunziger Jahren
       versicherte der Gouverneur von Massachusetts, dass die veröffentlichten
       Krankendaten seines Staates datenschutzrechtlich unbedenklich sind, weil
       personenbezogene Informationen entfernt wurden.
       
       Die Forscherin Latanya Sweeney [8][machte diese Anonymisierung rückgängig],
       in dem sie nicht anonymisierte, scheinbar harmlose Informationen des
       Datenbergs mit weiteren Datensätzen verknüpfte. So war sie in der Lage, die
       persönliche Krankenakte des Gouverneurs herauszufinden und ihm
       zuzuschicken.
       
       Im Jahr 2000 fand Sweeney heraus, dass 87 Prozent aller Amerikaner mit nur
       drei kleinen Daten eindeutig identifiziert werden können: Geschlecht,
       Geburtsdatum und Postleitzahl. Seitdem haben immer mehr Studien gezeigt,
       dass man aus scheinbar anonymisierten Datensätzen Einzelpersonen
       “re-identifizieren” oder “de-anonymisieren” kann, oft mit erstaunlicher
       Leichtigkeit. Die Königliche Gesellschaft Großbritanniens kam kürzlich
       [9][in einem Bericht] zu dem Fazit, „dass die Sicherheit von persönlichen
       Daten in Datenbanken durch Anonymisierung nicht garantiert werden kann,
       wenn aktiv nach Identitäten gesucht wird.“
       
       Der Chaos Computer Club erweiterte schon in den Achtziger Jahren die
       [10][Hackerethik] um den Grundsatz: „Öffentliche Daten nützen, private
       Daten schützen“. Auch bei diesem Thema stellt sich also erneut die Frage:
       Was ist privat, was ist öffentlich? Die Sozialforscherin Danah Boyd
       beschäftigte sich vor zwei Jahren mit der Frage nach [11][Datenschutz im
       Zeitalter von Big Data]. Eine ihrer fünf Überzeugungen ist: „Nur weil man
       Zugriff auf Daten hat, ist es noch nicht ethisch vertretbar, diese auch zu
       verwenden.“
       
       Mobilfunk-Anbieter speichern Verbindungs- und Ortsdaten ihrer Kunden zu
       Abrechnungszwecken. Als der Telefónica-Konzern mit seiner deutschen Tochter
       O2 aus diesen Daten Bewegungsprofile erstellen [12][zu Werbezwecken
       erstellen wollte], musste sich erst das [13][Wirtschaftsministerium
       einmischen], bis der Konzern die Pläne für Deutschland zurückzog. Im
       deutschen Recht existiert das Konzept der Zweckbindung, nach der Daten nur
       für vor der Erhebung definierte Zwecke verwendet werden dürfen.
       
       ## Datenbriefe sind dringender denn je
       
       Ein großes Problem dabei ist jedoch, dass wir in der digitalen Gesellschaft
       gar nicht mehr überblicken können, wer welche Daten über uns erhebt,
       verarbeitet und weitergibt. Die Grundvoraussetzung für eine bewusste
       Entscheidung ist jedoch genau dieses Wissen. Verbraucher sollten regelmäßig
       von Firmen, Behörden und Institutionen informiert werden, welche
       personenbezogenen Daten über sie dort gespeichert sind. Dieses Konzept des
       so genannten [14][Datenbriefs] ist nicht neu – aber dringender denn je.
       
       Zudem sollten Verbraucher frei und selbstbestimmt entscheiden dürfen, für
       welche Zwecke sie welche Daten zur Verfügung stellen. Die derzeit gängige
       Praxis, alle möglichen Verwendungszwecke in undurchsichtigen und
       ellenlangen Geschäftsbedingungen zu verstecken und absegnen zu lassen muss
       durch einfache und offene Fragen ersetzt werden. Dienste müssen auch
       nutzbar sein, wenn man der unbestimmten Verarbeitung und Weitergabe meiner
       Daten widerspricht. Das schafft einen fairen Ausgleich zwischen dem
       Erkenntnisinteresse der Datenforscher und dem Selbstbestimmungsrecht des
       Einzelnen.
       
       Schließlich muss an neuen und wirksamen Methoden zur Anonymisierung
       geforscht werden. Der vom Polio-Forscher Dave Menninger ausgemachte
       [15][Gegensatz], entweder Datenschutz oder die Bekämpfung der
       Kinderlähmung, muss aufgelöst werden. Wir wollen natürlich beides.
       
       21 Nov 2012
       
       ## LINKS
       
   DIR [1] /!105303/
   DIR [2] http://www.economist.com/node/15557443
   DIR [3] http://www.guardian.co.uk/technology/2012/oct/04/facebook-hits-billion-users-a-month
   DIR [4] http://www.wired.com/threatlevel/2012/03/ff_nsadatacenter/
   DIR [5] http://www.hsph.harvard.edu/news/press-releases/2012-releases/cell-phone-data-malaria.html
   DIR [6] http://futurezone.at/future/11714-big-data-soll-malaria-und-polio-ausrotten.php
   DIR [7] http://www.guardian.co.uk/science/2012/aug/28/nhs-patient-records-medical-research-revolution
   DIR [8] http://arstechnica.com/tech-policy/2009/09/your-secrets-live-online-in-databases-of-ruin/
   DIR [9] http://royalsociety.org/policy/projects/science-public-enterprise/report/
   DIR [10] http://www.ccc.de/hackerethik
   DIR [11] http://www.danah.org/papers/talks/2010/WWW2010.html
   DIR [12] http://www.tagesschau.de/wirtschaft/telefonica106.html
   DIR [13] http://www.handelsblatt.com/unternehmen/it-medien/ortungsprogramm-bundesregierung-verbietet-o2-handel-mit-bewegungsdaten/7328904.html
   DIR [14] http://www.ccc.de/datenbrief
   DIR [15] http://futurezone.at/future/11714-big-data-soll-malaria-und-polio-ausrotten.php
       
       ## AUTOREN
       
   DIR Andre Meister
       
       ## TAGS
       
   DIR Datenschutz
   DIR Datensicherheit
   DIR Schwerpunkt Überwachung
   DIR Big Data
   DIR Forschung
   DIR Anonymisierung
   DIR Big Data
   DIR Tesco
   DIR Mobilfunk
   DIR Datenschutz
   DIR Big Data
   DIR Big Data
   DIR o2
       
       ## ARTIKEL ZUM THEMA
       
   DIR Anonymität bei Gendatenbanken: Verräterische Verwandschaft
       
       Menschen sind selbst über anonymisierte Genomdaten identifizierbar, zeigen
       Studien. Schon entfernte Verwandte verraten ganze Stammbäume.
       
   DIR Scanningpläne der Supermarktkette Tesco: Die spinnen, die Briten
       
       Der Einzelhandelskonzern Tesco installiert Kameras an seinen Kassen. Damit
       soll das Gesicht des Kunden erfasst und passende Werbung gezeigt werden.
       
   DIR Bewegungsdaten von Mobiltelefonen: Individueller als der Fingerabdruck
       
       MIT-Forscher stellen fest: Alleine mit wenigen Angaben zu Ort und Zeitpunkt
       aus den Bewegungsdaten sind Mobilfunk-Nutzer erkennbar.
       
   DIR Mobilfunk-Überwachung: Von wegen streng geheim
       
       Behörden sollen künftig Inhaber und PIN eines Handys abfragen können. Auch
       dann, wenn nur eine Ordnungswidrigkeit vorliegt.
       
   DIR „Data Mining“ in Behörden: Verbrecherjagd in Datenbanken
       
       Bundesbehörden nutzen bei Ermittlungen Software, die sehr große Datensätze
       auswerten können. Linke-Politiker befürchten darin eine neue Form der
       Rasterfahndung.
       
   DIR Die wunderbare Welt von Big Data: „Es wird größer als das Internet“
       
       Big Data ist das nächste große Ding. Big Data? Der Fotograf Rick Smolan
       versucht mit „The Human Face of Big Data“ das abstrakte Konzept
       verständlich zu machen.
       
   DIR O2-Mutter Telefónica: Handydaten werden nicht verkauft
       
       Man habe sich entschieden, das „Produkt“ nicht anzubieten. So klingt
       Krisen-PR. Nach viel Kritik an der Idee, Daten seiner Kunden zu verkaufen,
       macht O2 einen Rückzieher.
       
   DIR Weltweite Migration: E-Mails wandern mit
       
       Aktuelle, belastbare Daten zur weltweiten Migration sind selten, doch in
       E-Mails werden sie täglich gesammelt. Ein Forscher wertete nun die
       IP-Adressen von Yahoo-Nutzern aus.
       
   DIR Sicherheit bei Smartphone-Programmen: Verkauf von persönlichen Daten
       
       Etliche Smartphone-Apps haben gravierende Datenschutz- und
       Sicherheitslücken, sagt Stiftung Warentest. Sie übertragen unverschlüsselte
       Daten und spähen Adressbücher aus.