Vad Är “Differentiell Integritet,” och Hur Fungerar Det att Hålla Min Data Anonym?

Apple satsar sitt rykte på att se den data man samlar in från dig är privat. Hur? Med hjälp av något som kallas “Differentiell Integritet.”

Vad Är Differentiell Integritet?

Apple förklarar det så här:

Apple använder Differentiell Integritet teknik för att hjälpa till att upptäcka användningsmönster för ett stort antal användare utan att äventyra den enskildes integritet. För att dölja en individs identitet, Differentiell Integritet lägger matematiska buller till ett litet urval av individens användning mönster. Fler människor som delar samma mönster, generella mönster börjar att växa fram, som kan informera och förbättra användarupplevelsen.

Filosofin bakom Differentiell Integritet är detta: en användare vars enhet, oavsett om det är en iPhone, iPad eller Mac, lägger en beräkning att en större pool av aggregerade data (en stor bild som bildas från olika mindre bilder), bör inte avslöjas som källa, för att inte tala om vad för data som de bidragit med.

Apple är inte det enda företaget som gör detta, antingen—både Google och Microsoft använde det ännu tidigare. Men Apple populariserade det genom att prata om det i detalj på dess 2016 WWDC keynote.

Så hur skiljer sig detta från andra anonymiserade data, frågar du? Tja, anonymiserade data kan fortfarande användas för att härleda personlig information om du inte vet tillräckligt mycket om en person.

Låt oss säga att en hacker kan få tillgång till en anonymiserad databas som visar ett företags löneadministration. Låt oss säga att de också vet att de Anställdas X är att flytta till ett annat område. Hackaren kan sedan enkelt söka i databasen före och efter Anställd X flyttar och enkelt härleda sin inkomst.

För att skydda Anställdas X känslig information, Differentiell Integritet ändrar data med matematiska “buller” och andra tekniker så att om du söker i databasen, du kommer endast att få en uppskattning av hur mycket (eller någon annan) Anställd X var betald.

Alltså, hans personliga integritet bevaras på grund av att “skillnaden” mellan uppgifter och buller till det, så är det sedan vagt nog att det är praktiskt taget omöjligt att veta om att data du tittar på är faktiskt en viss person.

Hur Har Apple Differentiell Integritet Arbete?

Differentiell Integritet är ett relativt nytt begrepp, men tanken är att det kan ge ett företag angelägna insikter som bygger på data från sina användare, utan att veta exakt vad som data säger eller från vem det kommer ifrån.

Apple, till exempel, bygger på tre komponenter för att göra det tar på Differentiell Integritet arbeta på din Mac eller iOS-enhet: hashing, underprovtagning och buller injektion.

Hash tar en sträng av text och förvandlar den till ett kortare värde med en fast längd och blandar dessa nycklar på upp till oåterkalleligt slumpmässiga strängar av unika karaktärer eller “hash”. Detta skymmer din data så att enheten är inte lagra något av det i sin ursprungliga form.

Underprovtagning innebär att istället för att samla varje ord en person typ, kommer Apple att endast ett mindre urval av dem. Till exempel, låt oss säga att du har en lång sms-konversation med en vän frikostigt med hjälp av emoji. Istället för att samla på att hela konversationen, underprovtagning kan istället bara använda de delar som Apple är intresserad av, såsom emoji.

Slutligen, enheten sprutar buller, lägga till en slumpmässig data till den ursprungliga datasetet för att göra det mer vaga. Detta betyder att Apple blir ett resultat som har maskerats aldrig så lite och är därför inte helt exakta.

Allt detta händer på enheten, så det har redan förkortats, blandat, provtas, och suddig innan det är även skickat till molnet för för Apple att analysera.

Där Är Apple Differentiell Integritet Används?

Det finns en mängd olika fall där Apple kanske vill samla in data för att förbättra sina program och tjänster. Just nu dock, Apple-använder endast Differentiell Integritet i fyra specifika områden.

  • När tillräckligt många människor för att ersätta ett ord med ett visst emoji, det kommer att bli ett förslag för alla.
  • När nya ord läggs till tillräckligt lokala lexikon, för att betraktas som vardagsmat, kommer Apple att lägga det till alla andra ordbok också.
  • Du kan använda ett sökord i Rampljuset, och den kommer då att förse app förslag och öppna länken i denna app kan du installera det från App Store. Till exempel, säg att du söker efter “Star Trek”, vilket tyder på IMDB-appen. Ju fler människor som är öppna eller installera IMDB-appen, desto mer kommer att visas i alla sökresultat.
  • Det kommer att ge mer exakta resultat för Sökning Tips i Anteckningar. Till exempel, säga att du har en lapp med ordet “apple” i det. Du gör en sökning och det ger resultat, inte bara för en ordbok, men också Apples webbplats, platser för Apple-Butiker, och så vidare. Förmodligen kommer det mer folk peka på att ett visst resultat, högre och mer ofta de visas i Sökning efter alla andra.

Låt oss använda emojis som ett exempel. I iOS 10, Apple presenterade en ny emoji ersätter funktionen iMessage. Skriv ordet “kärlek”, och du kan ersätta det med ett hjärta emoji. skriv ordet “hund”, och du gissade rätt—du kan ersätta det med en hund emoji.

På samma sätt är det möjligt för din iPhone för att förutsäga vad emoji du vill ha sådan att den, om du skriver ett meddelande: “jag kommer att gå ut med hunden” på din iPhone kommer att hjälpsamt tyder på hunden emoji.

Så, Apple tar alla dessa små bitar av iMessage data man samlar in, undersöker dem som en helhet, och kan härleda mönster från vad folk skriver och i vilket sammanhang. Detta innebär att din iPhone kan ge dig smartare val eftersom det drar nytta av alla dessa sms-konversationer andra är att skapa och tänker, “detta är förmodligen den emoji du vill.”

Det Tar en By (Emoji)

Nackdelen med att Differentiell Integritet är att den inte ger korrekta resultat i små prover. Det är makt ligger i att göra särskilda uppgifter vaga så att det inte kan hänföras till någon användare. För att det ska fungera och fungera bra, många användare måste delta.

Det är lite som att titta på en bitmappad bild upp extremt nära. Du kommer inte att kunna se vad det är om du tittar på bara ett par bitar, men när du kommer ett steg tillbaka och titta på det hela, bilden blir tydligare och tydligare, även om det inte är super hög upplösning.

Således, för att förbättra emoji ersättning och prediktion (bland annat), måste Apple att samla in iPhone och Mac data från hela världen för att ge det en allt tydligare bild av vad människor gör och därmed förbättra sina program och tjänster. Den vänder sig till alla denna randomiserade, bullriga, crowdsourcad data, och gruvor det för mönster—till exempel hur många användare som använder persika emoji i stället för “i rumpan.”

Så, makt Differentiell Integritet bygger på Apple för att kunna behandla stora mängder data i aggregerad form, hela tiden se till att det är klokare om vem som skickar dem som data.

Hur att Välja Differentiell Integritet i iOS och macOS

Om du fortfarande inte är övertygad om att Differentiell Integritet är rätt för dig, även om du är i tur. Du kan välja ut rätt från enhetens inställningar.

På din iOS-enhet knacka på öppna “Inställningar” och sedan “Sekretess”.

På Privacy screen, tryck på “Diagnos Och Användning”.

Slutligen, på Diagnostik Och Användning av skärmen, tryck på “Skicka inte”.

På macOS, öppnar du systeminställningar och klicka på “Säkerhet & Sekretess”.

I Säkerhet & Sekretess inställningar, klicka på fliken “Sekretess” och sedan se till att “Skicka diagnostiska & användningsdata till Apple” är avmarkerat. Observera att du måste klicka på lås-ikonen i det nedre vänstra hörnet och ange ditt lösenord innan du kan göra denna förändring.

Självklart finns det mycket mer att Differentiell Integritet, både i teori och tillämpning, än denna förenklade förklaring. Kött och potatis i det i hög grad förlitar sig på en del allvarliga matematik och som sådan, det kan bli ganska tungt och komplicerat.

Förhoppningsvis, men detta ger dig en uppfattning om hur det fungerar och att du känner dig mer säker på om företagen samla in uppgifter utan rädsla för att bli identifierad.


Posted

in

by

Tags: