Che cos'è la Privacy differenziale e come mantiene i miei dati anonimi?
Apple sta scommettendo sulla propria reputazione garantendo che i dati raccolti da te rimangano privati. Come? Utilizzando qualcosa chiamato "Privacy differenziale".
Cos'è la privacy differenziale?
Apple lo spiega come tale:
Apple utilizza la tecnologia Differential Privacy per aiutare a scoprire i modelli di utilizzo di un gran numero di utenti senza compromettere la privacy individuale. Per oscurare l'identità di un individuo, Privacy differenziale aggiunge rumore matematico a un piccolo campione del modello di utilizzo dell'individuo. Man mano che più persone condividono lo stesso modello, iniziano a emergere modelli generali che possono informare e migliorare l'esperienza dell'utente.
La filosofia alla base di Differential Privacy è questa: qualsiasi utente il cui dispositivo, che sia un iPhone, iPad o Mac, aggiunge un calcolo a un più ampio insieme di dati aggregati (una grande immagine formata da varie immagini più piccole), non dovrebbe essere rivelato come la fonte, per non parlare di quali dati hanno contribuito.
Anche Apple non è l'unica azienda a farlo, sia Google che Microsoft lo stavano usando ancora prima. Ma Apple lo rese popolare parlando dettagliatamente nel suo discorso del WWDC del 2016.
Quindi, come si differenzia da altri dati anonimi, chiedi? Bene, i dati anonimi possono ancora essere usati per dedurre informazioni personali se ne sai abbastanza di una persona.
Supponiamo che un hacker possa accedere a un database anonimo che rivela il libro paga dell'azienda. Diciamo che sanno anche che Employee X si sta trasferendo in un'altra area. L'hacker quindi potrebbe semplicemente interrogare il database prima e dopo che Employee X si sposti e dedurre facilmente il suo reddito.
Al fine di proteggere le informazioni sensibili di Employee X, Privacy Differenziale altera i dati con "rumore" matematico e altre tecniche tali che se si interroga il database, si riceverà solo un approssimazione di quanto (o qualcun altro) Dipendente X è stato pagato.
Pertanto, la sua privacy è preservata a causa della "differenza" tra i dati forniti e il rumore aggiunto ad essa, quindi è abbastanza vago che è praticamente impossibile sapere se i dati che stai guardando siano in realtà di un individuo particolare.
Come funziona la privacy differenziale di Apple?
La privacy differenziale è un concetto relativamente nuovo, ma l'idea è che possa dare a una società spunti approfonditi basati sui dati dei suoi utenti, senza sapere cosa Esattamente che i dati dicono o da chi proviene.
Apple, ad esempio, si affida a tre componenti per fare il suo lavoro sulla privacy differenziale sul tuo Mac o dispositivo iOS: hashing, sottocampionamento e iniezione di rumore.
Hashing prende una stringa di testo e la trasforma in un valore più breve con una lunghezza fissa e mescola questi tasti in stringhe irreversibilmente casuali di caratteri univoci o "hash". Ciò oscura i tuoi dati in modo che il dispositivo non li memorizzi nella sua forma originale.
Sottocampionamento significa che invece di raccogliere ogni parola di una persona, Apple utilizzerà solo un campione più piccolo di essi. Ad esempio, supponiamo di avere una lunga conversazione di testo con un amico che usa liberamente le emoji. Invece di raccogliere quell'intera conversazione, il sottocampionamento potrebbe invece utilizzare solo le parti a cui Apple è interessata, come l'emoji.
Infine, il dispositivo inietta il rumore, aggiungendo dati casuali nel set di dati originale per renderlo più vago. Ciò significa che Apple ottiene un risultato che è stato mascherato leggermente e quindi non è esattamente esatto.
Tutto ciò accade sul tuo dispositivo, quindi è già stato abbreviato, mescolato, campionato e sfocato prima che venga inviato al cloud affinché Apple possa analizzare.
Dove viene utilizzata la privacy differenziale di Apple?
Ci sono una varietà di casi in cui Apple potrebbe desidera raccogliere dati per migliorare le sue app e i suoi servizi. Al momento, però, Apple utilizza la privacy differenziale solo in quattro aree specifiche.
- Quando un numero sufficiente di persone sostituirà una parola con una particolare emoji, diventerà un suggerimento per tutti.
- Quando nuove parole vengono aggiunte a dizionari locali sufficienti per essere considerati comuni, Apple la aggiungerà anche al dizionario di tutti gli altri.
- Puoi utilizzare un termine di ricerca in Spotlight, quindi fornirà suggerimenti per le app e aprirà quel link in detta app o ti consentirà di installarlo dall'App Store. Ad esempio, supponi di cercare "Star Trek", che suggerisce l'app IMDB. Più persone aprono o installano l'app IMDB, più appariranno nei risultati di ricerca di tutti.
- Fornirà risultati più accurati per i Suggerimenti di ricerca nelle note. Ad esempio, supponiamo di avere una nota con la parola "mela" al suo interno. Esegui una ricerca di ricerca e ti dà risultati non solo per la definizione del dizionario, ma anche per il sito Web di Apple, le posizioni degli Apple Store e così via. Presumibilmente, più persone toccano determinati risultati, più in alto e più spesso appariranno nella Ricerca per tutti gli altri.
Usiamo le emoji come esempio. In iOS 10, Apple ha introdotto una nuova funzione di sostituzione di emoji su iMessage. Digita la parola "amore" e puoi sostituirla con un'emoji del cuore. digita la parola "cane" e, hai indovinato, puoi sostituirlo con un'emoji di cane.
Allo stesso modo, è possibile che il tuo iPhone preveda quale emoji desideri in modo tale che, se stai digitando un messaggio "I'm going to dog the dog", il tuo iPhone ti suggerirà in modo utile l'emoji del cane.
Quindi, Apple prende tutti quei piccoli frammenti di dati di iMessage che raccoglie, li esamina nel suo insieme e può dedurre schemi da ciò che le persone stanno digitando e in quale contesto. Ciò significa che il tuo iPhone può offrirti scelte più intelligenti perché beneficia di tutte quelle conversazioni di testo che altri stanno creando e pensano, "questa è probabilmente l'emoji che vuoi".
Prende un villaggio (di Emoji)
Il lato negativo di Privacy differenziale è che non fornisce risultati accurati in piccoli campioni. Il potere sta nel rendere vaghi dati specifici, quindi non può essere attribuito a nessun utente. Perché funzioni e funzioni bene, molti utenti devono partecipare.
È un po 'come guardare una foto bitmap estremamente vicina. Non sarai in grado di vedere di cosa si tratta se guardi solo alcuni bit, ma mentre fai un passo indietro e guardi l'intera cosa, l'immagine diventa più chiara e definita, anche se non è super alta risoluzione.
Pertanto, al fine di migliorare la sostituzione e la previsione delle emoji (tra le altre cose), Apple ha bisogno di raccogliere dati iPhone e Mac da tutto il mondo per dare un'immagine sempre più chiara di ciò che le persone stanno facendo e quindi migliorare le sue app e servizi. Si rivolge a tutti questi dati randomizzati, rumorosi, crowdsourcing e li estrae per i pattern, come ad esempio il numero di utenti che utilizzano l'emoji Peach al posto di "butt".
Quindi, la potenza di Differential Privacy si basa sulla capacità di Apple di esaminare grandi quantità di dati aggregati, assicurando nel contempo che non sia più saggio chi li stia inviando tali dati.
Come disattivare la privacy differenziale in iOS e macOS
Se non sei ancora convinto che la Differential Privacy sia giusta per te, sei fortunato. Puoi disattivare direttamente dalle impostazioni del tuo dispositivo.
Sul tuo dispositivo iOS, tocca "Impostazioni" e poi "Privacy".
Nella schermata Privacy, tocca "Diagnostica e utilizzo".
Infine, nella schermata Diagnostica e utilizzo, tocca "Non inviare".
Su macOS, apri le Preferenze di Sistema e fai clic su "Sicurezza e privacy".
Nelle preferenze Sicurezza e privacy, fare clic sulla scheda "Privacy" e quindi assicurarsi che "Invia dati di diagnostica e utilizzo a Apple" sia deselezionato. Nota che dovrai fare clic sull'icona a forma di lucchetto nell'angolo in basso a sinistra e inserire la password di sistema prima di poter apportare questa modifica.
Ovviamente, c'è molto di più nella Privacy differenziale, sia in teoria che in applicazione, rispetto a questa spiegazione semplificata. La carne e le patate di esso dipendono pesantemente da alcune matematiche serie e come tale, può diventare piuttosto pesante e complicato.
Speriamo, tuttavia, che questo ti dia un'idea di come funzioni e di sentirti più sicuro delle aziende che raccolgono determinati dati senza timore di essere identificati.