Apa itu Privasi Diferensial, dan Bagaimana Cara Menjaga Data Saya Tetap Anonim?
Apple mempertaruhkan reputasi mereka untuk memastikan data yang dikumpulkannya dari Anda tetap rahasia. Bagaimana? Dengan menggunakan sesuatu yang disebut "Privasi Diferensial."
Apa itu Privasi Diferensial?
Apple menjelaskannya sebagai berikut:
Apple menggunakan teknologi Privasi Diferensial untuk membantu menemukan pola penggunaan sejumlah besar pengguna tanpa mengorbankan privasi individu. Untuk mengaburkan identitas individu, Diferensial Privasi menambahkan suara matematika ke sampel kecil dari pola penggunaan individu. Semakin banyak orang berbagi pola yang sama, pola umum mulai muncul, yang dapat menginformasikan dan meningkatkan pengalaman pengguna.
Filosofi di balik Privasi Diferensial adalah ini: setiap pengguna yang perangkatnya, apakah itu iPhone, iPad, atau Mac, menambahkan perhitungan ke kumpulan data agregat yang lebih besar (gambar besar yang dibentuk dari berbagai gambar kecil), tidak boleh diungkapkan sebagai sumbernya, apalagi data apa yang dikontribusikannya.
Apple bukan satu-satunya perusahaan yang melakukan ini, baik Google maupun Microsoft menggunakannya lebih awal. Namun Apple mempopulerkannya dengan membicarakannya secara mendetil pada keynote WWDC 2016-nya.
Jadi, apa bedanya dengan data anonim lainnya, Anda bertanya? Nah, data anonim masih dapat digunakan untuk menyimpulkan informasi pribadi jika Anda cukup tahu tentang seseorang.
Katakanlah seorang hacker dapat mengakses database anonim yang mengungkapkan daftar gaji perusahaan. Katakanlah mereka juga tahu bahwa Karyawan X pindah ke daerah lain. Peretas kemudian dapat dengan mudah meminta basis data sebelum dan sesudah Karyawan X bergerak dan dengan mudah menyimpulkan penghasilannya.
Untuk melindungi informasi sensitif Karyawan X, Privasi Diferensial mengubah data dengan "noise" matematis dan teknik lainnya sehingga jika Anda meminta database, Anda hanya akan menerima perkiraan berapa banyak (atau siapa pun) Karyawan X dibayar.
Oleh karena itu, privasinya dipertahankan karena "perbedaan" antara data yang diberikan dan suara yang ditambahkan padanya, sehingga cukup samar sehingga hampir tidak mungkin untuk mengetahui apakah data yang Anda lihat sebenarnya adalah data individu tertentu..
Bagaimana Cara Kerja Privasi Diferensial Apple?
Diferensial Privasi adalah konsep yang relatif baru, tetapi idenya adalah bahwa ia dapat memberikan wawasan perusahaan yang tajam berdasarkan data dari penggunanya, tanpa mengetahui apa persis bahwa data mengatakan atau dari siapa asalnya.
Apple, misalnya, bergantung pada tiga komponen untuk melakukan tugas Privasi Diferensial pada perangkat Mac atau iOS Anda: hashing, subsampling, dan injeksi noise.
Hashing mengambil string teks dan mengubahnya menjadi nilai yang lebih pendek dengan panjang tetap dan mencampurkan kunci-kunci ini menjadi string acak unik dari karakter unik atau "hash". Ini mengaburkan data Anda sehingga perangkat tidak menyimpannya dalam bentuk aslinya.
Subsampling berarti bahwa alih-alih mengumpulkan setiap kata yang diketik seseorang, Apple hanya akan menggunakan sampel yang lebih kecil. Misalnya, katakanlah Anda memiliki percakapan teks yang panjang dengan teman secara bebas menggunakan emoji. Alih-alih mengumpulkan seluruh percakapan itu, subsampling mungkin hanya menggunakan bagian-bagian yang diminati Apple, seperti emoji.
Akhirnya, perangkat Anda menyuntikkan noise, menambahkan data acak ke dalam dataset asli agar lebih kabur. Ini berarti bahwa Apple mendapatkan hasil yang telah ditutup-tutupi sedikit dan karenanya tidak cukup tepat.
Semua ini terjadi pada perangkat Anda, sehingga telah dipersingkat, dicampur, disampel, dan dikaburkan sebelum dikirim ke cloud untuk dianalisis oleh Apple..
Di Mana Privasi Diferensial Apple Digunakan?
Ada berbagai kasus di mana Apple mungkin ingin mengumpulkan data untuk meningkatkan aplikasi dan layanannya. Namun saat ini, Apple hanya menggunakan Diferensial Privasi di empat area spesifik.
- Ketika cukup banyak orang mengganti kata dengan emoji tertentu, itu akan menjadi saran untuk semua orang.
- Ketika kata-kata baru ditambahkan ke kamus lokal yang cukup untuk dianggap biasa, Apple akan menambahkannya ke kamus semua orang juga.
- Anda dapat menggunakan istilah pencarian di Spotlight, dan kemudian akan memberikan saran aplikasi dan membuka tautan itu di aplikasi tersebut atau memungkinkan Anda untuk menginstalnya dari App Store. Misalnya, Anda mencari "Star Trek", yang menyarankan aplikasi IMDB. Semakin banyak orang membuka atau menginstal aplikasi IMDB, semakin banyak itu akan muncul di hasil pencarian semua orang.
- Ini akan memberikan hasil yang lebih akurat untuk Petunjuk Pencarian di Notes. Misalnya, Anda memiliki catatan dengan kata "apel" di dalamnya. Anda melakukan pencarian pencarian dan itu memberi Anda hasil tidak hanya untuk definisi kamus, tetapi juga situs web Apple, lokasi Toko Apple, dan sebagainya. Agaknya, semakin banyak orang mengetuk hasil tertentu, semakin tinggi dan semakin sering mereka akan muncul di Pencarian untuk orang lain.
Mari kita gunakan emoji sebagai contoh. Di iOS 10, Apple memperkenalkan fitur penggantian emoji baru di iMessage. Ketik kata "cinta," dan Anda dapat menggantinya dengan emoji hati. ketikkan kata "anjing," dan - Anda dapat menebaknya - Anda dapat menggantinya dengan emoji anjing.
Demikian pula, iPhone Anda dapat memprediksi emoji apa yang Anda inginkan sehingga, jika Anda mengetik pesan "Aku akan mengajak anjing berjalan", iPhone Anda akan sangat menyarankan emoji anjing.
Jadi, Apple mengambil semua bagian kecil dari data iMessage yang dikumpulkannya, memeriksanya secara keseluruhan, dan dapat menyimpulkan pola dari apa yang diketik orang dan dalam konteks apa. Ini berarti iPhone Anda dapat memberi Anda pilihan yang lebih cerdas karena itu menguntungkan dari semua percakapan teks yang dibuat orang lain dan berpikir, "ini mungkin emoji yang Anda inginkan."
Membawa Desa (dari Emoji)
Kelemahan dari Privasi Diferensial adalah tidak memberikan hasil yang akurat dalam sampel kecil. Kekuatannya terletak pada pembuatan data spesifik yang tidak jelas sehingga tidak dapat dikaitkan dengan satu pengguna. Agar berfungsi dan bekerja dengan baik, banyak pengguna harus berpartisipasi.
Ini seperti melihat foto yang dipetakan dengan sangat dekat. Anda tidak akan dapat melihat apa itu jika Anda melihat hanya beberapa bit, tetapi ketika Anda melangkah mundur dan melihat semuanya, gambar menjadi lebih jelas dan lebih jelas, bahkan jika itu tidak super tinggi resolusi.
Jadi, untuk meningkatkan penggantian dan prediksi emoji (antara lain), Apple perlu mengumpulkan data iPhone dan Mac dari seluruh dunia untuk memberikan gambaran yang lebih jelas tentang apa yang dilakukan orang dan dengan demikian meningkatkan aplikasi dan layanannya. Ternyata semua data acak, berisik, crowdsourced ini, dan ranjau itu untuk pola-seperti berapa banyak pengguna yang menggunakan emoji persik sebagai ganti "butt."
Jadi, kekuatan Privasi Diferensial bergantung pada Apple yang mampu memeriksa sejumlah besar data agregat, sambil memastikan bahwa tidak ada yang lebih bijak tentang siapa yang mengirim mereka data itu..
Cara Menyisih dari Privasi Diferensial di iOS dan macOS
Namun, jika Anda masih tidak yakin bahwa Diferensial Privasi tepat untuk Anda, Anda beruntung. Anda dapat memilih keluar langsung dari pengaturan perangkat Anda.
Di perangkat iOS Anda, ketuk buka "Pengaturan" dan kemudian "Privasi".
Pada layar Privasi, ketuk “Diagnostics & Usage”.
Terakhir, pada layar Diagnostics & Usage, ketuk “Jangan Kirim”.
Di macOS, buka System Preferences dan klik "Keamanan & Privasi".
Di preferensi Keamanan & Privasi, klik tab "Privasi" dan kemudian pastikan "Kirim data diagnostik & penggunaan ke Apple" tidak dicentang. Perhatikan bahwa Anda harus mengklik ikon kunci di sudut kiri bawah dan memasukkan kata sandi sistem Anda sebelum Anda dapat melakukan perubahan ini.
Jelas, ada banyak hal untuk Privasi Diferensial, baik secara teori maupun aplikasi, daripada penjelasan yang disederhanakan ini. Daging dan kentang sangat bergantung pada beberapa matematika yang serius dan karena itu, bisa menjadi sangat berat dan rumit.
Mudah-mudahan, bagaimanapun, ini memberi Anda ide tentang cara kerjanya dan bahwa Anda merasa lebih percaya diri tentang perusahaan yang mengumpulkan data tertentu tanpa takut diidentifikasi.