Komputasi rahasia untuk analisis data, AI, dan federated learning

Last reviewed 2024-12-20 UTC

Dokumen ini memberikan ringkasan umum tentang confidential computing, termasuk cara Anda dapat menggunakannya untuk kolaborasi data yang aman, pelatihan model AI, dan federated learning. Dokumen ini juga memberikan informasi tentang layanan Confidential Computing diGoogle Cloud dan referensi arsitektur untuk berbagai kasus penggunaan.

Dokumen ini dimaksudkan untuk membantu para eksekutif teknologi memahami potensi bisnis komputasi rahasia dengan AI generatif dan AI terapan di berbagai industri, termasuk layanan keuangan dan kesehatan.

Apa itu confidential computing?

Praktik keamanan data secara konvensional berpusat pada perlindungan data saat nonaktif dan dalam pengiriman melalui enkripsi. Confidential computing menambahkan lapisan perlindungan baru dengan mengatasi kerentanan data selama penggunaan aktifnya. Teknologi ini memastikan bahwa informasi sensitif tetap bersifat rahasia meskipun sedang diproses, sehingga membantu menutup celah penting dalam keamanan data.

Lingkungan confidential computing menerapkan perlindungan data yang sedang digunakan dengan trusted execution environment (TEE) berbasis hardware. TEE adalah area aman dalam prosesor yang melindungi kerahasiaan dan integritas kode dan data yang dimuat di dalamnya. TEE berfungsi sebagai ruang aman untuk operasi sensitif, yang memitigasi risiko terhadap data meskipun sistem disusupi. Dengan Confidential Computing, data dapat tetap dienkripsi dalam memori selama pemrosesan.

Misalnya, Anda dapat menggunakan confidential computing untuk analisis data dan machine learning guna membantu mencapai hal berikut:

  • Privasi yang ditingkatkan: Lakukan analisis pada set data sensitif (misalnya, catatan medis atau data keuangan) tanpa mengekspos data ke infrastruktur yang mendasarinya atau pihak yang terlibat dalam komputasi.
  • Kolaborasi yang aman: Latih model machine learning secara bersama-sama atau lakukan analisis pada set data gabungan dari beberapa pihak tanpa mengungkapkan data individu kepada masing-masing pihak. Confidential computing meningkatkan kepercayaan dan memungkinkan pengembangan model yang lebih andal dan dapat digeneralisasi, terutama di sektor seperti layanan kesehatan dan keuangan.
  • Peningkatan keamanan data: Meminimalkan risiko pelanggaran data dan akses tidak sah, serta memastikan kepatuhan terhadap peraturan perlindungan data, seperti General Data Protection Regulation (GDPR) atau Health Insurance Portability and Accountability Act (HIPAA).
  • Meningkatkan kepercayaan dan transparansi: Memberikan bukti yang dapat diverifikasi bahwa komputasi dilakukan pada data yang dimaksud dan di lingkungan yang aman, sehingga meningkatkan kepercayaan di antara pemangku kepentingan.

Cara kerja lingkungan komputasi rahasia

Lingkungan komputasi rahasia memiliki properti berikut:

  • Enkripsi runtime: Prosesor menjaga semua data lingkungan confidential computing tetap dienkripsi dalam memori. Penyerang komponen sistem atau hardware yang mencoba membaca data lingkungan komputasi rahasia langsung dari memori hanya akan melihat data terenkripsi. Demikian pula, enkripsi mencegah modifikasi data lingkungan confidential computing melalui akses langsung ke memori.
  • Isolasi: Prosesor memblokir akses berbasis software ke lingkungan komputasi rahasia. Sistem operasi dan aplikasi lain hanya dapat berkomunikasi dengan lingkungan komputasi rahasia melalui antarmuka tertentu.
  • Pengesahan: Dalam konteks komputasi rahasia, pengesahan memverifikasi keandalan lingkungan komputasi rahasia. Dengan pengesahan, pengguna dapat melihat bukti bahwa Confidential Computing melindungi data mereka karena pengesahan memungkinkan Anda mengautentikasi instance TEE.

    Selama proses pengesahan, chip CPU yang mendukung TEE menghasilkan laporan yang ditandatangani secara kriptografis (dikenal sebagai laporan pengesahan) dari pengukuran instance. Pengukuran kemudian dikirim ke layanan pengesahan. Pengesahan untuk isolasi proses mengautentikasi aplikasi. Pengesahan untuk isolasi VM mengautentikasi VM, firmware virtual yang digunakan untuk meluncurkan VM, atau keduanya.

  • Keamanan siklus proses data: Confidential Computing menciptakan lingkungan pemrosesan yang aman untuk memberikan perlindungan yang didukung hardware bagi data yang sedang digunakan.

Teknologi Confidential Computing

Teknologi berikut memungkinkan confidential computing:

  • Enclave aman, juga dikenal sebagai confidential computing berbasis aplikasi
  • Confidential VM dan GPU, juga dikenal sebagai VM-based confidential computing

Google Cloud menggunakan Confidential VM untuk mengaktifkan komputasi rahasia. Untuk mengetahui informasi selengkapnya, lihat Menerapkan confidential computing di Google Cloud.

Enklave aman

Enclave aman adalah lingkungan komputasi yang menyediakan isolasi untuk kode dan data dari sistem operasi menggunakan isolasi berbasis hardware atau mengisolasi seluruh VM dengan menempatkan hypervisor dalam basis komputasi tepercaya (TCB). Enclave aman dirancang untuk memastikan bahwa bahkan pengguna dengan akses fisik atau root ke mesin dan sistem operasi tidak dapat mempelajari konten memori enclave aman atau merusak eksekusi kode di dalam enclave. Contoh enclave aman adalah Intel Software Guard Extension (SGX).

Confidential VM dan GPU rahasia

Confidential VM adalah jenis VM yang menggunakan enkripsi memori berbasis hardware untuk membantu melindungi data dan aplikasi. Confidential VM menawarkan isolasi dan pengesahan untuk meningkatkan keamanan. Teknologi komputasi Confidential VM mencakup AMD SEV, AMD SEV-SNP, Intel TDX, Arm CCA, IBM Z, IBM LinuxONE, dan GPU Confidential Nvidia.

GPU Rahasia membantu melindungi data dan mempercepat komputasi, terutama di lingkungan cloud dan bersama. Teknologi ini menggunakan teknik enkripsi dan isolasi berbasis hardware untuk membantu melindungi data saat sedang diproses di GPU, sehingga memastikan bahwa bahkan penyedia cloud atau pelaku kejahatan tidak dapat mengakses informasi sensitif.

Kasus penggunaan analisis data rahasia, AI, dan federated learning

Bagian berikut memberikan contoh kasus penggunaan komputasi rahasia untuk berbagai industri.

Layanan kesehatan dan ilmu hayati

Confidential computing memungkinkan berbagi dan analisis data yang aman di seluruh organisasi sekaligus menjaga privasi pasien. Confidential computing memungkinkan organisasi layanan kesehatan berpartisipasi dalam riset kolaboratif, pemodelan penyakit, penemuan obat, dan rencana perawatan yang dipersonalisasi.

Tabel berikut menjelaskan beberapa contoh penggunaan komputasi rahasia di sektor kesehatan.

Kasus penggunaan Deskripsi

Prediksi penyakit dan deteksi dini

Rumah sakit melatih model federated learning untuk mendeteksi lesi kanker dari data pencitraan medis (misalnya, pemindaian MRI atau pemindaian CT di beberapa rumah sakit atau wilayah rumah sakit) sambil menjaga kerahasiaan pasien.

Pemantauan pasien secara real-time

Penyedia layanan kesehatan menganalisis data dari perangkat kesehatan wearable dan aplikasi kesehatan seluler untuk pemantauan dan peringatan real-time. Misalnya, perangkat wearable mengumpulkan data tentang kadar glukosa, aktivitas fisik, dan kebiasaan diet untuk memberikan rekomendasi yang dipersonalisasi dan peringatan dini untuk fluktuasi gula darah.

Penemuan obat kolaboratif

Perusahaan farmasi melatih model pada set data eksklusif untuk mempercepat penemuan obat, meningkatkan kolaborasi sekaligus melindungi kekayaan intelektual.

Jasa keuangan

Confidential Computing memungkinkan lembaga keuangan membuat sistem keuangan yang lebih aman dan tangguh.

Tabel berikut menjelaskan beberapa contoh penggunaan confidential computing dalam layanan keuangan.

Kasus penggunaan Deskripsi

Kejahatan keuangan

Lembaga keuangan dapat berkolaborasi dalam upaya model anti pencucian uang (AML) atau penipuan umum dengan membagikan informasi tentang transaksi yang mencurigakan sekaligus melindungi privasi pelanggan. Dengan menggunakan confidential computing, lembaga dapat menganalisis data bersama ini secara aman, dan melatih model untuk mengidentifikasi dan menghentikan skema pencucian uang yang kompleks secara lebih efektif.

Penilaian risiko kredit yang menjaga privasi

Pemberi pinjaman dapat menilai risiko kredit menggunakan berbagai sumber data, termasuk data dari lembaga keuangan lain atau bahkan entitas non-keuangan. Dengan menggunakan confidential computing, pemberi pinjaman dapat mengakses dan menganalisis data ini tanpa mengeksposnya kepada pihak yang tidak berwenang, sehingga meningkatkan akurasi model penskoran kredit sekaligus menjaga privasi data.

Penemuan harga yang menjaga privasi

Dalam dunia keuangan, terutama di area seperti pasar over-the-counter atau aset tidak likuid, penetapan harga yang akurat sangat penting. Komputasi rahasia memungkinkan beberapa institusi menghitung harga yang akurat secara kolaboratif, tanpa mengungkapkan data sensitif mereka satu sama lain.

Sektor publik

Confidential computing memungkinkan pemerintah membuat layanan yang lebih transparan, efisien, dan efektif, sekaligus mempertahankan kontrol dan kedaulatan atas data mereka.

Tabel berikut menjelaskan beberapa contoh penggunaan komputasi rahasia di sektor publik.

Kasus penggunaan Deskripsi

Kedaulatan digital

Confidential Computing memastikan bahwa data selalu dienkripsi, bahkan saat sedang diproses. Solusi ini memungkinkan migrasi data warga yang aman ke cloud, dengan data yang dilindungi meskipun dihosting di infrastruktur eksternal, di seluruh lingkungan hybrid, publik, atau multicloud. Confidential computing mendukung dan memberdayakan kedaulatan digital dan otonomi digital, dengan kontrol dan perlindungan data tambahan untuk data yang digunakan sehingga kunci enkripsi tidak dapat diakses oleh penyedia cloud.

Analisis rahasia multi-lembaga

Komputasi rahasia memungkinkan analisis data multi-pihak di beberapa lembaga pemerintah (misalnya, kesehatan, pajak, dan pendidikan), atau di beberapa pemerintah di berbagai wilayah atau negara. Komputasi rahasia membantu memastikan bahwa batas kepercayaan dan privasi data terlindungi, sekaligus memungkinkan analisis data (menggunakan pencegahan kebocoran data (DLP), analisis skala besar, dan mesin kebijakan) serta pelatihan dan penayangan AI.

AI Tepercaya

Data pemerintah sangat penting dan dapat digunakan untuk melatih model AI pribadi dengan cara yang tepercaya untuk meningkatkan kualitas layanan internal serta interaksi dengan warga. Confidential computing memungkinkan framework AI tepercaya, dengan pelatihan pembuatan perintah rahasia atau confidential retrieval augmented generation (RAG) untuk menjaga data dan model warga tetap bersifat pribadi dan aman.

Supply chain

Confidential computing memungkinkan organisasi mengelola rantai pasokan dan kolaborasi keberlanjutan mereka serta berbagi insight sambil menjaga privasi data.

Tabel berikut menjelaskan beberapa contoh penggunaan confidential computing dalam rantai pasokan.

Kasus penggunaan Deskripsi

Perkiraan permintaan dan pengoptimalan inventaris

Dengan komputasi rahasia, setiap bisnis melatih model perkiraan permintaannya sendiri berdasarkan data penjualan dan inventarisnya sendiri. Model ini kemudian digabungkan secara aman ke dalam model global, sehingga memberikan gambaran yang lebih akurat dan holistik tentang pola permintaan di seluruh rantai pasokan.

Penilaian risiko pemasok yang menjaga privasi

Setiap organisasi yang terlibat dalam penilaian risiko pemasok (misalnya, pembeli, lembaga keuangan, dan auditor) melatih model penilaian risiko mereka sendiri menggunakan data mereka sendiri. Model ini digabungkan untuk membuat profil risiko supplier yang komprehensif dan menjaga privasi, sehingga memungkinkan identifikasi awal potensi risiko supplier, peningkatan ketahanan rantai pasokan, dan pengambilan keputusan yang lebih baik dalam pemilihan dan pengelolaan supplier.

Pelacakan dan pengurangan jejak karbon

Komputasi rahasia menawarkan solusi untuk mengatasi tantangan privasi dan transparansi data dalam upaya pelacakan dan pengurangan jejak karbon. Komputasi rahasia memungkinkan organisasi membagikan dan menganalisis data tanpa mengungkapkan bentuk mentahnya, sehingga memungkinkan organisasi membuat keputusan yang tepat dan mengambil tindakan yang efektif untuk masa depan yang lebih berkelanjutan.

Iklan digital

Iklan digital telah beralih dari cookie pihak ketiga ke alternatif yang lebih aman privasinya, seperti Privacy Sandbox. Privacy Sandbox mendukung kasus penggunaan periklanan penting sekaligus membatasi pelacakan lintas situs dan aplikasi. Privacy Sandbox menggunakan TEE untuk memastikan pemrosesan data pengguna yang aman oleh perusahaan periklanan.

Anda dapat menggunakan TEEs dalam kasus penggunaan iklan digital berikut:

  • Algoritma pencocokan: Menemukan korespondensi atau hubungan dalam set data.
  • Atribusi: Menghubungkan efek atau peristiwa kembali ke kemungkinan penyebabnya.
  • Agregasi: Menghitung ringkasan atau statistik dari data mentah.

Menerapkan confidential computing di Google Cloud

Google Cloud mencakup layanan berikut yang memungkinkan komputasi rahasia:

  • Confidential VM: Aktifkan enkripsi data aktif untuk workload yang menggunakan VM
  • Confidential GKE: Aktifkan enkripsi data aktif untuk workload yang menggunakan kontainer
  • Confidential Dataflow: Aktifkan enkripsi data aktif untuk streaming analisis dan machine learning
  • Confidential Dataproc: Aktifkan enkripsi data aktif untuk pemrosesan data
  • Confidential Space: Mengaktifkan enkripsi data aktif untuk analisis data dan machine learning bersama

Layanan ini memungkinkan Anda mengurangi batas kepercayaan sehingga lebih sedikit resource yang memiliki akses ke data rahasia Anda. Misalnya, di lingkungan Google Cloud tanpa Confidential Computing, batas kepercayaan mencakup Google Cloud infrastruktur (hardware, hypervisor, dan OS host) serta OS tamu. Di lingkungan Google Cloud yang mencakup Confidential Computing (tanpa Confidential Space), batas kepercayaan hanya mencakup OS tamu dan aplikasi. Di lingkungan Google Cloud dengan Confidential Space, batas kepercayaan hanyalah aplikasi dan ruang memori terkaitnya. Tabel berikut menunjukkan cara batas kepercayaan dikurangi dengan Confidential Computing dan Confidential Space.

Elemen Dalam batas kepercayaan tanpa menggunakan Confidential Computing Dalam batas kepercayaan saat menggunakan Confidential Computing Dalam batas kepercayaan saat menggunakan Confidential Space

Stack cloud dan administrator

Ya

Tidak

Tidak

BIOS dan firmware

Ya

Tidak

Tidak

OS host dan hypervisor

Ya

Tidak

Tidak

Admin tamu VM

Ya

Ya

Tidak

OS tamu VM

Ya

Ya

Ya, diukur dan disahkan

Aplikasi

Ya

Ya

Ya, diukur dan disahkan

Data rahasia

Ya

Ya

Ya

Confidential Space membuat area aman dalam VM untuk memberikan tingkat isolasi dan perlindungan tertinggi bagi data dan aplikasi sensitif. Manfaat keamanan utama Ruang Rahasia meliputi:

  • Pertahanan mendalam: Menambahkan lapisan keamanan ekstra di atas teknologi komputasi rahasia yang ada.
  • Permukaan serangan yang lebih kecil: Mengisolasi aplikasi dari potensi kerentanan di OS tamu.
  • Kontrol yang ditingkatkan: Memberikan kontrol terperinci atas akses dan izin dalam lingkungan yang aman.
  • Kepercayaan yang lebih kuat: Menawarkan jaminan yang lebih tinggi atas kerahasiaan dan integritas data.

Confidential Space dirancang untuk menangani workload yang sangat sensitif, terutama di industri yang diatur atau skenario yang melibatkan kolaborasi multi-pihak yang mengutamakan privasi data.

Referensi arsitektur untuk analisis rahasia, AI, dan federated learning

Anda dapat menerapkan confidential computing di Google Cloud untuk menangani kasus penggunaan berikut:

  • Analisis rahasia
  • AI Rahasia
  • Federated learning rahasia

Bagian berikut memberikan informasi selengkapnya tentang arsitektur untuk kasus penggunaan ini, termasuk contoh untuk bisnis keuangan dan kesehatan.

Arsitektur analisis rahasia untuk institusi layanan kesehatan

Arsitektur analisis rahasia menunjukkan cara beberapa institusi kesehatan (seperti penyedia layanan kesehatan, institusi biofarmasi, dan institusi penelitian) dapat bekerja sama untuk mempercepat penelitian obat. Arsitektur ini menggunakan teknik confidential computing untuk membuat ruang bersih digital guna menjalankan analisis kolaboratif rahasia.

Arsitektur ini memiliki manfaat berikut:

  • Insight yang lebih baik: Analisis kolaboratif memungkinkan organisasi kesehatan memperoleh insight yang lebih luas dan mengurangi waktu pemasaran untuk penemuan obat yang lebih baik.
  • Privasi data: Data transaksi sensitif tetap dienkripsi dan tidak pernah diekspos ke peserta lain atau TEE, sehingga memastikan kerahasiaan.
  • Kepatuhan terhadap peraturan: Arsitektur ini membantu institusi kesehatan mematuhi peraturan perlindungan data dengan mempertahankan kontrol yang ketat atas data mereka.
  • Kepercayaan dan kolaborasi: Arsitektur ini memungkinkan kolaborasi yang aman antara institusi yang bersaing, sehingga mendorong upaya kolektif untuk menemukan obat-obatan.

Diagram berikut menunjukkan arsitektur ini.

Diagram arsitektur analisis rahasia untuk institusi layanan kesehatan.

Komponen utama dalam arsitektur ini mencakup:

  • Server agregasi OLAP TEE: Lingkungan yang aman dan terisolasi tempat pelatihan dan inferensi model machine learning terjadi. Data dan kode dalam TEE dilindungi dari akses yang tidak sah, bahkan dari sistem operasi yang mendasarinya atau penyedia cloud.
  • Partner kolaborasi: Setiap institusi kesehatan yang berpartisipasi memiliki lingkungan lokal yang berfungsi sebagai perantara antara data pribadi institusi dan TEE.
  • Data terenkripsi khusus penyedia: Setiap institusi layanan kesehatan menyimpan data pasien terenkripsi pribadi miliknya sendiri yang mencakup rekam medis elektronik. Data ini tetap dienkripsi selama proses analisis, yang memastikan privasi data. Data hanya dirilis ke TEE setelah memvalidasi klaim pengesahan dari masing-masing penyedia.
  • Klien Analytics: Lembaga kesehatan yang berpartisipasi dapat menjalankan kueri rahasia terhadap data mereka untuk mendapatkan insight langsung.

Arsitektur AI rahasia untuk lembaga keuangan

Pola arsitektur ini menunjukkan cara lembaga keuangan dapat melatih model deteksi penipuan secara kolaboratif sekaligus menggunakan label penipuan untuk menjaga kerahasiaan data transaksi sensitif mereka. Arsitektur ini menggunakan teknik komputasi rahasia untuk mengaktifkan machine learning multipihak yang aman.

Arsitektur ini memiliki manfaat berikut:

  • Deteksi penipuan yang ditingkatkan: Pelatihan kolaboratif menggunakan set data yang lebih besar dan lebih beragam, sehingga menghasilkan model deteksi penipuan yang lebih akurat dan efektif.
  • Privasi data: Data transaksi sensitif tetap dienkripsi dan tidak pernah diekspos ke peserta lain atau TEE, sehingga memastikan kerahasiaan.
  • Kepatuhan terhadap peraturan: Arsitektur ini membantu lembaga keuangan mematuhi peraturan perlindungan data dengan mempertahankan kontrol ketat atas data mereka.
  • Kepercayaan dan kolaborasi: Arsitektur ini memungkinkan kolaborasi yang aman antara institusi yang bersaing, sehingga mendorong upaya kolektif untuk memerangi penipuan keuangan.

Diagram berikut menunjukkan arsitektur ini.

Diagram arsitektur analisis rahasia untuk lembaga keuangan.

Komponen utama arsitektur ini meliputi:

  • Server agregasi OLAP TEE: Lingkungan yang aman dan terisolasi tempat pelatihan dan inferensi model machine learning terjadi. Data dan kode dalam TEE dilindungi dari akses yang tidak sah, bahkan dari sistem operasi yang mendasarinya atau penyedia cloud.
  • Pelatihan model TEE: Model dasar penipuan global dikemas sebagai container untuk menjalankan pelatihan ML. Dalam TEE, model global dilatih lebih lanjut menggunakan data terenkripsi dari semua bank yang berpartisipasi. Proses pelatihan menggunakan teknik seperti federated learning atau secure multi-party computation untuk memastikan bahwa tidak ada data mentah yang diekspos.
  • Partner kolaborator: Setiap lembaga keuangan yang berpartisipasi memiliki lingkungan lokal yang bertindak sebagai perantara antara data pribadi lembaga dan TEE.
  • Data terenkripsi khusus bank: Setiap bank menyimpan data transaksi terenkripsi pribadinya sendiri yang mencakup label penipuan. Data ini tetap dienkripsi selama seluruh proses, sehingga memastikan privasi data. Data hanya dilepaskan ke TEE setelah memvalidasi klaim pengesahan dari masing-masing bank.
  • Repositori model: Model deteksi penipuan terlatih yang berfungsi sebagai titik awal untuk pelatihan kolaboratif.
  • Model dan bobot terlatih penipuan global (dilambangkan dengan garis hijau): Model deteksi penipuan yang ditingkatkan, beserta bobot yang dipelajarinya, ditukar kembali secara aman ke bank yang berpartisipasi. Kemudian, mereka dapat men-deploy model yang ditingkatkan ini secara lokal untuk mendeteksi penipuan pada transaksi mereka sendiri.

Arsitektur federated learning rahasia untuk lembaga keuangan

Federated learning menawarkan solusi canggih bagi pelanggan yang menghargai privasi data dan kedaulatan data yang ketat. Arsitektur federated learning rahasia memberikan cara yang aman, skalabel, dan efisien untuk menggunakan data bagi aplikasi AI. Arsitektur ini membawa model ke lokasi tempat data disimpan, bukan memusatkan data di satu lokasi, sehingga mengurangi risiko yang terkait dengan kebocoran data.

Pola arsitektur ini menunjukkan cara beberapa lembaga keuangan dapat berkolaborasi melatih model deteksi penipuan sekaligus menjaga kerahasiaan data transaksi sensitif mereka dengan label penipuan. Teknologi ini menggunakan federated learning bersama dengan teknik confidential computing untuk memungkinkan machine learning multipihak yang aman tanpa pergerakan data pelatihan.

Arsitektur ini memiliki manfaat berikut:

  • Peningkatan privasi dan keamanan data: Federated learning memungkinkan privasi dan lokalitas data dengan memastikan bahwa data sensitif tetap berada di setiap situs. Selain itu, lembaga keuangan dapat menggunakan teknik yang menjaga privasi seperti enkripsi homomorfik dan filter privasi diferensial untuk lebih melindungi data yang ditransfer (seperti bobot model).
  • Peningkatan akurasi dan keragaman: Dengan melatih berbagai sumber data dari berbagai klien, lembaga keuangan dapat mengembangkan model global yang andal dan dapat digeneralisasi untuk merepresentasikan set data heterogen dengan lebih baik.
  • Skalabilitas dan efisiensi jaringan: Dengan kemampuan untuk melakukan pelatihan di perangkat edge, institusi dapat menskalakan federated learning di seluruh dunia. Selain itu, institusi hanya perlu mentransfer bobot model, bukan seluruh set data, sehingga memungkinkan penggunaan resource jaringan yang efisien.

Diagram berikut menunjukkan arsitektur ini.

Diagram arsitektur federated learning rahasia.

Komponen utama arsitektur ini meliputi:

  • Server gabungan dalam cluster TEE: Lingkungan yang aman dan terisolasi tempat server federated learning mengatur kolaborasi beberapa klien dengan terlebih dahulu mengirimkan model awal ke klien federated learning. Klien melakukan pelatihan pada set data lokal mereka, lalu mengirimkan update model kembali ke server federated learning untuk diagregasi guna membentuk model global.
  • Repositori model federated learning: Model deteksi penipuan terlatih yang berfungsi sebagai titik awal untuk federated learning.
  • Mesin inferensi aplikasi lokal: Aplikasi yang menjalankan tugas, melakukan komputasi dan pembelajaran lokal dengan set data lokal, serta mengirimkan kembali hasil ke server federated learning untuk agregasi yang aman.
  • Data pribadi lokal: Setiap bank menyimpan data transaksi terenkripsi pribadi miliknya sendiri yang mencakup label penipuan. Data ini tetap dienkripsi selama seluruh proses, sehingga memastikan privasi data.
  • Protokol agregasi aman (dilambangkan dengan garis biru putus-putus): Server federated learning tidak perlu mengakses pembaruan masing-masing bank untuk melatih model; server hanya memerlukan rata-rata tertimbang per elemen dari vektor pembaruan, yang diambil dari subset acak bank atau situs. Menggunakan protokol agregasi yang aman untuk menghitung rata-rata tertimbang ini membantu memastikan bahwa server hanya dapat mempelajari bahwa satu atau beberapa bank dalam subset yang dipilih secara acak ini menulis kata tertentu, tetapi bukan bank mana, sehingga menjaga privasi setiap peserta dalam proses federated learning.
  • Model yang dilatih untuk mendeteksi penipuan secara global dan bobot gabungan (dilambangkan dengan garis hijau): Model deteksi penipuan yang ditingkatkan, beserta bobot yang dipelajarinya, dikirim kembali ke bank yang berpartisipasi secara aman. Selanjutnya, bank dapat men-deploy model yang ditingkatkan ini secara lokal untuk mendeteksi penipuan pada transaksi mereka sendiri.

Langkah berikutnya

Kontributor