Safety, Privacy & Eval

M11.L01 · Menengah · 35-45 menit

Privacy dan data yang tidak boleh sembarang masuk AI

Privacy dan data yang tidak boleh sembarang masuk AI kedengarannya teknis. Sebenarnya tidak serumit itu kalau dibedah pelan-pelan.

KALAU LESSON INI BERES1/3

Paham pII
Paham confidential data
Paham data minimization

Sebelum mulai

Baca ringkasan modul dan siapkan satu contoh pekerjaan nyata.
Selesaikan modul sebelumnya atau pahami konsep dasarnya dulu.

Target belajar: Setelah lesson ini, kamu bisa menjelaskan privacy dan data yang tidak boleh sembarang masuk ai, menerapkannya pada contoh Indonesia yang sederhana, dan tahu bagian mana yang harus dicek manusia.

Yang perlu kamu tangkap

01PII

PII perlu dipahami sebagai bagian dari data classification. Data yang harus hati-hati: identitas pribadi, nomor dokumen, data kesehatan, data finansial, kontrak rahasia, API key, password, data customer, dan dokumen internal yang belum boleh publik. Prinsipnya: masukkan data seminimal mungkin untuk menyelesaikan task.

Kenapa penting: Ini penting karena lesson M11.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan pii membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Aman: “customer A komplain barang telat”. Tidak aman: tempel nama lengkap, nomor HP, alamat rumah, invoice, dan chat lengkap tanpa izin.

Kesalahan pemula: Kesalahan umum: menganggap pii otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

02Confidential data

Confidential data perlu dipahami sebagai bagian dari prompt injection. Sebelum memakai AI publik, redaksi data sensitif. Ganti nama dengan label, hapus nomor rekening, hapus email, dan jangan tempel API key. Untuk bisnis, cek policy vendor: apakah data dipakai untuk training, bagaimana retensi, siapa yang punya akses, dan apakah ada mode enterprise/privacy.

Kenapa penting: Ini penting karena lesson M11.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan confidential data membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Aman: “customer A komplain barang telat”. Tidak aman: tempel nama lengkap, nomor HP, alamat rumah, invoice, dan chat lengkap tanpa izin.

Kesalahan pemula: Kesalahan umum: menganggap confidential data otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

03Data minimization

Data minimization perlu dipahami sebagai bagian dari least privilege. Untuk website course, safety harus diajarkan secara praktis: checklist, contoh data aman/tidak aman, cara redaction, dan approval flow.

Kenapa penting: Ini penting karena lesson M11.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan data minimization membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Aman: “customer A komplain barang telat”. Tidak aman: tempel nama lengkap, nomor HP, alamat rumah, invoice, dan chat lengkap tanpa izin.

Kesalahan pemula: Kesalahan umum: menganggap data minimization otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

04Redaction

Redaction perlu dipahami sebagai bagian dari output validation dan audit log. Data yang harus hati-hati: identitas pribadi, nomor dokumen, data kesehatan, data finansial, kontrak rahasia, API key, password, data customer, dan dokumen internal yang belum boleh publik. Prinsipnya: masukkan data seminimal mungkin untuk menyelesaikan task.

Kenapa penting: Ini penting karena lesson M11.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan redaction membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Aman: “customer A komplain barang telat”. Tidak aman: tempel nama lengkap, nomor HP, alamat rumah, invoice, dan chat lengkap tanpa izin.

Kesalahan pemula: Kesalahan umum: menganggap redaction otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

05Access control

Access control perlu dipahami sebagai bagian dari Access control. Sebelum memakai AI publik, redaksi data sensitif. Ganti nama dengan label, hapus nomor rekening, hapus email, dan jangan tempel API key. Untuk bisnis, cek policy vendor: apakah data dipakai untuk training, bagaimana retensi, siapa yang punya akses, dan apakah ada mode enterprise/privacy.

Kenapa penting: Ini penting karena lesson M11.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan access control membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Aman: “customer A komplain barang telat”. Tidak aman: tempel nama lengkap, nomor HP, alamat rumah, invoice, dan chat lengkap tanpa izin.

Kesalahan pemula: Kesalahan umum: menganggap access control otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

06Retention

Retention perlu dipahami sebagai bagian dari Retention. Untuk website course, safety harus diajarkan secara praktis: checklist, contoh data aman/tidak aman, cara redaction, dan approval flow.

Kenapa penting: Ini penting karena lesson M11.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan retention membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Aman: “customer A komplain barang telat”. Tidak aman: tempel nama lengkap, nomor HP, alamat rumah, invoice, dan chat lengkap tanpa izin.

Kesalahan pemula: Kesalahan umum: menganggap retention otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

07Vendor policy

Vendor policy perlu dipahami sebagai bagian dari Vendor policy. Data yang harus hati-hati: identitas pribadi, nomor dokumen, data kesehatan, data finansial, kontrak rahasia, API key, password, data customer, dan dokumen internal yang belum boleh publik. Prinsipnya: masukkan data seminimal mungkin untuk menyelesaikan task.

Kenapa penting: Ini penting karena lesson M11.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan vendor policy membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Aman: “customer A komplain barang telat”. Tidak aman: tempel nama lengkap, nomor HP, alamat rumah, invoice, dan chat lengkap tanpa izin.

Kesalahan pemula: Kesalahan umum: menganggap vendor policy otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

Oke, sekarang kita bongkar

Data yang harus hati-hati: identitas pribadi, nomor dokumen, data kesehatan, data finansial, kontrak rahasia, API key, password, data customer, dan dokumen internal yang belum boleh publik. Prinsipnya: masukkan data seminimal mungkin untuk menyelesaikan task.

Sebelum memakai AI publik, redaksi data sensitif. Ganti nama dengan label, hapus nomor rekening, hapus email, dan jangan tempel API key. Untuk bisnis, cek policy vendor: apakah data dipakai untuk training, bagaimana retensi, siapa yang punya akses, dan apakah ada mode enterprise/privacy.

Untuk website course, safety harus diajarkan secara praktis: checklist, contoh data aman/tidak aman, cara redaction, dan approval flow.

Contoh biar kebayang

Aman: “customer A komplain barang telat”. Tidak aman: tempel nama lengkap, nomor HP, alamat rumah, invoice, dan chat lengkap tanpa izin.

Coba praktik

Ambil contoh data customer fiktif.
Tandai field sensitif.
Buat versi redacted.
Gunakan versi redacted untuk prompt.

Prompt yang bisa kamu coba

Redaksi data sensitif dari teks berikut sebelum dipakai untuk AI. Tandai informasi yang dihapus dan ganti dengan placeholder. Teks: [tempel teks].

Beneran paham, atau cuma terasa familiar?

Jawab pakai bahasamu sendiri. Kalau masih muter-muter, bagian atasnya perlu dibaca sekali lagi.

1
Apa itu data minimization?
2
Sebutkan 5 jenis data yang tidak boleh sembarang dimasukkan ke AI.
3
Kenapa API key tidak boleh ditempel ke prompt?

Bikin sesuatu dari lesson ini

Buat Privacy Checklist untuk pengguna AI pemula dan bisnis kecil.

Catatan dan batasan

Tambahkan warning pada lesson automation dan agent yang memakai data client.
Checklist tambahan: data classification.
Checklist tambahan: prompt injection.
Checklist tambahan: least privilege.
Checklist tambahan: output validation dan audit log.

Langkah berikutnya

Simpan hasil latihan, cek kembali dengan rubric sederhana, lalu lanjut ke lesson berikutnya saat output sudah bisa dijelaskan ulang.

llm token context window hallucination

Risiko LLM: prompt injection, data leakage, dan excessive agency