Kembali
Safety & Evaluation · Menengah
Moderation
Proses mendeteksi atau menangani konten yang melanggar kebijakan.
Definisi sederhana
Proses mendeteksi atau menangani konten yang melanggar kebijakan.
Penjelasan tanpa jargon
Proses mendeteksi atau menangani konten yang melanggar kebijakan. Biasanya istilah ini dipakai saat membuat test set, aturan data, validasi output, dan simulasi serangan.
Analogi
Seperti quality control, pagar pengaman, dan uji tabrak sebelum produk dipakai. Moderation kurang lebih bekerja di bagian yang mengatur alurnya.
Contoh penggunaan
Contoh paling gampang: Moderation dipakai saat membuat test set, aturan data, validasi output, dan simulasi serangan.
Kenapa penting
Kalau paham Moderation, kamu mencegah output meyakinkan tetapi salah, berbahaya, atau membocorkan data.
Istilah terkait
- Guardrails
- Data Privacy
- Output Validation
Kesalahan pemula
Yang sering membuat keliru: mengandalkan satu filter dan menganggap sistem sudah aman. Moderation juga beda dengan Guardrails.