Kembali
Safety & Evaluation · Menengah

Moderation

Proses mendeteksi atau menangani konten yang melanggar kebijakan.

Definisi sederhana

Proses mendeteksi atau menangani konten yang melanggar kebijakan.

Penjelasan tanpa jargon

Proses mendeteksi atau menangani konten yang melanggar kebijakan. Biasanya istilah ini dipakai saat membuat test set, aturan data, validasi output, dan simulasi serangan.

Analogi

Seperti quality control, pagar pengaman, dan uji tabrak sebelum produk dipakai. Moderation kurang lebih bekerja di bagian yang mengatur alurnya.

Contoh penggunaan

Contoh paling gampang: Moderation dipakai saat membuat test set, aturan data, validasi output, dan simulasi serangan.

Kenapa penting

Kalau paham Moderation, kamu mencegah output meyakinkan tetapi salah, berbahaya, atau membocorkan data.

Istilah terkait

  • Guardrails
  • Data Privacy
  • Output Validation

Kesalahan pemula

Yang sering membuat keliru: mengandalkan satu filter dan menganggap sistem sudah aman. Moderation juga beda dengan Guardrails.