M09.L01 · Lanjutan · 45-60 menit

Apa itu RAG dan kenapa penting?

Di sini kamu akan memahami apa itu rag dan kenapa penting? tanpa harus hafal jargon dulu.

KALAU LESSON INI BERES1/2

Paham retrieval-Augmented Generation
Paham knowledge base
Paham chunking

Sebelum mulai

Baca ringkasan modul dan siapkan satu contoh pekerjaan nyata.
Selesaikan modul sebelumnya atau pahami konsep dasarnya dulu.

Target belajar: Setelah lesson ini, kamu bisa menjelaskan apa itu rag dan kenapa penting?, menerapkannya pada contoh Indonesia yang sederhana, dan tahu bagian mana yang harus dicek manusia.

Yang perlu kamu tangkap

01Retrieval-Augmented Generation

Retrieval-Augmented Generation perlu dipahami sebagai bagian dari chunking dan metadata. RAG atau Retrieval-Augmented Generation adalah teknik membuat model menjawab dengan mengambil informasi relevan dari knowledge base eksternal sebelum menghasilkan jawaban. AWS menjelaskan RAG sebagai proses mengoptimalkan output LLM agar merujuk pada basis pengetahuan otoritatif di luar data pelatihan model.

Kenapa penting: Ini penting karena lesson M09.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan retrieval-augmented generation membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Chatbot course AI bisa memakai RAG untuk menjawab “lesson mana yang harus saya ambil kalau ingin belajar AI untuk konten?”. Sistem mengambil data lesson, roadmap, dan persona path sebelum menjawab.

Kesalahan pemula: Kesalahan umum: menganggap retrieval-augmented generation otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

02Knowledge base

Knowledge base perlu dipahami sebagai bagian dari embeddings. Masalah yang diselesaikan RAG: model tidak tau data internal, data terbaru, atau dokumen spesifik. Dengan RAG, dokumen perusahaan, FAQ, policy, course material, atau database komunitas bisa dicari lalu dipakai sebagai konteks jawaban.

Kenapa penting: Ini penting karena lesson M09.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan knowledge base membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Kesalahan pemula: Kesalahan umum: menganggap knowledge base otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

03Chunking

Chunking perlu dipahami sebagai bagian dari vector dan hybrid search. Pipeline dasar RAG: kumpulkan dokumen -> pecah menjadi chunk -> ubah menjadi embedding -> simpan di vector database -> saat user bertanya, cari chunk relevan -> berikan ke LLM -> LLM menjawab dengan sumber. RAG bukan obat semua hallucination, tapi membantu grounding jika data dan retrieval bagus.

Kenapa penting: Ini penting karena lesson M09.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan chunking membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Kesalahan pemula: Kesalahan umum: menganggap chunking otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

04Embedding

Embedding perlu dipahami sebagai bagian dari reranking dan RAG evaluation. RAG atau Retrieval-Augmented Generation adalah teknik membuat model menjawab dengan mengambil informasi relevan dari knowledge base eksternal sebelum menghasilkan jawaban. AWS menjelaskan RAG sebagai proses mengoptimalkan output LLM agar merujuk pada basis pengetahuan otoritatif di luar data pelatihan model.

Kenapa penting: Ini penting karena lesson M09.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan embedding membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Kesalahan pemula: Kesalahan umum: menganggap embedding otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

05Vector database

Vector database perlu dipahami sebagai bagian dari Vector database. Masalah yang diselesaikan RAG: model tidak tau data internal, data terbaru, atau dokumen spesifik. Dengan RAG, dokumen perusahaan, FAQ, policy, course material, atau database komunitas bisa dicari lalu dipakai sebagai konteks jawaban.

Kenapa penting: Ini penting karena lesson M09.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan vector database membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Kesalahan pemula: Kesalahan umum: menganggap vector database otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

06Retrieval

Retrieval perlu dipahami sebagai bagian dari Retrieval. Pipeline dasar RAG: kumpulkan dokumen -> pecah menjadi chunk -> ubah menjadi embedding -> simpan di vector database -> saat user bertanya, cari chunk relevan -> berikan ke LLM -> LLM menjawab dengan sumber. RAG bukan obat semua hallucination, tapi membantu grounding jika data dan retrieval bagus.

Kenapa penting: Ini penting karena lesson M09.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan retrieval membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Kesalahan pemula: Kesalahan umum: menganggap retrieval otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

07Citation

Citation perlu dipahami sebagai bagian dari Citation. RAG atau Retrieval-Augmented Generation adalah teknik membuat model menjawab dengan mengambil informasi relevan dari knowledge base eksternal sebelum menghasilkan jawaban. AWS menjelaskan RAG sebagai proses mengoptimalkan output LLM agar merujuk pada basis pengetahuan otoritatif di luar data pelatihan model.

Kenapa penting: Ini penting karena lesson M09.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan citation membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Kesalahan pemula: Kesalahan umum: menganggap citation otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

08Grounded answer

Grounded answer perlu dipahami sebagai bagian dari Grounded answer. Masalah yang diselesaikan RAG: model tidak tau data internal, data terbaru, atau dokumen spesifik. Dengan RAG, dokumen perusahaan, FAQ, policy, course material, atau database komunitas bisa dicari lalu dipakai sebagai konteks jawaban.

Kenapa penting: Ini penting karena lesson M09.L01 bukan cuma mengejar istilah. Kamu perlu tahu kapan grounded answer membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Kesalahan pemula: Kesalahan umum: menganggap grounded answer otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

Oke, sekarang kita bongkar

RAG atau Retrieval-Augmented Generation adalah teknik membuat model menjawab dengan mengambil informasi relevan dari knowledge base eksternal sebelum menghasilkan jawaban. AWS menjelaskan RAG sebagai proses mengoptimalkan output LLM agar merujuk pada basis pengetahuan otoritatif di luar data pelatihan model.

Masalah yang diselesaikan RAG: model tidak tau data internal, data terbaru, atau dokumen spesifik. Dengan RAG, dokumen perusahaan, FAQ, policy, course material, atau database komunitas bisa dicari lalu dipakai sebagai konteks jawaban.

Pipeline dasar RAG: kumpulkan dokumen -> pecah menjadi chunk -> ubah menjadi embedding -> simpan di vector database -> saat user bertanya, cari chunk relevan -> berikan ke LLM -> LLM menjawab dengan sumber. RAG bukan obat semua hallucination, tapi membantu grounding jika data dan retrieval bagus.

Contoh biar kebayang

Chatbot course AI bisa memakai RAG untuk menjawab “lesson mana yang harus saya ambil kalau ingin belajar AI untuk konten?”. Sistem mengambil data lesson, roadmap, dan persona path sebelum menjawab.

Coba praktik

Ambil 3 dokumen pendek.
Pecah menjadi chunk manual.
Tulis 5 pertanyaan user.
Tentukan chunk mana yang harus diambil untuk menjawab.

Prompt yang bisa kamu coba

Saya ingin membuat RAG untuk dokumen berikut: [jenis dokumen]. Bantu rancang: struktur knowledge base, aturan chunking, metadata, contoh pertanyaan user, retrieval strategy, dan format jawaban dengan sumber.

Beneran paham, atau cuma terasa familiar?

Jawab pakai bahasamu sendiri. Kalau masih muter-muter, bagian atasnya perlu dibaca sekali lagi.

1
Apa kepanjangan RAG?
2
Masalah apa yang diselesaikan RAG?
3
Apa itu chunking dan embedding?

Bikin sesuatu dari lesson ini

Buat desain RAG chatbot untuk FAQ/course/company docs, lengkap dengan data source dan contoh query.

Catatan dan batasan

Course website bisa punya AI assistant internal berbasis materi course menggunakan RAG.
Checklist tambahan: chunking dan metadata.
Checklist tambahan: embeddings.
Checklist tambahan: vector dan hybrid search.
Checklist tambahan: reranking dan RAG evaluation.

Langkah berikutnya

Simpan hasil latihan, cek kembali dengan rubric sederhana, lalu lanjut ke lesson berikutnya saat output sudah bisa dijelaskan ulang.

ai agent api webhook eval

Mendesain knowledge base yang bisa dibaca AI