LLM, token, context window, dan multimodal
Di sini kamu akan memahami llm, token, context window, dan multimodal tanpa harus hafal jargon dulu.
- Paham lLM sebagai model bahasa besar
- Paham token sebagai potongan teks yang dibaca model
- Paham context window sebagai batas memori percakapan
Sebelum mulai
- Baca ringkasan modul dan siapkan satu contoh pekerjaan nyata.
- Tidak perlu pengalaman teknis.
Yang perlu kamu tangkap
01LLM sebagai model bahasa besar
LLM sebagai model bahasa besar perlu dipahami sebagai bagian dari AI berbasis aturan vs machine learning. Large Language Model atau LLM adalah model AI yang dilatih untuk memproses dan menghasilkan bahasa. Model seperti ini bisa menjawab pertanyaan, menulis, merangkum, menerjemahkan, membuat kode, dan membantu reasoning. LLM membaca input sebagai token, bukan huruf persis seperti manusia.
Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan llm sebagai model bahasa besar membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.
Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.
Kesalahan pemula: Kesalahan umum: menganggap llm sebagai model bahasa besar otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.
02Token sebagai potongan teks yang dibaca model
Token sebagai potongan teks yang dibaca model perlu dipahami sebagai bagian dari training vs inference. Token adalah potongan teks. Satu kata bisa menjadi satu token atau beberapa token tergantung bahasa dan model. Context window adalah kapasitas informasi yang bisa “dilihat” model dalam satu percakapan atau satu request. Semakin besar context window, semakin banyak dokumen atau instruksi yang bisa dimasukkan, tapi kualitas tetap bergantung pada struktur konteks.
Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan token sebagai potongan teks yang dibaca model membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.
Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.
Kesalahan pemula: Kesalahan umum: menganggap token sebagai potongan teks yang dibaca model otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.
03Context window sebagai batas memori percakapan
Context window sebagai batas memori percakapan perlu dipahami sebagai bagian dari model vs aplikasi AI. Multimodal berarti model bisa bekerja dengan lebih dari satu jenis input/output: teks, gambar, audio, video, file, layar komputer, atau kode. Ini penting karena pekerjaan nyata jarang hanya teks. Banyak task perlu membaca screenshot, memahami tabel, menilai desain, atau mengekstrak informasi dari PDF.
Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan context window sebagai batas memori percakapan membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.
Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.
Kesalahan pemula: Kesalahan umum: menganggap context window sebagai batas memori percakapan otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.
04Multimodal sebagai kemampuan membaca/menulis lebih dari teks
Multimodal sebagai kemampuan membaca/menulis lebih dari teks perlu dipahami sebagai bagian dari AI, ML, deep learning, dan GenAI. Large Language Model atau LLM adalah model AI yang dilatih untuk memproses dan menghasilkan bahasa. Model seperti ini bisa menjawab pertanyaan, menulis, merangkum, menerjemahkan, membuat kode, dan membantu reasoning. LLM membaca input sebagai token, bukan huruf persis seperti manusia.
Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan multimodal sebagai kemampuan membaca/menulis lebih dari teks membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.
Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.
Kesalahan pemula: Kesalahan umum: menganggap multimodal sebagai kemampuan membaca/menulis lebih dari teks otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.
05Model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan
Model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan perlu dipahami sebagai bagian dari Model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan. Token adalah potongan teks. Satu kata bisa menjadi satu token atau beberapa token tergantung bahasa dan model. Context window adalah kapasitas informasi yang bisa “dilihat” model dalam satu percakapan atau satu request. Semakin besar context window, semakin banyak dokumen atau instruksi yang bisa dimasukkan, tapi kualitas tetap bergantung pada struktur konteks.
Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.
Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.
Kesalahan pemula: Kesalahan umum: menganggap model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.
Oke, sekarang kita bongkar
Large Language Model atau LLM adalah model AI yang dilatih untuk memproses dan menghasilkan bahasa. Model seperti ini bisa menjawab pertanyaan, menulis, merangkum, menerjemahkan, membuat kode, dan membantu reasoning. LLM membaca input sebagai token, bukan huruf persis seperti manusia.
Token adalah potongan teks. Satu kata bisa menjadi satu token atau beberapa token tergantung bahasa dan model. Context window adalah kapasitas informasi yang bisa “dilihat” model dalam satu percakapan atau satu request. Semakin besar context window, semakin banyak dokumen atau instruksi yang bisa dimasukkan, tapi kualitas tetap bergantung pada struktur konteks.
Multimodal berarti model bisa bekerja dengan lebih dari satu jenis input/output: teks, gambar, audio, video, file, layar komputer, atau kode. Ini penting karena pekerjaan nyata jarang hanya teks. Banyak task perlu membaca screenshot, memahami tabel, menilai desain, atau mengekstrak informasi dari PDF.
Contoh biar kebayang
Coba praktik
- Coba satu prompt pendek tanpa konteks.
- Lalu ulangi dengan konteks lengkap: tujuan, audience, format, contoh, batasan.
- Bandingkan kualitas output.
Prompt yang bisa kamu coba
Beneran paham, atau cuma terasa familiar?
Jawab pakai bahasamu sendiri. Kalau masih muter-muter, bagian atasnya perlu dibaca sekali lagi.
- 1
Apa itu token?
- 2
Apa fungsi context window?
- 3
Apa arti multimodal?
- 4
Kenapa context besar tidak otomatis membuat output bagus?
Bikin sesuatu dari lesson ini
Catatan dan batasan
- Bisa dibuat sebagai halaman glossary interaktif dengan hover tooltip untuk token, context, multimodal, model, prompt, dan hallucination.
- Checklist tambahan: AI berbasis aturan vs machine learning.
- Checklist tambahan: training vs inference.
- Checklist tambahan: model vs aplikasi AI.
- Checklist tambahan: AI, ML, deep learning, dan GenAI.