Generative AI & LLM
M01.L03 · Pemula · 25-35 menit

LLM, token, context window, dan multimodal

Di sini kamu akan memahami llm, token, context window, dan multimodal tanpa harus hafal jargon dulu.

KALAU LESSON INI BERES2/5
  • Paham lLM sebagai model bahasa besar
  • Paham token sebagai potongan teks yang dibaca model
  • Paham context window sebagai batas memori percakapan

Sebelum mulai

  • Baca ringkasan modul dan siapkan satu contoh pekerjaan nyata.
  • Tidak perlu pengalaman teknis.
Target belajar: Setelah lesson ini, kamu bisa menjelaskan llm, token, context window, dan multimodal, menerapkannya pada contoh Indonesia yang sederhana, dan tahu bagian mana yang harus dicek manusia.

Yang perlu kamu tangkap

01LLM sebagai model bahasa besar

LLM sebagai model bahasa besar perlu dipahami sebagai bagian dari AI berbasis aturan vs machine learning. Large Language Model atau LLM adalah model AI yang dilatih untuk memproses dan menghasilkan bahasa. Model seperti ini bisa menjawab pertanyaan, menulis, merangkum, menerjemahkan, membuat kode, dan membantu reasoning. LLM membaca input sebagai token, bukan huruf persis seperti manusia.

Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan llm sebagai model bahasa besar membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.

Kesalahan pemula: Kesalahan umum: menganggap llm sebagai model bahasa besar otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

02Token sebagai potongan teks yang dibaca model

Token sebagai potongan teks yang dibaca model perlu dipahami sebagai bagian dari training vs inference. Token adalah potongan teks. Satu kata bisa menjadi satu token atau beberapa token tergantung bahasa dan model. Context window adalah kapasitas informasi yang bisa “dilihat” model dalam satu percakapan atau satu request. Semakin besar context window, semakin banyak dokumen atau instruksi yang bisa dimasukkan, tapi kualitas tetap bergantung pada struktur konteks.

Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan token sebagai potongan teks yang dibaca model membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.

Kesalahan pemula: Kesalahan umum: menganggap token sebagai potongan teks yang dibaca model otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

03Context window sebagai batas memori percakapan

Context window sebagai batas memori percakapan perlu dipahami sebagai bagian dari model vs aplikasi AI. Multimodal berarti model bisa bekerja dengan lebih dari satu jenis input/output: teks, gambar, audio, video, file, layar komputer, atau kode. Ini penting karena pekerjaan nyata jarang hanya teks. Banyak task perlu membaca screenshot, memahami tabel, menilai desain, atau mengekstrak informasi dari PDF.

Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan context window sebagai batas memori percakapan membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.

Kesalahan pemula: Kesalahan umum: menganggap context window sebagai batas memori percakapan otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

04Multimodal sebagai kemampuan membaca/menulis lebih dari teks

Multimodal sebagai kemampuan membaca/menulis lebih dari teks perlu dipahami sebagai bagian dari AI, ML, deep learning, dan GenAI. Large Language Model atau LLM adalah model AI yang dilatih untuk memproses dan menghasilkan bahasa. Model seperti ini bisa menjawab pertanyaan, menulis, merangkum, menerjemahkan, membuat kode, dan membantu reasoning. LLM membaca input sebagai token, bukan huruf persis seperti manusia.

Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan multimodal sebagai kemampuan membaca/menulis lebih dari teks membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.

Kesalahan pemula: Kesalahan umum: menganggap multimodal sebagai kemampuan membaca/menulis lebih dari teks otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

05Model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan

Model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan perlu dipahami sebagai bagian dari Model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan. Token adalah potongan teks. Satu kata bisa menjadi satu token atau beberapa token tergantung bahasa dan model. Context window adalah kapasitas informasi yang bisa “dilihat” model dalam satu percakapan atau satu request. Semakin besar context window, semakin banyak dokumen atau instruksi yang bisa dimasukkan, tapi kualitas tetap bergantung pada struktur konteks.

Kenapa penting: Ini penting karena lesson M01.L03 bukan cuma mengejar istilah. Kamu perlu tahu kapan model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan membantu kerja nyata, kapan harus diverifikasi, dan batas apa yang tetap perlu dijaga manusia.

Contoh: Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.

Kesalahan pemula: Kesalahan umum: menganggap model tidak benar-benar “ingat” kecuali diberi memori/sistem penyimpanan otomatis membuat hasil benar tanpa contoh, sumber, atau checklist evaluasi.

Oke, sekarang kita bongkar

Large Language Model atau LLM adalah model AI yang dilatih untuk memproses dan menghasilkan bahasa. Model seperti ini bisa menjawab pertanyaan, menulis, merangkum, menerjemahkan, membuat kode, dan membantu reasoning. LLM membaca input sebagai token, bukan huruf persis seperti manusia.

Token adalah potongan teks. Satu kata bisa menjadi satu token atau beberapa token tergantung bahasa dan model. Context window adalah kapasitas informasi yang bisa “dilihat” model dalam satu percakapan atau satu request. Semakin besar context window, semakin banyak dokumen atau instruksi yang bisa dimasukkan, tapi kualitas tetap bergantung pada struktur konteks.

Multimodal berarti model bisa bekerja dengan lebih dari satu jenis input/output: teks, gambar, audio, video, file, layar komputer, atau kode. Ini penting karena pekerjaan nyata jarang hanya teks. Banyak task perlu membaca screenshot, memahami tabel, menilai desain, atau mengekstrak informasi dari PDF.

Contoh biar kebayang

Saat kamu upload PDF panjang lalu bertanya “apa intinya?”, model membaca potongan dokumen di context. Saat kamu upload screenshot chart, model multimodal membaca elemen visual. Saat kamu meminta analisis ribuan baris data, model perlu bantuan tool atau file processing karena context saja belum tentu cukup.

Coba praktik

  • Coba satu prompt pendek tanpa konteks.
  • Lalu ulangi dengan konteks lengkap: tujuan, audience, format, contoh, batasan.
  • Bandingkan kualitas output.

Prompt yang bisa kamu coba

Bandingkan dua output AI dari prompt A dan prompt B berikut. Prompt A: [prompt pendek] Prompt B: [prompt lengkap] Nilai dari segi akurasi, relevansi, struktur, dan kebutuhan edit manual.

Beneran paham, atau cuma terasa familiar?

Jawab pakai bahasamu sendiri. Kalau masih muter-muter, bagian atasnya perlu dibaca sekali lagi.

  1. 1

    Apa itu token?

  2. 2

    Apa fungsi context window?

  3. 3

    Apa arti multimodal?

  4. 4

    Kenapa context besar tidak otomatis membuat output bagus?

Bikin sesuatu dari lesson ini

Buat glossary mini 20 istilah AI dasar dengan definisi satu kalimat dan contoh sederhana.

Catatan dan batasan

  • Bisa dibuat sebagai halaman glossary interaktif dengan hover tooltip untuk token, context, multimodal, model, prompt, dan hallucination.
  • Checklist tambahan: AI berbasis aturan vs machine learning.
  • Checklist tambahan: training vs inference.
  • Checklist tambahan: model vs aplikasi AI.
  • Checklist tambahan: AI, ML, deep learning, dan GenAI.

Langkah berikutnya

Simpan hasil latihan, cek kembali dengan rubric sederhana, lalu lanjut ke lesson berikutnya saat output sudah bisa dijelaskan ulang.
Jenis model dan cara memilih model