Kembali
GenAI & LLM · Pemula
Vision Model
Model yang dapat memahami gambar atau video, misalnya objek, teks, dan hubungan visual.
Definisi sederhana
Model yang dapat memahami gambar atau video, misalnya objek, teks, dan hubungan visual.
Penjelasan tanpa jargon
Model yang dapat memahami gambar atau video, misalnya objek, teks, dan hubungan visual. Biasanya istilah ini muncul saat membuat draft, gambar, voiceover, ringkasan, atau analisis dokumen.
Analogi
Bayangkan mesin pola yang menyusun jawaban baru dari pola yang pernah dipelajari. Vision Model kurang lebih bekerja di bagian yang memroses informasinya.
Contoh penggunaan
Contoh paling gampang: Vision Model muncul saat membuat draft, gambar, voiceover, ringkasan, atau analisis dokumen.
Kenapa penting
Kalau paham Vision Model, kamu membantu memilih model dan memahami batas input, biaya, serta kualitas output.
Istilah terkait
- Multimodal
- Text-to-Image
- Foundation Model
Kesalahan pemula
Yang sering membuat keliru: menganggap output generatif selalu merupakan fakta yang diambil dari database. Vision Model juga beda dengan Multimodal.