Kembali
GenAI & LLM · Pemula

Vision Model

Model yang dapat memahami gambar atau video, misalnya objek, teks, dan hubungan visual.

Definisi sederhana

Model yang dapat memahami gambar atau video, misalnya objek, teks, dan hubungan visual.

Penjelasan tanpa jargon

Model yang dapat memahami gambar atau video, misalnya objek, teks, dan hubungan visual. Biasanya istilah ini muncul saat membuat draft, gambar, voiceover, ringkasan, atau analisis dokumen.

Analogi

Bayangkan mesin pola yang menyusun jawaban baru dari pola yang pernah dipelajari. Vision Model kurang lebih bekerja di bagian yang memroses informasinya.

Contoh penggunaan

Contoh paling gampang: Vision Model muncul saat membuat draft, gambar, voiceover, ringkasan, atau analisis dokumen.

Kenapa penting

Kalau paham Vision Model, kamu membantu memilih model dan memahami batas input, biaya, serta kualitas output.

Istilah terkait

  • Multimodal
  • Text-to-Image
  • Foundation Model

Kesalahan pemula

Yang sering membuat keliru: menganggap output generatif selalu merupakan fakta yang diambil dari database. Vision Model juga beda dengan Multimodal.