#multimodal
2 articles tagged with #multimodal.
Multimodal AI AI yang dapat memahami dan menghasilkan beberapa modalitas — teks, gambar, audio, video, 3D. Contoh: GPT-4o, Claude 3.5 Sonnet, Gemini 2.5, Sora 2. CLIP Model OpenAI (2021) yang belajar menghubungkan teks dan gambar dengan contrastive learning. Fondasi DALL-E 2, Stable Diffusion, dan image generation modern.