CLIP

Model OpenAI (2021) yang belajar menghubungkan teks dan gambar dengan contrastive learning. Fondasi DALL-E 2, Stable Diffusion, dan image generation modern.

CLIP

Definisi

CLIP (Contrastive Language-Image Pre-training) adalah model multimodal dari OpenAI yang belajar menghubungkan teks dan gambar menggunakan contrastive learning pada 400 juta image-text pairs.

Inovasi

Dampak