Multimodal AI

AI yang dapat memahami dan menghasilkan beberapa modalitas — teks, gambar, audio, video, 3D. Contoh: GPT-4o, Claude 3.5 Sonnet, Gemini 2.5, Sora 2.

Multimodal AI

Definisi

Multimodal AI adalah sistem yang dapat memahami dan menghasilkan lebih dari satu modalitas — teks, gambar, audio, video, 3D, sensor data, dll.

Tonggak