audio-vision-text

#audio-vision-text

Hello GPT-4o

OpenAI Blog ↗ · 2024-05-13 Cached

OpenAI announces GPT-4o, a flagship multimodal model that processes audio, vision, text, and video in real-time with 232ms average audio response latency. The model matches GPT-4 Turbo on text/code while significantly improving multilingual, audio, and vision capabilities at 50% cheaper API costs.

0 favorites 0 likes

#audio-vision-text

Spring Update

OpenAI Blog ↗ · 2024-05-13 Cached

OpenAI releases GPT-4o, a new flagship model capable of real-time reasoning across audio, vision, and text modalities.

0 favorites 0 likes

audio-vision-text

Hello GPT-4o

Spring Update

Submit Feedback