OpenAI系统卡里的232ms是骗局吗?我把GPT-4o实时视频API塞进手语翻译原型后的48小时
上个月 OpenAI 把 GPT-4o 的 system card 公开出来的时候,我正在实验室里对着一个实时翻译 demo 抓狂。那篇系统卡里有一个让我过目难忘的数字:音频到音频的平均响应延迟 232 毫秒,而且是在真实网络环境下测的。我第一时间想的是:这不就意味着,我终于可以把“视频理解+语音合…
上个月 OpenAI 把 GPT-4o 的 system card 公开出来的时候,我正在实验室里对着一个实时翻译 demo 抓狂。那篇系统卡里有一个让我过目难忘的数字:音频到音频的平均响应延迟 232 毫秒,而且是在真实网络环境下测的。我第一时间想的是:这不就意味着,我终于可以把“视频理解+语音合…