AI 见闻
精选· 重要性 3/5

OpenAI WebRTC音频会话新增文档上下文支持

Simon Willison's Weblog··约 1 分钟阅读
中文导读

Simon Willison更新了其OpenAI WebRTC音频会话工具,支持GPT-Realtime-2模型并允许粘贴文档上下文,实现浏览器内基于文档的语音对话。

2026年6月12日-链接博客OpenAI WebRSC音频会话,现在包含文档上下文。我于2024年12月构建了该工具的第一个版本,以尝试当时新的OpenAI WebRSC API来与他们的实时音频模型交互。

上个月,OpenAI为该API引入了一种名为GPT-Realtime-2的全新模型,他们将其宣传为“我们第一个具有GPT-5级推理的语音模型”-知识截止日期为2024年9月30日。

我一直在等待该模型出现在ChatGPT iPhone应用程序中,但它仍然没有出现,所以我重新参观了我的旧游乐场。您现在可以选择更好的模型,还可以粘贴大块文档上下文,这样您就可以在浏览器中进行音频对话,了解您认为以对话方式探索的任何信息。

最近的文章- 克劳德·寓言(Claude Fable)坚持不懈地积极主动-2026年6月11日- 克劳德寓言的初步印象2026年6月5日至9日- 使用MicroPython和WASM在沙箱中运行Python代码-2026年6月6日

原文出处
OpenAI WebRTC Audio Session, now with document context

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读