OpenAI 昨日(11 月 25 日)發布博文,宣布旗下 ChatGPT 正式合并將“語音模式”(Voice Mode)合并至主聊天界面。此次整合讓用戶能在語音對話中實時查看地圖、圖片等視覺信息和文字轉錄,實現了多模態交互。
注:語音對話此前是一個獨立的功能模塊,而現在用戶無需再切換模式,可以直接在主聊天窗口內啟動語音交互,從而提供一個更無縫、更多功能的多模態體驗。
新版語音模式的最大亮點在于其整合了視覺信息呈現能力。根據 OpenAI 的演示,在用戶通過語音提問時,ChatGPT 不僅能用自然流暢的語音回答,還能在聊天界面中實時顯示相關的視覺內容,例如地圖、圖表或圖片。同時,系統會自動生成語音對話的文字轉錄稿,方便用戶隨時回顧和查閱交流內容。

考慮到不同用戶的使用習慣,OpenAI 在此次更新中也提供了“后悔藥”。對于那些更喜歡沉浸式純音頻對話體驗的用戶,新版本在應用的設置菜單中增加了一個切換開關。用戶可以通過該開關,一鍵將界面恢復到舊版的獨立語音模式。
OpenAI 正推進戰略布局,持續迭代產品、拓展 AI 應用邊界,在此之前,該公司已相繼推出了用于商品比價的 AI 購物助手、支持 iCloud 鑰匙串的 Atlas AI 瀏覽器新功能、在部分地區上線的群聊功能,以及性能更強的 GPT-5.1 模型等。 






































