微軟今年 10 月推出其首個自研 AI 圖像生成模型 MAI-Image-1,今日宣布該模型已應用于 Bing Image Creator 和 Copilot Audio Expressions 兩款產品中(歐盟暫時除外)。
微軟 AI 部門負責人 Mustafa Suleyman 介紹稱,該模型在生成食物、自然風景、藝術化光效及寫實細節等圖像方面“表現尤為出色”。
微軟表示:“MAI-Image-1 在生成具有逼真光影效果(如反射、漫反射)及風景類圖像時表現突出,尤其是在與一些更大、更慢的模型相比時更具優勢。其速度與質量的平衡讓用戶能更快地將創意呈現在屏幕上,迅速迭代,并能將成果導入其他工具繼續優化。”
從官方獲悉,MAI-Image-1 還將用于 Copilot 的文本轉語音平臺 Copilot Audio Expressions 的“故事模式”中,為 AI 生成的音頻故事配以同步生成的圖像內容。
微軟在今年 8 月曾宣布推出首批自研 AI 模型,包括語音模型 MAI-Voice-1 與文本模型 MAI-1-preview。該公司當時表示,MAI-1-preview 將在特定場景下應用于其 Copilot AI 助手,顯示出微軟正在逐步減少對 OpenAI 模型的依賴。
目前,微軟表示 Copilot 聊天機器人正過渡至 OpenAI 的 GPT-5 模型,同時也為用戶提供 Anthropic 的 Claude 系列模型作為可選方案。
在 Bing 圖像生成網站與應用中,MAI-Image-1 被列為三大可選模型之一,另兩款為 OpenAI 的 DALL-E 3 和 GPT-4o。 








































