【澳門日報消息】研發聊天機械人ChatGPT的美國公司OpenAI宣佈,長期以來僅限於輸入文字提示的生成式人工智能(AI)平台,將新增語音互動和影像傳送功能,讓使用者能和ChatGPT進行語音對話或展示圖片作出相關回應。
語音功能方面,ChatGPT可以用語音來回答問題和命令,挑戰蘋果的Siri等個人助理,毋須再透過文字輸入指令,而ChatGPT亦可以將結果以語音讀出。這項新功能是因為OpenAI的全新文字轉語音模型,能夠產生如人類說話般的語音。為了給予用戶更多語音選擇,OpenAI特別與專業配音員合作,提供Juniper、Sky、Cove、Ember和Breeze五把聲線,同時支援語音音訊生成文本、將Podcast語音翻譯成其他語言等功能。例如,OpenAI正與Spotify合作,將Podcast翻譯成其他語言,同時保持Podcast的聲音。
至於影像分析功能則對應所有平台,只要有瀏覽器就能使用,用戶可以上載多張圖片,並向ChatGPT查詢相關的問題。例如用戶可以打開雪櫃並拍照,然後要求ChatGPT以雪櫃內的食材,建議和提供可行的食譜;又或者將損壞的單車照片上載,再查詢維修的方案。跟語音功能一樣,影像分析同樣為ChatGPT Plus和Enterprise用戶限定。
以上兩項新功能會在未來兩星期,陸續開放予付費用戶,OpenAI同時透露DALL-E 3圖像生成工具亦會在稍後向ChatGPT付費用戶提供。
DALL-E是由OpenAI和Microsoft共同開發的圖像生成人工智能。DALL-E 3為最新版本,新版本能夠生成與用戶查詢更為契合的圖像,並強調了其增強的理解和解釋提示詞的能力。DALL-E 3的主要更新是與ChatGPT集成,用戶能夠通過與聊天機器人進行互動對話,來細化圖像請求。這意味用戶現在可以直接在聊天應用程序中接收生成的圖像。
留言