【澳門日報消息】Facebook母公司Meta近日推出一款人工智能AI文本轉語音工具,取名Voicebox。這款語音生成式AI模型,可以幫助音頻編輯、採樣等。
由微軟公司支持的人工智能公司OpenAI開發的聊天機械人ChatGPT,是以文本相關內容而聞名。Dall-E以圖像生成而聞名。而Meta公司的Voicebox,則是AI模型系列中的最新產品。
Meta表示,Voicebox可以製作高質素的聲音檔案,也可編輯已預先錄製的音頻,例如去除汽車喇叭聲或狗吠聲,同時能保留音頻內容和風格。Voicebox能利用可能短至兩秒的音頻樣本,能匹配特定的音頻風格,並將其用於文本轉語音的生成。Voicebox還可以重新創建被噪音打斷的部分語音,或改換說錯的單詞,而無需重新錄製整段語音。
此外,若已準備好某人的語音樣本,以及一段以英文,或是法文、德文、西班牙文、波蘭文或葡萄牙文寫成的文本,Voicebox可以用上述六種語言之一來生成語音。
Meta稱,在未來,諸如Voicebox之類的生成式AI模型可以為元宇宙中的虛擬助手和不同角色提供自然的聲音。它可以讓視障人士聽到朋友的書面訊息,人工智能會用其朋友的聲音來朗讀訊息。
留言