AI語音成為新戰場!OpenAI「進階語音模式」上線:新增5種聲音,改善非英語語言精確度

2024-09-25 11:15

? 人氣

ChatGPT Plus。(翻攝OpenAI官網)

ChatGPT Plus。(翻攝OpenAI官網)

OpenAI今天(24日)正式向ChatGPT Plus和Teams用戶逐步開放「進階語音模式」。除了可打斷AI說話之外,AI會解讀說話者的語氣做出回應。另外新增了5種新聲音並改善非英語語言的發音精準度。

人工智慧新創公司OpenAI在今年春季發布會預告「進階語音模式」(Advanced Voice Mode),被科技圈稱為是發布會上最令人期待的功能之一。

[啟動LINE推播] 每日重大新聞通知

7月時限量邀請特定人士測試,今天則正式面向廣泛使用者,月付20美元(約新台幣650元)的ChatGPT Plus用戶、及月付30美元的Teams用戶可享有功能。

OpenAI在社群媒體指出,「進階語音模式」增加了自訂指令、記憶功能、五種新聲音,口音也獲得改善。它還會用超過50種語言說「抱歉,我遲到了」。

OpenAI的語音技術曾引發爭議,原內建語音Sky說話因激似好萊塢女星史嘉蕾喬韓森(Scarlett Johansson)遭到抨擊,隨後被移除。這次一口氣推出Arbor、Maple、Sol、Spruce 、Vale五種聲音,一般和進階語音模式皆可使用。

這些聲音是由世界各地專業配音員錄製,OpenAI面試了數十位演員,找到溫暖、平易近人、好奇心強、且具有特色的聲音,盼提升使用者體驗。

雖然出現爭議,但「進階語音模式」上線仍受到關注。人類與聊天機器人之間的對話變得更加流暢,還可以隨時打斷它,不必聽完冗長的回應。用戶也可以要求AI記憶資訊讓功能更加個人化,非英語語言的發音精準度也有所提升。

OpenAI執行長阿特曼(Sam Altman)在X平台表示,「進階語音模式今天開始推出(將在一週內完成)」,意指將逐步開放給ChatGPT Plus和Teams用戶。

另外,OpenAI預計下週開始向Enterprises和Education用戶開放這項功能。

「進階語音模式」尚未在歐盟、英國、瑞士、冰島、挪威等地區推出。

不少人已實測並上網分享。有網友說,仍有一些小問題,像是過程中突然卡住,但整體狀況相當穩定。另有人形容它有感知力和情感意識,且極聰明。

一些人則驚艷對話時的圓形圖示也從原本的白色更新為流動的水藍色。

不過,也有使用者失望表示,它不會唱歌,感覺仍在和機器人對話。

喜歡這篇文章嗎?

作者喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章