《經濟學人》2025年AI展望:更聰明的人工智慧來了!為何「AI代理」值得期待

2025-01-03 09:06

? 人氣

AI產品的開發挑戰

從OpenAI和Google的新品發佈可以看出,產品的重要性超越了模型。《經濟學人》表示,雖然致力於大型語言模型(LLMs)的科學家正努力追求技術突破,但開發者卻面臨著市場壓力,需要推出各種產品來證明這些新技術真的有市場需求。

透過<Google新聞> 追蹤風傳媒

開發生成式AI產品和大多數商品不同,一般而言,產品開發者會從消費者的需求出發,回頭設計產品;但生成式AI發展的速度太快,反而是技術決定了產品型態。OpenAI的產品長魏爾(Kevin Weil)說:「通常我們被教導不要當那種拿著錘子到處找釘子的人,但現在每隔兩個月,電腦就能做出以前從未實現過的事情」。

不過這次,OpenAI的新產品卻出現不少問題。公司執行長阿特曼(Sam Altman)表示,由於公司低估需求,因此在產品推出後不久就不得不暫停ChatGPT訂閱用戶對Sora的使用權限。即使有些用戶獲得了使用權,並對Sora的功能印象深刻,但他們發現早期測試版本中出現的問題,現在依舊存在,其中最明顯的問題是Sora無法真實呈現複雜的動作。科技評論YouTuber布朗里(Marques Brownlee)指出,Sora幾乎一定會搞砸任何四足動物的動作,有些物品也會莫名其妙的消失。

《經濟學人》指出,Google 的AI代理技術也還不夠完善。例如,Astra現在只開放給一小部分「受信任的測試者」使用,它可以用多種語言解釋透過手機鏡頭看到的內容,並能存取Google搜尋和地圖等服務。在展示中,Astra能對名畫進行專業講解,但當《經濟學人》詢問哪些城市展出最多原作時,它卻無法回答。Mariner則是另一個新原型,能在瀏覽器上執行任務,例如在線上超市新增商品到購物車裡,但它卻不能完成結帳。

AI代理會遇到哪些阻礙?

《經濟學人》指出3項原因,說明為什麼打造AI代理比開發聊天機器人更困難。一是數據問題。與從網路上抓取資料來回答問題的聊天機器人不同,AI代理需要有關任務執行方式的數據,包括操作順序和行為背後的推理邏輯。舉例而言,像處理客戶訂單這類簡單的例行工作,可能比較容易獲得所需的數據,但在很多情況下,比如讓AI代理參與公司營運的決策等,要找到足夠的數據來訓練就相當困難,

第二個困難是建立信任。《經濟學人》指出,要檢查聊天機器人回答得對不對通常很簡單,但要判斷AI代理是否在你的預算內定了最好的餐廳或旅行,就比較困難了。此外,使用者可能會對於是否要提供敏感的個資有所保留,例如消費紀錄等,但這些資訊可能正是AI代理正常運作所需要的。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章