OpenAI推GPT-4、律師資格考贏90%人類 錯誤更少

2023-03-15 12:40

? 人氣

更強大的ChatGPT-4來了(示意圖 @freshvanroot/Unsplash)

更強大的ChatGPT-4來了(示意圖 @freshvanroot/Unsplash)

人工智慧(AI)聊天機器人「ChatGPT」開發商OpenAI宣布,推出最新版大型語言模型「GPT-4」,聲稱能在美國大學的入學SAT測驗擊敗90%人類、並在律師資格考試(Bar examination)擊敗90%受試者。

透過<Google新聞> 追蹤風傳媒

GPT-4功能更強,專業領域擊敗90%以上人類

CNBC、Forbes等外電報導,OpenAI 14日在官方部落格宣布推出GPT-4,使用微軟(Microsoft)的Azure公用雲端服務平台進行訓練,跟過去的版本相比規模更龐大。這代表該模型受過更多資料訓練、模型檔案更具份量,營運成本也更昂貴。OpenAI宣稱,GPT-4在許多專業測試的表現已「可媲美人類」(human-level performance)。

OpenAI表示,GPT-4生成的答案錯誤更少、正確性比GPT-3.5高40%,也較不會超脫常軌、大聊禁忌話題,在許多標準化測驗的表現甚至比人類優秀。值得注意的是,GPT-3.5及GPT-4閒聊時差別雖不大,但若任務夠複雜,GPT-4比GPT-3.5更可靠、有創意且能處理更多微妙指令。

根據OpenAI說法,GPT-4可在律師資格考試擊敗90%人類、在國際生物奧林匹亞(Biology Olympiad)擊敗99%高中生。事實上,GPT-4在至少34種涵蓋總經、寫作、數學等領域的測驗皆名列前茅(各項測驗的成績見此)

有趣的是,GPT-4如今可接受圖片及文字指示,用戶能展示一張食材的照片,詢問可以做成甚麼食物。GPT-4現在也可保留超過25,000字的文字,能進行更長的對話及回應。

延伸閱讀:ChatGPT怎麼用,有可能會毀滅人類嗎?一篇看懂中文操作註冊步驟、背後原理!

AI平均年成長率將達27%,2026年超過3000億美元

不過,OpenAI警告,GPT-4未臻完美,許多情境仍然不如人類,且還是有「幻覺」(hallucination)的問題,也就是會捏造資訊,生成的文字或許跟事實不符。不只如此,GPT-4依舊傾向在出錯時堅持自己是對的。

OpenAI 表示,GPT-4仍有許多必須設法解決的已知限制,例如社會偏見、幻覺及對抗提示(adversarial prompts)。

GPT-4將提供ChatGPT付費訂閱戶使用,也可做為應用程式開發介面(API)的一部分,讓程式設計師把這款AI整合至手中的app。OpenAI會對750字的文字提示收費3美分、750字的回應收費6美分。

科技市調機構IDC近日才剛發表研究報告指出,2023年全球對AI系統的支出將年增27%至1,540億美元,之後每年平均有望成長27%、到2026年支出將超過3,000億美元。

IDC分析師Mike Glennon表示,引進AI速度緩慢的企業,無論規模大小都會落後競爭對手。企業應用AI的最佳方式,就是藉此放大人類的能力、把重複的任務自動化、提供個人化建議,並快速且正確地依據大數據下決策。


本文獲授權轉載自MoneyDJ,未經同意不得轉載,小標為編輯所加。

責任編輯/郭家宏

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章