華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站,為何成為全球矚目的焦點?

2025-01-28 09:12

? 人氣

留著鬍子的阿納斯塔西奧斯·安傑洛普洛斯和Chatbot Arena聯合負責人Wei-Lin Chiang上個月在加州伯克利的實驗室空間展示了該工具。 圖片來源:LAURA MORTON FOR WSJ

留著鬍子的阿納斯塔西奧斯·安傑洛普洛斯和Chatbot Arena聯合負責人Wei-Lin Chiang上個月在加州伯克利的實驗室空間展示了該工具。 圖片來源:LAURA MORTON FOR WSJ

唱片公司有《告示牌》百大單曲榜(Billboard Hot 100)。大學橄欖球有季後賽排名。人工智慧(AI)則有由兩名研究生營運的網站Chatbot Arena。

透過<Google新聞> 追蹤風傳媒

彼此是室友的阿納斯塔西奧斯·安傑洛普洛斯(Anastasios Angelopoulos)和Wei-Lin Chiang從未想過,他們去年開發的這個研究生計畫會迅速成為最受關注的全球最佳AI系統排名。

本文為風傳媒與華爾街日報正式合作授權轉載。加入VVIP會員請點此訂閱:風傳媒・華爾街日報VVIP,獨享全球最低優惠價,暢讀中英日文全版本之華爾街日報,洞悉國際政經最前沿。

一直以來,對AI技術的評估是通過高等數學、科學和法律測試進行的。Chatbot Arena讓用戶提出一個問題,從兩個匿名AI模型中獲得答案,並對哪個模型更好進行評分。

這些評分會被匯總到一個排行榜上,OpenAI、Google和Meta Platforms等矽谷巨頭與來自中國和歐洲的不太知名的新創公司在這個排行榜上爭奪霸主地位。

「每個公司都在努力成為這個排行榜上的佼佼者,」Meta Platforms的AI產品管理總監約瑟夫·斯皮薩克(Joseph Spisak)說。「幾個學生聚在一起就能產生如此大的影響力,這真是太棒了。」

Chatbot Arena開始走紅的背景是,科技公司投入數以十億美元計的資金,押注AI將是未來幾十年的決定性技術。任何被認為在競爭中取得的明顯優勢都可能在吸引客戶和人才方面產生巨大影響,這就是眾多科技高管和工程師像華爾街交易員關注市場一樣密切關注Chatbot Arena的原因。

加州大學伯克利分校(University of California, Berkeley)的研究人員於2023年4月推出了Chatbot Arena,旨在使用類似於專業國際象棋排名系統的評分系統,將他們開發的AI技術與其他開源聊天機器人進行比較。短短一周內,該網站就收到了4,700張投票。

Chatbot Arena項目團隊的成員由本科生和博士生組成,他們在加州大學伯克利分校Soda Hall的實驗室空間裡開完團隊會議後交談。 圖片來源:LAURA MORTON FOR WSJ
Chatbot Arena項目團隊的成員由本科生和博士生組成,他們在加州大學伯克利分校Soda Hall的實驗室空間裡開完團隊會議後交談。 圖片來源:LAURA MORTON FOR WSJ

該項目很快引起了大型AI公司的注意,這些公司開始要求Chatbot Arena的負責人將他們的技術納入排名。OpenAI一度躍居排行榜榜首,但在去年3月被競爭對手Anthropic趕超。

Chatbot Arena最初推出時只有九個AI模型,現在已經發展到對170多個模型進行排名,共獲得了200萬張投票。該網站已擴展到包括創意寫作、編寫程式和指令遵循等類別的單獨排名。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章