華爾街日報》AI大模型為何不「香」了?考量成本與實際需求,企業現在更青睞這類模型

2024-07-22 11:00

? 人氣

2024世界人工智慧大會7月4至6日在中國上海登場。(AP)

2024世界人工智慧大會7月4至6日在中國上海登場。(AP)

越來越多的公司正部署較小型及中型生成式AI模型,更青睞這種規模縮小、成本效益高的技術,而不是在AI熱潮早期掀起波瀾的那種熱炒的大型模型。

[啟動LINE推播] 每日重大新聞通知

OpenAI的GPT-4等基礎模型開發成本超過1億美元,使用超過一兆個參數(這是其規模的一個衡量標準),較小型模型與之不同,使用較少的數據進行訓練,通常是為特定任務而設計的。

本文為風傳媒與華爾街日報正式合作授權轉載。加入VVIP會員請點此訂閱:風傳媒・華爾街日報VVIP,獨享全球最低優惠價,暢讀中英日文全版本之華爾街日報,洞悉國際政經最前沿。

幾乎所有的模型提供商都在轉向提供更多此類模型,包括微軟(Microsoft)、Google以及Mistral、Anthropic和Cohere等新創公司。

資訊長們表示,對於一些最常見的AI用例(通常涉及文件分類等小範圍的重複性任務)來說,較小型及中型模型更有意義。而且由於較小型模型使用的算力較少,運行成本也更低。

企業在慢慢轉向部署更多AI用例的同時,也面臨著對這種昂貴技術控製成本和回報的壓力,上述轉變正是發生在這種背景之下。

網路安全、內容分發和雲計算公司Akamai技術長Robert Blumofe說:「在整個網際網路上訓練出來的巨型大語言模型可能會嚴重大材小用。」他說,對於企業用例來說,「你並不需要一個知道《教父》(The Godfather)所有演員、知道所有電影、知道所有電視節目的AI模型。」

Google Cloud全球生成式AI產品上市策略副總裁Oliver Parker表示,在過去三個月裡,他已經看到企業轉向中型模型,部分原因是這些模型符合捕捉更多企業用例的標準。

非銀行抵押貸款服務商和發起人Mr. Cooper資訊長Sridhar Sharma說,Mr. Cooper正在其呼叫中心測試中型模型的功能,以分析語音數據,幫助座席人員了解對話的可能走向,以及客戶可能會問的問題。

Sharma說:「我們不需要僅僅因為某個東西更大就對其進行過度設計,」並稱Mr. Cooper也在使用大型基礎模型來處理更複雜的用例。

到目前為止,道明銀行(TD Bank)一直在使用GPT-4等OpenAI的GPT系列模型和其他模型來幫助呼叫中心工作人員更快地回答客戶諮詢。道明銀行首席AI科學家Maksims Volkovs稱,該行最近還與AI模型提供商Cohere簽訂了合作協議,將研究是Cohere的小型模型還是中型模型在該用例和其他用例中更有效、更具成本效益。

Volkovs說,他將從成本、準確性和延遲方面對Cohere的模型和OpenAI的產品進行評估。Volkovs說,他預計中型模型將在某些情景下勝出。

他說,在準確性和成本之間進行權衡應該更有利。

營銷服務公司WPP的首席技術官Stephan Pretorius說,一些企業一年前還傾向於使用少數大模型。他說,當企業在有限的試點範圍內使用大模型時,這種做法還算不錯,但現在隨著範圍的擴大,大模型的成本很快就會失控。WPP正在使用GoogleGemini系列中的幾個模型,包括中型模型Flash。

Flash適合用於分析不同國家的購物習慣,並利用分析結果為給定產品撰寫合適的網路文案。例如,在英國銷售的睫毛膏的文案最好能突出防水功能。撰寫這樣的文案正是中型模型大顯身手之處,Pretorius說。

Pretorius說,對於需要海量數據、創造力和進行解釋的複雜用例,大模型仍然具有實用價值。他舉例稱,大模型適用於讀取莎士比亞(Shakespeare)的所有作品,並分析女性角色與男性角色在不同時期的對比情況。但這並不在WPP的任務清單上。

決策者的最佳夥伴

立即訂閱,即刻暢讀華爾街日報全文內容

並享有更佳的閱讀體驗

訂閱 每天只要10.9元 查看訂閱方案
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章