華爾街日報》AI大模型為何不「香」了？考量成本與實際需求，企業現在更青睞這類模型-風傳媒

華爾街日報》AI大模型為何不「香」了？考量成本與實際需求，企業現在更青睞這類模型

越來越多的公司正部署較小型及中型生成式AI模型，更青睞這種規模縮小、成本效益高的技術，而不是在AI熱潮早期掀起波瀾的那種熱炒的大型模型。

OpenAI的GPT-4等基礎模型開發成本超過1億美元，使用超過一兆個參數（這是其規模的一個衡量標準），較小型模型與之不同，使用較少的數據進行訓練，通常是為特定任務而設計的。

本文為風傳媒與華爾街日報正式合作授權轉載。加入VVIP會員請點此訂閱：風傳媒・華爾街日報VVIP，獨享全球最低優惠價，暢讀中英日文全版本之華爾街日報，洞悉國際政經最前沿。

幾乎所有的模型提供商都在轉向提供更多此類模型，包括微軟（Microsoft）、Google以及Mistral、Anthropic和Cohere等新創公司。

資訊長們表示，對於一些最常見的AI用例（通常涉及文件分類等小範圍的重複性任務）來說，較小型及中型模型更有意義。而且由於較小型模型使用的算力較少，運行成本也更低。

企業在慢慢轉向部署更多AI用例的同時，也面臨著對這種昂貴技術控製成本和回報的壓力，上述轉變正是發生在這種背景之下。

網路安全、內容分發和雲計算公司Akamai技術長Robert Blumofe說：「在整個網際網路上訓練出來的巨型大語言模型可能會嚴重大材小用。」他說，對於企業用例來說，「你並不需要一個知道《教父》（The Godfather）所有演員、知道所有電影、知道所有電視節目的AI模型。」

Google Cloud全球生成式AI產品上市策略副總裁Oliver Parker表示，在過去三個月裡，他已經看到企業轉向中型模型，部分原因是這些模型符合捕捉更多企業用例的標準。

非銀行抵押貸款服務商和發起人Mr. Cooper資訊長Sridhar Sharma說，Mr. Cooper正在其呼叫中心測試中型模型的功能，以分析語音數據，幫助座席人員了解對話的可能走向，以及客戶可能會問的問題。

Sharma說：「我們不需要僅僅因為某個東西更大就對其進行過度設計，」並稱Mr. Cooper也在使用大型基礎模型來處理更複雜的用例。

到目前為止，道明銀行（TD Bank）一直在使用GPT-4等OpenAI的GPT系列模型和其他模型來幫助呼叫中心工作人員更快地回答客戶諮詢。道明銀行首席AI科學家Maksims Volkovs稱，該行最近還與AI模型提供商Cohere簽訂了合作協議，將研究是Cohere的小型模型還是中型模型在該用例和其他用例中更有效、更具成本效益。

Volkovs說，他將從成本、準確性和延遲方面對Cohere的模型和OpenAI的產品進行評估。Volkovs說，他預計中型模型將在某些情景下勝出。

他說，在準確性和成本之間進行權衡應該更有利。

營銷服務公司WPP的首席技術官Stephan Pretorius說，一些企業一年前還傾向於使用少數大模型。他說，當企業在有限的試點範圍內使用大模型時，這種做法還算不錯，但現在隨著範圍的擴大，大模型的成本很快就會失控。WPP正在使用GoogleGemini系列中的幾個模型，包括中型模型Flash。

Flash適合用於分析不同國家的購物習慣，並利用分析結果為給定產品撰寫合適的網路文案。例如，在英國銷售的睫毛膏的文案最好能突出防水功能。撰寫這樣的文案正是中型模型大顯身手之處，Pretorius說。

Pretorius說，對於需要海量數據、創造力和進行解釋的複雜用例，大模型仍然具有實用價值。他舉例稱，大模型適用於讀取莎士比亞（Shakespeare）的所有作品，並分析女性角色與男性角色在不同時期的對比情況。但這並不在WPP的任務清單上。

決策者的最佳夥伴

立即訂閱，即刻暢讀華爾街日報全文內容

並享有更佳的閱讀體驗

訂閱每天只要10.9元查看訂閱方案

華爾街日報》AI大模型為何不「香」了？考量成本與實際需求，企業現在更青睞這類模型

華爾街日報》職場上的科技戰：數位監控技術大升級，遠距辦公也別想摸魚

華爾街日報》科技界變天：馬斯克和矽谷大佬集體靠攏川普，拜登做錯了什麼？

華爾街日報》習近平的科技願景正拖累中國經濟，「新質生產力」等計畫弊端顯現

華爾街日報》「他是一個無恥冷酷的騙子！」郭文貴在紐約被裁定詐欺逾 10 億美元，恐吃數十年牢飯

華爾街日報》川普遇刺震撼美國，眾人憂心大選走向「不堪結局」

華爾街日報》中國正在承受「一胎化政策」苦果：催生經濟奇蹟，但也提前透支人口紅利