OpenAI近日發布GPT4-Turbo版本,不僅其推理、應對效能受到各界矚目,很快的,OpenAI也奪回了全球AI模型之王的寶座!
向來專注盲測LLM(大型語言模型)效能的LMSYS Chatbot Arena公布最新評測結果指出,經過基準測試後發現,GPT4-Turbo於各個層面大幅優於新創公司Anthropic推出的Claude3 Opus,讓OpenAI得以再從由前員工們另組成的Anthropic公司手中,再拿回AI之王的寶座!
另有中國玩家測試Claude3 Opus和GPT4-Turbo的程式碼處理能力,確實發現部分Claude 3 Opus找不到的錯誤,GPT4-Turbo都能找到。
事實上,兩個月前,ChatGPT模型一度被Claude3 Opus超越,當時科技圈不少網友都揶揄ChatGPT越來越不好用了,不過依此評測結果看來,OpenAI的AI模型仍是如過往優秀。
OpenAI另指出,相較既有的模型,不論是文字寫作、數學計算、程式設計或邏輯推理思考等能力,GPT4-Turbo都進步許多,除了反應速度更快,回覆的內容也更為人性化、更加正確。