首頁 > 科技要聞 > 科技> 正文

OpenAI 突然發(fā)布 GPT-4o mini !更快更便宜,人人免費可用,GPT-3.5 成為歷史

appso 整合編輯:吳利虹 發(fā)布于:2024-07-19 07:59

今天起,ChatGPT 正式進入「4」時代。就在剛剛,OpenAI 官宣推出 GPT-3.5 Turbo 的替代品——GPT-4o mini,顧名思義,這是 GPT-4o 更小參數(shù)量的簡化版本。即日起,ChatGPT 的免費用戶、Plus 用戶和 Team 用戶都能夠使用 GPT-4o mini。下周,企業(yè)版客戶也將獲得使用 GPT-4o mini 的權限。OpenAI 官方表示,「這一變化符合我們讓所有用戶都能享受到 AI 技術好處的目標!

主打低成本和快速響應能力的 GPT-4o mini 適用于多種應用場景。例如,它可以支持需要連續(xù)或同時調用多個模型的應用程序(如同時調用多個 API),能夠處理大量上下文信息(如完整的代碼庫或對話記錄),以及通過快速實時的文本回復與客戶進行互動(如客戶服務聊天機器人)。具體來說,GPT-4o mini 目前在 API 中提供了文本和圖像處理功能,后續(xù)還將逐步增加對視頻和音頻的支持。該模型能夠處理多達 128K token 的長上下文,知識庫截止日期為 2023 年 10 月份,并且對非英文內容的支持更友好。

ChatGPT 截圖從 OpenAI 分享的基準測試結果來看,GPT-4o mini 在推理基準結果 MMLU 上得分為 82%,而 Gemini Flash 為 77.9%,此前主打極高性價比的 Claude Haiku 為 73.8%。GPT-4o mini 在數(shù)學推理和編程任務方面也同樣表現(xiàn)出色,遠超市場上的其他小型模型。在 MGSM 數(shù)學推理能力基準測試中,GPT-4o mini 得分達到了 87.0%,而 Gemini Flash 的得分為 75.5%,Claude Haiku 的得分為 71.7%。GPT-4o mini 在 HumanEval 基準測試中同樣再次展現(xiàn)優(yōu)勢,得分達到 87.2%,而 Gemini Flash 的得分為 71.5%,Claude Haiku 的得分為 75.9%。

而在多模態(tài)推理 MMMU 中,GPT-4o mini 也表現(xiàn)出色,得分為 59.4%,而 Gemini Flash 得分為 56.1%,Claude Haiku 得分為 50.2%。尤為顯眼的是,GPT-3.5 Turbo 在這些基準測試中的得分均不如 GPT-4o mini,甚至可以說被全面碾壓。此外,GPT-4o mini 在大模型盲測競技場 LMSYS 中的表現(xiàn)也要優(yōu)于 GPT-4T 01-25。除了性能上的增強,GPT-4o mini 也化身價格屠夫,要給 API 市場帶來小小的震撼。@ArtificialAnlys 在 X 上發(fā)布了一些模型的價格對比,足以看出其價位水準:

OpenAI 表示,GPT-4o mini 現(xiàn)在可在 Assistant API、Chat Completions API 和 Batch API 中作為文本和視覺模型使用。GPT-4o mini 每100 萬輸入 token 價格為 15 美分,每 100 萬輸出 token 價格為 60 美分,比 GPT-3.5 Turbo 便宜超過 60%。也就是說,GPT-4o mini 生成一本 2500 頁的書,價格只需要 60 美分。對于 GPT-4o mini 的到來,OpenAI CEO Sam Altman 在 X 平臺發(fā)文感慨:回顧 2022 年,當時世界上最先進的模型是 text-davinci-003。與現(xiàn)在的新模型相比,它的性能要差得多。而且,它的使用成本比現(xiàn)在的新模型高出 100 倍。

另外,考慮到模型的安全性問題,OpenAI 還邀請了 70 多位來自社會心理學和錯誤信息研究等領域的專家對 GPT-4o 的潛在風險進行了測試并根據(jù)反饋結果進行改進。同時基于這些經驗,OpenAI 還采用一些新的技術來增強對 GPT-4o mini 越獄攻擊等防御能力,使其在大規(guī)模應用中更加安全,也更加穩(wěn)定可靠。今年以來,國內外掀起了新一輪大模型價格戰(zhàn),但沒想到的是,OpenAI 也用響應速度更快、成本更低的 GPT-4o mini 模型加入了本就亂成一鍋粥的戰(zhàn)局。

Altman 更是將其形容為「towards intelligence too cheap to meter」。作為 GPT-3.5 Turbo 的免費替代品,GPT-4o mini 在性能方面也沒落下,甚至也比同量級的 Claude 3 Haiku 和 Gemini 1.5 Flash 還要好。不少網(wǎng)友在體驗過后也都給出了一致好評。值得一提的是,關于我們心心念念的 GPT-4o 語音模式,Altman 也透露將在本月晚些時候到來。

文章來源:APPSO

appso

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
  • 二維碼 回到頂部