首頁 > 科技要聞 > 科技> 正文

GPT-4.5/5 內(nèi)測版回歸?OpenAI 神秘新模型驚艷網(wǎng)友,另一個重磅更新即將上線

appso 整合編輯:龔震 發(fā)布于:2024-05-10 17:44

前段時間,一個名為 gpt2-chatbot 的神秘大模型一夜冒頭,憑借媲美 GPT-4 的實力在整個 AI 圈賺足了眼球,甚至被認(rèn)為是 GPT-4.5/5 的內(nèi)測版。

連 OpenAI CEO Sam Altman 都忍不住下場蹭起了熱度:

我確實對 gpt 2 情有獨鐘。

好奇的網(wǎng)友們蜂擁而至,結(jié)果由于人氣太旺,很快該模型就被緊急下架,而最近這款模型再次上線,并且還帶來了一款新的模型:

-Im-a-good-gpt2-chatbot

-Im-also-a-good-gpt2-chatbot

GPT-4.5/5 的內(nèi)測版?到底什么來頭

新模型的誕生總能激起網(wǎng)友的狂歡,短短幾天,網(wǎng)友已經(jīng)將這兩款模型玩出了花。

網(wǎng)友 @kiieford 給 im-a-good-gpt2-chatbot 出了個難題,讓它創(chuàng)建一個對 mp3 文件做出反應(yīng)的 3D 可視化網(wǎng)頁,結(jié)果一次就成功了。

當(dāng)網(wǎng)友讓它分析一張直升機的符號照片時,Im-also-a-good-gpt2-chatbot 如同庖丁解牛一般,光速拆解細(xì)節(jié),「看圖說話」的能力堪稱一流。

在同一問題的對比上,這兩位「選手」的表現(xiàn)可謂是各有千秋。

im-a-good-gpt2-chatbot 不僅對于給出了詳盡的解答,更是將游戲的機制和得分情況分析得頭頭是道。而 im-also-a-good-gpt2-chatbot 的回復(fù)簡潔凝練,直擊要點,雖然話不多,但每一句都是精華。

別看 im-also-a-good-gpt2-chatbot 在回答問題時惜字如金,做起事來卻一點也不含糊。

當(dāng)網(wǎng)友輸入提示詞:Code Flappy Bird game in Python,讓其編寫鳥飛類游戲代碼時,配上幾張精心挑選的 Png 照片,不一會兒,一個生動的游戲界面便大功告成。

當(dāng) AI 遇上中文問題,這兩個模型的表現(xiàn)瞬間拉開差距。

im-a-good-gpt2-chatbot 的回復(fù)展現(xiàn)了它對中文語境的深刻理解,面對「魯迅打周樹人」這樣的調(diào)侃,它能指出其中的幽默之處。

而 im-also-a-good-gpt2-chatbot 則洋洋灑灑寫了一大堆,強行上價值的回答仿佛在做閱讀理解。

不過 im-also-a-good-gpt2-chatbot 在編程方面的表現(xiàn)也確實可圈可點。

網(wǎng)友 @itsandrewgao 要求其編寫一個方格顏色隨機變化的康威生命游戲代碼,并且要顯示每一代的活細(xì)胞數(shù)量時,雖說最初的結(jié)果不太理想,但在網(wǎng)友的再次要求下,它能夠自行修復(fù)代碼。

Reddit 網(wǎng)友拋出了一個棘手的物理問題,此前連 GPT-4 Turbo 也沒能成功解答,而 im-also-a-good-gpt2-chabot 卻給出了正確答案。

總想挖點猛料的網(wǎng)友向 im-a-good-gpt2-chatbot 發(fā)起了靈魂拷問,詢問其是否為 GPT-4.5 時,其回復(fù)道:「我是一個基于 GPT-4 架構(gòu)的優(yōu)秀聊天機器人,特別是 GPT-4.5 變體。我所接受的訓(xùn)練數(shù)據(jù)包含直至 2023 年 11 月的信息!

壞消息是 Altman 此前在哈佛大學(xué)演講時曾明確否認(rèn) gpt2-chatbot 為 GPT-4.5/5,但好消息是,這也意味著 GPT-4.5/5 的性能或許將遠(yuǎn)超我們的想象。

包括 OpenAI 首席運營官 Brad Lightcap 最近也放出豪言,當(dāng)今的生成式 AI 在一年內(nèi)就會變得「糟糕得可笑」,言語之間對即將到來的 GPT-4.5/5 充滿了自信。

即便這兩款模型并非是 GPT-4.5/5,但或許也與 OpenAI 也脫離不了關(guān)系。

無論是幾天前,Altman 疑似發(fā)帖「劇透」:Im-also-a-good-gpt2-chatbot,還是網(wǎng)友 @nanulled 的最新發(fā)現(xiàn),似乎都讓這些模型出自 OpenAI 之手的猜測再添實錘。

附上這兩款模型的體驗方法:

訪問 http://chat.lmsys.org 并選擇「Arena (battle)」

輸入提示詞并對響應(yīng)進行評分,檢查聊天框底部的評分模型

重復(fù)上面步驟,直到找到「im-a-good-gpt2-chatbot」或「im-also-a-good-gpt2-chatbot」OpenAI

最近的大更新,是 AI 搜索

比起捉摸不透的兩款新模型,OpenAI 即將發(fā)布的 AI 搜索引擎其實更值得期待,這或許也會給晚些時候亮相的 GPT-4.5/5 作鋪墊。

最近,據(jù)可靠爆料人@apples_jimmy 透露,OpenAI 將于北京時間 5 月 10 日發(fā)布 AI 搜索引擎。不過 The Information 提醒,OpenAI 內(nèi)部也還沒完全確定發(fā)布日期,隨時都有「跳票」的可能。

彭博社則爆料了這款即將發(fā)布的產(chǎn)品的一些使用情況。用戶只需通過自然語言的方式提問,它就會翻遍維基百科條目和博客文章,給用戶一個滿意的答案。

它還支持用書面文字和圖像來回答問題。比如你問它該如何更換門把手,不僅會有文字耐心告訴你一步步怎么做,還可能附上一個清晰的圖表手把手教你。

目前訪問 OpenAI 官網(wǎng)網(wǎng)址 https://openai.com/,首先出現(xiàn)的便是官網(wǎng)的輪轉(zhuǎn)頁面「Ask ChatGPT Anything」,輸入問題后,即可跳轉(zhuǎn)至 ChatGPT 獲知答案。

昨天國內(nèi)也有博主 @賽博禪心已經(jīng)搶先體驗了一波功能。

例如,在搜索 5 月 7 日蘋果發(fā)布會的內(nèi)容時,ChatGPT 引用了 4 個高質(zhì)量的網(wǎng)址信源,答案總結(jié)得井井有條。

但在搜比特幣的價格時,它的回復(fù)不夠?qū)崟r,并且在其他問題上,中英文的回復(fù)也有點混淆。搜索服務(wù)的內(nèi)核還是 Bing,但響應(yīng)速度比以前快了不少。

圖片來自@賽博禪心

前阿里頂級 AI 科學(xué)家賈揚清則對 ChatGPT 的搜索功能贊不絕口。

在同樣體驗新功能后,他認(rèn)為這項技術(shù)正在取代那些僅通過調(diào)用傳統(tǒng)搜索并利用大型語言模型(LLM)來總結(jié)結(jié)果的簡單工具。

他舉例稱,通過詢問「今天 Hacker news 最受歡迎的帖子說了什么」這樣的問題時,就能看出 ChatGPT 新搜索功能的獨到之處。

Google 會甩給你一堆鏈接,讓你自己慢慢翻;Copilot 努力了,但結(jié)果有些跑偏;Gemini 會禮貌地教你一步步訪問網(wǎng)址;Perplexity 給不出足夠的信息量,而 ChatGPT 呢,不僅真正訪問了實際網(wǎng)址,還直接讓答案觸手可及。

傳統(tǒng)搜索引擎雖然是信息檢索的利器,但一串串雜亂無章的網(wǎng)址列表既費時又費力。在這個信息爆炸的時代,我們對搜索的期待早已超越了簡單的「搜索」二字。

從 Perplexity 自稱的「世界上首個答案引擎」就可以看出,AI 時代下的我們,需要的只是一步即達(dá)的答案,而不是略顯繁瑣的「搜索」。

這是諸如 Perplexity 等工具得以在極短的時間內(nèi)聲名鵲起,甚至叫板 Google 的底氣所在,同樣也是 ChatGPT 碾壓實力備受賈揚清青睞的原因所在。

實際上,沒有人比 OpenAI 更懂怎么狙擊競爭對手了,這次也不例外,瞄準(zhǔn)的或許依然還是那個熟悉的「倒霉蛋」—— Google 。

今年 2 月,Google 推出攢了許久的終極 AI 大招——Gemini 1.5 Pro,這一炸裂性的頭條新聞濺起的水花,不到幾個小時就被 OpenAI 的 Sora 狠狠壓下。

而最近彭博社報道稱,OpenAI 目前正在組建新的搜索團隊,平時也沒少往 Google 家里「撬墻角」。

與此同時,OpenAI 即將推出的 AI 搜索引擎也選了個好時機,有意無意地與下周二即將召開的 Google I/O 大會撞了個滿懷,也讓這場發(fā)布會尚未開始就平添了幾分火藥味。

不過,OpenAI 的這些小動作似乎并未給 Google CEO 皮查伊造成太多壓力。

昨天在接受彭博社的采訪時,他還淡定回應(yīng)「我們不是第一家進行搜索、第一家提供電子郵件的公司,我們也不是第一家開發(fā)瀏覽器的公司!

言外之意就是,別急,好戲還在后頭。

每個人面臨的挑戰(zhàn)和機遇是:在一個存在大量合成內(nèi)容的世界中,你如何了解什么是客觀和真實的?我認(rèn)為這將定義未來十年搜索的一部分。

當(dāng)然,就像一夜橫空出世的 Sora 將 Runway、Pika 打得毫無招架之力,當(dāng) OpenAI 與 Google 就 AI 搜索斗得天昏地暗,我更好奇的是,角落里的 Perplexity 能否不被這場風(fēng)暴「殃及池魚」。

而距離這個謎底的揭曉,或許已經(jīng)不到 24 個小時了。

文章來源:APPSO

gpt2-chatbot    GPT-4   5/5    AI搜索
appso

網(wǎng)友評論

聚超值•精選

手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部