首頁 > 科技要聞 > 科技> 正文

OpenAI重磅更新定檔下周一,奧特曼暗示會有「魔法」!

新智元 整合編輯:龔震 發(fā)布于:2024-05-12 23:15

確認(rèn)了,沒有GPT-5,沒有搜索引擎,但還會有驚喜!

OpenAI今天官宣預(yù)告,即將在13日,下周一上午10點(diǎn)(太平洋時間)開啟線上直播。

屆時,會有全新的ChatGPT demo演示,以及GPT-4升級更新。

傳送門:https://openai.com/(OpenAI還在網(wǎng)頁UI整了個小心機(jī)設(shè)計,一點(diǎn)滿屏字頗有趣味)

而Altman本人更是興奮地表示,「對我來說,感覺就像魔法一樣」。

本來,發(fā)布「搜索引擎」這件事基本實(shí)錘,甚至連路透援引內(nèi)部人士消息這篇報道,昨天在全網(wǎng)瘋轉(zhuǎn)。

然而,發(fā)布時間是對上了,但奧特曼突然變卦,直言「沒有搜索引擎」。

據(jù)網(wǎng)友爆料,這是OpenAI投出的誘餌,目的是揪出內(nèi)部泄密者。而經(jīng)常給Jimmy Apples、Flowers泄密的爆料人,已經(jīng)被OpenAI解雇。

不得不說,還是OpenAI套路深。

那么,萬眾期待的GPT-5沒有,確認(rèn)了再確認(rèn)的「搜索引擎」也沒有,下周一OpenAI的「魔法」究竟是啥?

Information獨(dú)家報道,OpenAI正在開發(fā)一個全能的AI語音助手,預(yù)計在下周展示。

這項(xiàng)新技術(shù)可以通過聲音和文本,與人交流,可以聽出不同人的語調(diào)、語氣,并能識別物體和圖像。

網(wǎng)友紛紛表示,又是沒等到GPT-5的一天。

Her即將成真!AI語音助手要來

其實(shí),OpenAI希望,能夠開發(fā)出一款像人類一樣交流的AI。

Altman曾表示,自己對Spike Jonze導(dǎo)演的電影《Her》深感興趣,并稱其具有預(yù)見性。

在這個影片中,講述了主人公愛上了一個對話操作系統(tǒng)——Semantha,并在互動過程中,AI也逐漸熟悉了他。

「她」記得他的故事,他的習(xí)慣,還發(fā)展出了自己的個性。

因此,打一開始,OpenAI致力于最終開發(fā)出類似于《Her》中的虛擬助手,同時讓現(xiàn)有語音助手,如Siri更加出色。

新模型有音頻輸入、音頻輸出功能,以及更好的推理能力。在一些查詢上甚至超過了GPT-4 Turbo

據(jù)兩位知情人士透露,OpenAI已經(jīng)向一些客戶展示了這項(xiàng)新技術(shù),包括優(yōu)于現(xiàn)有模型的邏輯推理能力在內(nèi)的多項(xiàng)能力。

而且,預(yù)計在下周一的活動中,將首次公開展示這款進(jìn)階后的AI。

可以確認(rèn)的是,OpenAI這波操作再次截胡谷歌,搶占奪人眼睛的先機(jī)。

谷歌預(yù)計在14日召開I/O大會(OpenAI掐點(diǎn)的直播時間真及時,簡直不給谷歌留下喘氣的機(jī)會)

據(jù)網(wǎng)友發(fā)現(xiàn),在Altman官宣不會發(fā)布「搜索引擎」,谷歌的股價立馬飆升。

精準(zhǔn)識別語調(diào)語氣,但體積太大裝不進(jìn)手機(jī)

OpenAI團(tuán)隊(duì)篤定的是,具備視覺+音頻能力的AI助手,可能會像智能手機(jī)一樣,將給世界帶來顛覆性的變革性。

ChatGPT,還只是這類強(qiáng)大AI助手的雛形。

理論上,他們設(shè)想的這款A(yù)I助手,可以完成不可能的任務(wù)。

比如,指導(dǎo)學(xué)生寫論文、解決數(shù)學(xué)難題,或人們詢問時,提供及時豐富的信息、翻譯標(biāo)志,甚至指導(dǎo)如何修理故障的汽車。

不幸的是,OpenAI這款A(yù)I目前體積太大,根本無法在個人終端設(shè)備運(yùn)行。

不過,客戶可以在短期內(nèi)使用基于云的版本,來增強(qiáng)OpenAI已經(jīng)支持的軟件功能,例如自動客戶服務(wù)智能體。

另據(jù)了解這項(xiàng)AI的人透露,新軟件的音頻功能可以幫助,這些智能體更精準(zhǔn)地理解來電者的「語調(diào)」,以及他們是否在提出請求時使用「諷刺語氣」。

目前,OpenAI已經(jīng)開發(fā)了用于轉(zhuǎn)錄音頻(Whisper)以及文本轉(zhuǎn)語言(TTS)的模型。

ChatGPT背后便集成了這些能力,不過在用到的時候,需要分別調(diào)用這些工具。

據(jù)稱,OpenAI即將推出的新模型,將這些能力整合到一個模型之中,即打造一個「原生多模態(tài)模型」。

這個全新多模態(tài)模型,在理解圖像和音頻方面表現(xiàn)更佳,同時其響應(yīng)速度也超過了那些能力較弱的模型。

微軟搶先體驗(yàn)

一如既往,OpenAI更新那天,作為「金主爸爸」的微軟,定是最先用上新功能的那個人。

預(yù)計,微軟將會利用OpenAI新技術(shù)升級自己的語音助手。

而且,他們設(shè)想試圖去壓縮這個技術(shù),以便將其「裝進(jìn)」包括配備前置攝像頭的可穿戴設(shè)備中,能夠捕捉到用戶的周圍環(huán)境。

不過,目前雖尚不清楚OpenAI何時會向其付費(fèi)客戶提供這些新功能,但最終目標(biāo)是,將其納入ChatGPT的免費(fèi)版本中。

據(jù)一位體驗(yàn)過的人士透露,OpenAI的目標(biāo)是,讓具備新功能的AI模型的運(yùn)營成本,低于其當(dāng)前收費(fèi)的最尖端的模型GPT-4-Turbo。

他還指出,新模型在回答某些問題上表現(xiàn)得更好。然而,它依舊會出現(xiàn)「幻覺」。

GPT-5年底前發(fā),冰山之下深藏的秘密

OpenAI的領(lǐng)先優(yōu)勢,幾乎無人能及。

一直以來,谷歌高管夢想著,利用AI開發(fā)出強(qiáng)大的助手。

去年12年,谷歌首次展示了對話AI「Gemini」,能夠?qū)崟r響應(yīng)人的語音指令,并識別人類正在觀看的圖片。

一時間,這個宣傳視頻在全網(wǎng)掀起軒然大波,讓許多人瞬間對谷歌刮目相看。

沒想到,還沒發(fā)布一天,視頻竟被曝出「造假」?!

谷歌隨后解釋,這些能力的實(shí)現(xiàn),需要研究人員通過圖片和文本指令來引導(dǎo)模型,并非視頻所展示的那種簡單對話。

此后,隨著Gemini的迭代升級,也增加了一些新功能,除了分析圖像和文本之外,還能分析音頻。

盡管如此,它依舊不能理解多數(shù)傳統(tǒng)語音命令,也不能像Siri和Google Assistant等傳統(tǒng)語音助手那樣與用戶進(jìn)行交流。

而OpenAI即將發(fā)布的AI語音助手,或許對谷歌來說,又是一個致命性的打擊。

另外,OpenAI也在全力以赴,確保自己在AI領(lǐng)域的領(lǐng)先地位,不被主打「開源王牌」的Meta趕超。

今年4月,Llama 3的8B和70B版本發(fā)布,并預(yù)告了400B+開源大模型,直接狙擊GPT-4。

而具備「音頻+視覺」能力的AI模型,只是OpenAI正在開發(fā)的眾多產(chǎn)品之一。

雖這次不會發(fā)布「網(wǎng)絡(luò)搜索引擎」,但這件事確實(shí)在OpenAI內(nèi)部正在推進(jìn),就是為了與谷歌搜索競爭。

畢竟,OpenAI在上周的主頁中,已經(jīng)對外展示了一個新的UI。

此外,OpenAI還在開發(fā)一種自動化軟件,稱為「計算機(jī)操作智能體」(computer-using agent)。

該軟件有望加速軟件開發(fā),及其他計算機(jī)相關(guān)任務(wù)。

另外,今年年初,AI視頻生成器Sora的誕生,已經(jīng)在好萊塢掀起巨震,雖然目前尚未公開發(fā)布。

更重要的是,GPT-5也在默默推進(jìn)中,并且要顯著優(yōu)于GPT-4。知情人士透露,OpenAI可能在今年年底前完成GPT-5的開發(fā),并公開發(fā)布。

之所以,OpenAI內(nèi)部在產(chǎn)品和AI模型開發(fā)上進(jìn)展迅速,是因?yàn)榇饲靶嫉捻?xiàng)目,未能獲得足夠的關(guān)注。

比如,他們曾承諾開發(fā)者最在今年第一季度,通過構(gòu)建定制聊天機(jī)器人,來為其商店賺錢。

但到目前為止,OpenAI尚未推出實(shí)現(xiàn)這一目標(biāo)的具體方式。

ChatGPT裝進(jìn)iPhone,與蘋果合作基本達(dá)成

另一方面,打造視覺+音頻AI助手可以幫助OpenAI,將其能力引入數(shù)億,甚至數(shù)十億的蘋果設(shè)備中。

就在剛剛,彭博報道稱,蘋果與OpenAI正在敲定一項(xiàng)協(xié)議,貌似接近尾聲,基本達(dá)成。

這項(xiàng)協(xié)議,即將為今年的iOS提供全新的生成式AI能力。

此前,還曾爆出蘋果與谷歌就Gemini的談判正在進(jìn)行中,不過還未達(dá)成協(xié)議。

畢竟,距蘋果今年的開發(fā)者大會WWDC(6月10日),留給蘋果的時間不多了。

多家媒體爆料稱,這屆大會將AI整合進(jìn)全新iOS 18系統(tǒng)中。

對于大家的期待,蘋果可不想辜負(fù)。

硬件設(shè)備,OpenAI也要自己做

此外,Altman還與iPhone設(shè)計師Jony Ive合作,去開發(fā)一款獨(dú)立的AI消費(fèi)設(shè)備。

Information曾報道,這款一個硬件可能從Emerson Collective和Thrive Capital等投資者那里,籌集到高達(dá)10億美元的資金。

過去一年,AI Pin、Rabbit R1等AI驅(qū)動的設(shè)備和可穿戴產(chǎn)品蜂擁而出,Altman此舉也是希望加入這一陣列。

不得不承認(rèn)的是,即便OpenAI最先進(jìn)的AI模型推出,也將因其龐大的規(guī)模,只限在云端運(yùn)行,并且需要聯(lián)網(wǎng)操作。

而未來,若想讓復(fù)雜的具備「視覺+音頻」的對話AI,縮小到足以在設(shè)備上運(yùn)行,可能還需要幾個月,甚至幾年的時間。

全網(wǎng)大預(yù)測:智能體、gpt4-lite...

OpenAI這波官宣,可謂是戳中了所有人的興奮點(diǎn)。

爆料人Jimmy Apples又來泄密,「預(yù)計下周,我們會看到智能體的發(fā)布」。

而「搜索引擎」可能會在蘋果WWDC大會上,一起發(fā)布。

OpenAI研究科學(xué)家Bowen Cheng甚至表示,要發(fā)的可比GPT-5酷多了。

不知為何,這個帖子目前卻被刪除了。

另一位OpenAI負(fù)責(zé)視頻生成的科學(xué)家Will Depue發(fā)了一張圖,不知在暗示著什么。

還有一位網(wǎng)友Siqi Chen預(yù)測下周一,在GPT-4模型方面的更新:

- gpt4-lite:替換gpt-3.5

- gpt4-auto:一個新的模型端點(diǎn)(endpoint),可自動從網(wǎng)絡(luò)檢索數(shù)據(jù),并集成內(nèi)部數(shù)據(jù)來增強(qiáng)響應(yīng)(不是「搜索引擎」)

- gpt4-lite-auto:與gpt4-auto類似,但使用的是lite版本。

同樣,也有人稱,gpt4-lite即將發(fā)布。

離職OpenAI,入職谷歌的Logan Kilpatrick表示,「6個月后,AI領(lǐng)域的格局將會完全不同。大多數(shù)人會對事情的發(fā)展感到驚訝」。

還有一個疑問是,OpenAI這次會對,gpt2做解釋嗎?

接下來一個月,AI海嘯將翻涌而來。

關(guān)于GPT-5何時面世,最近Altman在All-In Pod中回應(yīng),「我甚至不確定我們是否會命名它為GPT-5」。

他暗示,未來可能不再遵循GPT N+1的發(fā)布模式,而是轉(zhuǎn)向持續(xù)的改進(jìn)過程。

但,GPT-5還得再等等。

參考資料:

https://www.theinformation.com/articles/openai-develops-ai-voice-assistant-as-it-chases-google-apple

https://www.bloomberg.com/news/articles/2024-05-11/apple-closes-in-on-deal-with-openai-to-put-chatgpt-on-iphone

https://twitter.com/sama/status/1788989777452408943

文章來源:新智元

新智元

網(wǎng)友評論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部