首頁 > 科技要聞 > 科技> 正文

GPT-4o為何背離OpenAI,打起“感情牌”?

趙甜怡 編輯:林炯佳 發(fā)布于:2024-05-14 14:14 PConline原創(chuàng)

“你為什么說話的時候也會嘆氣?”

“是嗎?我不知道,可能只是習慣,也許是從你那兒學的!

在電影《her》中,AI語音助手Samantha擁有迷人的聲線(由演員斯嘉麗配音),溫柔體貼地替男主處理好各種郵件,提醒開會。在生活上,她又幽默風趣,時常讓男主開懷大笑。

就在今天的凌晨1點,OpenAI將這個“Samantha”帶到了我們的現(xiàn)實世界。

打破機器與人的邊界

“哇,慢一點,Mark別喘太快,你可不是個吸塵器!

技術人員Mark在演示中,讓新的旗艦模型GPT-4o對他的呼吸進行反饋。他在現(xiàn)場裝出氣喘吁吁的樣子,大口喘氣。GPT-4o立馬給出了這樣幽默的回復。

這個能夠感受你的呼吸節(jié)奏、用豐富的情緒作出回答的,就是OpenAI這次發(fā)布會的“主角”—— 實時語音助手GPT-4o。

語音助手早已進入普通人的家里,一聲“小愛同學”就可以得知今天的天氣和新聞。但這與電影中的語音助手差距就在于對話的自然性。

與人類對話和與機器對話有什么區(qū)別?

OpenAI的研發(fā)團隊也在不斷地問自己這個問題。為什么有的語音助手一聽就是機器,真實感的關鍵是什么?

OpenAI在電影《her》中找到了答案。語音助手的真實感關鍵在于三點:

首先是實時性。我們在自然對話時,在「聽」和「說」的同時會思考接下來說什么,而機器卻是需要人類說完,給到完整的指令,才會反應之后執(zhí)行。這就帶來了2、3秒的延遲。

而這次的GPT-4o,它可以在短至 232 毫秒的時間內(nèi)響應我們。這比現(xiàn)有的響應速度提高了6~9倍!并且,這個速度是接近人類在對話中的響應速度的,更加強了“對話感”。

其次是隨機性。技術人員Mark在演示中,多次用新的問題打斷GPT-4o對上一個問題的回答。但它仍然能夠絲滑回應。并且可以以多種不同的情感風格生成語音。

在發(fā)布會現(xiàn)場,GPT-4o在講一個關于機器人和愛情的睡前故事時,不斷切換情緒,越來越“戲劇化”,它的“機靈勁兒”逗得全場觀眾哈哈大笑。

最后也是最關鍵的一點:視覺。

我們在聊天對話時,除了語音信息以外,視覺信息同樣重要。OpenAI也關注到了這一點。

在電影《her》中,男主將Samantha放入口袋,在沙灘上約會,欣賞海岸的美景。在OpenAI的官方視頻中,ChatGPT替盲人用戶“觀察”著這個世界,并幫用戶順利的打上了車。

GPT-4o可聽、可說、可看,像是一個能力超群的朋友。

討好用戶是為打倒谷歌?

這次的發(fā)布會看個熱鬧的同時,外界對于OpenAI保持了疑問的態(tài)度,為什么這次AI的態(tài)度會一反常態(tài),甚至不惜違背之前定下的規(guī)則。

從OpenAI發(fā)布ChatGPT開始,它的主要定位是服務企業(yè)。規(guī)則中還專門提示用戶“不建議和ChatGPT產(chǎn)生情感關系”。在今年年初GPTstore上線后,OpenAI還專門刪除了不少虛擬女友類的內(nèi)容。

而現(xiàn)在,OpenAI卻和原來背道而馳。

從發(fā)布會預熱開始,就與電影《her》深深綁定。音頻AGI研究負責人Alexis Conneau專門將自己的主頁背景更換為電影《her》的劇照。在發(fā)布之后,Altman也緊接著在推特發(fā)布了內(nèi)容為“her”的博文。而這部電影的主題正是人類和人工智能助手的愛情故事。

并且在直播演示中,三位技術大佬不斷展示GPT-4o幽默、搞怪、害羞等擬人化的情緒,F(xiàn)場GPT-4o還回答了“哎呀別說了,你都讓我臉紅了!”的語句。

要知道,在此之前,如果你對ChatGPT發(fā)出有關性別的設定,它會直接冰冷地回答:“我無法完成此提示,因為假設個人的性別可能會令人反感!

OpenAI如此改變的原因到底是什么?

歸結這是一次精彩的宣傳戰(zhàn)。而最終目標,就是為了“狙擊”谷歌。

OpenAI現(xiàn)在有超過1億用戶,但從去年6月份開始,用戶增長就已見頂。但谷歌在全球有近30億的用戶,龐大的用戶基礎是谷歌的優(yōu)勢所在。想要成為AI行業(yè)的領頭企業(yè),谷歌是OpenAI必須要征服的一座大山。

如今,AI賽道的搶占已經(jīng)悄然打響。

在這個賽道中,所有玩家都在瘋狂爭奪領地,建立護城河。在這個過程中,OpenAI也逐漸意識到C端用戶的重要。

直播僅僅用17分鐘的演示就已經(jīng)吊足了所有看客的胃口。首席技術官Mira還在最后宣布, 在未來的幾周內(nèi),GPT-4o會向所有人免費開放!

用技術和價格爭取更多的用戶,是OpenAI現(xiàn)在的核心任務。

搜索哪去了?

在發(fā)布會之前,關于OpenAI將發(fā)布搜索引擎的新聞一度引起了熱議。還有網(wǎng)友扒出SearchGPT的頁面,收到了灰度測試。當網(wǎng)友們都以為這次發(fā)布會將隆重推出搜索服務時,OpenAI卻選擇再向前走一步。

搜索引擎旨在查找和提供信息。而智能助手則是著重自動化和優(yōu)化任務執(zhí)行,其功能范圍包含了信息查找,但絕不僅止于此。

傳統(tǒng)的搜索引擎,通過用戶關鍵詞查詢的方式開啟信息檢索,將搜索到的信息以網(wǎng)頁鏈接的形式進行羅列。

在2023年中,搜索市場又涌現(xiàn)了不少“新生力量”——AI搜索。例如,Perplexity AI、Arc Search等,大多遵從了“Answer First”原則——在面對用戶發(fā)出的對話式提問時,優(yōu)先用文本總結,而非網(wǎng)頁鏈接的方式來回答用戶提出的問題。在回答的文本中,還會以引用的小標識形式來標注信息來源,用戶點擊后才會進入相關網(wǎng)頁。

有了AI大模型的加持,搜索的交互從「關鍵詞查詢」到了「對話式提問」,用戶體驗上了一個臺階。

但是,聲音是語言的關鍵,視覺才是人類輸入的第一信息。

這一次,OpenAI直接拓寬了開啟交互的渠道,將一個單調(diào)的對話框變成一個語音鍵、一個攝像頭,甚至可以同時調(diào)動三者,實現(xiàn)多模態(tài)交互。所有讓人興奮不已、眼花繚亂的功能只告訴了我們一個信息:

你的下一個搜索工具,何必是瀏覽器?

如此一個“集大成者”的智能助手是否讓你感覺一絲熟悉?沒錯,就是Siri。

在OpenAI的發(fā)布會之前,已經(jīng)有消息爆出OpenAI和蘋果達成了合作,Siri將接入ChatGPT。消息的真實性尚且無法確定。

與此同時,被瞄準的谷歌也不會坐以待斃。據(jù)傳,在明日開啟的2024年I/O開發(fā)者大會上,谷歌或?qū)⑸壷悄苤諴ixie。它的出現(xiàn)能否將比賽推向新的熱潮?蘋果的Siri又會花落誰家?

毫無疑問,這個夏天AI的世界將會令我們更加驚喜。

趙甜怡

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部