首頁 > 科技要聞 > 科技> 正文

黃仁勛最愛用的 AI 產(chǎn)品重磅升級(jí),體驗(yàn)后我找到了這些細(xì)節(jié)

appso 整合編輯:太平洋科技 發(fā)布于:2024-07-07 18:49

正掙扎在盜用內(nèi)容爭(zhēng)議中的 Perplexity,「頂風(fēng)」發(fā)布了最新的 Pro search 功能。


圖片來自:Perplexity hub

不知道是不是受到爭(zhēng)議的影響,這次的更新技術(shù)細(xì)節(jié)不多,亮點(diǎn)在于能夠更好地處理數(shù)學(xué)計(jì)算問題、編程任務(wù)等。

當(dāng)然,作為看家本領(lǐng),檢索和回答的能力也得到提高,采用多步推理來解決復(fù)雜提問,并且展示每一個(gè)環(huán)節(jié),讓用戶看到每一個(gè)步驟。

兩個(gè)關(guān)于 Pro search 的重要信息:

普通用戶每四小時(shí)里可以使用 5 次 pro search,付費(fèi)用戶不限次數(shù)

為教育機(jī)構(gòu)、政府機(jī)構(gòu)、非盈利組織提供付費(fèi)折扣

傳送門:https://www.perplexity.ai/

不過,到底有了多大提升,得試了才知道。

測(cè)試熱身,考簡(jiǎn)答

為了了解 Pro search 的基本使用流程,我們先從簡(jiǎn)單的生活問題開始 —— 各地都進(jìn)入了高溫天氣,夏天了有什么解暑方式?

Pro search 的啟動(dòng)鍵在輸入框右下角,撥動(dòng)變色,即代表開啟。

開啟后默認(rèn)保留,即便結(jié)束了一個(gè)對(duì)話,另起一個(gè)新對(duì)話時(shí),也默認(rèn)在 Pro search 模式下進(jìn)行,對(duì)于不限次數(shù)的付費(fèi)用戶來說就很方便了。

運(yùn)行后,會(huì)漸次出現(xiàn) Researching 下拉框,這是模型的「思考工作」,完成后可以點(diǎn)擊右邊展開鍵查看詳情。

繼續(xù)點(diǎn)開可以看到信息來源,算是集合了不少中文信源,來源也很多樣。從回答上來看算是中規(guī)中矩,「多喝水」是怎么都不會(huì)出錯(cuò)的方法。

考數(shù)學(xué),本輪更新重點(diǎn)項(xiàng)目

數(shù)學(xué)計(jì)算能力是本次更新的亮點(diǎn),正好 Runway 更新了 Gen-3 模型,那么就讓 Perplexity 來計(jì)算一下:

如果購買標(biāo)準(zhǔn)套餐,在賬號(hào)里已經(jīng)有 400 積分的情況下,能用 Gen-3 生成多少視頻?

可以看到它擺開架勢(shì),列式子,做計(jì)算。不僅成功檢索到標(biāo)準(zhǔn)套餐的費(fèi)用、所提供的積分?jǐn)?shù)量,也能完成加法和除法。

根據(jù)它的計(jì)算,總共能用 Gen-3 生成 102.5 秒視頻,如果按 10 秒一條的頂格條件,是十支視頻。那么,換算成真金白銀呢,每生成十秒的視頻,要花多少錢?

這里 Perplexity 出現(xiàn)了「斷片」:它能提取自己之前的計(jì)算結(jié)果,也就是 102.5 秒。可是,它卻忘了第一輪計(jì)算時(shí),套餐月費(fèi)是按 12 美元 / 月計(jì)算的。

在這輪計(jì)算里,它錯(cuò)用了高級(jí)套餐,月費(fèi) 25 美元 / 月,計(jì)算出 0.24 美元作為每秒成本。

這是個(gè)明顯的失誤,且不論第一輪計(jì)算時(shí),明確指定了「標(biāo)準(zhǔn)套餐」,即便是高級(jí)套餐,有折扣的年付方式折合每月是 28 美元,無折扣的月付方式直接是 35 美元 —— 壓根沒有 25 美元這個(gè)數(shù)字

在追問之下,它承認(rèn)自己的確搞錯(cuò)了價(jià)格。

考專業(yè),深度提問

數(shù)學(xué)考試算是有驚無險(xiǎn)吧。Perplexity 一直以來主打深度,那么專業(yè)考試表現(xiàn)如何呢?

正好,昨天微軟研究院開源了 GraphRAG,也是一項(xiàng)用于 AI 搜索的技術(shù),這不就是 Perplexity 的「本專業(yè)」,那么來問問它好了。

從 searching 這一步來看,長(zhǎng)問題會(huì)被分解成更小的問題(相比之下,上一個(gè)簡(jiǎn)單提問里,是靠變換近義詞)。

第一個(gè)信源便是微軟的開源頁面,很即時(shí)。回答方面,Perplexity 把問題拆分成了兩個(gè)小問,做了平行回答:一是 GraphRAG 是什么,二是它自己在用的技術(shù)。

正想著追問細(xì)節(jié)之后,這一輪的免費(fèi)次數(shù)已經(jīng)耗盡了,得等四小時(shí)之后的刷新。

每四小時(shí) 5 次免費(fèi)的額度,比每 24 小時(shí)刷新要大方。但說多也不多,必須要思考一下,怎么提問才能最有效地表達(dá)需求。倒逼用戶提高自己的提問能力,這也是 AI 搜索的「?jìng)鹘y(tǒng)藝能」了。

總體來說,Pro search 是一個(gè)在用戶體驗(yàn)方面更貼心的升級(jí)。

不再是僵硬的「輸入提問 - 得到回答」,而是能看到 Perplexity 處理問題的步驟,怎么拆分、怎么檢索,調(diào)用了哪些信源。

AI 搜索的潛力股,或許是它

Perplexity 在有深度、專業(yè)性強(qiáng)的問題上,更能體現(xiàn)出實(shí)力。那么,深度提問時(shí)提到的「GraphRAG」,究竟是什么呢?

RAG 是 Retrieval(檢索),Augmented(增強(qiáng)),Generation(生成)的縮寫,是目前主流 AI 檢索所使用的策略,也是 Perplexity 自己采用的方式。

局限性體現(xiàn)在,它像一個(gè)縫縫補(bǔ)補(bǔ)的「內(nèi)容裁縫」。

比如,在深度提問里,「GraphRAG 是什么?Perplexity 是如何使用 RAG 做檢索?」這兩個(gè)小問,的確可以分開回答,但兩者之間顯然是有關(guān)聯(lián)的。

傳統(tǒng) RAG 無法捕捉到信息之間的關(guān)聯(lián),只能僵板地羅列。對(duì)于簡(jiǎn)單提問,或許無傷大雅。但在深度提問上,在把問題分解成更小的子問題之后,卻沒法有機(jī)地展示這些子問題之間的聯(lián)系。

GraphRAG 技術(shù),就意在通過建立信息之間的聯(lián)系。在接到問題、返送回答之間,多了一個(gè)步驟:建立知識(shí)圖譜。


圖片來自:微軟研究院

人類的思考能力,體現(xiàn)在能夠把自己所知道的、所掌握的,互相勾連,形成知識(shí)圖譜。

對(duì)人工智能來說,為了做到這一點(diǎn),除了要完成常規(guī)的數(shù)據(jù)提取、分割,還要完成對(duì)實(shí)體的識(shí)別、提取,并圍繞實(shí)體,建立一個(gè)個(gè)「小圈子」。

「小圈子」本身的結(jié)構(gòu)是自下而上,而它們之間又彼此相關(guān),鏈接在一起,就能形成一個(gè)龐大的巨網(wǎng)。這讓后續(xù)的回答生成環(huán)節(jié),就有了更豐富的組成方式。


圖片來自:微軟研究院

上圖中可以看到,右邊基于 GraphRAG 機(jī)制,能夠根據(jù)具不同的主題,進(jìn)行內(nèi)容整合。

這豈不是意味著 AI 又更有「人味兒」了嗎?怎么 Perplexity 這次更新沒有用上呢?

不著急,微軟研究院 4 月時(shí)發(fā)布對(duì)于這項(xiàng)技術(shù)的研究,昨天才正式開源。更重要的是,這項(xiàng)技術(shù),更適用于私有數(shù)據(jù)集。

例如,知乎最新發(fā)布的大模型產(chǎn)品「直答 AI」,就是以知乎站內(nèi)回答為優(yōu)先、網(wǎng)絡(luò)內(nèi)容為補(bǔ)充的形態(tài),建立的數(shù)據(jù)集。

相比之下,Perplexity 不想把自己局限住,而是放眼整個(gè)互聯(lián)網(wǎng)。憑借海量數(shù)據(jù)和大模型能力,Perplexity 一度是英偉達(dá)掌舵人黃仁勛最愛用的產(chǎn)品之一。

直到上周,,接連被福布斯、WIRED 點(diǎn)名道姓,指控它繞過媒體門戶網(wǎng)站的反爬機(jī)制,硬是把內(nèi)容抓進(jìn)自己的語料庫里。

AI 搜索領(lǐng)域,數(shù)據(jù)庫「彈藥充實(shí)」的確非常重要,不然 OpenAI 也不會(huì)接二連三地與各大媒體談合作。

但另一方面,有效地理解、分析和使用搜集來的數(shù)據(jù),將會(huì)起到越來越關(guān)鍵的作用。

歸根到底,用戶對(duì) AI 搜索的期待,絕不僅僅是一個(gè)「更多、更快」的搜索引擎,而是「更強(qiáng)」。

本文來源:Appso

appso

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部