首頁(yè) > 科技要聞 > 科技> 正文

蘋(píng)果今年最大的更新要來(lái)了,AI Siri 的終極形態(tài)比 GPT-4o 更科幻

appso 整合編輯:太平洋科技 發(fā)布于:2024-06-05 16:01

Siri 已經(jīng)落后了。

據(jù)《紐約報(bào)道》,這就是去年蘋(píng)果軟件主管 Craig Federighi 和機(jī)器學(xué)習(xí)高管 John Giannandrea 花了幾周測(cè)試 ChatGPT 后的想法,因此,他們決定對(duì)這個(gè) 13 歲的語(yǔ)音助手進(jìn)行大改造。

離 WWDC 開(kāi)發(fā)者大會(huì)還有不到半個(gè)月的時(shí)間,科技記者 Mark Gurman 帶來(lái)了 AI 版 Siri 的最新進(jìn)展爆料,看起來(lái),這個(gè)總是被吐槽「人工智障」的語(yǔ)音助手確實(shí)將迎來(lái)大更新。

一個(gè)壞消息:里面一些重磅功能可能不會(huì)在今年到來(lái)。

盡管如此, Mark Gurman 稱蘋(píng)果內(nèi)部依然將 iOS 18 視為有史以來(lái)最重要的升級(jí)。蘋(píng)果 WWDC24 將于北京時(shí)間 6 月 11 日凌晨 1 點(diǎn)舉辦,屆時(shí) APPSO 將在 Apple Park 現(xiàn)場(chǎng)給大家?guī)?lái)最新報(bào)道,敬請(qǐng)關(guān)注。

姍姍來(lái)遲又未來(lái)可期的「掌控應(yīng)用」功能

據(jù)報(bào)道,在 AI 的加持下,Siri 將能夠進(jìn)一步「掌控應(yīng)用」,實(shí)現(xiàn)應(yīng)用功能的精準(zhǔn)控制。

比如說(shuō),讓 Siri 把文件從一個(gè)文件夾轉(zhuǎn)移到另一個(gè)文件夾,或者讓 Siri 打開(kāi)特定的新聞文章,甚至可以讓 Siri 給出一個(gè)文章摘要。

雖然現(xiàn)在已經(jīng)能夠使用 Siri 來(lái)發(fā)短信甚至發(fā)微信,但是基于 AI 大改造的 Siri 將走得更遠(yuǎn),能夠分析人們?nèi)绾问褂米约旱脑O(shè)備,并學(xué)會(huì)越來(lái)越多的自動(dòng)操作。蘋(píng)果計(jì)劃,將在其開(kāi)發(fā)的 app 中支持「數(shù)百個(gè)」的命令。

iOS 10 就已經(jīng)能實(shí)現(xiàn)的 Siri 發(fā)微信功能

聽(tīng)著確實(shí)不錯(cuò),不過(guò) Gurman 表示,這個(gè)功能一開(kāi)始僅限于蘋(píng)果自己開(kāi)發(fā)的 app,而且不會(huì)在今年推出,可能最早要等到明年的 iOS 18 后續(xù)更新。

并且也有消息稱,舊型號(hào)或許僅有搭載 A17 Pro 處理器的 iPhone 15 Pro,以及 M1 以上的 Mac 能夠支持更多本地 AI 功能。

新的 Siri 一開(kāi)始可能一次只能聽(tīng)懂并執(zhí)行一個(gè)命令,但有望在未來(lái)支持一串的命令,比如說(shuō)將錄制好的會(huì)議錄音生成一個(gè)總結(jié)(也是 iOS 18 有望推出的功能),然后用郵件發(fā)給同事,還能直接補(bǔ)充一點(diǎn)文字說(shuō)明,一套操作一句話就能交給 Siri 完成。

新的 Siri 也預(yù)計(jì)會(huì)和 iOS 18 的其他 AI 功能一樣,存在一個(gè)判斷系統(tǒng),根據(jù)所需算力大小,判斷 AI 任務(wù)是否可以在設(shè)備本地完成,還是需要在云端運(yùn)行。

如果要去總結(jié) Siri 目前這 13 年的發(fā)展,「管生不管養(yǎng)」恐怕是最貼切的一個(gè)。

在 2011 年的 iPhone 4s 發(fā)布會(huì)上,Siri 壓軸登場(chǎng),給在場(chǎng)觀眾和世人不小震撼。當(dāng)時(shí)對(duì) Siri 的演示是這樣的:可以問(wèn)它某城市天氣如何,或者某股票表現(xiàn)如何,而一句話就能設(shè)定一個(gè)離開(kāi)公司自動(dòng)彈出的提醒事項(xiàng),在當(dāng)時(shí)也是一個(gè)非常酷非常未來(lái)的功能。

結(jié)果,13 年過(guò)去,上面的功能似乎還是 Siri 使用最多的幾個(gè)場(chǎng)景,就算是后來(lái)支持的家居操控,和快捷指令,總體上還是一些打開(kāi)關(guān)閉的功能,其實(shí) Siri 一直沒(méi)迎來(lái)質(zhì)的飛躍。

即使在面對(duì) Google Assistant、微軟 Cortana、三星 Bixby 等其他后來(lái)居上的語(yǔ)音助手挑戰(zhàn),甚至國(guó)內(nèi)小米「小愛(ài)同學(xué)」也越來(lái)越好用的情況下,蘋(píng)果依然不思進(jìn)取,直到 ChatGPT 橫空出世才意識(shí)到 Siri 已經(jīng)落后時(shí)代。

小愛(ài)同學(xué)已經(jīng)在去年接入了大模型

雖然蘋(píng)果好像隔三差五就在發(fā)布會(huì)上介紹,Siri 又變強(qiáng)了,能理解更多指令了,能干更多事情了,但很多時(shí)候,能理解不代表能做到,能做到不代表能做好。

比如告訴 Siri,我想自拍,Siri 二話不說(shuō)幫你打開(kāi)相機(jī)和前置攝像頭,然后就沒(méi)有然后了,用戶還需要伸手去點(diǎn)擊快門。甚至有的時(shí)候,Siri 只會(huì)自動(dòng)跳轉(zhuǎn)相機(jī)應(yīng)用,而不會(huì)跳轉(zhuǎn)到前置模式。

如果是三星的 Bixby 助手,會(huì)自動(dòng)進(jìn)入自拍的倒計(jì)時(shí),全程真正做到不需要用戶動(dòng)手操作。

蘋(píng)果默認(rèn)的相機(jī)應(yīng)用本身自帶倒計(jì)時(shí)功能,因此這種流程在實(shí)現(xiàn)上根本不需要太多 AI 因素加持,但蘋(píng)果就是沒(méi)有把體驗(yàn)做好。

Siri 的對(duì)手是快捷指令

不知道你有沒(méi)有使用過(guò)「快捷指令」這個(gè)功能呢?

蘋(píng)果收購(gòu) Workflow 公司后,在 iOS 12 中將其產(chǎn)品作為「快捷指令」整合入 iPhone,也在 macOS 12 時(shí)在 Mac 平臺(tái)上推出。

快捷指令已經(jīng)整合進(jìn)入了蘋(píng)果生態(tài)鏈中

這個(gè)功能能夠?qū)崿F(xiàn)很多 iOS 的進(jìn)階玩法,比如說(shuō)一鍵實(shí)現(xiàn)釘釘打卡,一鍵將 LivePhoto 和視頻制作成 GIF,甚至還能自動(dòng)化運(yùn)行,實(shí)現(xiàn)「節(jié)假日自動(dòng)關(guān)鬧鐘」。

但這個(gè)功能對(duì)小白用戶并不友好。想要新建一個(gè)快捷指令,用戶要在一個(gè)類似腳本編程的界面中選擇各種操作模塊,并用各種諸如「如果..那么」「只要...就」的邏輯將其串聯(lián)起來(lái),像是「節(jié)假日鬧鐘」這種包含多種邏輯判斷和自動(dòng)化運(yùn)行的快捷指令,用戶即使是對(duì)著教程設(shè)置,也很容易出錯(cuò)。

蘋(píng)果雖然提供一個(gè)可以直接獲取現(xiàn)成腳本的「快捷指令中心」,但是里面提供的快捷指令效果簡(jiǎn)單,很少有切中用戶痛點(diǎn)的功能。

這個(gè)功能類似三星 Galaxy 手機(jī)的「Good Lock」模塊,提供效果非常強(qiáng)大的自定義功能,但是門檻相對(duì)應(yīng)也不低。

而 AI 大模型最重要的能力之一,就是自然語(yǔ)言的理解和邏輯思維能力。也就是說(shuō),用戶對(duì)大模型 AI 說(shuō)一句「我下班了,幫我打卡」,AI 就會(huì)知道你的意思是執(zhí)行「打開(kāi)釘釘」-「進(jìn)行打卡」的操作,而不是表示自己「沒(méi)聽(tīng)明白」。

現(xiàn)在的 Siri 也不是完全不具備這種能力。讓 Siri 在你離開(kāi)公司時(shí)提醒你給家人買個(gè)生日蛋糕,是 iPhone 4s 發(fā)布會(huì)上就被演示的功能,背后同樣是理解用戶語(yǔ)言并轉(zhuǎn)化成相關(guān)操作的一個(gè)過(guò)程。

Siri 發(fā)布會(huì)上介紹的很多功能依舊是現(xiàn)在 Siri 的主要能力

而 AI 大模型加持后的 Siri 能做到的應(yīng)該遠(yuǎn)遠(yuǎn)不僅如此。用戶用自然語(yǔ)言描述自己的復(fù)雜需求,Siri 聽(tīng)懂后,轉(zhuǎn)化成腳本的邏輯,并自己執(zhí)行相應(yīng)的步驟,不用讓用戶面對(duì)復(fù)雜的編程,這才是真正的「快捷」指令。

ChatGPT 教我如何用 iOS 快捷指令設(shè)置節(jié)假日鬧鐘,雖然邏輯清晰,但似乎不太可用

除了讓用戶更自然自定義操作,還可以去期待 Siri 成為一個(gè)更「主動(dòng)」的助理。

如果你使用 iPhone 時(shí)間夠長(zhǎng),會(huì)發(fā)現(xiàn)在有時(shí)候,iPhone 會(huì)自動(dòng)彈出建議。比如說(shuō),用戶戴好藍(lán)牙耳機(jī),就推薦你打開(kāi)網(wǎng)易云音樂(lè),因?yàn)檫@就是你的使用規(guī)律;或者在深夜充電時(shí),手機(jī)自動(dòng)降低了充電功率,以保養(yǎng)電池,但又能在你醒來(lái)前充好,也是因?yàn)榘l(fā)現(xiàn)你有在睡前長(zhǎng)時(shí)間充電的習(xí)慣。

這些就是機(jī)器學(xué)習(xí)的結(jié)果,也是蘋(píng)果一直以來(lái)致力的 AI 功能,F(xiàn)代人一天要花不少時(shí)間在手機(jī)上,用手機(jī)買買買、吃飯、辦公已經(jīng)很普遍,手機(jī)自然成為比肚里的蛔蟲(chóng)更懂你的存在。

想象一下蘋(píng)果強(qiáng)大的情景感知,加上更強(qiáng)大的手機(jī)自動(dòng)操作能力,AI 版的 Siri 或許真的能化身成一個(gè)真正的「私人助理」,在你把事情交給它完成之前,就預(yù)判好你的需求,把一切安排妥當(dāng)。

比如說(shuō),通過(guò)你訂的機(jī)票,自動(dòng)幫你查詢好目的地到達(dá)后的天氣,還提前設(shè)好鬧鐘,根據(jù)你的出行習(xí)慣和實(shí)時(shí)交通狀況,預(yù)計(jì)好出行的時(shí)間提前幫你叫車,到了機(jī)場(chǎng)自動(dòng)彈出機(jī)票和自行使用應(yīng)用值機(jī),到了當(dāng)?shù)亟o你打開(kāi)大眾點(diǎn)評(píng)推薦餐廳,簡(jiǎn)直是私人助理+導(dǎo)游。

想要實(shí)現(xiàn)這一套行云流水的操作,我們當(dāng)然會(huì)去想,這需要也開(kāi)發(fā)者和蘋(píng)果的雙向奔赴。不過(guò),AI 發(fā)展的速度已經(jīng)超出了我們的想象,也許未來(lái),AI 能夠直接模仿人類的操作。

我們能看懂的 UI,AI 也在學(xué)習(xí)中

雖然新的 Siri 的智能操作初期只支持蘋(píng)果自己的應(yīng)用,但我更愿意相信這只是蘋(píng)果 AI Siri 路線的起點(diǎn)或者中段,而并非終點(diǎn)。

我相信蘋(píng)果 AI 最終的目標(biāo)是實(shí)現(xiàn)這樣的場(chǎng)景:早上起床,用一句「Siri」喚醒 Siri,再讓它打開(kāi)微信公眾號(hào)「愛(ài)范兒」,朗讀最新的文章,就這樣在完全不用動(dòng)手的情況下,聽(tīng)取愛(ài)范兒的早報(bào)。

一個(gè)許多年前的 iPhone 概念手機(jī)殼,想法是「Siri」擬人化和語(yǔ)音解放雙手

「快捷指令」能夠支持第三方 app 的操作,主要是因?yàn)樘O(píng)果開(kāi)放了 API,第三方應(yīng)用廠商也可以將應(yīng)用內(nèi)的操作拆分成快捷指令能夠執(zhí)行的模塊。

但這還要看應(yīng)用廠商是否愿意提供相關(guān)的模塊和操作,比如說(shuō),如果菜鳥(niǎo) app 不開(kāi)放顯示取件碼的操作,就算 Siri 再聰明,也無(wú)法自行打開(kāi)菜鳥(niǎo)顯示取件碼。

如果再進(jìn)一步,讓 AI 直接能理解什么是取件碼,以及取件碼在 app 的哪個(gè)位置,并在接到指令后自己打開(kāi)呢?

這聽(tīng)起來(lái)好像有點(diǎn)太科幻,不過(guò),行業(yè)已經(jīng)在進(jìn)行相關(guān)嘗試了。

在上星期的微軟 Build 2024 開(kāi)發(fā)者大會(huì)上,微軟整了個(gè)活:GPT-4o 支持的 Copliot,能夠?qū)崟r(shí)查看屏幕上的內(nèi)容,引導(dǎo)玩家一起玩《我的世界》。

演示中,Copilot 用非常流暢自然、甚至還帶有一絲情緒的語(yǔ)言,引導(dǎo)玩家在游戲中制作一把劍。在這個(gè)過(guò)程中,Copilot 能夠識(shí)別游戲背包內(nèi)的物品,還能告知玩家缺少的材料,完全就像一個(gè)帶你玩游戲的「大神」。

這表明,AI 助手已經(jīng)不僅僅是「你問(wèn)我答」的文字機(jī)器人,或者只能夠在后臺(tái)編程處理數(shù)據(jù),而是真正能開(kāi)始理解我們?nèi)祟惪匆?jiàn)的 UI 界面,還能知曉我們?nèi)绾尾僮鳌?/span>

而今年火了一段時(shí)間的「AI 硬件」Rabbit R1,基本拋棄了操作界面,完全通過(guò) AI 語(yǔ)音助手完成各種服務(wù)的使用。Rabbit 公司宣稱,他們使用了一種名為「大動(dòng)作模型」(LAM)的 AI 模型技術(shù),能夠在理解了用戶的指令后,在服務(wù)器模仿人類的操作,直接在相關(guān)網(wǎng)頁(yè)和應(yīng)用中完成用戶的指令。

Rabbit R1 號(hào)稱用語(yǔ)音來(lái)實(shí)現(xiàn)跨應(yīng)用跨平臺(tái)的操作

雖然 Rabbit R1 的表現(xiàn)與他們所描繪的場(chǎng)景相差甚遠(yuǎn),但是這個(gè)愿景本身非常美好,GPT-4o 等機(jī)器人在視覺(jué)理解的優(yōu)秀表現(xiàn),也讓人感覺(jué)讓 AI 代替人類實(shí)現(xiàn)操作的未來(lái)確實(shí)不遠(yuǎn)了。

蘋(píng)果作為一家在開(kāi)發(fā)者中極具號(hào)召力的公司,完全可以不用模仿初創(chuàng)公司 Rabbit 全盤使用「LAM」的做法,可以通過(guò)開(kāi)放相關(guān)接口和提供 SDK 的做法,讓各大第三方開(kāi)發(fā)商在應(yīng)用中原生支持 AI 操作,帶來(lái)更加成熟穩(wěn)定的語(yǔ)音操作體驗(yàn)。

蘋(píng)果相關(guān)的研究顯示,他們確實(shí)有這種想法,配套蘋(píng)果的應(yīng)用 UI 設(shè)計(jì)標(biāo)準(zhǔn),Siri 能夠更容易理解 iPhone 屏幕上的一切。

蘋(píng)果也在研究怎么讓大模型看懂 UI

雖然技術(shù)不如人,但蘋(píng)果在用戶數(shù)量和生態(tài)構(gòu)建上的領(lǐng)先,能成為一種非常強(qiáng)大的優(yōu)勢(shì)。

9to5Mac 這樣預(yù)測(cè)和評(píng)價(jià)蘋(píng)果即將到來(lái)的 Siri 和 AI 更新:

在 WWDC 上。我們或許不會(huì)看到任何特別革命性的東西,但 AI 融入數(shù)百萬(wàn)人每天使用的系統(tǒng)和應(yīng)用本身就是一場(chǎng)革命。

比起 Rabbit R1 這種新潮硬件,人人都有的智能手機(jī)或許才是 AI 的最佳載體。

用戶不需要知道自己在用的是 AI 功能,但是當(dāng)他讓 Siri 幫忙規(guī)劃一個(gè)旅游計(jì)劃、幫訂機(jī)票的時(shí)候,AI 已經(jīng)在開(kāi)始深刻改變他的生活。

本文來(lái)源:Appso

Siri    AI
appso

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來(lái)
  • 漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢(shì)不可擋
    漢美馳李梟雄:擁抱AI浪潮,智能家居需求暴增勢(shì)不可擋

    作為美國(guó)百年家電品牌,HamiltonBeach漢美馳在美國(guó)市場(chǎng)處于行業(yè)領(lǐng)導(dǎo)地位,在本屆AWE展會(huì)上,漢美馳與太平洋網(wǎng)絡(luò)合作,展出了他們的三個(gè)主打品類:破壁機(jī)、慢燉鍋和空氣炸鍋,其中,破壁機(jī)屬于攪拌類小家電,漢美馳是這個(gè)品類的開(kāi)創(chuàng)者;慢燉鍋是美國(guó)家庭的必需品,就像我們中國(guó)家庭的電飯煲一樣,漢美馳慢燉鍋累計(jì)在美國(guó)的銷量超過(guò)3000萬(wàn)臺(tái),是這個(gè)品類的領(lǐng)導(dǎo)品牌;漢美馳的這款HALO空氣炸鍋剛剛獲得了全球頂級(jí)設(shè)計(jì)大獎(jiǎng)——iF設(shè)計(jì)獎(jiǎng)。 今年,漢美馳在國(guó)內(nèi)市場(chǎng)的動(dòng)作很多,包括:推出了家電行業(yè)第一款應(yīng)用chatGPT的AI牛排機(jī),全球首發(fā)煙灶產(chǎn)品,全球首發(fā)中式廚電產(chǎn)品,自建抖音、淘寶直播間,與頭部主播烈兒寶貝等合作……這些經(jīng)營(yíng)動(dòng)作的背后,漢美馳有怎樣的戰(zhàn)略規(guī)劃?他們對(duì)中國(guó)市場(chǎng)有些什么樣的判斷?他們的優(yōu)勢(shì)有哪些?請(qǐng)看PConline獨(dú)家專訪漢美馳中國(guó)營(yíng)銷中心總經(jīng)理李梟雄先生。

    呼倫 呼倫 2023-05-05 00:03
  • 二維碼 回到頂部