99在线精品免费视频九九视,国产亚洲精品v,亚洲最新无码中文字幕久久
首頁 > 資訊 > 評論

多模態(tài)和Agent成為大廠AI的新賽點

2025/04/28 10:04      微信公眾號窄播


  本文來自于微信公眾號窄播。

  這是《窄播Weekly》的第52期,本期我們關(guān)注的商業(yè)動態(tài)是:當(dāng)大廠的AI競爭策略開始傾斜向應(yīng)用場景,多模態(tài)能力和代理執(zhí)行成為兩個焦點。

  大模型落地C端場景的核心,就是讓大模型的能力越來越接近人。沿著這個主旋律,可以劃分出兩個進(jìn)化方向:一個是持續(xù)降低用戶與大模型進(jìn)行有效溝通的難度;另一個則是讓大模型具備執(zhí)行更復(fù)雜任務(wù)的能力。前者的實現(xiàn),需要給到大模型多模態(tài)能力;后者則需要依托于Agent產(chǎn)品生態(tài)的不斷成熟。

  多模態(tài)方面,字節(jié)、百度、谷歌、OpenAI都在近期推出了多模態(tài)能力更強(qiáng)的基礎(chǔ)大模型產(chǎn)品,為相應(yīng)的應(yīng)用創(chuàng)新帶來了可能。阿里旗下的AI to C產(chǎn)品夸克,就在本周上線了基于「通義推理及多模態(tài)大模型+后訓(xùn)練」實現(xiàn)的「拍照問夸克」功能。

  代理執(zhí)行層面,在Manus指出方向之后,類似的通用Agent產(chǎn)品也在近期紛紛上線。其中就包括了字節(jié)旗下的扣子空間、百度的心響App、360的納米AI、前百度高管的Genspark等。這些產(chǎn)品都主打一站式完成用戶通過自然語言布置的復(fù)雜任務(wù),并且都具有編寫代碼和連接第三方數(shù)據(jù)、工具的能力。

  相比國內(nèi),海外巨頭會更傾向于打造服務(wù)于單一場景的Agent。Notion推出了AI驅(qū)動的電子郵件服務(wù)Notion Mail,幫助用戶組織電子郵件、起草回復(fù)、搜索消息等。OpenAI此前推出的Operator和Deep Research也分別聚焦在操作瀏覽器和研究領(lǐng)域。X AI則增加了Grok Studio,用來協(xié)助用戶生成文檔、代碼、報告和小游戲。

  從目前能夠體驗到的產(chǎn)品來看,多模態(tài)能力和代理執(zhí)行能力的提升,確實為用戶帶來了更低門檻、更高效率的AI使用體驗。套用微軟CEO納德拉夸贊自家Cop ilot體驗的話,具備執(zhí)行能力的通用Agent就是在為用戶搭建一個腳手架,并在上面放好趁手的工具,助力用戶完成日常工作、學(xué)習(xí)、生活相關(guān)的任務(wù)。

  當(dāng)這個產(chǎn)品成熟時,人們會發(fā)覺自己的工作、學(xué)習(xí)、生活的體驗可能已經(jīng)被其改變。但改變不是一個短期過程。這些還處于早期探索階段的產(chǎn)品,在細(xì)節(jié)上差強(qiáng)人意,需要一段時間去打磨,從用戶意圖理解、第三方工具調(diào)用和相應(yīng)內(nèi)容的生成等方面,全方位提升產(chǎn)品體驗。

  從現(xiàn)階段看,模型能力的強(qiáng)弱依然非常重要。大模型能力的提升和成本的降低,確實刺激了AI應(yīng)用的爆發(fā),也再次讓人們看到了百度創(chuàng)始人李彥宏口中「應(yīng)用統(tǒng)治未來世界」的可能。

  但是,大模型技術(shù)還在持續(xù)突破,目前我們看到的Agent的不足之處,很多需要依靠模型能力的提升來完善。甚至未來有可能會實現(xiàn)「模型即應(yīng)用」,畫圖有畫圖的模型,分析圖表有分析圖表的模型,F(xiàn)在看,OpenAI有向這個方向前進(jìn)的傾向。

  Agent的終局到底是什么,現(xiàn)在看來尚無定論。

  多模態(tài)正在滲透進(jìn)現(xiàn)實場景

  從近期的大模型發(fā)布來看,多模態(tài)是重要的能力培養(yǎng)方向。字節(jié)旗下火山引擎發(fā)布的豆包1.5深度思考模型,能夠結(jié)合視覺理解能力完成看圖分析地貌、生成項目流程圖等工作。李彥宏在介紹文心4.5Turbo時,通過識別馬拉多納「上帝之手」的照片和水槽實驗視頻中的不同顏色物體,展示了圖像和視頻的理解能力。

  此外,OpenAI最新發(fā)布的o3和o4-mini也都具備看圖表和自己畫圖的多模態(tài)理解能力。OpenAI稱其首次實現(xiàn)了「用圖像思考」。谷歌發(fā)布的首個混合推理模型Gemini2.5Flash能夠比較精準(zhǔn)地分析股票走勢圖,并能根據(jù)給到的素材圖生成游戲場景設(shè)計圖。

  不斷提升多模態(tài)推理能力的同時,各個廠商都在為這種能力尋找第一塊試驗田?淇嗽谕瞥鯝I超級框概念之后,最新上線了拍照問夸克功能,就是在將大模型的多模態(tài)能力注入到AI超級框中,讓用戶不但能夠通過文字完成與AI超級框的交互,還能實現(xiàn)圖文并茂的溝通。

  在實際的使用過程中,我們發(fā)現(xiàn)拍照問夸克功能基本可以滿足「拍照搜索」的體驗,比如拍攝一個梅瓶的陳列,夸克可以回答出梅瓶的由來,以及它在宋朝會被用來盛酒。用戶還可以拍攝照片,讓夸克根據(jù)照片生成文案,或者識別食物的卡路里、辨別景點并給到游玩攻略。

  通過加入圖像,夸克可以讓用戶給AI下達(dá)更加精準(zhǔn)的任務(wù),然后調(diào)用夸克積累的Agent和原子功能,更好地完成任務(wù)。

圖片

  這其實是在讓攝像頭成為用戶賦予AI的眼睛,未來可能不止依靠拍照,還會有直接通過攝像頭進(jìn)行的實時交互。這也是谷歌試圖實現(xiàn)的多模態(tài)交互體驗。

  在谷歌多模態(tài)搜索產(chǎn)品負(fù)責(zé)人Rajan Patel的暢想中,多模態(tài)能力的融入,會讓搜索變得毫不費(fèi)力。用戶在谷歌可以打字、可以說話、可以拍照,可以對著攝像頭說自己需要什么,而谷歌將利用大模型、產(chǎn)品能力,幫助用戶快速連接到相關(guān)且正確的信息。

  也因此,多模態(tài)能力的提升,會影響到AI眼鏡的進(jìn)展。一位AI硬件創(chuàng)業(yè)者告訴《窄播》,現(xiàn)在之所以沒有選擇AI眼鏡的方向,是因為多模態(tài)大模型還不成熟,他無法根據(jù)使用場景去進(jìn)行產(chǎn)品定義。但是面向未來,類似用戶與拍照問夸克的交互可能會從手機(jī)遷移到眼鏡。

  代理執(zhí)行需要三個能力

  多模態(tài)提升的是交流效率,Agent的重心則在于執(zhí)行。

  在2024年下半年,具備任務(wù)執(zhí)行能力和系統(tǒng)操控能力的Agent就已經(jīng)成為一門顯學(xué)。但當(dāng)時有兩個問題尚待解決:一個是Agent產(chǎn)品的形態(tài)應(yīng)該是什么樣?另一個則是Agent與第三方數(shù)據(jù)、工具之間應(yīng)該如何實現(xiàn)連接?

  Manus的出現(xiàn)為大家指出了前進(jìn)方向——通過對話框+工作區(qū)的方式,呈現(xiàn)Agent的工作場景,然后基于大模型能力理解、拆分用戶任務(wù)意圖,調(diào)用不同工具模塊,協(xié)同完成任務(wù)。雖然會被人稱作「縫合怪」,但是Manus確實讓面向C端用戶的通用Agent產(chǎn)品的雛形顯現(xiàn)出來了。

  近期發(fā)布的扣子空間、心響App、納米AI的Agent能力以及Genspark基本都遵循了這個雛形模版?圩涌臻g分為三個部分,左邊部分是任務(wù)目錄,中間部分是任務(wù)交互區(qū),右邊可以展開一個Agent的工作空間。同時,扣子空間還會支持添加擴(kuò)展,以及選擇探索和規(guī)劃兩種思考深度不同的模式。

  從使用上看,扣子空間更擅長完成文字梳理工作。但在將梳理出的文字轉(zhuǎn)化為網(wǎng)頁時,扣子空間的效果會打折扣。我們嘗試讓扣子空間生成了一份騰沖旅游攻略、一個展示秦滅六國過程的網(wǎng)頁和一次AI新聞匯總。文字版的騰沖旅游攻略要更詳細(xì),轉(zhuǎn)化為網(wǎng)頁后,信息量會被稀釋,美食的配圖也會出現(xiàn)問題。后兩個任務(wù)也不太令人滿意。

  百度的心響App的特殊之處是選擇了在移動端上線,相對可以完成的任務(wù)就會更輕量化和生活化,其推薦任務(wù)中不僅有旅游攻略、數(shù)據(jù)分析等通用Agent產(chǎn)品常見的任務(wù),還會有數(shù)學(xué)解題、AI相親、例行任務(wù)等類似聊天機(jī)器人的功能。整體感覺,心響App是文小言的Agent進(jìn)化版。

  我們認(rèn)為,目前想要優(yōu)化具體的任務(wù)體驗,通用Agent們需要持續(xù)培養(yǎng)三個關(guān)鍵能力。

  第一個是,能否連接足夠數(shù)量的第三方數(shù)據(jù)和工具。MCP(Model Context Protocol,支持大模型與外部數(shù)據(jù)、工具集成的開源協(xié)議)和A2A(Agent2Agent,智能體協(xié)作協(xié)議)的推出,不但讓第三方數(shù)據(jù)、工具有了順暢接入通用Agent的統(tǒng)一接口,還賦予了Agent與Agent之間的交互、協(xié)作能力。

  目前,國內(nèi)廠商基本都接受了這種連接解決方案,接下來需要解決的是,如何擴(kuò)充有效的工具箱。

  納米AI主打的賣點是「MCP萬能工具箱」,號稱接入了近百個優(yōu)質(zhì)第三方工具?圩涌臻g的擴(kuò)展相對要少很多,而且有些只具備簡單功能。以騰沖攻略為例,我可以用扣子空間里的墨跡天氣擴(kuò)展將天氣預(yù)報添加進(jìn)攻略中,但沒有成功利用高德地圖擴(kuò)展生成每天的景點路線圖,大部分嘗試中,都只顯示了騰沖在地圖上的位置。

圖片

  編碼則是通用Agent需要培養(yǎng)的第二項能力。AI編程為Agent解決復(fù)雜任務(wù)提供了一個通用的有效工具,無論是ppt、網(wǎng)頁、圖表的生成,還是小游戲的創(chuàng)作,都需要依賴編碼能力來執(zhí)行。有消息顯示,OpenAI正在討論用30億美元收購AI編程初創(chuàng)公司W(wǎng)indsurf,借此來提升AI的編碼能力。

  第三個也是最底層的,是大模型的任務(wù)理解能力。只有具備更強(qiáng)的任務(wù)理解能力,通用Agent才能讓更多人依賴其去完成任務(wù),并保證任務(wù)的完成水準(zhǔn)。這也是大廠在多模態(tài)能力之外,著力在提升的另外一項大模型能力。OpenAI在推出o3和o4-mini時,就強(qiáng)調(diào)這是一個知道去上網(wǎng)查資料、執(zhí)行Python代碼的「大腦」。

  從目前的布局來看,OpenAI期待這個「大腦」在未來能夠精準(zhǔn)調(diào)度Operator和Deep Research等職業(yè)身份不同的Agent,前者是操控瀏覽器的司機(jī),后者則是負(fù)責(zé)做研究的學(xué)者。未來可能還會有擅長編程的程序員,擅長講故事的作家等Agent。

  字節(jié)的扣子空間、百度的邏輯是像開發(fā)API一樣開發(fā)Agent,需要有扣子、秒搭等Agent或工作流的搭建平臺提供支持。而OpenAI的路徑是按照職業(yè)去培養(yǎng)Agent。這是API邏輯之外的另一種更加擬人化的Agent生態(tài)培養(yǎng)模式。兩個模式都是為了調(diào)用Agent生態(tài),去完成不同的任務(wù)。

  在OpenAI給到投資者的預(yù)期中,AI Agent及其他新產(chǎn)品合計銷售額將在2025年末超越ChatGPT,達(dá)到30億美元,到2029年Agent業(yè)務(wù)將為其貢獻(xiàn)290億美元的收入。這是一個非常樂觀的預(yù)期。國內(nèi)的通用Agent們也有可能從Agent體驗升級中,奠定面向C端用戶的收費(fèi)模式。

  實現(xiàn)這一預(yù)期的前提是,通用Agent們能夠?qū)⒍嗄B(tài)能力與Agent的執(zhí)行能力結(jié)合起來,成為未來的底層入口。

IT產(chǎn)業(yè)網(wǎng)微信二維碼logo

  榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。

海報生成中...

分享到微博

掃描二維碼分享到微信

分享到微信
一鍵復(fù)制
標(biāo)題鏈接已成功復(fù)制

最新新聞

熱門新聞

99热手机在线_五月天在线免费视频_波多野结衣之无限发射_美女一区二区三区视频_日韩在线观看a_天天天干夜夜夜操_日韩黄色片在线_97在线免费视频观看_天堂а√在线中文在线_88av.com_国产乱女淫av麻豆国产_日本a在线免费观看
国产亚洲激情| 日本视频在线一区| 欧美freesex黑人又粗又大| 99免费精品| 国产三级精品三级在线观看国产 | 欧美激情福利| 亚洲欧美日韩视频二区| 国产日产一区| 国产亚洲精品久久久久婷婷瑜伽| 久久亚洲资源中文字| 免费视频久久| 久久精品国内一区二区三区水蜜桃| 日韩精品亚洲一区二区三区免费| 久久精品1区| 国内精品麻豆美女在线播放视频| 亚洲欧美日韩综合国产aⅴ| 日本aⅴ精品一区二区三区| 在线日韩av| 欧美日韩a区| 亚洲在线国产日韩欧美| 国产69精品久久| 国产精品调教视频| 伊人精品久久| 亚洲欧美日韩视频二区| 免费毛片在线不卡| 91超碰国产精品| 日韩精品影视| 日韩高清中文字幕一区二区| 久久成人av| 国产欧美久久一区二区三区| 日韩深夜视频| 久久精品影视| 日韩av福利| 久久视频国产| 免费黄色成人| 亚洲在线电影| 亚洲一区二区免费看| 日韩免费久久| 久久久水蜜桃av免费网站| 红杏一区二区三区| av高清不卡| 精品国产一区二区三区2021| 老司机精品视频网| 色综合五月天| 日本免费久久| 午夜欧美精品| 亚洲韩日在线| 99精品99| 日韩在线一二三区| 亚洲a级精品| 精品国产欧美| 国内精品伊人| 久久久精品网| 蜜桃免费网站一区二区三区| 欧美综合精品| 天堂中文在线播放| 狠狠久久婷婷| 国产精品色婷婷在线观看| 国产精品久久久久蜜臀| 不卡av一区二区| 婷婷久久免费视频| 欧美xxxx中国| 亚洲一区欧美| 久久一区欧美| 国产视频久久| 精品国产中文字幕第一页| 99久久久久久中文字幕一区| 午夜久久美女| 精品久久精品| 中文在线日韩| 国产一区2区| 蜜桃久久久久久久| 激情亚洲影院在线观看| 伊人久久亚洲美女图片| 另类综合日韩欧美亚洲| 亚洲欧美日韩精品一区二区| 成人在线视频区| 五月精品视频| а√天堂8资源中文在线| 夜久久久久久| 日韩专区精品| 精品一区av| 蜜桃视频一区二区三区在线观看| 成人亚洲精品| 日韩在线观看一区二区三区| 国产一区二区高清| 国产精品一二| 不卡在线一区二区| 亚洲一区二区成人| 精品视频高潮| 日韩成人在线看| 97精品在线| 欧美一区精品| 国产在线|日韩| 欧美国产免费| 午夜久久99| 久久精品导航| 日韩av影院| 视频一区中文字幕国产| 国产精品极品| 亚洲三级精品| 日韩国产欧美| 国产高清亚洲| 麻豆成人在线| 尤物在线精品| 久久麻豆视频| 六月丁香综合在线视频| 亚洲激情不卡| 制服诱惑一区二区| 国产一区二区三区免费在线 | 日韩av在线免费观看不卡| 精品国产午夜| 麻豆国产精品一区二区三区| 亚洲激情av| 欧美在线综合| 久久国产小视频| 美女少妇全过程你懂的久久| 国产日产高清欧美一区二区三区| 蜜臀av亚洲一区中文字幕| 日韩电影免费在线观看| 国产 日韩 欧美一区| 欧美1区2区3| 精品国产日韩欧美精品国产欧美日韩一区二区三区 | 欧美sss在线视频| 亚洲免费资源| 亚洲v在线看| 日韩中文字幕91| 日韩精品久久久久久久软件91| 欧美a级一区| 久久青草久久| 日韩欧美国产精品综合嫩v| 九九99久久精品在免费线bt| 一区二区三区四区在线看| 黄色亚洲大片免费在线观看| 色婷婷精品视频| 日本一区二区高清不卡| 精品午夜av| 欧美国产极品| 国产激情久久| 国产亚洲一区二区手机在线观看 | 久久高清免费| 欧美成a人国产精品高清乱码在线观看片在线观看久 | 国产欧美久久一区二区三区| 狠狠久久婷婷| 国产视频一区二| 国产日本精品| 国产精品久久乐| 免费在线播放第一区高清av| 热久久久久久| 91国内精品| a天堂资源在线| 电影亚洲精品噜噜在线观看| 国产拍在线视频| 久久中文字幕av一区二区不卡| 日韩国产欧美| 亚洲精品在线影院| 91精品一区二区三区综合在线爱| 国产亚洲一级| 亚洲精品大全| 日韩av网站在线观看| 日韩av电影一区| 免费在线亚洲欧美| 中文av在线全新| 亚洲不卡av不卡一区二区| 三级在线看中文字幕完整版| 福利一区在线| 日韩和的一区二在线| 亚洲欧美日韩高清在线| 石原莉奈在线亚洲二区| 日韩国产成人精品| 免费精品视频在线| 午夜欧美巨大性欧美巨大| 伊人久久大香线蕉av不卡| 91精品99| 欧美偷窥清纯综合图区| 红杏一区二区三区| 97精品国产福利一区二区三区| 亚洲欧洲国产精品一区| 久久影视三级福利片| 成人国产综合| 久久久久一区| 日本一区免费网站| 国产一区二区三区免费在线| 另类专区亚洲| 国产日韩欧美| 久久久久久久久久久妇女| 蜜桃视频第一区免费观看| 美女视频一区在线观看| 亚洲天堂av影院| 免费看日韩精品| 激情综合亚洲| 国产精品毛片久久久| 欧美亚洲在线日韩| 国产亚洲一区二区三区啪| 日韩精品dvd| 日本亚洲视频在线| 国产精品a久久久久| 日韩av成人高清| 欧美不卡高清| 国产一区二区三区视频在线|