AI領(lǐng)域比較火的幾個(gè)詞,我們先大概走馬燈一下:
1. RAG(檢索增強(qiáng)生成)
這篇文章對RAG這塊有介紹,感興趣的可以看一下:
2. World Model(世界模型)
就是用生成式大模型直接“想象”出可交互的 3D 虛擬環(huán)境,供 AI 或人類在其中訓(xùn)練、測試。被視為多模態(tài)大模型的下一個(gè)階段,比如谷歌 DeepMind Genie 2、英偉達(dá) Cosmos、李飛飛 World Labs ......未來可能會與具身智能結(jié)合,為機(jī)器人、自動(dòng)駕駛提供低成本仿真。
3. Embodied AI(具身智能)
可以理解為把大模型裝進(jìn)機(jī)器人、無人車、機(jī)械臂等物理載體,讓 AI 在真實(shí)世界里“長身體”。硬件成本下降、仿真-到-真實(shí)的遷移技術(shù)提升,讓實(shí)驗(yàn)室里的 demo 快速走向小規(guī)模商用。AI+硬件會是下一步的趨勢,尤其是今年WAIC大會展示的各種機(jī)器人,有的奇奇怪怪的,比如搏擊機(jī)器人,我也不知道是要干啥,感覺我能打10個(gè)。但有的我是真想要......
4. Nano-Banana
最近確實(shí)太火了,我想提一嘴,教程看這里 ?? http://www.lmyhmgk.cn/zt/nano-banana
11.? Multi-Agent System(多智能體系統(tǒng))
上主角!就是多個(gè)單Agent協(xié)作。把5個(gè)專門干活的“單Agent”——文案、主圖、修圖、布局、測試——像設(shè)計(jì)工作室里的小團(tuán)隊(duì)一樣放在同一張?jiān)谱烂嫔稀S脩粢痪湫枨髞G進(jìn)來,它們按順序或并行開工,幾分鐘就交出一張可直接印刷的海報(bào)。
其實(shí)多Agent這個(gè)概念很早就有了,但是為什么最近開始頻頻被提起,主要是在25年6月的時(shí)候,Anthropic發(fā)的一篇技術(shù)報(bào)告,就是Claude 模型的那家公司。
比較難啃,但是可以用AI輔助總結(jié)下去“讀”一下這篇文章,可以非常專業(yè)且清晰的告訴你如何構(gòu)建一個(gè)多智能體研究系統(tǒng)!建議收藏拜讀!!!
在聊多Agent之前,我還是要得先說明白,什么是Agent?
1. Agent與LLM的區(qū)別
小時(shí)候都玩過樂高積木吧?大語言模型,比如GPT4,就像是一大堆樂高積木,能力超強(qiáng),但它自己不會動(dòng),你得告訴它搭個(gè)啥,它才給你搭。而AI Agent,就像是給這堆積木配上了一個(gè)聰明的大腦和靈活的手腳。
Agent =?LLM+memory+planning skills+?tool use
簡單說,傳統(tǒng)的聊天AI是被動(dòng)回答,你問一句,它答一句。而AI Agent是主動(dòng)干活,你給它一個(gè)目標(biāo),它會自己想辦法、找工具、一步步把事兒給辦了。它是一個(gè)能感知環(huán)境、做出決策、并采取行動(dòng)的數(shù)字員工。
ok,那Agent如何動(dòng)手呢?我們舉一個(gè)例子:
用戶問:“告訴我今天廣州市的天氣,并為其畫幅圖”
Agent會先去調(diào)用天氣api(amap_weather)去查天氣,然后會調(diào)用生圖api(image_gen)來為用戶畫幅圖。
2. 市面上幾大Agent制作平臺
ok,我們大概知道Agent如何動(dòng)手了,那我們能在哪兒動(dòng)手做一個(gè)Agent嗎?提前說一下,省得看完了一整篇還不知道在哪兒做Agent,那就廢了。
新手適用的幾個(gè)平臺
包括還有Dify、N8N等工具,不過相對來說這兩個(gè)對新手來說門檻較高。這里就不展開說了,推薦字節(jié)的Coze,上手更快一些。
單Agent vs. 多Agent
好,既然單個(gè)Agent已經(jīng)這么牛了,為啥還要搞多Agent系統(tǒng)呢?這不是多此一舉嗎?
這個(gè)問題問到點(diǎn)子上了。一開始我也這么想,直到我看到了Anthropic(就是開發(fā)Claude的那個(gè)公司)的一份研究報(bào)告。他們舉了個(gè)例子:
任務(wù):“列出標(biāo)普500指數(shù)中,所有信息技術(shù)類公司的董事會成員。”
這個(gè)任務(wù),讓一個(gè)單智能體去做,它會怎么干?大概率是:
- 搜索“標(biāo)普500信息技術(shù)類公司名單”。
- 拿到名單后,一個(gè)一個(gè)地去搜索:“A公司的董事會成員是誰?”
- 找到A公司的,再去找B公司的……
這是一個(gè)線性的過程,效率低,而且很容易因?yàn)槟硞€(gè)環(huán)節(jié)出錯(cuò)就卡住。就像一個(gè)員工,能力再強(qiáng),也只能一件一件地處理任務(wù)。
而多智能體系統(tǒng)的玩法完全不同:
- 總指揮Agent(主控智能體)接到任務(wù),立即進(jìn)行拆解:“這個(gè)任務(wù)需要先找到公司名單,然后再分別查每個(gè)公司的董事會。OK,我需要10個(gè)幫手!”
- 它會立刻“召喚”出10個(gè)干活的Agent(子智能體),給它們分配任務(wù):“你,去查A公司”、“你,去查B公司”……
- 這10個(gè)子智能體并行開工,同時(shí)上網(wǎng)搜索。
- 最后,還有一個(gè)質(zhì)檢員Agent(引用助手),負(fù)責(zé)把所有子智能體找回來的信息進(jìn)行匯總、核對,并附上引用來源。
Anthropic的數(shù)據(jù)顯示,多智能體系統(tǒng)完成這類任務(wù)的成功率,比單智能體提升了90%!
所以,多智能體的核心優(yōu)勢在于:分工與協(xié)作。就像一個(gè)真正的團(tuán)隊(duì),通過明確的角色分工和并行處理,來解決單個(gè)個(gè)體難以高效完成的復(fù)雜問題。它能夠把一個(gè)復(fù)雜任務(wù),變成了一個(gè)可協(xié)作、可迭代、可擴(kuò)展的任務(wù)網(wǎng)絡(luò)。
多Agent系統(tǒng)這個(gè)概念火了之后,各種框架和產(chǎn)品也如雨后春筍般冒了出來。要說多Agent系統(tǒng)最先落地的領(lǐng)域,軟件開發(fā)絕對是TOP 1。畢竟,程序員們最懂“分工協(xié)作”的重要性了。其中,MetaGPT和ChatDev是必須要說一嘴的。
1. 軟件開發(fā)
MetaGPT
MetaGPT的思路特別有意思,它不只是讓AI寫代碼,而是直接在AI世界里復(fù)刻了一個(gè)完整的軟件公司。你只需要給它一句需求,比如“給我做一個(gè)2048游戲”,它內(nèi)部的AI員工們就開始忙活了:
- AI產(chǎn)品經(jīng)理:開始寫產(chǎn)品需求文檔(PRD),進(jìn)行競品分析。
- AI架構(gòu)師:根據(jù)PRD設(shè)計(jì)系統(tǒng)架構(gòu),畫出流程圖和API接口。
- AI項(xiàng)目經(jīng)理:把任務(wù)拆解,分配給工程師。
- AI工程師:吭哧吭哧開始寫代碼。
- AI測試工程師:對代碼進(jìn)行測試和審查。
這套流程下來,它不僅能交付代碼,還能產(chǎn)出配套的需求文檔、設(shè)計(jì)文檔等,主打tm一個(gè)專業(yè)!它的核心理念是“代碼 = ”,把SOP編碼到Agent的行為里,讓AI協(xié)作得有章法,減少犯錯(cuò)。MetaGPT在處理復(fù)雜軟件項(xiàng)目時(shí),完成率和效率都相當(dāng)驚人。
ChatDev
ChatDev同樣是模擬一個(gè)虛擬軟件公司,但它的協(xié)作模式更像經(jīng)典的“瀑布模型”。任務(wù)從設(shè)計(jì)、編碼、測試到文檔,一步步流轉(zhuǎn)。
每個(gè)階段由不同的Agent通過對話來協(xié)作完成。比如在編碼階段,“程序員Agent”和“代碼審查員Agent”會進(jìn)行多輪對話,討論代碼實(shí)現(xiàn)和潛在的bug。
為了防止AI“一本正經(jīng)地胡說八道”(也就是代碼幻覺),ChatDev還引入了“思維指令”機(jī)制,讓Agent在不確定的時(shí)候可以相互提問和解釋,從而更精準(zhǔn)地定位和修復(fù)問題。
MetaGPT和ChatDev都專注于軟件開發(fā),通過模擬真實(shí)世界的團(tuán)隊(duì)協(xié)作流程,讓多Agent系統(tǒng)能夠高效、高質(zhì)量地完成復(fù)雜的編程任務(wù)。
它們最大的區(qū)別在于協(xié)作范式:
MetaGPT更像基于SOP的流水線;
ChatDev更像基于對話的瀑布流。
2. 商業(yè)產(chǎn)品
除了開源框架,市面上也涌現(xiàn)出了一批將多Agent理念產(chǎn)品化的先行者。尤其是Manus當(dāng)時(shí)PR的時(shí)候,基本上都炸了!
- Manus:由中國團(tuán)隊(duì)Monica.im開發(fā),采用Multiple Agent架構(gòu)。它的核心是“知行合一”,不僅能思考規(guī)劃,還能在獨(dú)立的虛擬機(jī)里直接執(zhí)行任務(wù),比如寫代碼、分析數(shù)據(jù),整個(gè)過程透明可見。在GAIA Benchmark測試中,它的表現(xiàn)甚至超過了OpenAI的Deep Research。
- TARS:字節(jié)跳動(dòng)開源的多模態(tài)AI Agent框架。它的絕活是能通過自然語言控制你的電腦,理解屏幕內(nèi)容,進(jìn)行點(diǎn)擊、填寫表單等GUI操作,與操作系統(tǒng)深度集成。
- Genspark:由前百度小度創(chuàng)始人景鯤打造,采用多智能體混合系統(tǒng)架構(gòu),整合了8個(gè)不同規(guī)模的LLM。它最酷的功能是“AI電話”,能模擬真人打電話去預(yù)訂餐廳、查詢服務(wù),把數(shù)字世界的操作延伸到了現(xiàn)實(shí)世界。
- Flowith:一個(gè)創(chuàng)新的畫布式AI創(chuàng)作平臺。它的Agent框架Flowith Oracle允許用戶在一個(gè)畫布上與多個(gè)AI模型同時(shí)交互,并且可以在Agent運(yùn)行過程中隨時(shí)添加或修改任務(wù),定制化程度極高。
3. Anthropic的多智能體系統(tǒng)
如果說前面的框架各有側(cè)重,那Anthropic的Research系統(tǒng)可以說是多Agent協(xié)作的教科書級范例。它采用的是經(jīng)典的“協(xié)調(diào)者-工作者”(Coordinator-Worker)模式。
這支“虛擬研究團(tuán)隊(duì)”的角色分工極其明確:
- 主控智能體 (LeadResearcher):團(tuán)隊(duì)大腦,負(fù)責(zé)理解用戶需求,制定研究策略,并將大任務(wù)拆解成多個(gè)子任務(wù)。
- 子智能體 (Subagent):研究員,接收主控分配的具體任務(wù),獨(dú)立進(jìn)行網(wǎng)絡(luò)搜索、信息篩選和初步總結(jié)。
- 引用助手 (CitationAgent):事實(shí)核查員,在所有研究完成后,負(fù)責(zé)核對內(nèi)容與原始來源,確保所有結(jié)論都有據(jù)可查。
- 記憶系統(tǒng) (Memory):團(tuán)隊(duì)的共享文檔,用于在長任務(wù)中保存中間計(jì)劃和結(jié)果,防止上下文丟失。
- 工具集 (Toolsets):團(tuán)隊(duì)的裝備庫,每個(gè)Agent都知道什么任務(wù)該用什么工具。
這套系統(tǒng)的強(qiáng)大之處不僅在于分工,更在于其提示詞工程。Anthropic不是簡單地給Agent下命令,而是教會了它們一套“團(tuán)隊(duì)協(xié)作的藝術(shù)”,比如:
- 不重復(fù)造輪子:每個(gè)子任務(wù)有唯一ID,Agent只干自己的活。
- 懂得自我評估:如果搜索結(jié)果質(zhì)量差,會選擇再次搜索或報(bào)告失敗,而不是硬著頭皮交差。
- 預(yù)算控制:每個(gè)任務(wù)有搜索次數(shù)上限,防止陷入死循環(huán)。
- 先廣后深:先用通用關(guān)鍵詞摸清大概,再逐步縮小范圍。
可以說,Anthropic把人類優(yōu)秀研究員的工作方法論,變成了一套可執(zhí)行的提示詞策略,這才是多Agent系統(tǒng)能發(fā)揮出1+1>2效果的關(guān)鍵。真的非常推薦大家去看看這篇報(bào)告!
理論說了這么多,大家可能還是有點(diǎn)云里霧里。下面來給大家實(shí)戰(zhàn)拆解一下,多Agent系統(tǒng)到底是怎么干活的。
1. 項(xiàng)目背景
傳統(tǒng)海報(bào)制作高度依賴人工:文案、主圖、模板分別由不同角色產(chǎn)出,再通過“拼圖”式合圖完成。存在以下致命缺口:
規(guī)模缺口
- 大促/日常營銷每天需要上萬張不同主題、不同商品的海報(bào),設(shè)計(jì)師人力只能產(chǎn)出幾百張,缺口 10 倍以上。
- 商品上新節(jié)奏快,人工來不及做圖,導(dǎo)致“貨已上架、圖還沒出”,流量白白流失。
時(shí)效缺口
- 熱點(diǎn)、秒殺、直播切片等場景要求“分鐘級”出圖,人工最快也要小時(shí)級。
- 跨部門反復(fù)改文案、改圖、改模板,導(dǎo)致一張海報(bào)來回 3~5 版才能定稿,錯(cuò)過流量高峰。
結(jié)果缺口
- 人工模板風(fēng)格趨同,用戶產(chǎn)生審美疲勞,點(diǎn)擊率持續(xù)下滑。
- 不同運(yùn)營憑經(jīng)驗(yàn)做圖,缺少數(shù)據(jù)化歸因,無法保證“利益點(diǎn)突出、氛圍到位、轉(zhuǎn)化可預(yù)期”。
ok,所以我們可以結(jié)合背景推出項(xiàng)目情況:
OK,那這時(shí)候我們明確了要針對素材GC做生產(chǎn)規(guī)劃,在整個(gè)產(chǎn)品的架構(gòu)中是屬于原子能力層:文案GC、圖片GC。
在原子能力層的建設(shè)中,文案的生成所用的底模是什么?封裝的System Prompt怎么寫?圖片GC用的什么技術(shù)方案?底模+lora微調(diào),還是接的第三方API?這塊就不展開說了,涉及到模型選型、模型調(diào)優(yōu)還有成本,巴拉巴拉的,主要也不是講AI產(chǎn)品的工作,所以我們還是說回主題。
原子能力默認(rèn)就緒,會再通過各領(lǐng)域算法模型進(jìn)行?圖文生成+模版召回+合圖?的方式 來進(jìn)行海報(bào)生成。
2. v1.0設(shè)計(jì)方案
通過圖 、 文 及 模版 各自生成 , 通過鏈路上召回匹配的方式,先做圖、文在模板里面的批量替換,解決運(yùn)營需求量大的問題。我用Coze大概跑了一個(gè)簡單的Demo,而其中{海報(bào)生成}這塊我是固定了一個(gè)背景圖,類比于模板的概念。
鏈路全貌
海報(bào)生成節(jié)點(diǎn)
輸出效果
我輸入的提示詞是“一只小狗”,文案會進(jìn)行潤色再輸出,而圖片會根據(jù)輸入的提示詞進(jìn)行生圖prompt的擴(kuò)寫,最終根據(jù)畫板里的變量進(jìn)行替換。邏輯上和當(dāng)時(shí)做的v1.0是一樣的。
但是v1.0版本肯定是有問題的,或者說本身就是為了解決運(yùn)營強(qiáng)訴求之一:量。因此,存在的問題就是也很明顯。
- 在已有有限的模版上進(jìn)行僅做圖文素材的替換填充, 卡片樣式的多樣性和新穎度不足
- 圖 、文 及 模版 各自生成 , 通過鏈路上召回匹配的方式, 在 多樣性 上的漏斗損耗大
所以可以理解為:
- 一期,是為了解決運(yùn)營“量”的問題,同時(shí)在生產(chǎn)鏈路的節(jié)點(diǎn)上,把原來的素材人工制作替換成AIGC生產(chǎn);
- 那二期的目標(biāo),就是解決運(yùn)營對于多樣性的一個(gè)強(qiáng)訴求。提高多樣性的同時(shí)兼顧業(yè)務(wù)表達(dá)是我們的目標(biāo),需要從元素上進(jìn)行突破,比如文案(自訓(xùn)練基底+RAG)、圖片(圖庫標(biāo)簽匹配召回 / LoRa模型定制化)以及模版,不能是遵循于一套標(biāo)準(zhǔn)或者是一個(gè)固定范式。
為了打破這個(gè)瓶頸,決定用多Agent系統(tǒng),徹底改造生產(chǎn)流程,于是就有了“智能海報(bào)2.0”
3. v2.0設(shè)計(jì)方案
智能生卡2.0的核心思路,就是用一個(gè)多Agent數(shù)字團(tuán)隊(duì),來取代過去“AI元素 + 人工模板”的模式。整個(gè)工作流依然由一個(gè)主控Agent來協(xié)調(diào),但:
- 素材生成模塊,包括文、主體元素、背景等構(gòu)成 素材生成Agent;
- 模板填充節(jié)點(diǎn)被一個(gè)全新的智能布局Agent所取代。
Agent運(yùn)行流程(部分脫敏)
整個(gè)流程是這樣的:
主控Agent進(jìn)行任務(wù)拆解:和1.0一樣,主控Agent先分析需求,然后并行啟動(dòng)多個(gè)“素材生產(chǎn)”子Agent(文案、圖像生成、元素提取等)。
素材生產(chǎn)Agent并行工作:各個(gè)子Agent分頭行動(dòng),產(chǎn)出海報(bào)所需的各種文本和視覺元素。
智能布局Agent:這是2.0版本的靈魂所在。當(dāng)所有素材都準(zhǔn)備好后,它們不會被送去匹配模板,而是被統(tǒng)一交給“智能布局Agent”。這個(gè)Agent是團(tuán)隊(duì)里的“首席設(shè)計(jì)師”,它內(nèi)部集成了三大核心模型:
布局模型:這個(gè)模型學(xué)習(xí)了海量優(yōu)秀的設(shè)計(jì)案例。它會根據(jù)收到的素材數(shù)量和類型(比如1個(gè)主標(biāo)題、3個(gè)賣點(diǎn)、1個(gè)Logo),動(dòng)態(tài)地生成一個(gè)美觀、專業(yè)的布局結(jié)構(gòu)。這背后需要一個(gè)非常精細(xì)的模板標(biāo)簽體系,讓模型能理解“主標(biāo)題應(yīng)該放哪”、“行動(dòng)點(diǎn)按鈕長啥樣”。
背景圖模型:它會智能地對生成的背景圖進(jìn)行優(yōu)化,比如擴(kuò)展、裁剪、或者增加光影效果,使其更適合作為海報(bào)背景。
配色算法模型:它會分析背景圖和Logo的主色調(diào),然后根據(jù)色彩美學(xué)原理(如色相、明度對比),為海報(bào)上的文字、按鈕等元素智能推薦一套和諧的配色方案,確保信息清晰可讀,視覺效果統(tǒng)一。
最終輸出:經(jīng)過智能布局Agent的精心編排,一張布局合理、配色協(xié)調(diào)、信息突出、且完全原創(chuàng)的營銷海報(bào)就誕生了!!!
具體的case我沒辦法復(fù)現(xiàn),我們就直接說對比吧:
智能海報(bào)1.0(模板填充):布局生硬,字體顏色靠規(guī)則寫死,缺乏設(shè)計(jì)感,整體看起來就像是“素材的簡單堆砌”
智能海報(bào)2.0(智能創(chuàng)作):字體字色更統(tǒng)一,按鈕、文案的底襯顏色搭配更協(xié)調(diào),背景和前景的融合度更高,整體視覺效果和諧且專業(yè),接近設(shè)計(jì)師的水準(zhǔn)。
過引入真正的多Agent協(xié)作,特別是核心的“AutoLayout Agent”,智能海報(bào)2.0實(shí)現(xiàn)了從內(nèi)容理解、創(chuàng)意生成到布局配色的端到端自動(dòng)化,解決了傳統(tǒng)方法效率低、效果差的核心痛點(diǎn)。
但其實(shí)這塊也并不是純自研,是基于開源框架PosterLLaVa & PosterLLama 。在GitHub上也可以搜到的,感興趣的同學(xué)可以去看看。
4. PosterLLaVa
該模型提出了一個(gè)統(tǒng)一的框架,用于自動(dòng)圖形布局生成,利用多模態(tài)大語言模型適應(yīng)多樣化的設(shè)計(jì)任務(wù)。與其他方法不同,PosterLLaVa采用結(jié)構(gòu)化文本(JSON格式)和視覺指令調(diào)整,在特定的視覺和文本約束條件下生成布局,包括用戶定義的自然語言規(guī)范。大量實(shí)驗(yàn)表明,PosterLLaVa在公共的多模態(tài)布局生成基準(zhǔn)測試中取得了最先進(jìn)的性能。此外,針對現(xiàn)有數(shù)據(jù)集在捕捉現(xiàn)實(shí)世界圖形設(shè)計(jì)復(fù)雜性方面的局限性,PosterLLaVa提出了兩個(gè)新的數(shù)據(jù)集,用于更具挑戰(zhàn)性的任務(wù)(用戶約束生成和復(fù)雜海報(bào)),進(jìn)一步驗(yàn)證了模型在實(shí)際環(huán)境中的實(shí)用性。
5. PosterLLama
該模型通過將布局元素轉(zhuǎn)換為HTML代碼,利用語言模型中豐富的設(shè)計(jì)知識,生成視覺和文本內(nèi)容相協(xié)調(diào)的布局。此外,PosterLlama引入了一種基于深度的海報(bào)增強(qiáng)策略,以提高模型的魯棒性,確保在數(shù)據(jù)有限的情況下生成的布局既具有語義豐富性,又具備視覺吸引力。該模型在多個(gè)基準(zhǔn)測試中表現(xiàn)出色,支持多種條件下的布局生成,包括內(nèi)容感知布局生成、元素條件布局生成和布局補(bǔ)全等。
利用大語言模型(LLM)進(jìn)行海報(bào)布局生成。采用二階段的訓(xùn)練方法:
- 在第一階段,使用線性層作為適配器,以對齊圖像編碼器與LLM,同時(shí)保持其他部分不變。
- 在第二階段,保持視覺適配器不變,微調(diào)LLM (CodeLlaMA) 以生成布局,使用HTML格式數(shù)據(jù)集。
聊了這么多,也要潑一盆冷水。多Agent系統(tǒng)雖然強(qiáng)大,但遠(yuǎn)非完美。
可以看看《Why Do Multi-Agent LLM Systems Fail?》的論文就指出了幾個(gè)常見的“坑”:
角色混亂:理想中,每個(gè)Agent各司其職。現(xiàn)實(shí)是,它們經(jīng)常“越界”。比如“測試員Agent”跑去寫代碼,“產(chǎn)品經(jīng)理Agent”直接把技術(shù)方案定了。這本質(zhì)上還是大模型的“幻覺”問題,只是在多Agent系統(tǒng)里被放大了。
溝通障礙:Agent之間的溝通效率低下。它們可能會在一些無關(guān)緊要的細(xì)節(jié)上反復(fù)拉扯,或者關(guān)鍵信息沒有共享,導(dǎo)致整個(gè)團(tuán)隊(duì)被帶偏。想象一下開會時(shí),一群人都在跑題,就是那個(gè)感覺。
驗(yàn)收漏洞:缺乏有效的驗(yàn)證機(jī)制。比如讓Agent開發(fā)一個(gè)象棋游戲,它可能只檢查了代碼能跑通,但沒驗(yàn)證游戲規(guī)則對不對。很多系統(tǒng)在任務(wù)還沒完全達(dá)標(biāo)時(shí)就草草結(jié)束,交付一個(gè)“半成品”。
這些問題,和人類團(tuán)隊(duì)管理中的問題驚人地相似!!!
但解決方案也很樸素:加強(qiáng)管理和控制。
比如,通過更明確的提示詞來限定Agent的職責(zé)范圍,引入“交叉驗(yàn)證”機(jī)制讓Agent互相評審,強(qiáng)制執(zhí)行檢查清單來確保交付質(zhì)量。
這說明,現(xiàn)階段的多Agent系統(tǒng),還遠(yuǎn)沒到可以完全自動(dòng)化的程度。它需要的不是更少的控制,而是更細(xì)致的管理框架和思路。
腦接口還沒搞定,同志仍需努力!!!接著研究吧
復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。
發(fā)評論!每天贏獎(jiǎng)品
點(diǎn)擊 登錄 后,在評論區(qū)留言,系統(tǒng)會隨機(jī)派送獎(jiǎng)品
2012年成立至今,是國內(nèi)備受歡迎的設(shè)計(jì)師平臺,提供獎(jiǎng)品贊助 聯(lián)系我們
AI輔助海報(bào)設(shè)計(jì)101例
已累計(jì)誕生 752 位幸運(yùn)星
發(fā)表評論 為下方 7 條評論點(diǎn)贊,解鎖好運(yùn)彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓