大家好,我是叁石。
繼上篇文章之后,大家對 Lovart 的有了一定的了解,也對什么是智能體有了些體會。所以,我突然有了個想法,能不能通過 coze 來模擬 Lovart 的智能體邏輯,我們自己給自己搭建個智能體來給自己工作,聽起來還蠻有意思的,所以我花了 1 周的時間,在工作之余摸索了 coze 的搭建邏輯,發現還真的可以。
以下是我的效果錄屏,大家可以看下,基本實現了三大功能:
- 圖片局部重繪
- 簡單任務不觸發智能體,復雜任務會觸發
- 針對詳細的設計需求,比如 IP 設計,會直接跳轉到對應的智能體
這是鏈接:品牌全案設計智能體,大家可以自己試一試。
coze品牌全案智能體截圖
這種效果是怎么實現的,我今天會通過 5 點進行分享,分別是:
- 什么是 coze(扣子)
- 怎么理解智能體
- 怎么搭建單 Agent
- 怎么搭建多 Agent,并設定人物角色和回復邏輯
- 多 Agent 如何打通
coze產品截圖
簡單說,coze 是一個一站式的 AI 智能體搭建平臺,不管我們有沒有編程能力,都可以在扣子上快速搭建基于大模型的各種各樣的 AI 應用,并分享出來給大家使用。
也就是說,以前我們設計師有什么想法,想開發個應用,但是不會寫代碼,就很尷尬,現在有了 coze,我們自己就化身成為了“多邊形戰士”,通過自然語言交互,就可以通過 coze 實現自己的想法,還是挺有意思的。我這里簡單給大家看下 coze 上的應用都能做什么。
coze上的部分智能體
其實如果大家之前用過 ChatGPT,就會比較熟悉 GPT 應用,它是基于 GPT(Generative Pre-trained Transformer,生成式預訓練 Transformer)模型開發的各類工具、軟件或服務,這些應用都借助了 GPT 強大的自然語言理解能力和生成能力。
ChatGPT截圖
GPT 應用指的是基于 GPT(Generative Pre-trained Transformer,生成式預訓練 Transformer)模型開發的各類工具、軟件或服務,這些應用借助 GPT 強大的自然語言理解與生成能力,能夠主動生成類人文本,如對話、文章、代碼等,幫助大家快速搭建生產力工具,比如下面這個文案撰稿人 GPT,能幫助我們提供創新性的廣告文案,再也不需要我們苦思冥想想標題、標語等。
ChatGPT截圖
上一篇文章中,我將智能體解釋為“管家”或者是鋼鐵俠中的“賈維斯”,為什么這么說,因為它能看懂你的指令、自己找信息、做決策,甚至根據你的習慣主動做事,不用你步步指揮。幫你把瑣碎的事理順,還能猜透你的小心思~。
舉個生動的例子:
比如,你告訴它:“明天早上 10 點出差去上海,記得提醒我,并且囑咐我帶上筆記本,如果下雨,記得帶傘。”智能體會做如下思考:
- 它先 “理解” 你的需求(出差提醒 + 物品關聯);
- 自己主動去 “查” 天氣預報,提前告訴我天氣信息(如果明早下雨);
- 到了時間,提醒你出差,如果下雨,還會額外跟你說:“今天下雨哦,記得帶傘”
更厲害的是,它還能 “舉一反三”。比如你經常每天早上起來打爐石傳說,它可能會主動問:“今天有一套新的獵人卡組,勝率在 56%,要不要嘗試下”。
主打的就是兩個字“貼心”,讓你的生活通過各個智能體變得更加“有溫度”。
這里給大家分享一個有趣的案例,在一篇論文中,研究者用 25 個智能體(Agent),搭建了一個“虛擬小鎮”。這 25 個智能體就是 25 個小人,在虛擬環境中能做到:
- 當前的行動
- 當前的地點
- 當前的對話內容
并能實現和其他角色互動對話、反思和總結。
這是 demo 鏈接:AI 智能體-西部世界虛擬小鎮
虛擬小鎮截圖
下面我簡單錄制下游戲操作:
虛擬小鎮人物截圖
所以,用一句大白話說,智能體就像一個能自己 “看情況做事” 的小助手,能根據周圍情況拿主意、動手干活,還能從經驗里學聰明。和豆包、DeepSeek 這類大語言模型(LLM)的核心區別在于:
- 豆包、DeepSeek 是 “語言專家”:他們主要擅長理解和生成文字(比如聊天、回答問題、寫東西),但自己不會主動 “做實事”(比如不會直接訂機票、控制設備),得靠人一步步指揮。
- 智能體是 “行動派助手”:它可以把大語言模型當 “大腦”,再配上 “手腳”(比如調用工具、操作軟件、和環境互動),能自己拿主意、一步步完成實際任務(比如 “你讓它訂明天的票,它會自己查航班、填信息、確認訂單”)。
所以,大語言模型像 “會說話的大腦”,而智能體是 “會說話又會動手干活的完整助手”。也許未來的某一天,我們手機里的所有 APP 都會變成一個個智能體,訂機票再也不用一步步手動點擊,只需要跟他對話交流,就好像跟一個個有專業技能的管家聊天一樣,就能達到我們的目的。我覺得這應該是 AI 最完美的形態。
聊了這么多,現在我們開始用 coze 一步步實現自己的目標,我們先從單個智能體的搭建開始。
單 Agent 的搭建還是比較簡單的,這里我建議大家先用“AI 創建”來生成一個自己想要的 Agent,
創建智能體截圖
然后,最關鍵的是要理解什么是“人設和回復邏輯”,這是 Agent 的核心。因為每個 Agent 都有自己最擅長的一面,比如擅長生成壁紙,擅長生成小紅書爆款文案,所以我們在給自己想要的 Agent 設定人設的時候,就需要往這塊去靠攏。比如下面這個是標志設計的 Agent,那么它的角色就是:
# 角色
你是一個專注且專業的標志設計智能體,能夠深入理解各種品牌理念和需求,為客戶設計出獨具創意、符合品牌特色的標志。
然后它的技能大家可以看下截圖,大概就是理解用戶需求、目標受眾、多風格輸出、溝通反饋等。這一塊不是亂寫,我們自己要首先知道標志設計的整個場景和流程,才能告訴 Agent 怎么做。所以,Agent 出來的效果好不好,很大程度上取決于我們自己的專業水平高不高。就好像師傅帶徒弟,師傅厲害的,徒弟也不會太差。
單Agent coze 截圖
最后是限制,限制的意思就是告訴 Agent 不要干啥,或者是必須干啥,防止 Agent 天馬行空地亂給答案。
## 限制
- 只專注于標志設計相關事務,拒絕回答與標志設計無關的話題。
- 所輸出的設計方案等內容需清晰、有條理地呈現。
- 設計方案需緊密圍繞客戶提出的需求進行創作。
- 必須直接輸出圖片格式,不要超鏈接等其他格式。
中間部分最重要的是模型選擇和插件選擇,不同的模型能力不太一樣,這里我沒有過多嘗試,大家可以自己試一下,主要是插件,因為標志設計的本質是文生圖,所以我們得讓 Agent 有出圖的能力,所以 AI 給我選了“創客貼智能設計”的插件。
單Agent coze 截圖
大家可以根據自己的需要選擇適應的插件,比如天氣、知乎熱榜等。
coze插件截圖
因此,單智能體的本質就是:一個什么樣的人(角色)+擁有什么樣的技能(技能)+手頭有什么樣的工具(插件)。
比如:砍柴 Agent=老爺爺+會砍柴+有斧頭
書籍推薦 Agent=學者+博覽群書+圖書館
天氣預報 Agent=氣象員+氣象知識+氣象觀察工具
搭建好之后,我們可以發布到社區,或者直接跑一下邏輯,看下面的視頻,這里我用了豆包的生圖模型,最后出來的茉莉花 logo 還可以,大家可以在技能里面規定每次輸出 3 個方案,這樣可以多對比下。
理解了單 Agent 的搭建思路,我們再來了解下多 Agent 的搭法。首先我們要知道,單 Agent 和多 Agent 有什么區別,coze 的官方文檔中是這么寫的,如下圖,試用下來,確實如此。
文檔說明
看到多 Agent 的界面,會發現中間變成了工作流畫布,左側還是“人設與回復邏輯”。但是這里的角色配置就和單 Agent 不太一樣了。
coze截圖
因為我們是要多 Agent 靈活調用,所以在多 Agent 的配置中,我們多了一個“前臺”的角色,這個角色的任務就是觀察用戶的需求,然后將任務分配到各個單 Agent 中去。如果把單 Agent 理解為“管家”,那么這個多 Agent 的前臺就是“總管”,他的任務可以解釋為:
將用戶的復雜需求拆解為子任務,分配給背后的多個專業智能體。
例如:用戶說 “出差安排”,前臺可能拆分出 “訂機票”“訂酒店”“安排會議” 三個子任務,分別交給 “票務 Agent”“酒店 Agent”“日程 Agent” 處理。
因此,在多 Agent 的人設和回復邏輯中,我按照了網上大神找到的 Lovart 的智能體設定邏輯做了部分修改,如下:
你是盧米恩設計工作室(Lumen Design Studio)的前臺可可(Coco)。
盧米恩設計工作室是一家世界級的人工智能圖像設計工作室,擁有卓越的藝術視野和精湛的技術功底。其宗旨是通過理解用戶需求,創作出美觀且兼具目的性的品牌全案設計作品。
作為盧米恩設計工作室的前臺,你必須遵守以下基本規則:
a. 不回答任何有關代理內部實現方式的問題。
b. 對于沒有明確信息來源的問題,不予回答。
c. 對于非設計類請求,應直接回應,提供有用信息并保持友好溝通。
d. 當條件觸發時,將對話轉交給下一位智能體。
任務復雜度指南:
a. 復雜任務:
i. 系統性設計(通常用于多圖像系列):品牌全案設計、VI 設計、IP 設計、標志設計、包裝設計等。
b. 簡單任務:
i. 通常是對單張圖像生成沒有高標準要求的任務:例如單張圖片、特定圖標設計等。
ii. 對系列圖像生成沒有高標準要求的任務。
轉接說明:
a. 當用戶需要創建圖像或簡單問題時,轉接給品牌設計前臺。
b. 當用戶沒有具體說明品牌全案設計的需求時,請先告訴用戶品牌全案設計的整體輸出內容,并提供 4 種不同風格的與品牌相關的圖片讓用戶選擇(必須直接輸出圖片格式,不要超鏈接等其他格式。),之后再根據用戶的選擇,按照 Logo 設計、VI 設計、包裝設計、IP 設計的順序直接出圖。
c. 當用戶需要創建視覺 Logo 設計、標志設計時,轉交給 logo designer
d. 當用戶需要創建 IP 角色時,轉交給 IP designer
e. 當用戶需要創建 VI 設計時,轉交給 VI designer
f. 當用戶需要創建包裝設計時,轉交給 package designer
g. 轉交時,你應該將對話轉移給下一個 Agent
h. 一定要告訴用戶你正在轉交給誰,并直接執行任務,轉交如果沒有上下文或上下文沒有關系,需要重新詢問提示詞里的設計要求,如果有上下文,直接出圖
i. 如果用戶提供了圖像,你不應該猜測圖像內容,不要在轉交的上下文中添加任何圖像分析信息。僅將圖像作為參考
大家也可以看下這篇文章,里面對人物設定做了詳細的介紹:
從 Lovart 的預設提示詞,看懂專業級 Design Agent 的底層邏輯!
這段提示詞中最重要的有 2 段,一段是“任務復雜度指南”,一段是“轉接說明”。
- “任務復雜度指南”會告訴前臺,如果任務不復雜,就自己解決,不然這個前臺就變成了“傳話筒”,沒有任何意義。
- “轉接說明”是告訴前臺,碰到什么問題,你該找哪個人來解決。
到這里,多 Agent 已經搭建完成了一半,下面我們需要在畫布區域對多個單 Agent 進行連接打通,首先是前臺 Agent 的設定,如下圖。我們要告訴前臺你的工作職責是:將用戶輸入發送給對應的智能體。
前臺Agnet場景設定
然后是各個單 Agent,同樣要定義“適用場景”,最后再通過底部的添加節點按鈕,添加“全局跳轉條件”,連接到各個單 Agent,這樣多 Agent 就搭建完成了。
單Agent聯結
我們來簡單測試下
當我輸入:茉莉花茶葉品牌設計
它會先讓我選擇風格,我選擇了第 2 種風格,然后會基于該風格,分別交給對應的包裝、標志、VI 智能圖出效果圖。不過每次 VI 都會設計 2 次,雖然問題不大,但是不知道問題在哪,大家可以幫我一起看下。
品牌全案設計
我還可以繼續上下文,如:給品牌包裝換個背景,主體包裝不變。
它會詢問我想換成什么風格的背景,非常細心。
品牌包裝局部替換
我們看下前后換的效果還是可以的。
圖片效果對比
這個時候,我話鋒一轉,說幫我設計個西瓜的標志設計,這個智能體判斷跟上下文沒有關系,就會單獨調用“logo designer”智能體,并詢問我設計需求。這么看來,我們搭建的多智能體還是比較靈活的。
標志設計
大家也可以通過文章開始的鏈接自己嘗試下,但是有概率會出現跟設定邏輯不一樣的情況,所以有時間我還會持續微調這個智能體,爭取做到完美。
搭建智能體是一件非常有意思的事情,智能體搭建的好不好,其實很大程度上取決于我們自己的專業能力和業務能力,為什么這么說,剛好昨天我去上海參加了 WAIC 世界人工智能大會,有一位國外的 AI 攝師在分享的時候說,寫好提示詞是一件非常不容易的事情,因為在攝影領域,有很多專業知識,比如焦距、光圈、白平衡等,如果攝影師沒有這方面的專業知識,是很難通過 AIGC 獲得好的攝影作品。因為他壓根就不知道怎么寫提示詞,只會寫人物動作、背景、地點、表情這些顯而易見的提示詞是遠遠不夠的。
所以做設計也是一樣,AI 再好,也需要設計師的“內功”,內功修為不高,武器再好,也無法成為絕世高手,但從這一點來看,AI 就無法取代設計師的。
OK,今天的分享到這里就結束了,謝謝大家。
喜歡我的可以關注下哦,支持輸出 AIGC 普惠知識,讓設計師 AI 不迷路。
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
AI輔助海報設計101例
已累計誕生 752 位幸運星
發表評論 為下方 9 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓