今年已經過去了一半,突然心血來潮,來更新一期「2025 年上半年,我最推薦的 AI 清單」了。
綜合我半年使用的個人看法,不覆蓋所有的產品,憑自己印象,直接碼出這篇文章。
實在沒記起來的好產品,也就不算“我的上半年推薦”了,還請包容。
評選標準如下:
- 類型劃分:分為模型與產品。部分品類由于國內和國外還是存在代差,但在國內有做得很好,會按國內、國外分開推薦。
- 上榜的原因大致有四:「最常用」、「驚喜時刻」、「有印象」、「當前推薦」,按真實體感挑選。
- 文章最后,還會根據日常推薦朋友的情況,總結出「AI 日常推薦表」,方便大家對照選擇使用。
接下來,是正式榜單:
文章沒有水,但還是有點長,將依次盤點:大模型(LLM、文生圖/視頻/音頻),AI 產品(Agent、Chat、Coding、其他),并在文末附上總結與趨勢展望。
上半年,無論是國內還是國外,LLM 還是文生圖、視頻模型,都涌現出來了很多強勁的選手。
1. 先說 LLM 模型
今年基本沒咋用 ChatGPT 模型,也就不對 GPT、o 系列模型進行評價(主要感覺也沒必須用的理由)
- 最常用:Gemini 2.5 Pro
- 驚喜時刻:DeepSeek R1
- 有印象:o3、QVQ-Max
當下推薦:Gemini 2.5 Pro、豆包 Seed 1.6、Qwen 3、Claude 4 sonnet
Gemini 2.5 Pro:當之無愧的黑馬,最常用的模型
今年最沒想到的,就是 Gemini 2.5 Pro 成了最大的黑馬,還憑借著強大的多模態識別能力,100 萬 tokens 的超長上下文空間,極其獨特的 think 過程,給到了我當下最佳的模型使用體驗。
2.5 Pro 是真的厲害,實測 10w tokens 之后,還能準確回憶起最早的對話內容,指令遵循也很不錯。
而且拿來作為日常對話,你會發現它的智力很高,總是能從你對話的細節中,發現你自己都沒注意到的情緒。
比較少有人注意到,Gemini 的 think 過程與其他推理模型有顯著的區別,往往會更加全面、細致的分析用戶輸入,偏金字塔思維的方式,完成更佳的推理。
就我私心而言,這就是當下各方面最均衡、最強大的模型體驗。
它的小弟 Gemini 2.5 flash,雖然沒有 Pro 大哥那么聰明的表現,但平衡光速的生成速度、還不錯的模型智力,也值得推薦。
體驗渠道:
- 普通用戶常用渠道: https://gemini.google.com ,就是需要開了 Pro 會員,才能享受滿血上下文記憶的體驗。
- 開發者渠道: https://aistudio.google.com ,免費、滿血體驗,普通用戶也能用。美中不足是,基于 Google Drive 的對話保存服務,穩定性有點差,經常容易丟歷史對話。
DeepSeek R1:春節的驚喜,全村的希望
如果不提 DeepSeek R1,這份 AI 產品清單肯定不完整。
DeepSeek R1 在春節火到沒邊,極大地促進了 AI 在國內落地應用的進度,甚至很多用戶不知道 ChatGPT、不知道豆包,但知道 DeepSeek(這是我的訪談實測),NB。
R1 在創造性、啟發性的文哲類任務里,實在是太強了,很容易給你額外的啟發,到現在也很難找到對手。
但除開這些能接受高隨機結果的任務外,我不推薦任何朋友使用 R1。原因無他——太“癲”了,指令遵循性差,很有自己的想法,喜歡添油加醋,沒法用 Prompt 穩定控制它。
用來干活、尤其是商業落地應用,還是需要再三評估衡量。(但在傳統軟件行業有額外加成,懂的都懂)
體驗渠道:太多了。
除了官網,你也可以在騰訊元寶等各類產品中使用它,也可以在阿里云、火山引擎、硅基流動等云服務中直接調用。
QVQ-Max:當 AI 有了一雙視力 5.0 的眼睛
今年,模型的多模態能力已經成了重要的比拼項,能準確識別圖片中的信息,能讓 AI 多做很多事。
前段時間,我設計了一項「網絡迷蹤 GeoGuessr」的模型測試,來測試模型的視覺與推理能力。
這項測試發出來一個月后,類似測試也被 Sam·Altman 轉發,擴大了影響力。
測試過程大概是這樣,讓模型看著一張照片,定位照片所處的世界地理位置:
非常值得一提,在測試中只有 o3、QVQ 識別了下圖中遠處很小的“Decathlon”迪卡儂 Logo,而且 QVQ 是沒用圖片縮放直接識別,而 o3 依賴了圖片縮放工具。(QVQ 基于 Qwen-VL 系列模型構建)
所以印象很深,可以說這倆代表了 2 個月前國內外 Top 級別的多模態能力。
當下推薦
除了我已經推薦過的 Gemini 2.5 Pro 外,比較想推薦的是選手分別是:豆包 Seed 1.6、Qwen 3 8B、Claude 4 sonnet。
我一直這么和朋友推薦的,也可以作為大家測試選型的參考。
1)豆包 Seed 1.6:國內均衡之選
推薦理由:目前體感國內當下滿血版本下,表現均衡,輸出速度、質量、價格都很不錯的大模型,和去年平平無奇的表現形成鮮明對比,很值得國內商業場景考慮。
特點:支持混合推理、多模態;官方宣稱 256k 上下文,最大輸出 16k tokens;0.4 元/百萬 tokens 的輸入價格,緩存命中還能低到 0.08。
2)Qwen 3,尤其是 8B:開源、本地部署
推薦理由:Qwen 系列模型,開源模型的神,尤其推薦小尺寸版本、本地部署場景(Llama 作弊跌落神壇后,全球最能打的開源模型必是 Qwen)
特點:
- 第一個把混合推理帶到國內的模型,在推理能力的加持下,僅在小尺寸模型上,就表現出了等同于上代大尺寸模型效果。
- 按照官方技術博客的說法,Qwen3-4B 的性能 ≈ Qwen2.5-72B。實測 Qwen3 的 8B 模型確實有著非常明顯的進步,降低推理和訓練成本,利好本地部署模型的場景。
在 Qwen3 首發當日,我發的實測與評價:《我們有必要使用 Qwen3 嗎?》
3)Claude 4 sonnet:代碼生成、工具調用
Claude 模型本來懶得單獨拿出來提,Coding 領域無可爭議的 Top 1。
無論是 AI Coding 工具里的模型選用,還是自己做 MCP 應用、Coding Agent,都首選 Claude 4 sonnet 就完事了。
也是前端代碼生成時,審美最好的大模型。
我自己開發的 Chat Memo 官網,就是用 Claude 4 進行 Vibe Design 的。我說需求、Claude 生成初版,然后再動動嘴微調,就有了這樣的效果:
體驗渠道:
- 官網 Chat 的話,國內環境容易封號;我自己用得多的渠道,現在主要是通過 Coding 產品,在寫代碼時直接使用。
- 風向上來說,現在推薦 Cursor、Augment,只是對話的話,Monica、POE 可以酌情考慮;便宜點可以用 Trae 國際版,但做好容忍它在較難場景的折磨 coding 體驗。
除開這些推薦外,如果需要免費大模型 API,且對模型智力要求沒有那么高:
智譜開放平臺有永久免費的推理模型,可以去看看(我有個產品就跑了半年的智譜免費 API,還是要夸夸 z.ai 的)
LLM 大模型總結
和很多 AI 從業者交流過(包括明星 Agent 公司、Benchmark 設計者),有些結論:
- Claude 是所有代碼相關場景的 Top 1
模型們其實是偏科的,大模型如果側重某方面能力提升,會導致其他方面的能力下降(普通難度下 - 不一定明顯)(比如 Claude 為了確保代碼生成的能力,會犧牲了一些對話、文學的體驗;Gemini 在推理過程更有人味,寫代碼能力就不如 Claude)
2. 簡談文生圖、文生視頻領域
今年文生圖、文生視頻領域,模型進步簡直是翻天覆地,可用度大大提升,AIGC 走進了消費用戶領域。
標志性變化就是,我們都能明顯看到,不論是文章配圖,還是小紅書、抖音,都出現了很多 AI 生成的內容。
這也是最接近模型即產品的一個領域。
我自己日常涉獵不算重度,主要用的是免費的產品。分享下作為非 AIGC 設計師&普通用戶的感受:
- 最常用:豆包生圖、Imagen、可靈(視頻模型)
- 驚喜時刻:Veo 3(視頻模型)、Gemini 2.0 Image Generation
- 有印象:ChatGPT-4o、Midjourney
- 我很常用的偏門用法:Claude 4(非文生圖模型,但可以靠 coding 生成前端頁面,提供圖片)
也請了我的好朋友,AIGC 領域寶藏博主,設計師 #阿真 irene 分享她的上半年之選。
她在這塊比我鉆研的深多了
有興趣可以關注:
豆包生圖:日常使用,免費,推薦
如果說給國內用戶推薦文生圖 AI,豆包生圖確實是我的第一選擇。
自從 SeedEdit 3.0 發布以來,感覺豆包生圖效果突飛猛進,變的越來越順手。(SeedEdit 3.0 技術報告: https://arxiv.org/pdf/2506.05083 )
一方面支持 4o 式的自然語言直接改圖;另一方面對于圖片內的文字生成,也有很好的支持。
在生成人像等各類場景也有不俗的質量:
而且免費,國內可直接使用,生成速度又特別快。
體驗渠道:
- 首推:豆包 Web 或 APP。用起來很方便,直接發條消息就能生成,也能改圖。
- 專業用戶:即夢 AI
Imagen:被人低估的偏科模型,免費
Google Imagen 其實有個非常強的領域——產品設計,其質感沒有模型能和它比拼。
我發現它的原因也很神奇
——接了一家產品公司的 AI 設計咨詢,幫忙調研并定制了 AI 輔助產品設計的工作流與提示詞。結果調研下來,發現表現最好的就是 Imagen 3,即使是現在也少有模型能比肩。
生成速度快、質量好,又免費,確實值得使用。現在 AI studio 中提供了 imagen 4 版本,感覺生成圖片的光感更好了些,但沒有顯著區別。
我現在依然配合自己寫的 《萬能文生圖提示詞》 ,使用 imagen 3 來覆蓋大部分精細作圖需求的場景。(這份提示詞有 1k+ 轉發,認可度極高。推薦納入自己的文生圖工作流)
體驗渠道:
- 首推 imagefx: https://labs.google/fx/zh/tools/image-fx
- Gemini 中也能用:直接在 Gemini 對話時,要求“圖片生成:xxx”,就可以觸發生圖了,用的也是 Imagen 3
- AI Studio: https://aistudio.google.com/prompts/new_image ,這里有 Imagen 4
可靈:來自快手老鐵的 AI 視頻絕活
可靈一直 6 到飛起,一直是最強的那幾個 AI 視頻模型的存在。
支持文生視頻、圖生視頻。用的比較多的還是圖生視頻,這樣比較容易控制視頻畫面。
畫面穩定,物理效果逼真,產品交互體驗優秀,價格適中。現在也已經更新到了「可靈 2.1」版本。
體驗渠道: https://app.klingai.com/cn/image-to-video/frame-mode/new
Veo 3:逼真到頭皮發麻的視頻模型
不過要論上半年看起來最驚喜、最強的視頻模型,那還得是 Google Veo3。
一個視頻體驗它的效果(視頻來源忘了):
看到小船掉落到洞里的過程了嗎?這個物理效果讓人頭皮發麻……居然 AI 能在 2D 空間完成對 3D 真實物理現象的模擬,還能同步生成匹配的音效。
體驗渠道:Google Flow - https://labs.google/fx/zh/tools/flow
Gemini 2.0 Image Generation:劃時代,但被 GPT 狙擊慘了的生圖模型
Gemini……我猜大家都快忘了它還有個支持生圖的版本了吧。
在 ChatGPT-4o 生圖發布的前一周,Gemini 就發了 2.0 Image Generation,也是行業內第一個支持連續精準改圖的文生圖模型。
能改圖、摳圖、能批量生圖,是 2025 年的初代文生圖許愿機。
可惜一周后就被 ChatGPT-4o 狙擊了,4o 比它的效果還要好,一下就失去了熱度。
現在,它的上位推薦是:ChatGPT-4o、豆包生圖。所以別刻意去用了。
ChatGPT-4o:上半年最火的文生圖模型,但太慢
憑一己之力,壓住 Gemini 2.0 生圖熱度的模型,是 OpenAI 上半年站起來的一大表現。自此用自然語言改圖成了徹底的用戶需求共識,大幅提升了文生圖創作體驗與可用性。
和上述豆包一樣,支持自然語言連續改圖、圖片合成,對圖內生成英文的支持很好,中文會稍微差一點。
比如 Qwen3 文章中的爐石圖,就是 4o 做出來的。
就是免費用戶生圖的速度確實太慢了點,不然應該會常用。
體驗渠道:「ChatGPT-4o」-「工具 - 創作一張圖片」
Midjourney:個人不常用,但我知道它很強
Midjourney 在我心里,一直以極高的畫面精細度、光感、藝術表達,被留下了深刻的印象。
雖然它需要付費,我也沒有那么高的日常作圖需求,但還是有必要推薦一下。
阿真 irene:科幻槍戰游戲
阿真 irene:概念藝術表達
阿真 irene:寫實人像
San 山雨的戰地風格圖片
配合《萬能文生圖提示詞》 ,能夠有效幫你提升 Midjourney 作畫效果,上面 4 張也都用了這套提示詞模板
體驗渠道:國外搜「Midjourney」;國內搜「悠船」
Claude 4:我很常用的偏門用法
混進來一個很偏門的文生圖方法——用 AI Coding 生成前端代碼,網頁即圖片。
比如這些 Case,就是我用 Claude Coding 生成的圖片:
之前我發完社交名片 Case 后,今年就有好多 Agent 產品,都普遍按這個思路,在做 Deep Research 結果轉可視化 PPT、長圖了,說明確實用戶接受度很高。
用來做文章配圖再好不過。
也可以看之前我在社區直播分享過的 PPT: https://zkv549gmz8.feishu.cn/slides
3. 文生音頻領域
輪到文生音頻領域,第一個想起來的是 MiniMax speech-02。
能克隆你的聲音,音色模擬的還可以。但是情感、語調、停頓還是與真人配音有明顯差距。
克隆了一款知名游戲的男主配音,可以聽一下效果。:
Btw:豆包的語音模型也還不錯,聲音復刻、語音識別都不錯(豆包 APP 里,AI 的語音通話表現就非常好了)
體驗渠道:
- MiniMax: https://www.minimax.io/audio/text-to-speech
- 豆包:火山方舟-語音模型 or 豆包 APP
終于寫到 AI 產品這一個 Part 了,好長,真不容易。
1. 先講 25 年最火的賽道:Agent
如果說 DeepSeek 帶火了國內大模型的全民應用,那小宏他們的 Manus,則帶火了通用 Agent 競賽熱潮。
一方面,嚴格來說 Coding Agent 也算 Agent,但由于場景過于垂直,就單獨劃歸在 AI Coding 產品一類,不在此節詳述。
另一方面,關于 Agent 和 Deep Research 之間的關系。
仔細區分,Deep Research 應該算 Agent 應用的子集(何況還有些通用 Agent,實則用 Deep Research 框架 + MCP 擴展實現 Agent 效果),所以 DR 倒是放在這一節一并討論。
同樣的,今年就是沒用 ChatGPT,它家的 DR 是很強,但確實沒仔細用過,暫且不論。
- 最常用:仔細想想,我的日常 AI 使用中,Agent 的使用頻次確實比較低。硬要說的話,那我選擇什么都能試試看的 Manus。
- 驚喜時刻:Manus、Kimi-Researcher
- 有印象:夸克高考志愿 Agent
- 當下推薦:Manus、Gemini Deep Research、Kimi-Research
另外,類似 Lovart(有設計需求的業余用戶會用),扣子空間(很有可能做成垂直 Agent 社區),昆侖天工(在 Office 類內容生成、需求澄清交互方面做的不錯),也都是不錯的產品。
Manus:目前唯一的真 · 通用 Agent
雖然現在宣傳自己是通用 Agent 的產品很多,嚴格意義上算通用 Agent 的,我認為還是只有 Manus。這也是我 2025 年最喜歡的 AI 產品。
在 Manus 首發期,里面就有一個 Case「讓 Manus 自主下載寶可夢并運行」。
如果說互聯網工作者的特征是 人 + 電腦 = 干活,那么真正給 AI 配了一臺完整云電腦的,確實只有 Manus。
這就意味著 Manus 的通用任務想象空間還是很大。當不知道一個任務交給哪個 AI 時,就可以試試先甩給 Manus 再說。
比如在單個網站中,像人一樣搜索站內信息、通過連續點擊網頁元素,完成信息收集
案例: https://manus.im/share/SqTXv0qMVLvXouGvaAXtDD?replay=1
換到以 DR+MCP 方案的 Agent 里,就容易直接改用 MCP 網頁搜索服務,導致解決方案偏離實際。
還意味著,Manus 不僅能生成前端網頁,還能直接搭建一個完整有后端的站點服務。AI + 云電腦 = Create everything,這點用到的話,會有質變的體驗。
體驗渠道:Manus 官網 - 我給一個自己的邀請鏈接,每人可得 500 積分 https://manus.im/invitation/
Kimi-Researcher:把 DR 能力內訓到模型里
Kimi Researcher 本來我也是打算單獨寫一篇的,作為 Kimi 沉寂了半年的力作,帶來了一些新的驚喜。(但是偷懶了)
原本我對于只能查國內內容的 Agent 出的報告,不報多少希望。因為國內的網頁信息又亂又雜,無從考證。
但 Kimi Researcher 以其超長上下文、大量深度的網頁搜索,硬是在中文內容中,能總結出一些很細節的內容,且幻覺率也明顯較低。
朋友拿我為例子,用 Kimi 做了一次 DR 任務,調研「一澤 Eze」博主的信息: https://www.kimi.com/share
不得不說,確實歸納的非常細節,而且推理正確、詳實,本人表示眼前一亮。
這種效果,得益于 Kimi 將 DR Agent 的能力,通過 RL 強化學習,內訓到了模型中,使得其行為不是被規則寫死的,而是根據當前任務動態生成的,所以在復雜信息的盡調上,確實表現出了極佳的水平。
Kimi 官方技術人員也在知乎上寫了兩篇 Agent 技術分享,有興趣也可以讀一下: https://www.zhihu.com
體驗渠道:Kimi Chat 內「申請 Kimi 深度研究內測」: https://www.kimi.com/ (和 Kimi 的朋友打過了招呼,在問卷中備注“一澤讀者”,有更大概率通過申請)
夸克高考志愿 Agent:首個千萬級用戶量的垂直 Agent
夸克 AI 做了個「高考志愿填報 Agent」,暗搓搓搞了個大數據。
不到一個月,生成超過 1000 萬份深度研究報告,峰值時并行處理 250 萬份復雜任務。
雖然這個 Case 過于垂直與時效性,但我覺得很值得拿來講講,它背后代表的下半年 Agent 發展方向。
AI 最容易犯的錯誤就是幻覺。而高考志愿填報這種嚴肅的場景,容不得一點幻覺,關系千萬考生的高考去向。
夸克 AI 為了確保 DR 的報告質量,以高質量垂直知識源 + 經過深度對齊的垂類大模型的方式,構成了夸克 Deep Research Agent 做出可靠研究、決策的核心:
① 在數據準備方面,對海量高考數據進行分類與清洗
② 同時,通過 SFT、RLVF、RLHF,訓練一個垂直、可信的高考志愿大模型,作為垂直 Agent 的核心。
我當時的評價是:這標志著 AI 應用已經有能力從過去抽卡式的、隨機生成報告的娛樂模式,進入真正解決復雜、垂直、高價值問題的“深度落地”階段。
如果要讓 AI 在現階段就能承接真正落地干活的需求,這套垂直數據+垂直模型訓練應該會成為下半年 AI Agent 正經落地的標配。
當下推薦:再加一個 Gemini DR
除開 Manus 負責通用任務,Kimi 負責中文信源盡調,Gemini Deep Research 雖然表現平平,但憑借免費、能訪問海外信源(含 Arixv)、低幻覺的特色,成了我外文信源調研的日常選擇。
體驗地址: https://gemini.google.com/ ,對話框里記得勾選「Deep Research」
Agent 總結
- 還是覺得云端 Agent 才是正確的發展方向:AI Agent 的 7*24 always online 是一大重要特色,而放到本地運行,卻需要保持電腦長時間開機喚醒,且占用人的電腦進程,怎么看還是覺得有些奇怪。
- 垂直模型驅動垂直 Agent,應該是下半年出活的方向:通過訓練垂直模型,能極大提升 Agent 在垂直場景的可用性,現在到了拼 AI 團隊數據質量和 RLHF 訓練能力的時刻了。
2. AI Chat
在大模型部分,其實或多或少已經提過了我現在的使用偏好。
PC 端:
- 高頻使用 Gemini 2.5 Pro(有 Pro 會員就直接在 Gemini 內使用,無則在 AI Studio 使用,確保體驗到最長上下文的滿血 2.5 Pro)
- 文哲類任務偶爾用 DeepSeek
- Btw,騰訊元寶憑借能對公眾號生態進行搜索回答,有其獨一份的特色。
移動端:
- 主用豆包 APP,主要是交互太方便了,響應也快,語音、視頻通話是一絕;
- 學生群體也可用夸克 APP,功能更全
豆包 APP:移動端最佳 Chat 體驗
在移動端,我們不追求頂級的 AI 智力,而是更希望全能、便捷、快速的問答體驗。
這半年以來,「打開豆包發送語音消息」的快捷指令,一直綁定在我手機的操作按鈕上,遇到要問的問題,按一下就開始錄音提問,特別方便。
而且多模態識別也挺順手的,今天還讓豆包幫我識別了陽臺花盆里突然長出來的草是什么。
特別值得一提的是,豆包的視頻模式,甚至還能充當你的虛擬導游:
開著視頻通話,就能直接實時對話提問,就像和一個真導游在視頻聊天,這塊體驗很神奇,建議試試。
也能體驗到優秀的自然語言生圖、改圖功能,豆包相當全能了。(就是上下文記憶表現不咋地)
3. AI 搜索 ?
我其實在猶豫要不要提 AI 搜索。
因為我的暴論是:從 2025 年上半年的發展趨勢來看,純 AI 搜索形態的產品,正在被 AI Chat 和 Deep Research 擠壓生存空間。甚至長期來看,我并不看好 AI 搜索產品的存在必要性。
簡單問題用 AI Chat,直接在開著的 AI 窗口問一嘴,就能得到答案,還能方便的帶著上下文記憶擴展問答。
復雜問題,用 DR 更能一次性找到有價值的增量信息,大家也愿意等這個 DR 時間。
如果你還是想問有什么 AI 搜索可以用?
那可以繼續用:
- 「秘塔搜索 - 研究模式」: https://metaso.cn/
- 「夸克 APP - 夸克 AI 搜索框」: https://ai.quark.cn/
實際上,這兩者也都在擺脫純粹的 AI 搜索形式。前者開始轉教育,做「今天學點啥」;后者的 AI 搜索框,則是包含了深度思考、AI 寫作、生圖等一籃子 AI 功能,主打一站式 AI 日常使用體驗。
4. AI Coding:Vibe Design + Vibe Coding!
如果作為一線產品經理,到現在還完全沒體驗過 AI Coding,我覺得基本是不合格的產品經理了。(不要求做出獨立的完整 Demo,用來做個靜態頁面也好啊)
像我最近的 Chat Memo,就是用了純 AI Coding。
在不懂編程的情況下,1 周半寫出了完成度非常高的 Chrome 插件 ;2 天完成了官網的 Vibe 設計與開發。發布后,短短 1 周就有了 1000 用戶量。
這個 Case 直接證明了 AI Coding 現在已經可以做出完成度極高的 MVP 產品,而非只能做 AI 小玩具。
而且,以我身邊樣本為例,一些 AI 團隊的新產品,AI 代碼占比達 90%;老牌產品的 AI Coding 采用率也能在 40% 以上。
沒用過 AI Coding 的,真的該抓緊去試試了。
也給一些負責任的 Coding 產品推薦:
- Trae:簡單項目,可以用 Trae 海外版,3 刀 1 個月,最便宜的訂閱價格,換來剛好能用的 AI Coding 體驗。復雜項目,如果沒有 AI Coding Prompt 經驗,憋用……簡直是折磨。
- Cursor:基本是 AI Coding 屆的一致選擇。
也有一些朋友覺得 Augment Code 作為新 AI Coding 產品,有著更佳智能的體驗,暫時還沒試過,不做推薦,可自行體驗。
另外關于 Code Review,某明星 Agent 公司的超靠譜朋友,推薦使用 Code Rabbit,作為 AI Code Review 的選擇。
Btw:Windsurf 自從被 OpenAI 收購后,它的 Claude 模型就不太穩定,保險起見,現在不建議入坑。
Claude Code 和 Gemini Cli,只適合程序員群體使用,普通用戶脫離了 GUI 再去用這倆,還是會很吃力的,不推薦主動退化自己的交互方式。
5. 其他推薦
上面提到的,就是 2025 年主流視野中,最火的一些模型、產品賽道,除開這些以外,也有一些零星的產品值得推薦:
Flomo:個人筆記軟件中,AI 做得最爽的
AI 功能做得好,不在于多么花里胡哨、專業難懂,而在于真的能讓人用進去、愛不釋手。
Flomo 絕對算這個類別。
1)相關筆記:根據筆記向量,匹配語義相似的筆記。無需 AI 總結,就能看到歷史相關筆記
2)AI 洞察:根據相關筆記,AI 洞察你在某類主題下筆記的共性與盲點,給予主動的啟發。
打磨 Prompt 如打磨產品本身。少楠為了 AI 洞察,自測迭代了數百個版本的 AI 洞察 Prompt,盡可能地讓 AI 能更加自然、不自嗨地融入 flomo 用戶的服務中。
而 flomo 做每個 AI 功能,也絕非是為了 AI 而 AI,而是在像溪流一樣設計產品。當一個人記錄很多的時候,他可能需要回顧。而 AI 回顧的前提是「找到相關的筆記」,再是基于相關筆記做洞察啟發。
來自少楠的小報童專欄:「松節油:Behind flomo」
如果說今年的 Agent 產品們,是在把未來帶到現實;Flomo 更像另一個視角,一點點沿著真實需求場景,把服務做的更好。
體驗渠道: https://flomoapp.com/ ,少楠周三晚直播,分享 AI 洞察的設計理念,正式版本該功能本周四上線。
Cherry Studio:本地 AI 對話與調試
本地多 API 集成的 AI 對話客戶端、本地知識庫,近 3w Github star。
可以自定義為你提供 AI 服務的云服務商:
如果需要:
1)一次性對比多 AI 的 Prompt 回應質量
2)無縫的本地 RAG 知識庫體驗
PS:甚至還有 MCP 體驗(只不過我現在不推薦一般用戶用 MCP)
——用它!
體驗渠道: https://www.cherry-ai.com/
Prompt Pilot:提示詞版本管理與效果評測(限國內模型)
字節做的一個 Prompt 工程工具,我最喜歡的是它的 Prompt 調優管理功能。如果是針對國內模型進行 Prompt 工程調優,非常好用。
在幫朋友的產品打磨封裝功能所用的 Prompt 時,就用了 Prompt Pilot。
能夠批量跑 Benchmark,批量評分 Prompt 結果的質量,很方便。
唯一的遺憾是只能用火山方舟提供的模型列表,包含 DS、豆包等模型。要是能支持國外模型測試就好了,出個海外版吧。
體驗渠道: https://promptpilot.volcengine.com/tasklist
Chat Memo:跨平臺無感保存、導出各 AI 平臺對話
一方面是在這個場景,確實沒產品比 Chat Memo 做的體驗更好、更無感;另一方面也是給自己的產品打個小廣告(自家免費的廣告位,當然要蹭(不是))
這是一份在 AI 時代都用得上,在將來也許會發揮大價值的禮物。
能夠幫你解決 AI 對話散落在各個 AI 平臺,難以沉淀與搜索的問題。在瀏覽器上裝上后就支持:
- 實時保存每一次 AI 對話
- 搜索并找到歷史 AI 對話中任何一個關鍵詞
- 無限制導出全部 AI 聊天記錄
而且默認數據存儲在瀏覽器本地,你的數據只屬于你
體驗渠道:
- 產品官網:chatmemo.ai
- 直接在 Chrome 擴展商店,搜索「Chat Memo」
- 如果你在國內,無法訪問 Chrome 商店,可參考本地安裝教程: https://zkv549gmz8.feishu.cn
附錄:AI 日常推薦表
也附上一份我日常推薦朋友的 AI 模型&產品推薦表:
寫完才猛然發現,2025 年上半年就已經發生了這么多的變化。
這么多新產品,每個產品放在過去前 AI 時代,都是相當“炸裂”、“顛覆性”的存在。但它們確實都集中發生在短短半年內。
DeepSeek R1 進一步確立了國際上中國 AI 的地位;Manus 則是率先帶起了通用 Agent 的浪潮。
豆包生圖、可靈 AI,則是進一步加速了 AIGC 應用的全民普及。Veo3 生視頻更是宣告 AI 生成內容進一步達到了以假亂真,低維模擬高維世界物理效果的可行性。
而 Lovart、夸克高考志愿 Agent 在垂直場景的成功實踐,又證明 AI 應用落地正在從淺水區,加速進入到各個垂直場景的深水區。
AI 百日,恍若數年。
在下半年,我直覺應用側會有兩個趨勢:
- Agent 開始在垂直領域卷數據、卷后訓練:就像夸克高考志愿 Agent、Kimi-Researcher,為了在垂直場景(高考志愿、DR)上獲取更加穩定、可用的效果,紛紛開始對模型層下手優化,且以模型的進步得到了 Agent 整體效果的提升。
- AI 記憶利用與 Context 構造:實話說,現在 AI 體驗不行、麻煩的最大原因,不是 AI 智力不行。而是 AI 不夠懂我們的意圖,每次都要我們反復說明已經陳述過的 Context。上半年只有看到 OpenAI 在 ChatGPT 中優化了 Memory 的利用。當模型發展遇阻,應用層 Prompt 套殼玩的差不多的時候,最終還是要回到 Context 工程上來,這是每個好 AI 產品都逃不掉的任務。(不僅是行業趨勢,也是我通過精進 Chat Memo、Context 工程實踐,下半年會持續深耕的方向)
當然,我個人覺得前者可能下半年就能看到爆發期,后者估計到明年上半年才會有比較多的落地探索。
潮水仍在奔涌,探索永無止境。
以上便是 2025 年上半年,我在國內所見、當前推薦的 AI 模型與產品清單。
那么,你的上半年最愛又是什么?歡迎在評論區留下你的清單,讓我們交換地圖,繼續前行。
感謝你的耐心閱讀
復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。
發評論!每天贏獎品
點擊 登錄 后,在評論區留言,系統會隨機派送獎品
2012年成立至今,是國內備受歡迎的設計師平臺,提供獎品贊助 聯系我們
AI輔助海報設計101例
已累計誕生 752 位幸運星
發表評論 為下方 11 條評論點贊,解鎖好運彩蛋
↓ 下方為您推薦了一些精彩有趣的文章熱評 ↓