萬字盤點!2025上半年值得推薦的AI模型與產品清單

今年已經過去了一半,突然心血來潮,來更新一期「2025 年上半年,我最推薦的 AI 清單」了。

綜合我半年使用的個人看法,不覆蓋所有的產品,憑自己印象,直接碼出這篇文章。

實在沒記起來的好產品,也就不算“我的上半年推薦”了,還請包容。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

評選標準如下:

  1. 類型劃分:分為模型與產品。部分品類由于國內和國外還是存在代差,但在國內有做得很好,會按國內、國外分開推薦。
  2. 上榜的原因大致有四:「最常用」、「驚喜時刻」、「有印象」、「當前推薦」,按真實體感挑選。
  3. 文章最后,還會根據日常推薦朋友的情況,總結出「AI 日常推薦表」,方便大家對照選擇使用。

接下來,是正式榜單:

文章沒有水,但還是有點長,將依次盤點:大模型(LLM、文生圖/視頻/音頻),AI 產品(Agent、Chat、Coding、其他),并在文末附上總結與趨勢展望。

一、層出不窮的模型們

上半年,無論是國內還是國外,LLM 還是文生圖、視頻模型,都涌現出來了很多強勁的選手。

1. 先說 LLM 模型

今年基本沒咋用 ChatGPT 模型,也就不對 GPT、o 系列模型進行評價(主要感覺也沒必須用的理由)

  1. 最常用:Gemini 2.5 Pro
  2. 驚喜時刻:DeepSeek R1
  3. 有印象:o3、QVQ-Max

當下推薦:Gemini 2.5 Pro、豆包 Seed 1.6、Qwen 3、Claude 4 sonnet

Gemini 2.5 Pro:當之無愧的黑馬,最常用的模型

今年最沒想到的,就是 Gemini 2.5 Pro 成了最大的黑馬,還憑借著強大的多模態識別能力,100 萬 tokens 的超長上下文空間,極其獨特的 think 過程,給到了我當下最佳的模型使用體驗。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

2.5 Pro 是真的厲害,實測 10w tokens 之后,還能準確回憶起最早的對話內容,指令遵循也很不錯。

而且拿來作為日常對話,你會發現它的智力很高,總是能從你對話的細節中,發現你自己都沒注意到的情緒。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

比較少有人注意到,Gemini 的 think 過程與其他推理模型有顯著的區別,往往會更加全面、細致的分析用戶輸入,偏金字塔思維的方式,完成更佳的推理。

就我私心而言,這就是當下各方面最均衡、最強大的模型體驗。

它的小弟 Gemini 2.5 flash,雖然沒有 Pro 大哥那么聰明的表現,但平衡光速的生成速度、還不錯的模型智力,也值得推薦。

體驗渠道:

  1. 普通用戶常用渠道: https://gemini.google.com ,就是需要開了 Pro 會員,才能享受滿血上下文記憶的體驗。
  2. 開發者渠道: https://aistudio.google.com ,免費、滿血體驗,普通用戶也能用。美中不足是,基于 Google Drive 的對話保存服務,穩定性有點差,經常容易丟歷史對話。

DeepSeek R1:春節的驚喜,全村的希望

如果不提 DeepSeek R1,這份 AI 產品清單肯定不完整。

DeepSeek R1 在春節火到沒邊,極大地促進了 AI 在國內落地應用的進度,甚至很多用戶不知道 ChatGPT、不知道豆包,但知道 DeepSeek(這是我的訪談實測),NB。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

R1 在創造性、啟發性的文哲類任務里,實在是太強了,很容易給你額外的啟發,到現在也很難找到對手。

但除開這些能接受高隨機結果的任務外,我不推薦任何朋友使用 R1。原因無他——太“癲”了,指令遵循性差,很有自己的想法,喜歡添油加醋,沒法用 Prompt 穩定控制它。

用來干活、尤其是商業落地應用,還是需要再三評估衡量。(但在傳統軟件行業有額外加成,懂的都懂)

體驗渠道:太多了。

除了官網,你也可以在騰訊元寶等各類產品中使用它,也可以在阿里云、火山引擎、硅基流動等云服務中直接調用。

QVQ-Max:當 AI 有了一雙視力 5.0 的眼睛

今年,模型的多模態能力已經成了重要的比拼項,能準確識別圖片中的信息,能讓 AI 多做很多事。

前段時間,我設計了一項「網絡迷蹤 GeoGuessr」的模型測試,來測試模型的視覺與推理能力。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

這項測試發出來一個月后,類似測試也被 Sam·Altman 轉發,擴大了影響力。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

測試過程大概是這樣,讓模型看著一張照片,定位照片所處的世界地理位置:

萬字盤點!2025上半年值得推薦的AI模型與產品清單

非常值得一提,在測試中只有 o3、QVQ 識別了下圖中遠處很小的“Decathlon”迪卡儂 Logo,而且 QVQ 是沒用圖片縮放直接識別,而 o3 依賴了圖片縮放工具。(QVQ 基于 Qwen-VL 系列模型構建)

萬字盤點!2025上半年值得推薦的AI模型與產品清單

所以印象很深,可以說這倆代表了 2 個月前國內外 Top 級別的多模態能力。

當下推薦

除了我已經推薦過的 Gemini 2.5 Pro 外,比較想推薦的是選手分別是:豆包 Seed 1.6、Qwen 3 8B、Claude 4 sonnet。

我一直這么和朋友推薦的,也可以作為大家測試選型的參考。

1)豆包 Seed 1.6:國內均衡之選

推薦理由:目前體感國內當下滿血版本下,表現均衡,輸出速度、質量、價格都很不錯的大模型,和去年平平無奇的表現形成鮮明對比,很值得國內商業場景考慮。

特點:支持混合推理、多模態;官方宣稱 256k 上下文,最大輸出 16k tokens;0.4 元/百萬 tokens 的輸入價格,緩存命中還能低到 0.08。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

2)Qwen 3,尤其是 8B:開源、本地部署

推薦理由:Qwen 系列模型,開源模型的神,尤其推薦小尺寸版本、本地部署場景(Llama 作弊跌落神壇后,全球最能打的開源模型必是 Qwen)

特點:

  1. 第一個把混合推理帶到國內的模型,在推理能力的加持下,僅在小尺寸模型上,就表現出了等同于上代大尺寸模型效果。
  2. 按照官方技術博客的說法,Qwen3-4B 的性能 ≈ Qwen2.5-72B。實測 Qwen3 的 8B 模型確實有著非常明顯的進步,降低推理和訓練成本,利好本地部署模型的場景。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

在 Qwen3 首發當日,我發的實測與評價:《我們有必要使用 Qwen3 嗎?》

3)Claude 4 sonnet:代碼生成、工具調用

Claude 模型本來懶得單獨拿出來提,Coding 領域無可爭議的 Top 1。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

無論是 AI Coding 工具里的模型選用,還是自己做 MCP 應用、Coding Agent,都首選 Claude 4 sonnet 就完事了。

也是前端代碼生成時,審美最好的大模型。

我自己開發的 Chat Memo 官網,就是用 Claude 4 進行 Vibe Design 的。我說需求、Claude 生成初版,然后再動動嘴微調,就有了這樣的效果:

萬字盤點!2025上半年值得推薦的AI模型與產品清單

體驗渠道:

  1. 官網 Chat 的話,國內環境容易封號;我自己用得多的渠道,現在主要是通過 Coding 產品,在寫代碼時直接使用。
  2. 風向上來說,現在推薦 Cursor、Augment,只是對話的話,Monica、POE 可以酌情考慮;便宜點可以用 Trae 國際版,但做好容忍它在較難場景的折磨 coding 體驗。

除開這些推薦外,如果需要免費大模型 API,且對模型智力要求沒有那么高:

智譜開放平臺有永久免費的推理模型,可以去看看(我有個產品就跑了半年的智譜免費 API,還是要夸夸 z.ai 的)

LLM 大模型總結

和很多 AI 從業者交流過(包括明星 Agent 公司、Benchmark 設計者),有些結論:

  1. Claude 是所有代碼相關場景的 Top 1
    模型們其實是偏科的,大模型如果側重某方面能力提升,會導致其他方面的能力下降(普通難度下
  2. 不一定明顯)(比如 Claude 為了確保代碼生成的能力,會犧牲了一些對話、文學的體驗;Gemini 在推理過程更有人味,寫代碼能力就不如 Claude)

2. 簡談文生圖、文生視頻領域

今年文生圖、文生視頻領域,模型進步簡直是翻天覆地,可用度大大提升,AIGC 走進了消費用戶領域。

標志性變化就是,我們都能明顯看到,不論是文章配圖,還是小紅書、抖音,都出現了很多 AI 生成的內容。

這也是最接近模型即產品的一個領域。

我自己日常涉獵不算重度,主要用的是免費的產品。分享下作為非 AIGC 設計師&普通用戶的感受:

  1. 最常用:豆包生圖、Imagen、可靈(視頻模型)
  2. 驚喜時刻:Veo 3(視頻模型)、Gemini 2.0 Image Generation
  3. 有印象:ChatGPT-4o、Midjourney
  4. 我很常用的偏門用法:Claude 4(非文生圖模型,但可以靠 coding 生成前端頁面,提供圖片)

也請了我的好朋友,AIGC 領域寶藏博主,設計師 #阿真 irene 分享她的上半年之選。

她在這塊比我鉆研的深多了

萬字盤點!2025上半年值得推薦的AI模型與產品清單

有興趣可以關注:

豆包生圖:日常使用,免費,推薦

如果說給國內用戶推薦文生圖 AI,豆包生圖確實是我的第一選擇。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

自從 SeedEdit 3.0 發布以來,感覺豆包生圖效果突飛猛進,變的越來越順手。(SeedEdit 3.0 技術報告: https://arxiv.org/pdf/2506.05083

一方面支持 4o 式的自然語言直接改圖;另一方面對于圖片內的文字生成,也有很好的支持。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

萬字盤點!2025上半年值得推薦的AI模型與產品清單

在生成人像等各類場景也有不俗的質量:

萬字盤點!2025上半年值得推薦的AI模型與產品清單

而且免費,國內可直接使用,生成速度又特別快。

體驗渠道:

  1. 首推:豆包 Web 或 APP。用起來很方便,直接發條消息就能生成,也能改圖。
  2. 專業用戶:即夢 AI

Imagen:被人低估的偏科模型,免費

萬字盤點!2025上半年值得推薦的AI模型與產品清單

Google Imagen 其實有個非常強的領域——產品設計,其質感沒有模型能和它比拼。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

我發現它的原因也很神奇

——接了一家產品公司的 AI 設計咨詢,幫忙調研并定制了 AI 輔助產品設計的工作流與提示詞。結果調研下來,發現表現最好的就是 Imagen 3,即使是現在也少有模型能比肩。

生成速度快、質量好,又免費,確實值得使用。現在 AI studio 中提供了 imagen 4 版本,感覺生成圖片的光感更好了些,但沒有顯著區別。

我現在依然配合自己寫的 《萬能文生圖提示詞》 ,使用 imagen 3 來覆蓋大部分精細作圖需求的場景。(這份提示詞有 1k+ 轉發,認可度極高。推薦納入自己的文生圖工作流)

體驗渠道:

  1. 首推 imagefx: https://labs.google/fx/zh/tools/image-fx
  2. Gemini 中也能用:直接在 Gemini 對話時,要求“圖片生成:xxx”,就可以觸發生圖了,用的也是 Imagen 3
  3. AI Studio: https://aistudio.google.com/prompts/new_image ,這里有 Imagen 4

可靈:來自快手老鐵的 AI 視頻絕活

可靈一直 6 到飛起,一直是最強的那幾個 AI 視頻模型的存在。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

支持文生視頻、圖生視頻。用的比較多的還是圖生視頻,這樣比較容易控制視頻畫面。

畫面穩定,物理效果逼真,產品交互體驗優秀,價格適中。現在也已經更新到了「可靈 2.1」版本。

體驗渠道: https://app.klingai.com/cn/image-to-video/frame-mode/new

Veo 3:逼真到頭皮發麻的視頻模型

不過要論上半年看起來最驚喜、最強的視頻模型,那還得是 Google Veo3。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

一個視頻體驗它的效果(視頻來源忘了):

看到小船掉落到洞里的過程了嗎?這個物理效果讓人頭皮發麻……居然 AI 能在 2D 空間完成對 3D 真實物理現象的模擬,還能同步生成匹配的音效。

體驗渠道:Google Flow - https://labs.google/fx/zh/tools/flow

Gemini 2.0 Image Generation:劃時代,但被 GPT 狙擊慘了的生圖模型

Gemini……我猜大家都快忘了它還有個支持生圖的版本了吧。

在 ChatGPT-4o 生圖發布的前一周,Gemini 就發了 2.0 Image Generation,也是行業內第一個支持連續精準改圖的文生圖模型。

能改圖、摳圖、能批量生圖,是 2025 年的初代文生圖許愿機。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

可惜一周后就被 ChatGPT-4o 狙擊了,4o 比它的效果還要好,一下就失去了熱度。

現在,它的上位推薦是:ChatGPT-4o、豆包生圖。所以別刻意去用了。

ChatGPT-4o:上半年最火的文生圖模型,但太慢

憑一己之力,壓住 Gemini 2.0 生圖熱度的模型,是 OpenAI 上半年站起來的一大表現。自此用自然語言改圖成了徹底的用戶需求共識,大幅提升了文生圖創作體驗與可用性。

和上述豆包一樣,支持自然語言連續改圖、圖片合成,對圖內生成英文的支持很好,中文會稍微差一點。

比如 Qwen3 文章中的爐石圖,就是 4o 做出來的。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

就是免費用戶生圖的速度確實太慢了點,不然應該會常用。

體驗渠道:「ChatGPT-4o」-「工具 - 創作一張圖片」

Midjourney:個人不常用,但我知道它很強

Midjourney 在我心里,一直以極高的畫面精細度、光感、藝術表達,被留下了深刻的印象。

雖然它需要付費,我也沒有那么高的日常作圖需求,但還是有必要推薦一下。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

阿真 irene:科幻槍戰游戲

萬字盤點!2025上半年值得推薦的AI模型與產品清單

阿真 irene:概念藝術表達

萬字盤點!2025上半年值得推薦的AI模型與產品清單

阿真 irene:寫實人像

萬字盤點!2025上半年值得推薦的AI模型與產品清單

San 山雨的戰地風格圖片

配合《萬能文生圖提示詞》 ,能夠有效幫你提升 Midjourney 作畫效果,上面 4 張也都用了這套提示詞模板

體驗渠道:國外搜「Midjourney」;國內搜「悠船」

Claude 4:我很常用的偏門用法

混進來一個很偏門的文生圖方法——用 AI Coding 生成前端代碼,網頁即圖片。

比如這些 Case,就是我用 Claude Coding 生成的圖片:

萬字盤點!2025上半年值得推薦的AI模型與產品清單

萬字盤點!2025上半年值得推薦的AI模型與產品清單

之前我發完社交名片 Case 后,今年就有好多 Agent 產品,都普遍按這個思路,在做 Deep Research 結果轉可視化 PPT、長圖了,說明確實用戶接受度很高。

用來做文章配圖再好不過。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

也可以看之前我在社區直播分享過的 PPT: https://zkv549gmz8.feishu.cn/slides

3. 文生音頻領域

輪到文生音頻領域,第一個想起來的是 MiniMax speech-02。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

能克隆你的聲音,音色模擬的還可以。但是情感、語調、停頓還是與真人配音有明顯差距。

克隆了一款知名游戲的男主配音,可以聽一下效果。:

Btw:豆包的語音模型也還不錯,聲音復刻、語音識別都不錯(豆包 APP 里,AI 的語音通話表現就非常好了)

體驗渠道:

  1. MiniMax: https://www.minimax.io/audio/text-to-speech
  2. 豆包:火山方舟-語音模型 or 豆包 APP

二、卷得水深火熱的 AI 產品

終于寫到 AI 產品這一個 Part 了,好長,真不容易。

1. 先講 25 年最火的賽道:Agent

如果說 DeepSeek 帶火了國內大模型的全民應用,那小宏他們的 Manus,則帶火了通用 Agent 競賽熱潮。

一方面,嚴格來說 Coding Agent 也算 Agent,但由于場景過于垂直,就單獨劃歸在 AI Coding 產品一類,不在此節詳述。

另一方面,關于 Agent 和 Deep Research 之間的關系。

仔細區分,Deep Research 應該算 Agent 應用的子集(何況還有些通用 Agent,實則用 Deep Research 框架 + MCP 擴展實現 Agent 效果),所以 DR 倒是放在這一節一并討論。

同樣的,今年就是沒用 ChatGPT,它家的 DR 是很強,但確實沒仔細用過,暫且不論。

  1. 最常用:仔細想想,我的日常 AI 使用中,Agent 的使用頻次確實比較低。硬要說的話,那我選擇什么都能試試看的 Manus。
  2. 驚喜時刻:Manus、Kimi-Researcher
  3. 有印象:夸克高考志愿 Agent
  4. 當下推薦:Manus、Gemini Deep Research、Kimi-Research

另外,類似 Lovart(有設計需求的業余用戶會用),扣子空間(很有可能做成垂直 Agent 社區),昆侖天工(在 Office 類內容生成、需求澄清交互方面做的不錯),也都是不錯的產品。

Manus:目前唯一的真 · 通用 Agent

雖然現在宣傳自己是通用 Agent 的產品很多,嚴格意義上算通用 Agent 的,我認為還是只有 Manus。這也是我 2025 年最喜歡的 AI 產品。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

在 Manus 首發期,里面就有一個 Case「讓 Manus 自主下載寶可夢并運行」。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

如果說互聯網工作者的特征是 人 + 電腦 = 干活,那么真正給 AI 配了一臺完整云電腦的,確實只有 Manus。

這就意味著 Manus 的通用任務想象空間還是很大。當不知道一個任務交給哪個 AI 時,就可以試試先甩給 Manus 再說。

比如在單個網站中,像人一樣搜索站內信息、通過連續點擊網頁元素,完成信息收集

案例: https://manus.im/share/SqTXv0qMVLvXouGvaAXtDD?replay=1

萬字盤點!2025上半年值得推薦的AI模型與產品清單

換到以 DR+MCP 方案的 Agent 里,就容易直接改用 MCP 網頁搜索服務,導致解決方案偏離實際。

還意味著,Manus 不僅能生成前端網頁,還能直接搭建一個完整有后端的站點服務。AI + 云電腦 = Create everything,這點用到的話,會有質變的體驗。

體驗渠道:Manus 官網 - 我給一個自己的邀請鏈接,每人可得 500 積分 https://manus.im/invitation/

Kimi-Researcher:把 DR 能力內訓到模型里

Kimi Researcher 本來我也是打算單獨寫一篇的,作為 Kimi 沉寂了半年的力作,帶來了一些新的驚喜。(但是偷懶了)

原本我對于只能查國內內容的 Agent 出的報告,不報多少希望。因為國內的網頁信息又亂又雜,無從考證。

但 Kimi Researcher 以其超長上下文、大量深度的網頁搜索,硬是在中文內容中,能總結出一些很細節的內容,且幻覺率也明顯較低。

朋友拿我為例子,用 Kimi 做了一次 DR 任務,調研「一澤 Eze」博主的信息: https://www.kimi.com/share

萬字盤點!2025上半年值得推薦的AI模型與產品清單

萬字盤點!2025上半年值得推薦的AI模型與產品清單

不得不說,確實歸納的非常細節,而且推理正確、詳實,本人表示眼前一亮。

這種效果,得益于 Kimi 將 DR Agent 的能力,通過 RL 強化學習,內訓到了模型中,使得其行為不是被規則寫死的,而是根據當前任務動態生成的,所以在復雜信息的盡調上,確實表現出了極佳的水平。

Kimi 官方技術人員也在知乎上寫了兩篇 Agent 技術分享,有興趣也可以讀一下: https://www.zhihu.com

體驗渠道:Kimi Chat 內「申請 Kimi 深度研究內測」: https://www.kimi.com/ (和 Kimi 的朋友打過了招呼,在問卷中備注“一澤讀者”,有更大概率通過申請)

萬字盤點!2025上半年值得推薦的AI模型與產品清單

萬字盤點!2025上半年值得推薦的AI模型與產品清單

夸克高考志愿 Agent:首個千萬級用戶量的垂直 Agent

夸克 AI 做了個「高考志愿填報 Agent」,暗搓搓搞了個大數據。

不到一個月,生成超過 1000 萬份深度研究報告,峰值時并行處理 250 萬份復雜任務。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

雖然這個 Case 過于垂直與時效性,但我覺得很值得拿來講講,它背后代表的下半年 Agent 發展方向。

AI 最容易犯的錯誤就是幻覺。而高考志愿填報這種嚴肅的場景,容不得一點幻覺,關系千萬考生的高考去向。

夸克 AI 為了確保 DR 的報告質量,以高質量垂直知識源 + 經過深度對齊的垂類大模型的方式,構成了夸克 Deep Research Agent 做出可靠研究、決策的核心:

① 在數據準備方面,對海量高考數據進行分類與清洗

萬字盤點!2025上半年值得推薦的AI模型與產品清單

② 同時,通過 SFT、RLVF、RLHF,訓練一個垂直、可信的高考志愿大模型,作為垂直 Agent 的核心。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

我當時的評價是:這標志著 AI 應用已經有能力從過去抽卡式的、隨機生成報告的娛樂模式,進入真正解決復雜、垂直、高價值問題的“深度落地”階段。

如果要讓 AI 在現階段就能承接真正落地干活的需求,這套垂直數據+垂直模型訓練應該會成為下半年 AI Agent 正經落地的標配。

當下推薦:再加一個 Gemini DR

除開 Manus 負責通用任務,Kimi 負責中文信源盡調,Gemini Deep Research 雖然表現平平,但憑借免費、能訪問海外信源(含 Arixv)、低幻覺的特色,成了我外文信源調研的日常選擇。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

體驗地址: https://gemini.google.com/ ,對話框里記得勾選「Deep Research」

Agent 總結

  1. 還是覺得云端 Agent 才是正確的發展方向:AI Agent 的 7*24 always online 是一大重要特色,而放到本地運行,卻需要保持電腦長時間開機喚醒,且占用人的電腦進程,怎么看還是覺得有些奇怪。
  2. 垂直模型驅動垂直 Agent,應該是下半年出活的方向:通過訓練垂直模型,能極大提升 Agent 在垂直場景的可用性,現在到了拼 AI 團隊數據質量和 RLHF 訓練能力的時刻了。

2. AI Chat

在大模型部分,其實或多或少已經提過了我現在的使用偏好。

PC 端:

  1. 高頻使用 Gemini 2.5 Pro(有 Pro 會員就直接在 Gemini 內使用,無則在 AI Studio 使用,確保體驗到最長上下文的滿血 2.5 Pro)
  2. 文哲類任務偶爾用 DeepSeek
  3. Btw,騰訊元寶憑借能對公眾號生態進行搜索回答,有其獨一份的特色。

移動端:

  1. 主用豆包 APP,主要是交互太方便了,響應也快,語音、視頻通話是一絕;
  2. 學生群體也可用夸克 APP,功能更全

豆包 APP:移動端最佳 Chat 體驗

在移動端,我們不追求頂級的 AI 智力,而是更希望全能、便捷、快速的問答體驗。

這半年以來,「打開豆包發送語音消息」的快捷指令,一直綁定在我手機的操作按鈕上,遇到要問的問題,按一下就開始錄音提問,特別方便。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

而且多模態識別也挺順手的,今天還讓豆包幫我識別了陽臺花盆里突然長出來的草是什么。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

特別值得一提的是,豆包的視頻模式,甚至還能充當你的虛擬導游:

萬字盤點!2025上半年值得推薦的AI模型與產品清單

開著視頻通話,就能直接實時對話提問,就像和一個真導游在視頻聊天,這塊體驗很神奇,建議試試。

也能體驗到優秀的自然語言生圖、改圖功能,豆包相當全能了。(就是上下文記憶表現不咋地)

3. AI 搜索 ?

我其實在猶豫要不要提 AI 搜索。

因為我的暴論是:從 2025 年上半年的發展趨勢來看,純 AI 搜索形態的產品,正在被 AI Chat 和 Deep Research 擠壓生存空間。甚至長期來看,我并不看好 AI 搜索產品的存在必要性。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

簡單問題用 AI Chat,直接在開著的 AI 窗口問一嘴,就能得到答案,還能方便的帶著上下文記憶擴展問答。

復雜問題,用 DR 更能一次性找到有價值的增量信息,大家也愿意等這個 DR 時間。

如果你還是想問有什么 AI 搜索可以用?

那可以繼續用:

  1. 「秘塔搜索 - 研究模式」: https://metaso.cn/
  2. 「夸克 APP - 夸克 AI 搜索框」: https://ai.quark.cn/

實際上,這兩者也都在擺脫純粹的 AI 搜索形式。前者開始轉教育,做「今天學點啥」;后者的 AI 搜索框,則是包含了深度思考、AI 寫作、生圖等一籃子 AI 功能,主打一站式 AI 日常使用體驗。

4. AI Coding:Vibe Design + Vibe Coding!

如果作為一線產品經理,到現在還完全沒體驗過 AI Coding,我覺得基本是不合格的產品經理了。(不要求做出獨立的完整 Demo,用來做個靜態頁面也好啊)

像我最近的 Chat Memo,就是用了純 AI Coding。

在不懂編程的情況下,1 周半寫出了完成度非常高的 Chrome 插件 ;2 天完成了官網的 Vibe 設計與開發。發布后,短短 1 周就有了 1000 用戶量。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

萬字盤點!2025上半年值得推薦的AI模型與產品清單

這個 Case 直接證明了 AI Coding 現在已經可以做出完成度極高的 MVP 產品,而非只能做 AI 小玩具。

而且,以我身邊樣本為例,一些 AI 團隊的新產品,AI 代碼占比達 90%;老牌產品的 AI Coding 采用率也能在 40% 以上。

沒用過 AI Coding 的,真的該抓緊去試試了。

也給一些負責任的 Coding 產品推薦:

  1. Trae:簡單項目,可以用 Trae 海外版,3 刀 1 個月,最便宜的訂閱價格,換來剛好能用的 AI Coding 體驗。復雜項目,如果沒有 AI Coding Prompt 經驗,憋用……簡直是折磨。
  2. Cursor:基本是 AI Coding 屆的一致選擇。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

也有一些朋友覺得 Augment Code 作為新 AI Coding 產品,有著更佳智能的體驗,暫時還沒試過,不做推薦,可自行體驗。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

另外關于 Code Review,某明星 Agent 公司的超靠譜朋友,推薦使用 Code Rabbit,作為 AI Code Review 的選擇。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

Btw:Windsurf 自從被 OpenAI 收購后,它的 Claude 模型就不太穩定,保險起見,現在不建議入坑。

Claude Code 和 Gemini Cli,只適合程序員群體使用,普通用戶脫離了 GUI 再去用這倆,還是會很吃力的,不推薦主動退化自己的交互方式。

5. 其他推薦

上面提到的,就是 2025 年主流視野中,最火的一些模型、產品賽道,除開這些以外,也有一些零星的產品值得推薦:

Flomo:個人筆記軟件中,AI 做得最爽的

AI 功能做得好,不在于多么花里胡哨、專業難懂,而在于真的能讓人用進去、愛不釋手。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

Flomo 絕對算這個類別。

1)相關筆記:根據筆記向量,匹配語義相似的筆記。無需 AI 總結,就能看到歷史相關筆記

萬字盤點!2025上半年值得推薦的AI模型與產品清單

2)AI 洞察:根據相關筆記,AI 洞察你在某類主題下筆記的共性與盲點,給予主動的啟發。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

打磨 Prompt 如打磨產品本身。少楠為了 AI 洞察,自測迭代了數百個版本的 AI 洞察 Prompt,盡可能地讓 AI 能更加自然、不自嗨地融入 flomo 用戶的服務中。

而 flomo 做每個 AI 功能,也絕非是為了 AI 而 AI,而是在像溪流一樣設計產品。當一個人記錄很多的時候,他可能需要回顧。而 AI 回顧的前提是「找到相關的筆記」,再是基于相關筆記做洞察啟發。

來自少楠的小報童專欄:「松節油:Behind flomo」

萬字盤點!2025上半年值得推薦的AI模型與產品清單

如果說今年的 Agent 產品們,是在把未來帶到現實;Flomo 更像另一個視角,一點點沿著真實需求場景,把服務做的更好。

體驗渠道: https://flomoapp.com/ ,少楠周三晚直播,分享 AI 洞察的設計理念,正式版本該功能本周四上線。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

Cherry Studio:本地 AI 對話與調試

本地多 API 集成的 AI 對話客戶端、本地知識庫,近 3w Github star。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

可以自定義為你提供 AI 服務的云服務商:

萬字盤點!2025上半年值得推薦的AI模型與產品清單

如果需要:

1)一次性對比多 AI 的 Prompt 回應質量

萬字盤點!2025上半年值得推薦的AI模型與產品清單

2)無縫的本地 RAG 知識庫體驗

萬字盤點!2025上半年值得推薦的AI模型與產品清單

PS:甚至還有 MCP 體驗(只不過我現在不推薦一般用戶用 MCP)

——用它!

體驗渠道: https://www.cherry-ai.com/

Prompt Pilot:提示詞版本管理與效果評測(限國內模型)

字節做的一個 Prompt 工程工具,我最喜歡的是它的 Prompt 調優管理功能。如果是針對國內模型進行 Prompt 工程調優,非常好用。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

在幫朋友的產品打磨封裝功能所用的 Prompt 時,就用了 Prompt Pilot。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

能夠批量跑 Benchmark,批量評分 Prompt 結果的質量,很方便。

唯一的遺憾是只能用火山方舟提供的模型列表,包含 DS、豆包等模型。要是能支持國外模型測試就好了,出個海外版吧。

體驗渠道: https://promptpilot.volcengine.com/tasklist

Chat Memo:跨平臺無感保存、導出各 AI 平臺對話

一方面是在這個場景,確實沒產品比 Chat Memo 做的體驗更好、更無感;另一方面也是給自己的產品打個小廣告(自家免費的廣告位,當然要蹭(不是))

這是一份在 AI 時代都用得上,在將來也許會發揮大價值的禮物。

萬字盤點!2025上半年值得推薦的AI模型與產品清單

能夠幫你解決 AI 對話散落在各個 AI 平臺,難以沉淀與搜索的問題。在瀏覽器上裝上后就支持:

  1. 實時保存每一次 AI 對話
  2. 搜索并找到歷史 AI 對話中任何一個關鍵詞
  3. 無限制導出全部 AI 聊天記錄

萬字盤點!2025上半年值得推薦的AI模型與產品清單

而且默認數據存儲在瀏覽器本地,你的數據只屬于你

體驗渠道:

  1. 產品官網:chatmemo.ai
  2. 直接在 Chrome 擴展商店,搜索「Chat Memo」
  3. 如果你在國內,無法訪問 Chrome 商店,可參考本地安裝教程: https://zkv549gmz8.feishu.cn

附錄:AI 日常推薦表

也附上一份我日常推薦朋友的 AI 模型&產品推薦表:

萬字盤點!2025上半年值得推薦的AI模型與產品清單

寫在最后:令人暈眩的上半年,以及兩個趨勢

寫完才猛然發現,2025 年上半年就已經發生了這么多的變化。

這么多新產品,每個產品放在過去前 AI 時代,都是相當“炸裂”、“顛覆性”的存在。但它們確實都集中發生在短短半年內。

DeepSeek R1 進一步確立了國際上中國 AI 的地位;Manus 則是率先帶起了通用 Agent 的浪潮。

豆包生圖、可靈 AI,則是進一步加速了 AIGC 應用的全民普及。Veo3 生視頻更是宣告 AI 生成內容進一步達到了以假亂真,低維模擬高維世界物理效果的可行性。

而 Lovart、夸克高考志愿 Agent 在垂直場景的成功實踐,又證明 AI 應用落地正在從淺水區,加速進入到各個垂直場景的深水區。

AI 百日,恍若數年。

在下半年,我直覺應用側會有兩個趨勢:

  1. Agent 開始在垂直領域卷數據、卷后訓練:就像夸克高考志愿 Agent、Kimi-Researcher,為了在垂直場景(高考志愿、DR)上獲取更加穩定、可用的效果,紛紛開始對模型層下手優化,且以模型的進步得到了 Agent 整體效果的提升。
  2. AI 記憶利用與 Context 構造:實話說,現在 AI 體驗不行、麻煩的最大原因,不是 AI 智力不行。而是 AI 不夠懂我們的意圖,每次都要我們反復說明已經陳述過的 Context。上半年只有看到 OpenAI 在 ChatGPT 中優化了 Memory 的利用。當模型發展遇阻,應用層 Prompt 套殼玩的差不多的時候,最終還是要回到 Context 工程上來,這是每個好 AI 產品都逃不掉的任務。(不僅是行業趨勢,也是我通過精進 Chat Memo、Context 工程實踐,下半年會持續深耕的方向)
    當然,我個人覺得前者可能下半年就能看到爆發期,后者估計到明年上半年才會有比較多的落地探索。

潮水仍在奔涌,探索永無止境。

以上便是 2025 年上半年,我在國內所見、當前推薦的 AI 模型與產品清單。

那么,你的上半年最愛又是什么?歡迎在評論區留下你的清單,讓我們交換地圖,繼續前行。

感謝你的耐心閱讀

收藏 45
點贊 116

復制本文鏈接 文章為作者獨立觀點不代表優設網立場,未經允許不得轉載。