8 家 AI 公司的不同玩法,能給不同世代的非工程師什麼啟示。這不是焦慮文,是一份地圖。
hi 大家今天 AI 用得開心嗎?有玩了什麼新花樣,有什麼新的賺錢方式嗎?
過去 18 個月我看過很多 AI 訪談、論文、Github 上散落的東西。有些我也發出去,流量還可以。但回頭看那些討論,我很清楚,都是些「片段式的焦慮紓解」:我們今天緊張一下、明天又緊張下一件事。
我真正想問、也覺得時候到了可以試著問跟回答的,是另一個層次的問題:
AI 原生的工作流是什麼?跟我們這些前 AI 時代長大的工作流有什麼不同?我們這代人能借鑒什麼,搭配自己累積 20 年的專業判斷後,會長成什麼樣?
不是恐嚇不是焦慮,而是藉這些一線 AI 公司的經驗想想,以後工作會變怎樣?
做得到的話,我想寫一篇 AI 時代中給非程式設計師看的的工作 4 講,序言之外包含美中工作流各一篇,以及一些目前已經有眉目的工作方式簡介(不只是 Skills 或龍蝦, 那很重要,但還有其他的)。
這篇是我給自己的小小試金石:不但測試我寫得出這題目嗎,也看看有沒有人想看。石頭丟到深淵裡面,還是滿煩的。
我研究的範圍,包含美國四家 frontier 公司(Anthropic、OpenAI、DeepMind、xAI)和中國四家 AI 主力(DeepSeek、Kimi、美團、字節豆包)。看公司文化,也對照看跨世代的人各自在 AI 洪流中做什麼決策。
我從 Lenny's Podcast 逐字稿出發,丟給 Opus 4.7/GPT5.5 還有其他 AI 們讀,然後討論,不夠了再請 AI 們上網找。
讀到一半我意識到,這些公司之間的差異,與其說是「美國 vs 中國」,或者是「誰技術強」,不如說是他們對「該轉下個世代的錢,還是賺進明天的錢」完全不同的判斷。
70 後老兵跟 90 新貴的賭法不同,東方跟西方的處境也不同。
他們怎麼應用資本,怎麼應用這世代最聰明的大腦,又想要靠著什麼作品與方法論,轉怎樣的錢。
這些思考又會對我們這些非工程師,這些麻瓜有什麼啟發?
這是我想整理給自己看,也跟你分享的。
美國這邊:兩邊都要 vs 純押下個世代
先從材料相對好找的美國開始。第一個該重新檢視的,是 Sam Altman。
Sam Altman(OpenAI):獨一無二的存在
Sam Altman 1985 年生,是這 8 家公司的 CEO 裡最會說話、也最少談技術細節的人。他過去 18 個月的發言,最有趣的不是講了什麼,而是他沒講的東西。
他不太談 evals、不太談 context engineering、不太談模型內部架構,這些是 Cat Wu、Mark Chen 那批中段技術主管的語言。
Sam 的語言是另一套:deployment、iterative、commercial readiness、data center buildout、global infrastructure。
OpenAI 內部的工作方法都不是他在講的,他講的是「OpenAI 要被怎麼部署到世界上」。
這也解釋了為什麼 OpenAI 一邊高速商業化,一邊又持續押 superintelligence、算力與全球基礎設施。這不是兩條路,而是同一家公司同時承擔的兩種時間尺度。
OpenAI 面臨數十億美元級別的資金消耗壓力(外部報導常提到約 50 億美元量級),沒有營收等於沒有續命。Nick Turley 那句「10 天就把 ChatGPT 推出去」、Kevin Weil 那句「maximally accelerated」,本質上都是 Sam 的下游執行。Sam 要的是現金流跑得過 GPU 燒錢的速度。
但他也沒放掉下個世代。Altman 公開談 superintelligence timeline、把 Sora 推到極端、不停跟 Nvidia 跟微軟談更大的數據中心、講「abundance of intelligence」這種完全不像 CEO 在報季度財報的話。
這部分是 Anthropic 那群人也在做的事,但 Sam 走得更激進,且把所有押注公開化。
明天的錢、下個世代的錢兩邊一起做,帶來組織內 alignment 的撕裂。
2023 年董事會事件、2024 年 5 月 Ilya Sutskever 離開、9 月 Mira Murati 出走、Greg Brockman 來來回回,這些不是孤立事件,是「兩邊都要」這種策略在組織內必然會出現的拉扯痕跡。
對我這個前 AI 時代長大的職場人來說,Sam Altman 的選擇有趣到值得觀察。他在 OpenAI 之前長期掌管 Y Combinator,是矽谷最頂級的創業者導師之一。他現在在 OpenAI 做的事,其實是把矽谷新創那套「用敘事撐住矛盾、用公開承諾換資源」的玩法,放到一家年燒幾十億美元的公司上。
當你的工作既要服務當下 KPI、又要準備下個世代時,你能不能像他這樣公開承認兩邊都要、且承擔組織必然會撕扯的代價?
多數人會選一邊、把另一邊外包給時間,或者打模糊仗。
Sam Altman 的奇妙之處在於他兩邊都不放。
其他七零後 CEO 也會說自己兩邊兼顧,但你聽完往往不太信。Sam 的特殊處在於:他講賺錢有人信、講理想也有人信。
這種兩邊都建立信用的位置,整個 8 家公司只有他一個。
Anthropic:用方法論換信用
Anthropic 走的是反方向。它的高層幾乎不講「abundance of intelligence」這種大字,講的是 evals、context、product taste、model behavior shaping 這種細部工程語言。
從 Lenny's Podcast 上輪流出來受訪的人,每一個都帶著職位跟具體話題:CPO Mike Krieger 講 context engineering 是地基、Head of Product(Claude Code & Cowork)Cat Wu 講 PM 不寫 PRD 改寫 evals、Head of Growth Amol Avasare 講 CASH 系統把成長實驗自動化、Claude Code 工程師 Boris Cherny 講自己 11 月之後沒手寫過一行程式碼但工程產能翻 3 倍、Design Lead Jenny Wen 直接說「設計流程死了」、前研究員 Karina Nguyen 講設計師→工程師→研究員的三跳轉換、共同創辦人 Benjamin Mann 講從 OpenAI 出走的安全動機。
這些話聽起來都像在炫耀,但背後其實是同一個動作:
把工作方法本身做成 Anthropic 的對外資產。
我當然很高興有這麼多素材,但仔細想想這很有趣。一家這麼年輕的公司,不用 CEO 高調曝光,不做大型技術推廣,他要怎麼跟 Google、Microsoft、OpenAI 這些有 distribution 的玩家競爭?
Anthropic 的答案不是 distribution,是 craft。
它把「Anthropic 怎麼工作」做成像當年 Stripe 把工程文化當成品牌資產一樣的東西。Hamel Husain 跟 Shreya Shankar 在 Maven 上開的 evals 課訓練了 OpenAI 跟 Anthropic 大量團隊,這代表方法論已經外溢到全產業。
這裡有三個概念快速講一下:distribution 通路、speed 速度、craft 工藝。
distribution 是「現成的分發通路」,例如 Google 有搜尋、Microsoft 有 Office、Meta 有 FB/IG,新產品塞進去就有人用。speed 是「執行速度」,OpenAI 的「10 天就 ship」就是這個。craft 是「工藝精細度」,Anthropic 那種「我們怎麼設計工作流」的厚度就是這個。
當你三個都沒有時,最容易學的是 speed,但最持久的是 craft,最難建的是 distribution。
Anthropic 押的是 craft 換信用,這條路慢但走得遠。
從留才敘事看,Anthropic 押的是 mission-driven 的吸引力。Benjamin Mann 公開講過為什麼從 OpenAI 走出來,理由不是錢:「我在 Meta 最好的結果是賺錢,在 Anthropic 最好的結果是影響人類未來」。
這種語言,跟 OpenAI 那邊被 Sam Altman 形容為「Meta 曾向我們員工開出高達 1 億美元 signing bonuses」的競爭環境放在一起看,更能看出 Anthropic 的留才籌碼不是 distribution,而是 craft 與 mission。
從最聰明的大腦流向看,Anthropic 是少數能讓研究員、PM、設計師、工程師、growth lead 全部講同一種語言的公司。
這不是文化口號,是 7 個人訪談裡反覆出現的組織文化,也是引發我想寫這系列的動機:他們一定做對了什麼,我怎麼學,能學到哪裡。
Google DeepMind:科學家撐著的緩慢爆炸
DeepMind 的氣質跟 OpenAI、Anthropic 完全不同。它不講 deployment 也不講 evals,它講 scaling laws、合成資料、model behavior。
Demis Hassabis 是諾貝爾化學獎得主,這個身份本身就決定了 Gemini 對外敘事的調性:science first,product second。
但這幾年 DeepMind 的對外語氣明顯在往產品靠攏。Logan Kilpatrick 帶 AI Studio、Josh Woodward 帶 Gemini App、Oriol Vinyals 守研究,這個三角架構透露出 Google 內部正在用組織重新平衡「研究 vs 產品」的張力。
Logan 那句「There's one mode and the mode is we ship fast」,跟 OpenAI Nick Turley 講的話幾乎一字不差,這代表 Google 也意識到:再不 ship 快,就連 Anthropic 跟 OpenAI 過去 3 年累積的 product muscle 都追不到。
從資本看,DeepMind 的優勢是 Google 整個生態給的補貼,TPU、Search、YouTube、Android、Chrome 這些通路一起頂著。這代表 Gemini 不必像 Anthropic 那樣靠單一 API 商業化生存,可以用更慢的節奏押科學賭注。
但這同時是它的詛咒:當研究厚度很深、資源極充足時,組織天然會比 OpenAI 或 Anthropic 更難維持那種 startup 式的 deployment 速度。
DeepMind 的問題不是「有沒有最頂尖的人」,而是「能不能把最頂尖研究穩定轉成產品肌肉」。
從作品方法論看,Gemini 的「product scaffolding 重於單模型」是值得抄的:他們不只訓練更強的模型,還在模型周圍堆檢索、工具調用、grounding 這些 scaffolding。
這個 scaffolding 思維對 BI 跟 PM 工作流很有借鑑。我們不一定要等更強的模型,我們可以用工具堆疊讓現有模型解更複雜的問題,這不但合乎公司資安,費用上也更合理。
xAI:一個人的武林
xAI 是這四家裡最像「一個人的公司」的。Elon Musk 1971 年生,是這四家美國公司裡唯一的 70 後 CEO。他帶著 Tesla 跟 SpaceX 的執行肌肉,把 xAI 蓋成了一個「極速執行 + 真實追求」的奇怪混合體。
還記得那個稱讚完公司,然後幾天後就離開的工程師嗎?
Sulaiman Ghori 2026 年 1 月在 Relentless Podcast 上講了 71 分鐘。他講 Colossus 122 天蓋完、講「No one tells me 'no'」、講「Fuzziness between teams is an advantage」。
但他也順便講了兩件比較敏感的事:xAI 蓋數據中心時用了「臨時許可」這條快速通道(這條許可原本是給嘉年華會用的);以及,xAI 內部團隊開始用大量 AI agents 做核心工作,他舉的例子是同事 ping 他說「org chart 上這個人向你回報,他怎麼不在」,結果那個「人」其實是 agent。
4 天後他發 X 文:「I have left xAI」。
時間點太敏感,外界普遍推測與那場過度坦白的訪談有關,但公司沒有公開說明。
這個結局本身就是 xAI 文化的最完整註腳。Elon 的「first principles + extreme execution」不是免費的,它有一個附加條款:你可以在裡面快、可以在裡面拼、可以挑戰任何 requirement,但你不能對外講太透。
Anthropic 是 7 個人輪流上 podcast 把方法論做成對外資產,xAI 則是一個工程師上 podcast 講太透就消失。兩種文化,兩種命運。
xAI 跟其他三家最大的不同,是它沒有「兩邊都要」的奢侈。
Elon 個人賭注太大,所以才不停加 product tracks(Grok、Coding、Imagine、Macrohard),他在賭的是 distribution 跟 speed,不是 craft。這個結構讓 xAI 變成一個極端的試金石:
如果一個 70 後可以靠純執行力把一家 AI lab 做進前四,那「老兵不適合 AI 時代」這個迷思就被打破了。
但這個迷思要真的打破,還得先看 xAI 的長期 sustainability。一家公司全靠創辦人 personal pull,歷史上很少能撐過第二代決策。
對我這個前 AI 時代長大的職場人來說,Elon 的 case 不是用來抄的,是用來校準的:他證明了「老兵 + AI」這個組合可以跑出 frontier 級結果,但代價是把所有人都拖進他的工作節奏裡。
我們這代人如果要學 xAI,要學的是它對「first principles」的堅持,不是 19 小時工作日。(我團隊同事應該很高興我有這個自覺)
中國這邊:把工作方法藏在技術系統裡
我讀梁寧的《#產品經理 30 講》受用最大的是他花很多力氣講人:講微信張小龍的產品設計能力、阿里的運營能力、千團大戰裡面美團怎麼打,還有傅盛雷軍如何帶團隊穿越週期。
核心思考與技術能力的交織,是一場場商戰的基礎。
這也是我在寫這篇時候想找到的,我們普通人,非工程師,如何在 AI 時代找一些工作方法論,核心價值觀,與前 AI 時代相同或不同的,藉由嗅聞世界前沿的改變,讓自己多做一點準備。
但寫到這裡我必須坦承:研究中國公司比研究美國那四家難很多。不是因為材料少,是因為材料的形狀不一樣。
美國頭部 AI 公司比較擅長把工作方式產品化、人格化、公開傳播。Anthropic 從 CPO 到 Head of Product 到 Designer 到 Head of Growth,每一層都有人對外講「我們怎麼做」。OpenAI 也類似,Kevin Weil、Nick Turley、Jake Brill、Sarah Friar 各自談產品、完整性、財務怎麼被重寫。這就是 Stripe 那套「把工作方法本身做成對外資產」的玩法,Anthropic 學得最徹底。
中國頭部 AI 公司比較擅長把工作方式沉到技術系統、訓練流程與開源項目裡。
美團技術博客把 LongCat 的 Agentic Search、Agentic Tool Use、TIR 重思考模式講得超清楚;EvoCUA 直接把訓練範式從「靜態軌跡模仿」推到「經驗進化學習」,公開十萬級並發交互沙盒與可驗證數據合成引擎。這些含金量比很多美國 podcast 還高,只是它們的表達形式是技術方法論,不是組織工作方法論。
換句話說:
美國公司輸出的單位是「人物 + 角色 + 原話 + 工作敘事」,
中國公司輸出的單位是「技術博客 + 開源 repo + 訓練框架」。
前者更容易被外行學走,後者更容易被低估。這也解釋了下面寫中國四家為什麼讀起來會比美國那四家薄一點。不是公司做得淺,是材料形狀沒被翻譯成「PM / growth / manager 等等非工程師可以直接抄的工作敘事」。
我試著做這個翻譯,把中國公司藏在技術系統裡的工作哲學,挖一些出來給非工程師看。如果有人要看,我在想辦法寫一篇做更多的挖寶。
首先,是世代差異,其實一點不意外,只是覺得有趣:
中國 80/90 後 AI 新貴幾乎都有美國常春藤訓練背景:楊植麟(清華 + CMU PhD + Google Brain)、梁文鋒(浙大 + 量化基金跟矽谷對標)、Manus 兩位創辦人(連環創業者,海外曝光)。
70 後老兵幾乎全是土生土長:李彥宏(北大)、劉強東(人大社會學系,1996 年畢業)、王興(清華 + Delaware 短暫)、雷軍(武大)。
這個差距顯現出兩個完全不同的訓練樹:
70 後在中國本土長出對中國市場的商業直覺,所以他們的 AI 戰略全部是「守住既有印鈔機」。
80/90 後新貴把矽谷 frontier 思維帶回中國執行,所以他們的 AI 戰略全部是「押下個世代」。
中國這邊比美國更涇渭分明。我也不只寫給你看,寫來提醒自己:看的時候要注意自己的心思正往哪裡走。
好,前言太長,開始。
DeepSeek:把推理做成工程系統
DeepSeek 對外不靠 founder branding。梁文鋒幾乎不公開受訪,整家公司的對外資產是模型、論文、GitHub、API 文檔。這跟 Sam Altman 高曝光的策略剛好相反,但兩個都建立了信任,只是用不同貨幣。
從一手資料讀到的最深細節,是 DeepSeek 把「推理過程」當成可被程序化處理的中間層。
deepseek-reasoner 文檔明講,模型先輸出 Chain-of-Thought 再給出 final answer,reasoning_content 顯式暴露給開發者。thinking mode 文檔還要求:若在多輪推理與工具調用中使用 reasoning_content,必須完整回傳到後續對話歷史,否則請求會失敗。
這聽起來很技術,但背後是哲學選擇。DeepSeek 在說:
思考鏈、工具鏈、結構化輸出都是 pipeline 的一部分,不是模型的「黑箱副產品」。
它要把整個 Agent 工作流做成可編程、可治理、可重現的工程系統。
從應用資本看,DeepSeek 對外最鮮明的訊號不是 founder charisma,而是工程密度。它反覆用論文、repo、API docs 與低成本訓練敘事來建立信任:技術報告中載明 V3 預訓練只用了約 266 萬 H800 GPU 小時,是 Llama 3 405B(30.8M GPU 小時)的不到十分之一。
梁文鋒少數受訪講過:「對於顯卡和人的調動是不設上限的,每個人隨時可以調用訓練集群的顯卡無需審批。」這跟 Anthropic 給工程師「無上限 token」是同一個哲學。
從最聰明的大腦流向看,DeepSeek 全公司 140 人,幾乎全是 25-32 歲、清華北大博士、極少海歸。這種純度極高的團隊組成,是它扁平自下而上組織能跑通的前提。
順便講一下梁文鋒出身的浙大計算機系:在中國它跟清華、北大計算機系並列第一梯隊,培養了大量科技創業者,但台灣比較少報導。我目前知道的只有 Zeabur 的林沅霖。
梁文鋒就是浙大背景,加上量化基金的對沖思維,DeepSeek 的「cost-first 工程效率」氣質很多就是從這裡長出來的。
早期 DeepSeek 確實以「最多天才工程師密度」聞名,現在仍然是。140 人撐起一家全球 frontier model 公司、且模型在 benchmark 上能對打 OpenAI / Anthropic,這個團隊規模在矽谷也算極端。
從作品方法論看,DeepSeek 是把「研究本身當作對外溝通」的代表。它不發 PR、不開大會、不做 launch event,它發 paper、開 source、把 API 寫得乾淨。這個策略很值得記:
當你沒有 distribution 也沒有 founder pull 時,你可以靠作品的工程密度建立信任。
Kimi(Moonshot 月之暗面):把 Agent 做成開發者工作台
楊植麟 1992 年生,中國清華本科 + CMU PhD + Google Brain。
CMU 是卡內基美隆大學,是中國 AI 新貴去美國讀博的熱門目的地之一。著名校友包括沈向洋(前微軟全球執行副總裁、微軟亞洲研究院創始成員)以及台灣新創圈的吳德威。
楊植麟從 Google Brain 回國創 Moonshot 的決定,本身就是「把矽谷 frontier 思維帶回中國執行」這個世代敘事的縮影。他是 Transformer-XL 跟 XLNet 的共同作者,這兩個工作在 NLP 圈很有份量。
Kimi 最著名的是基於長上下文(Long Context)技術的智能助手,擅長處理超長文本(百萬字級)、高效聯網搜尋、報告總結與代碼編寫,定位為高效的 AI 生產力工具。
他們的工作流哲學是「Agent Loop + 開發者工作台優先」。
從官方文件看,K2.6 的 Agent Swarm 把 1 個複雜任務分解成 300 個 sub-agents 並行,端到端延遲降 80%。這比美國任何家公司都激進:Anthropic 的 Boris Cherny 同時跑 5 個 agents 已經算極端,Kimi 直接拉到 300。
更值得記的是 Kimi 的「Formula」概念。
用語義化 URI 調用短暫算力,把 Python 腳本轉成「可被 AI 一鍵觸發的瞬態工具」。其餘啟動、調度、隔離、回收都由平台處理。這等於把 Agent 工作流的「工具層」抽象到一個全新層級,開發者不用管基礎設施,只管定義工具。
相較於美系模型乾脆地讓使用者縮減 token,楊植麟有句豪語是:「Lossless long context is everything.」
他在押 long context 是 AI 時代的真護城河,因為 long context 才能讓模型真正記住用戶、累積數據飛輪。
數據的角色忽然出現了啊,這才是千人萬面,每個人因為做了不同的事情會有不同的面向。
他另一個豪語是:「如果你有 10 億的 context length,今天看到的問題都不是問題」。
Kimi 對外明確瞄準 Agentic IDE 這條線:官方文件直接教你把 Kimi 接進 Claude Code、Cline、RooCode 這些編程工具。這是「我們不做 ChatGPT,我們做開發者的下一代工作台」的清楚表態。
從應用資本看,Kimi 的價格策略明顯偏向開發者友善;在某些 cached input 場景下,成本可以低到每百萬 tokens 0.15 美元級,這使 long context + agent 工作流更容易被當成基礎設施來使用。
順便講一下旁邊的阿里家的通義千問,不要瞧不起他。
它走的是企業工作流編排這條線,阿里雲百煉的 Agent 2.0 直接把知識庫跟 MCP 統一成工具,由智能體自主規劃調用,且能展示完整的「規劃-執行-反思」過程。
它的 GitHub(Qwen-Agent / qwen-code)跟官方 docs 都很扎實,是中國這邊把「企業流程做成可編排智能體」做得最完整的一家。
我在中國四大選了豆包不選通義,主要是豆包能代表通義且更高一階(後面會講),但通義的 Agent 2.0 工作流值得 BI / 流程治理人單獨研究。
字節豆包:把 AI 接進真實世界長鏈任務
豆包目前已是中國最強勢的 AI 應用入口之一。根據 QuestMobile 的《2026 春季大報告》,截至 2026 年 3 月,豆包 MAU 已達 3.45 億,遠超第二名千問的 1.66 億與 DeepSeek 的 1.27 億。在春節檔期間,DAU 甚至一度突破 1 億。
更重要的不是某個單點數字,而是它已經證明:字節能把 AI 真正推進大流量、多場景、長鏈任務的現實入口裡。
豆包在模型多樣性、研究能力、製圖能力、費用上,都讓中國白領工作者離不開。
字節 Seed 官方博客把工作流哲學講得直白:
「使用者需求正從『獲得建議、查資訊』轉向『讓模型直接執行複雜工作流』」。
Seed1.8 是 generalized agentic model,支援資訊檢索、代碼生成、GUI interaction、complex workflows。Seed2.0 進一步強調,真實世界任務跨越更長時間尺度、包含多階段過程,現有 Agent 難以在這樣的跨度中自主構建有效工作流並積累經驗。
這個「跨時序、跨工具、跨部門」的執行層思維,是字節 vs Anthropic 最大的區別。Anthropic 在做的是「把方法論做成可被別人抄的對外資產」,字節在做的是「把 AI 接進現有大廠流水線、用規模證明可行性」。
字節這條線還有另個值得學的,它對年輕骨幹的高授權。
官方 Seed Early Career / Top Seed 頁面寫得很具體:Employee C、Employee Z、Intern R 各自參與 Seedance 2.0 預訓練架構、後訓練資料冷啟動、Data-Training-Evaluation 閉環、HybridFlow / COMET 等項目。
比起很多公司只會寫「在這裡改變世界」,字節這些案例其實更誠實,因為它讓你看到很早期的人就能進核心研發、研究與系統與資料與評測是整在一起的、公司把「能不能真的發 paper / 開源 / 做出 infrastructure」視為成果。
對我來說字節這個 case 最有殺傷力的是 Coze。它把 visual workflow 編排平台對外開源,引發中國「全民 Agent」狂潮。
從應用資本看,這非常字節:不靠 founder branding、不靠 craft 敘事,靠把工具開放讓開發者自發傳播。
字節值得學的不只是規模,是它把實習生也納入核心研發的高授權結構。規模只有大廠玩得起,但「給年輕骨幹研究自由 + 用 Data-Training-Evaluation 閉環定義工作」這套,任何 BI / 數據團隊主管都能借鑑。
美團 / 王興:70 後老兵的隱忍賭注
老兵不死,回來看看 70 後。
王興 1979 年生,是中國 70 後互聯網老兵裡最深思的戰略家。他過去兩年對 AI 的動作幾乎都低調,但動作之間有非常清楚的線。
最關鍵的事件是 2023 年王慧文的「光年之外」。王慧文是王興清華同寢室的 28 年好友,他離開美團去創 AI 公司,王興當時是天使投資人。後來王慧文因健康問題退出,王興沒走「投資觀望」這條安全路,直接全資收購這家公司。
這個動作裡同時有三層:兄弟情、戰略焦慮、AI 防禦戰。沒有一個 70 後 CEO 在 AI 上花過這麼大膽的錢。更值得記的是這條線後來沒死。
王慧文恢復後回到美團體系,以較適合身體條件的方式參與 AI 探索,王興對他的安排是顧問、新業務探索與 AI 方向支持,不是讓他重新扛經營責任。光年之外那種「AI 原生應用」的想法被轉換了宿主,從獨立創業變成美團內部 AI 應用實驗室的思想來源之一。
從應用資本看,王興的 AI 戰略是「加固本地生活護城河」。本地生活服務(外賣、到店)是極度依賴線下苦活的市場,這是美團的真護城河。
但抖音正在用算法跟短影音蠶食美團的到店業務。王興看 AI,是看它能否加固這道城牆。
具體的動作有兩條:B 端商家 SaaS 跟空間智能 + 無人配送。中國有幾百萬家夫妻肺片、街邊小店,他們不懂寫行銷文案、做活動,美團 AI 直接變成商家的 SaaS 助理。外賣小哥的人力成本見頂,AI 調度的無人配送網絡是下個十年的利潤來源。
這裡值得停下來講講(這不是 AI 用語,是我記憶超深的故事):美團做的這套「給夫妻肺片用 AI」,正是吳恩達 2023 年在 TED Talk「How AI Could Empower Any Business」裡描述的願景。
我還寫了一篇番外篇詳細講這個對照:矽谷的願景,在天邊的小店落地了嗎?:吳恩達 2022 TED 與 2026 美團現實。如果你對「AI 民主化」這個議題有興趣,那篇可以一起看。
但王興這個 case 跟 Sam Altman 形成另一種尖銳對照。
Sam 講賺明天的錢有人信、講理想也有人信。王興也會說自己兩邊兼顧,全資收購光年之外不就是賭下個世代嗎?但你聽完總覺得,他講的「下個世代」更像「為了保住印鈔機而不得不做的防禦」。這跟 Sam 講「abundance of intelligence」那種完全脫離商業的理想,質感上不一樣。
這不是王興不真誠。這是他這個世代的老兵共同的處境:他們建過印鈔機,所以他們懂印鈔機怎麼壞掉。他們對 AI 的押注永遠帶著「這是不是會幹掉我既有業務」的算計,這個算計讓他們的「下個世代敘事」永遠少一點純粹度。
跨世代的決策圖譜:四代人在同一張賭桌上
把上面美國與中國 8 家 AI 大廠拉開來看,會浮現一張很清楚的世代地圖。我寫到這裡特別小心一件事:世代不是一個排隊清單,而是一組角色類型。同一個世代裡有 CEO、有中段技術主管、有研究員,他們承擔的張力不一樣。所以下面這張圖,與其說是「人物盤點」,不如說是「角色類型」。
70 後老兵(西方的 Pichai、Musk、Nadella;中國的李彥宏、王興、雷軍):把 AI 當成切競爭對手蛋糕的刀,從既有印鈔機、既有場景、既有分發系統出發,用防守式方式押未來。
80 後中堅 CEO(Sam Altman、Dario Amodei、Demis Hassabis;梁文鋒、楊植麟、曹越):在前沿技術理想跟商業壓力之間做艱難 tradeoff。多數人卡在「兩邊都要但只有一邊被相信」,Sam 是少數做到「兩邊都被相信」的。
80/90 中段技術主管 / 實踐者(Anthropic 的 7 人、OpenAI 的 6 人、Hamel & Shreya 那批):這一層在西方非常厚,是真正把方法論做成可被複製工作系統的關鍵層。中國這層相對薄,不是沒有人,是工作哲學藏在技術博客、開源 repo、訓練框架裡,沒被翻譯成可被外行學走的人物敘事。
90 後 AI 原生新貴(楊植麟、Manus 創辦人):拿矽谷 frontier 思維 + 中國執行速度做組合,直接從新入口、新工作台、新 agent 形態切入,不被既有業務包袱綁住。
這張地圖最值得記的,是 70 後問「這個 AI 動作會不會幹掉我的業務」,新貴問「這個 AI 動作能不能讓我達到 AGI」。兩種問題、兩種人才庫、兩種資本配置邏輯。
對我來說,這張地圖的意義很實際:我不必選邊。70 後老兵的算計力是我可以學的,因為我也有「印鈔機要不要保」的處境;80/90 後新貴的押注力也是我可以學的,因為我有幾十年累積的判斷力可以判斷哪些押注值得跟。
我們這個世代的特殊位置是:可以同時帶著老兵的謹慎跟新貴的野心,做出兩邊都不放的決定。這就是「跨科技週期生還者」的隱形 leverage。
但你不能裝作不需要做這個選擇。否則,會在 18 個月內被同代裡有意識在選的人甩開。
工作流被重組的方式:Agentic system + Evals
Agentic system in group work
2026 年初我看到一篇印象很深的中國大模型討論,就是在講 Agentic system。
對我們非工程師來說,我們體感就能感覺到工作流逐漸在重組。寫週報、做分析、回 stakeholder、追進度,這些事情不再是「你 1 個人做 4 件」,可以是「你設計 4 個 agent,每個做 1 件,你做 quality control」,甚至是「我們整個團隊共同維護一組 skills,每次遇到不夠就寫一條新指令上去,每週每月再精簡一下」。
能設計這個 group work 架構的人,會比只執行單一任務的人更不焦慮,因為忙著改 agents 都來不及了,哪有時間焦慮。
(如果你想看「把多個工作流組成個人知識系統」的實作版本,我之前寫過用 Claude Cowork 從散落筆記蓋出 51 張知識卡片的整個流程,那篇就是 group work 思維的具體應用。)
這些東西的共同 DNA 是:從單一 agent 做單一任務,轉向多個 agent 協作做長鏈跨工具任務。這不只是技術升級,是對「工作」這件事本身的重新定義。以前一個工作流要一個人從頭做到尾,現在一個工作流可以由多個 agent 分工、人類只在關鍵節點介入。
把 8 家公司放在一起對照,會發現大家都在做同一件事,只是叫法不同。
Anthropic 的 Boris Cherny 同時跑 5 個 agents、Cat Wu 講 Multi-Agent Orchestration;Anthropic 的 Amol Avasare 把成長實驗自動化成 CASH 系統;OpenAI 的 Kevin Weil 講 model ensembles,不同模型在速度成本能力上各司其職;Kimi 的 Agent Swarm 拉到 300 個 sub-agents;字節 Coze 的 visual workflow 編排平台;DeepSeek 的 reasoning + tool-use 共存 runtime;美團 LongCat 把 Agentic Search、Tool Use、TIR 整合進一個 agent engine。
字節 Seed 官方博客那句話講得最清楚:「使用者需求正從『獲得建議、查資訊』轉向『讓模型直接執行複雜工作流』」。
Evals:把直覺判斷轉成可測試的問題
OpenAI 的 Kevin Weil 講 evals 是 PM 新核心技能,其實就是 evaluations 的簡寫。
Evals 的本質是:把「直覺判斷」轉成「可測試的 yes/no 問題」。
你以前覺得「這份分析報告寫得好不好」是個感覺,現在你必須拆成「有沒有提到 KPI A」「有沒有用對的時間範圍」「有沒有給可執行的 next step」這幾個可測的 binary 問題。
這個方法論為什麼跨國跨世代共通?因為它解的是 AI 時代特有的問題:非確定性。所有用 LLM 的公司都會撞到這道牆:模型每次回答可能不一樣,你沒辦法用傳統 unit test 驗證。Evals 是這道牆的解。
對非工程師職場人的鏡子作用是:你過去靠經驗累積的「我覺得這樣對」的判斷力,現在必須轉成可外傳的 evals。這聽起來像是降級,把品味量化成規則。但其實是升級,你的品味從「跟你綁在一起的個人資產」變成「可以給團隊跟 AI 共用的組織資產」。
Anthropic 的 Cat Wu 講 PM 不寫 PRD 改寫 evals。DeepMind 的官方 Playbook 直接把 evals 列為「AI 時代的客戶滿意度調查」。Hamel Husain 跟 Shreya Shankar 在 Maven 開的 evals 課訓練了全產業。
中國這邊雖然不像西方有那麼明確的「evals」字眼,但 DeepSeek 的 strict mode + schema、字節 Seed 的多階段任務評測、Kimi 的 Agent Loop 穩定性,本質上都是同一套 evals 思維。
(如果你想知道「把 SOP 寫給 AI」這件事的入門版本,可以看我寫的Gems / GPTs / Skills 的對照,那是 evals 思維的最簡入門。)
收束:跨週期生還者的隱形 leverage
8 家公司講完,4 個世代圖譜畫完,我自己最大的收穫不是某個英雄人物的觀察,而是一個更素樸的感覺:這個時代的物種比我原先想像得多很多。不只美國有,亞洲也有。曹越、Zeabur 的林沅霖,都是 AI 原生世代的創業與工作思維長出來的物種。
對我們這些前 AI 時代長大的人來說,這個多樣性本身就是訊息。最容易做的反應是投資,買 NVIDIA、追 AI 概念股,這條路我也在走。但除了投資之外,趁這波還能學什麼?
我目前的觀察是角色躍遷這件事最關鍵:
從「我會用 Claude / GPT」變成「我能設計一個讓 5 個 agent 替我跑、我做品管的工作流」。前者是消費者,後者是工作者。從「我的個人判斷力很值錢」變成「我的判斷力能不能變成系統」。從「我做出一份對的分析」變成「我設計出一台能持續產出對的分析的機器」。
這件事不需要你是 AI 公司的 CEO、不需要你會寫程式、不需要你搬到矽谷。你只需要在你現在這份工作裡,開始做。這就是「跨科技週期生還者」的隱形 leverage 真正能變現的地方。
我這代前 AI 時代長大的職場人,多了跨週期記憶。看過 PC 時代、互聯網時代、行動網路時代的工作流如何被重組、誰賭錯了、誰賭對了。這個記憶本身就是判斷力。
但我們也缺少。我的本能還常停在 chat 模式還是個消費者,沒進到協作模式的工作者。
如果這篇有 500 個人看,我會開始試著沉澱一組方法論,是給我們的手繪地圖,紀錄怎麼往前推進,紀錄那些跑到前面的人怎麼做的。
有些文章我寫起來只是為了自己,沒啥人看,就像石頭丟到深淵裡面。但我知道回音是有的:你在讀,就是那個回音。
📬 想繼續看下去?
這是「AI 時代給非工程師的工作 4 講」的第一篇。如果你想看接下來三篇(美中工作流深度版、可立刻上手的 AI 工作方式),可以訂閱電子報,新文章發布時你會收到通知:
🤝 想要有人陪你做這場轉型?
如果你正在思考自己團隊的工作流要怎麼重組、哪些事情該交給 AI、哪些評估指標需要設計,歡迎直接寫信到 erica.yojuhsu@gmail.com,或是看一下我目前的諮詢與課程方向。