• 商業分析
  • AI實戰筆記
  • 行銷洞察
  • 閱讀與思考
  • 關於我
  • 商業分析
  • AI實戰筆記
  • 行銷洞察
  • 閱讀與思考
  • 關於我
AI 實戰筆記
  • 文章總覽
  • 分類
  • 閱讀與思考 (128)
    • 自己學習 (53)
    • 談判 (4)
    • 電信冷知識
    • 小訪談
    • 生活 (28)
  • 行銷洞察 (32)
    • AI 實戰筆記 (18)
      • 商業分析 (10)
        徵文 (0) 書單 (0) 楊斯棓 (1) 胡志明市 (0) 飛車搶劫 (0) Grab (0) 一談就贏 (2) 談判 (1) facebook (0) skin-care (0) 社群 (0) 信用貸款 (0) 利率 (0) 小額貸款 (0) 得到 (2) 數位金融 (0) 風險 (1) 香帥 (0) 終身學習 (2) 4A (2) 5A (2) AIDA (2) Funnel (1) Kotler (2) Marketing4.0 (1) 口碑 (2) 行銷4.0 (1) 轉換率 (2) 品牌行銷 (5) 廣告文案 (1) 故事學 (0) 行銷 (9) 成長心態 (0) 賽斯高汀 (0) Branding (1) PMO (1) position (1) 品牌 (5) 品牌無用 (1) 定位 (1) 劉潤 (1) 得到app (1) 創業 (1) 矽谷 (1) 臉書 (1) 大數據 行銷 演算法 恐怖谷 周哈里窗 (1) FMCG (1) 創投 (1) 消費性產業 (1) 生鮮 (1) 1984 (1) Apple (1) 品牌個性 (1) 品牌理念 (1) 品牌符號 (1) 品牌訊息 (1) 行銷學 (6) 千禧世代 (1) 嬰兒潮世代 (1) 數位行銷 (1) 價格 (0) 定價 (0) 廣告 (0) 文案 (0) NGO (1) 理財 (1) Alex Cheng (1) 銷售漏斗 (1) 銷售贏家 (1) 橘玲 (3) 生存策略 (2) 社會不公 (2) 數據分析 (1) 數據洞察 (1) Zozo (1) 信念 (1) 前澤友作 (1) 商業決策 (1) 國民品牌 (1) 日本企業 (1) 環球影城 (1) 迪士尼 (1) 國際英語,線上會議,自我介紹與打招呼,Small_Talks,主持,派工,開會的技巧 (0) 邱強博士,零錯誤,SOP優化,創意工作者,知識工作者,五顆彈珠,驢子都能執行的SOP,五個比兩個好, (1) 社會生存力 (Social Survival Skills),哈佛教育 (Harvard Education),快速寫作 (Qu (1) Amy Edmondson (1) 團隊動力學 Team Dynamics (1) 團隊自信 Team Confidence (1) 心理安全感的力量 (1) 無畏的組織 Fearless Organization (1) 賦能 Empowerment (1) 領導 Leadership (1) 得到app,羅振宇,羅胖,時間的朋友,自我賦能,轉型,科技未來,AI影響,個人成長,克服行業挑戰,逆境中保持動力 (1) 二手銷售 (1) 經營策略 (1) KeithDevlin (0) 吳軍 (0) 數學思維 (0) 數學教育 (0) 邏輯思考 (0) 台灣史 (1) 平路 (1) 身份認同 (1) PDCA (1) 安藤廣大 (1) 指標 (1) 數值化 (1) 老手 (1) 行動量 (1) 現代孤立 (1) 經濟不平等 (1) DevOps (1) IT運營 (1) Remove term: DevOps (1) 合作 (1) 效率提升 (1) 敏捷 (1) 現代開發 (1) 生產力 (1) 運營管理 (1) 開發與運維 (1) 非IT人員 (1) 鳳凰專案 (1) 21世紀資本論 (1) 何帆 (1) 社會經濟不平等 (1) 簡化經濟學 (1) 經濟學 (1) 經濟學入門 (1) 經濟學導讀 (1) 經濟學理解 (1) 資本不平等 (1) 資本主義分析 (1) 資本主義批判 (1)
        1. 首頁
        2. 部落格
        3. 番外一:電商搜尋技術三代拆解——從 BM25 到 LLM,一個麻瓜的學習筆記

        番外一:電商搜尋技術三代拆解——從 BM25 到 LLM,一個麻瓜的學習筆記

        2026 Mar 23 AI 實戰筆記
        內容目錄
        1. 搜尋系統的六步驟 Pipeline
        2. 技術的三代演進
          1. 第一代:關鍵字比對 + 查詢理解層(BM25 + Query Understanding)
          2. 第二代:向量語意搜尋(Dense Retrieval)——向量搜尋不是萬靈丹,混合搜尋(Hybrid Search)才是及格線
          3. 第三代:LLM 查詢理解 + 對話式商務——後台的苦工與前台的革命
        3. 基礎建設:一個能持續優化的搜尋系統需要什麼
          1. 資料層
          2. 模型層
          3. 工程層
          4. 評估層——沒有它,其他都是盲目投資
        4. FAQ 
        5. 參考資料

        番外一:電商搜尋技術三代拆解——從 BM25 到 LLM,一個麻瓜的學習筆記

        這篇是〈我們的搜尋無所獲,是平台的商業選擇〉的技術番外。主文聚焦商業分析,這篇把技術細節完整展開,包含搜尋系統的六步驟 Pipeline、三代演進的工程邏輯、以及一個能持續優化的搜尋系統需要的四層基礎建設。


        搜尋系統的六步驟 Pipeline

        說是技術,但以我麻瓜等級的理解來看,其實就是三步驟、六動作的 Pipeline:

        • 輸入、理解:輸入到一半甚至還沒輸入,預測要查什麼、錯別字友善。
        • 改寫、比對:錯字改對後,決定是品類還是品牌,跟商品或品牌關鍵字做比對。
        • 召回、排列:吐出幾個比對結果,按照事先設計的權重排優先順序。

        技術的三代演進

        第一代:關鍵字比對 + 查詢理解層(BM25 + Query Understanding)

        第一代搜尋的基礎是 BM25(一種機率式文字比對公式),這也是 Elasticsearch 最常用的預設演算法。

        它的運作邏輯很直觀:把用戶的查詢詞拆成 token(詞根),在資料庫裡找包含這些 token 的商品,再根據詞頻打分。

        BM25 有一個根本的數學假設:用戶輸入的詞,必須跟商品描述的詞一模一樣。

        這個假設在英文有空白斷詞的環境下運作良好,但在繁體中文卻是一場災難。

        為了應對中文,Elasticsearch 內建的 CJK 中日韓分析器通常採用 bi-gram(雙字節)切割法:把相鄰的字兩兩切開。

        所以,「遙控器」會被切成「遙控」「控器」;而注音錯字「搖控器」則會被切成「搖控」「控器」。

        從演算法的角度來看,「遙控」和「搖控」是兩個完全無關的 token。

        這就解釋了為什麼搜「搖控器」跑不出原本的「遙控器」商品:因為這兩個 token 的比對分數落差極大。

        陷入「維護地獄」的查詢理解層(QU)

        為了彌補這個演算法的死板,工程師會在前面加上一層「查詢理解層(QU)」。

        在標準的系統架構中,處理「搖控=遙控」、「蘋果15=iPhone 15」並不是什麼高深的 AI 技術,而是透過建立「同義詞字典(Synonym Dictionary)」與「正規化規則」來解決。

        理論上,只要把這本字典建好,第一代搜尋也能做到很精準。但在台灣電商的落地實境中,這成了無解的困境:

        1. 開源字典水土不服:最常用的 jieba 斷詞庫偏重簡中語料;中研院的 CKIP 是學術語料訓練出來的,根本不懂什麼是「神仙水」或「老爹鞋」。
        2. 詞典維護是勞力密集的人力活:電商語言是活的,每週都有新造詞、新品牌、特殊規格出現。要維持第一代搜尋的精準度,平台必須養一組專職團隊,天天分析 user log,手動更新同義詞與錯字庫。(現在也可以靠Agent, 但還是要有人去寫需求,磨內容)

        台灣各平台的搜尋之所以難用,往往不是卡在演算法的極限,而是卡在維運的貧窮。

        當平台不願意投入資源去持續維護、擴充專屬的「繁中電商詞典」時,最基礎的同義詞轉換就會失效,最終把演算法斷詞的數學結果(搜出毫不相干的商品),赤裸裸地丟給消費者承擔。


        第二代:向量語意搜尋(Dense Retrieval)——向量搜尋不是萬靈丹,混合搜尋(Hybrid Search)才是及格線

        第二代技術引入了向量語意搜尋(Dense Retrieval),將查詢詞與商品轉化為高維度向量,透過計算空間距離(餘弦相似度)來判斷相關性。

        這確實帶來了突破:系統不再死守字面一致,模型能自動從語料中學到「想吃辣的」與「麻辣鍋」在語意上高度重疊。

        然而,若盲目迷信 AI,純向量搜尋在電商場景會引發災難。它有一個關鍵弱點:「語意相近」絕對不等於「規格相同」。

        當消費者精準搜尋「iPhone 15 Pro Max 256G 深空黑」時,純向量模型會因為 512G 或原色鈦的款式在「語意上極度相似」而將其大量召回,這對想買特定型號的用戶來說完全是干擾。

        在這種強烈依賴精確匹配的查詢上,第一代的 BM25 反而具備不可替代的優勢。因此,當今工程界的最佳實踐(Best Practice)是實施 Hybrid Search(混合搜尋):

        讓 BM25 與向量搜尋雙軌並行,各自召回候選商品。系統在重新排序(Re-ranking)階段,透過權重融合來決定最終版面:

        • 精確型號拉高 BM25 的權重;
        • 面對「送媽媽的禮物」這類模糊意圖,則拉高向量信號的權重。

        這並不是遙不可及的黑科技,韓國電商巨頭 Coupang 也是基於此思路打造搜尋引擎。

        真正的卡點:繁中電商語料的在地化微調

        架構可以買,但「領域認知」買不到。

        市面上通用的中文向量模型大多基於簡體語料訓練,且通用語意與電商語意存在巨大鴻溝。例如,在美妝購物的語境裡,「奶油」指的是保養品的乳霜質地,而不是食材。

        台灣平台若只套用開源的向量架構,卻不投入資源與算力,拿自己獨有的「繁中電商語料」去對模型進行領域微調(Domain Fine-tuning),其向量召回的品質必然大打折扣。

        說穿了,混合搜尋的框架只是骨架,那顆經過百萬筆台灣真實交易數據微調過的向量腦,才是別人偷不走的護城河。


        第三代:LLM 查詢理解 + 對話式商務——後台的苦工與前台的革命

        許多人對第三代搜尋的幻想,是在 App 裡放一個無所不知的 AI 助理。但現實是,大型電商的第三代技術發展,目前必須走向截然不同的「雙軌制」:

        軌道一:隱身後台的 LLM 基礎設施(以淘寶 BEQUE 為例)

        在百萬級流量的電商首頁,每一次搜尋都呼叫 LLM 進行即時推理,不僅會輕易擊穿 P99 < 200ms 的延遲防線,消耗的 API Token 成本更會直接吃掉已經很微薄的訂單毛利。

        真正具備商業可行性的做法,是把 LLM 當作「離線的資料工人」。

        如淘寶的 BEQUE 框架,是利用大模型在「離線端」大量閱讀 user log,清洗並提煉出「長尾查詢 → 精準關鍵字」的改寫規則(例如把「送媽媽的實用禮物」轉譯為「肩頸按摩儀、保養品套組」),再將這些輕量化的規則部署回第一、第二代的檢索系統中。

        這才是兼顧 AI 語意理解,同時死守維運成本的工業級最佳實踐。

        軌道二:徹底顛覆 UI 的對話式商務(以 inline 為例)

        當 AI 走向前台,它改變的就不再是「搜尋框」,而是徹底消滅搜尋框。

        台灣本土最接近這個型態的案例是 inline 的 AI 訂位小助手。用戶的真實需求往往不是「輸入關鍵字找結果」,而是「描述情境,讓 AI 幫我決定」。當用戶輸入「週五晚上兩人聚餐有什麼推薦?」,AI 必須同時處理意圖理解、即時空位資料整合,並在對話中直接完成交易。

        這揭示了一個殘酷的現實:傳統電商的「關鍵字搜尋框」是建立在「用戶知道自己要找什麼」的假設上。當 LLM 普及,消費者越來越習慣用自然語言表達模糊需求時,固守傳統搜尋框的平台,將會連用戶的真實意圖都接不住。


        基礎建設:一個能持續優化的搜尋系統需要什麼

        站內搜尋不是寫 demo 做開心的 vibe coding,而是一個需要 24 小時不斷水不斷電、持續優化的維運系統。一個能運作的工業級搜尋,必須具備四層基礎建設。

        資料層

        • 商品索引管道(Ingestion Pipeline):從商品資料庫到搜尋索引的持續同步機制。台灣電商每天商品異動量以百萬計,索引延遲是基礎中的基礎。
        • 用戶行為日誌(Behavioral Log):每一次搜尋、點擊、購買、放棄,都必須被完整記錄:這是 Learning-to-Rank 模型的訓練資料來源,也是為什麼 Google 搜尋有登入後會越來越準(雖然很多人不喜歡)。沒有行為日誌就沒有辦法讓排名模型學習哪個結果相關、哪個不相關。

        模型層

        • 繁中電商斷詞器:不是通用的 jieba,是針對電商語料微調過的版本,詞典需定期更新。
        • 同義詞展開模型:又可以分成規則型與統計型。規則型應對已知問題,統計型從搜尋日誌自動學習長尾問題。
        • 電商領域微調的繁中向量模型。
        • Learning-to-Rank 排名模型:整合 BM25 分數、向量相似度、點擊率、轉換率、個人化訊號,持續用行為資料再訓練。

        工程層

        • 延遲與可用性:業界標準 P99 延遲 < 200ms,SLA 99.99% 可用率。
        • 向量索引服務:百萬級商品庫必須用 HNSW 或 IVF 等近似最近鄰演算法。
        • 後門介入系統(Merchandising Override):允許 PM 人工干預特定查詢的排名,是搜尋工程和商業需求之間的緩衝層。

        評估層——沒有它,其他都是盲目投資

        大多數團隊將精力花在前三層,台灣電商的搜尋技術停滯近十年,真正致命傷恐怕在於長期忽視了「評估層(Evaluation Layer)」。

        當團隊無法將隱性的「搜尋失敗代價」精準轉化為「流失的 GMV 金額」時,工程師就永遠拿不出數據,去抵抗純廣告變現邏輯對搜尋品質的無底線反噬。

        沒有量測,就沒有商業投資。

        一個合格的評估層必須包含:

        • 核心指標監控:零結果率(Zero Result Rate)、搜尋放棄率。這些數據直接對應著「流失的潛在營收」。
        • 排序品質指標:如 nDCG(歸一化折損累積增益),用數學客觀評估「最相關的商品是否排在最前面」。
        • A/B 測試框架:能夠同時跑多組策略,並將搜尋行為精準歸因到最終的 CTR、轉換率與 GMV 貢獻。
        • 離線評估套件:大量固定測試查詢,涵蓋高頻、長尾、注音錯字、中英混合,配上人工標注的相關性標準。

        業內有句殘酷的玩笑:「沒有搜尋品質量測,就只能靠老闆半夜搜了一個詞發現結果很爛,才開始修。這是消防,不是工程。」


        FAQ 

        Q:什麼是 BM25?為什麼它在中文搜尋會出問題?
        A:BM25 是一種機率式文字比對演算法,假設用戶輸入的詞必須跟商品描述完全一致。英文靠空白斷詞沒問題,但中文沒有天然邊界,「遙控器」和注音錯字「搖控器」被切成不同 token 後,演算法認為毫無關聯。

        Q:什麼是 Hybrid Search(混合搜尋)?
        A:讓 BM25(字面比對)和向量語意搜尋雙軌並行。精確型號查詢拉高 BM25 權重,模糊意圖查詢拉高向量權重,再透過 Re-ranking 融合最終結果。這是目前電商搜尋的業界最佳實踐。

        Q:為什麼不能直接在電商搜尋框裡用 LLM?
        A:貴和慢。成本和延遲。電商搜尋的業界標準是 P99 延遲 < 200ms,百萬流量下每次都呼叫 LLM 會擊穿延遲防線,API Token 成本也會吃掉訂單毛利。實務做法是把 LLM 當離線工人,提煉改寫規則再部署回前兩代系統。

        免責與邀請

        我不是搜尋工程師,也不在電商產業工作。這篇文章的內容來自公開資料的研究、技術文獻的閱讀、業內人士的請教,以及身為消費者的實測與交叉驗證。

        如果業內專家讀完覺得「不是這樣,我們早就做了,問題比你想像的複雜很多」——非常歡迎指正。寫這篇的目的就是把問題攤開來看,如果有人能補上我看不到的那一面,這篇文章就更完整了。

        來信:erica.yojuhsu@gmail.com


        參考資料

        1. YWC 科技筆記 — ElasticSearch 打造搜尋產品的經驗談 (2024)(大推,簡潔扼要) https://ywctech.net/tech/build-search-products-using-elasticsearch-notes
        2. Coupang Engineering Blog — Fueling the Coupang Search Engine (2024) https://medium.com/coupang-engineering/the-evolution-of-search-discovery-indexing-platform-fa43e41305f9
        3. Wenjun Peng et al. — Large Language Model based Long-tail Query Rewriting in Taobao Search, WWW '24 (2024) https://dl.acm.org/doi/abs/10.1145/3589335.3648298
        4. Baymard Institute — E-Commerce Search UX Benchmark (2024) https://baymard.com/research/ecommerce-search

        📎 回到主文:我們的搜尋無所獲,是平台的商業選擇

        番外二:台灣電商搜尋的 SaaS 市場機會:3,000 家客戶與 6,000 萬的起步估算

        番外三:當搜尋框不是正確工具:旅遊平台與社群平台的搜尋問題

         

          • 分享此文章
          0則留言

          相關文章

          AI 為什麼連「開門」都畫不好?原來是空間理解天生缺件

          AI 為什麼連「門打開、兩個人站前後」都畫不好?原因不是 AI 笨,而是它根本沒學過空間感,只能用語意猜圖,於是畫出各種奇妙怪圖。

          • 2026 Jan 08

          《郵報・密戰》中的談判場景

          • 2018 Jun 18

          如何做好聽講筆記?你不知道的強力學習法(練習篇)

          數位時代如何優化筆記流程?比較Notion、Obsidian、Roam Research等工具,探討雙向連結、知識圖譜與卡片盒筆記法(Zettelkasten)。從傳統筆記升級到個人知識管理系統。

          • 2019 Dec 02

          會不會說故事,差了 1200個人的生存機會

          • 2022 Jul 24

          最低的水果摘完後 -- 參加網路讀書會的N種姿勢

          • 2018 Mar 09

          《得到app 黃海 中國消費產業12講》

          • 2020 Jan 27

          關於我

          • 關於我_Erica 許幼如

          聯絡我們

          • 隱私權政策
          COPYRIGHT© All rights reserved | Powered by 路老闆