我們在多個企業專案中採用三層語料架構:靜態知識、半結構化文件以及高頻動態事件,並透過 Milvus 搭配 PostgreSQL 進行 metadata join。這使得查詢可以先用 metadata filter,再交由向量檢索精確比對。
- 使用 HuggingFace sentence-transformers(如 bge-large-zh)處理中英雙語語料,並建立版本化的嵌入索引。
- 長文件先以 trafilatura 切段,再以凝縮 Prompt 降抽象度,確保回答聚焦關鍵細節。
- 透過 Redis Semantic Cache 結合 cosine similarity,只要相似度高於 0.9 便直接回傳快取結果。
# Workflow
查詢 → Metadata 過濾 → 向量檢索 → Re-rank → 語意快取 → LLM 回覆