← 返回工具箱
🪵 RAG文档切片预览

粘贴文档,预览RAG切片效果

切片策略

500
黄色高亮部分为与相邻切片的重叠区域,帮助保留跨切片语义连续性。
切片结果将在此显示,每个切片以彩色卡片呈现。

📖 RAG切片策略详解

什么是RAG(检索增强生成)?

RAG(Retrieval-Augmented Generation)是一种将外部知识库与大语言模型结合的技术架构。它将文档切分为小块(Chunk),向量化存入数据库,在用户提问时检索相关Chunk,再将其拼入Prompt供LLM生成答案。

四种主流切片策略对比

策略原理优点缺点适用场景
固定字数按固定字符数硬切实现简单,切片均匀可能切断句子/段落,语义不完整快速原型验证
按句子以句号等标点为边界语义完整,保留句子结构句子长短不一,切片大小不均新闻、文章、FAQ
按段落以空行/换行为边界主题完整,保留段落逻辑段落可能过长或过短技术文档、书籍章节
滑动窗口固定窗口+重叠步进保留跨边界上下文,召回率高存储量增加,有重复内容合同、需要上下文的文档

切片大小选择建议

场景推荐大小说明
问答系统200~500字符粒度小,精准匹配
文档摘要500~1000字符保留足够上下文
长文分析1000~2000字符章节级别切分
代码文件按函数/类切分保留代码语义单元

重叠(Overlap)的作用

滑动窗口中的重叠区域确保处于切片边界的关键信息不会丢失。通常重叠设置为窗口大小的10%~20%。过大的重叠会显著增加存储和检索成本。

滑动窗口参数:

步长 = 窗口大小 - 重叠大小
切片数 ≈ (文档长度 - 重叠大小) / 步长

例:文档2000字,窗口500字,重叠100字
步长 = 400字,切片数 ≈ (2000-100)/400 ≈ 5个

向量化与检索

切片完成后,每个Chunk会通过Embedding模型(如text-embedding-ada-002、BGE、M3E等)转换为高维向量,存入向量数据库(如Milvus、Pinecone、Chroma、FAISS)。检索时计算查询向量与存储向量的余弦相似度,返回Top-K最相关的Chunk。

💡 最佳实践:切片策略没有银弹,建议针对具体业务数据进行实验。可以用Recall@K、MRR等指标评估检索效果。同时注意:切片过小会丢失上下文,切片过大会引入噪声、降低精准度,并占用更多上下文窗口。