OpenViking 语义搜索
火山引擎开源的 AI Agent 上下文数据库
为 OpenClaw 提供高级语义搜索和知识管理能力
核心能力:语义文档搜索、分层上下文、自动摘要、长期记忆存储与跨会话知识共享
新增能力
1. 语义搜索与 RAG
- 语义文档搜索 - 基于向量相似度的智能检索
- 分层上下文 - L0摘要 / L1概览 / L2全文,按需加载节省 Token
- 多格式支持 - PDF、Word、PPT、Excel、Markdown、HTML、EPUB 等
2. 知识管理
- 文档索引 - 自动提取和索引文档内容
- 自动摘要 - VLM 自动生成文档摘要和概览
- 目录浏览 - 类似文件系统的资源组织方式
3. 记忆增强
- 长期记忆存储 - 持久化存储对话历史和关键信息
- 智能检索 - 自动提取对话中的长期记忆
- 跨会话记忆 - 不同会话间共享知识库
使用方法
初始化
# 初始化 OpenViking 数据库
python3 /root/.openclaw/workspace/skills/openviking/viking.py init
python3 /root/.openclaw/workspace/skills/openviking/viking.py init
添加文档
# 添加单个文件
python3 /root/.openclaw/workspace/skills/openviking/viking.py add /path/to/file.pdf
# 批量添加目录
python3 /root/.openclaw/workspace/skills/openviking/viking.py add-dir /path/to/docs
python3 /root/.openclaw/workspace/skills/openviking/viking.py add /path/to/file.pdf
# 批量添加目录
python3 /root/.openclaw/workspace/skills/openviking/viking.py add-dir /path/to/docs
搜索文档
# 语义搜索
python3 /root/.openclaw/workspace/skills/openviking/viking.py search "查询内容"
python3 /root/.openclaw/workspace/skills/openviking/viking.py search "查询内容"
分层上下文机制
L0 - 摘要层
文档整体概要,最精简的语义表示
低Token消耗L1 - 概览层
章节级别的内容概览,平衡精度与效率
中等Token消耗L2 - 全文层
完整文档内容,最高精度的语义表示
高Token消耗适用场景
- 📚 知识库构建 - 将大量文档转化为可搜索的知识库
- 🔍 智能问答 - 基于文档内容的精准问答
- 💾 记忆增强 - 长期记忆存储与跨会话检索
- 📝 文档分析 - 自动摘要、关键词提取、内容分类
📚 参考资料
- OpenViking GitHub - 火山引擎开源项目
- 火山引擎 - 字节跳动旗下云服务平台
- RAG论文 - Retrieval-Augmented Generation