Coze知识库教程:使用飞书文档作为知识库的数据源
一、前言
目的
学习如何在coze平台上将飞书文档作为知识库的数据源
目标
- 利用coze和飞书文档和某招生入学服务系统的帮助信息,实现一个智能客服,用于回答与平台使用相关的问题。
- 尝试多种格式的文档,文本,文本+图片,表格,图片格式的飞书内容,并查看召回效果。
- 搞清楚应该如何处理知识库内容,如何给知识库分段。
注:本篇教程更多是如何操作将飞书文档作为coze的知识库,以及测试知识库的召回效果。
二、操作步骤
飞书设置
开通coze
coze的中文名是“扣子”。
先进入飞书的管理后台
选择应用管理
搜索扣子
再点击图表进行启用和配置
创建知识库
进入知识库页面后点击右上角,新建知识库
根据需求选择知识库模板,我这里就选择空白知识库
image.png
点击下一步,并输入知识库名称
点击创建,完成知识库的创建。
添加文档
添加一篇文档,内容大致如下
设置知识库权限
设置文档权限
这里可以根据你的实际需求选择,然后确定
到这里飞书文档设置就已经完成了!
coze设置
创建知识库
进入coze的知识库标签
右上角,创建知识库
选择飞书文档
可以根据自己的情况选择,如果你还不太了解分段逻辑可以选择自动分段,否则你也可以自己设定分段规则
处理中,我们可以点击确认,等待它后台分割完毕。
我们可以看到它将这注意事项分成了两部分。
我们输入搜索词尝试召回效果
我们看到,分割效果并不好。
可以使用编辑功能,手动的处理一下分段效果
多余的内容可以删除,也可以不删除,毕竟RAG的分割策略中大多会使用前后都有一些额外的重复的字符以尽可能的保证内容的完整
创建Agent
添加知识库
三、测试
直接包含关键词
返回正常
包含相关词
也能返回正常内容
增加了多分文档
找到了相关内容,并且根据得分确实找到了更相关的内容
文档中包含表格
原文内容如下:
分段后
并没有获取到相关内容
使用表格格式
将刚刚的电话放到表格中而非文档。
并建立一个表格类型的知识库
篇幅原因就不详细的介绍如何创建表格类型的知识库了,以后专门出教程说明
给Agent增加一个新的技能
回答是正确的
回答正确
可以看到他是通过SQL语句来查询表格的内容的。
还根据相关性获取了表格中的一条数据。
文档中包含图片
文档内容如图
分割处理后图片就只是在文档中,无法获取图片中的详细内容。
尝试搜索图片内的文字
使用图片类型的知识库
标注内容也只是对这个图片的描述,并没有内容的详情。
使用图片作为搜索条件
看来图片并没有做embedding
四、总结
- coze导入飞书文档需要先配置飞书文档的coze应用。
- 需要设置飞书文档的访问权限。
- 需要区分文档是文本格式还是表格格式。
- 不能获取图片的内容。
- 不能以图搜图。
- 能够进行相关性搜索。