0%

基于大语言模型LLM+知识库KB实现的问答系统-4.向量数据库[智能客服][NLP][LLM]

当前章节:向量数据库
目录导航

介绍

向量数据库是实现本地知识库的必备数据库。传统数据库是一种面向业务的数据库类型,不适用存储向量,以及快速相似查找。我们将文本分割后,通过text2vec模型将文本转为向量存储,与问题的向量比较相似度,最后选出topk实现信息匹配查找。

原理

向量数据库最重要的两点就是向量存储和最大相似度查找,一般向量数据库会使用KNN来实现最近邻的向量查找。

现有数据库

  1. annoy:小型数据库,仅CPU,1M条向量建树10min+,查找需要10ms级时间,响应较快
  2. faiss:支持GPU加速,数据量越大,性能越优,支持批量插入和查询
  3. milvus:不仅仅向量查询,提供了完整的数据库的业务支持,开源,建议大型项目使用。

测试

总结

项目测试时可以使用annoy数据库测试,在实际配置时可以为多个数据库实现接口。