0%

基于大语言模型LLM+知识库KB实现的问答系统-5.获取嵌入向量[智能客服][NLP][LLM]

当前章节:获取嵌入向量
目录导航

介绍

获取嵌入向量是使用模型的第一个部分,主要包括文本块和用户提问内容两个部分。我们将文本分割后会得到文本块,利用专门的embed模型或者直接通过llm嵌入,最终将所有文本块转为向量,向量、文本、数据库ID作为一个信息结点。使用向量数据库存储向量。

用户提问后,先将问题转为嵌入,从数据库查找最近的结点,返回ID对应的文本块即可。一同交付给模板打包即可。

嵌入模型

  1. 本地语言模型如bert、text2vec、word2vec
  2. 接口embedding模型如openai-embedding,chatglm的embedding层

嵌入方法

常用方法是将文本的word的词向量求mean

测试

总结