当前章节:获取嵌入向量
目录导航
介绍
获取嵌入向量是使用模型的第一个部分,主要包括文本块和用户提问内容两个部分。我们将文本分割后会得到文本块,利用专门的embed模型或者直接通过llm嵌入,最终将所有文本块转为向量,向量、文本、数据库ID作为一个信息结点。使用向量数据库存储向量。
用户提问后,先将问题转为嵌入,从数据库查找最近的结点,返回ID对应的文本块即可。一同交付给模板打包即可。
嵌入模型
- 本地语言模型如bert、text2vec、word2vec
- 接口embedding模型如openai-embedding,chatglm的embedding层
嵌入方法
常用方法是将文本的word的词向量求mean