一旦我们抓取了数据,并不是所有信息都会传递给 AI 模型。我们有一个过滤系统,可确保在响应生成中只使用最相关的文档或数据块。我们在这里使用多种技术——向量相似度、相关性评分和关键字匹配——来过滤掉不相关或冗余的信息。
我们方法的另一个关键部分是在将文档发送给 OpenAI 之前对其进行整理。我们不会将一堆抓取的数据扔给模型,然后希望得到最好的结果。相反,我们会根据相关性对文档进行排序,确保 AI 首先获得最有用、上下文最准确的信息。
从文档中提取多个匹配的段落时,我们会按正确的顺序排列它们。想象一下,如果你从故事中得到几个段落——如果段落杂乱无章,故事就说不通了,对吧?它需要遵循相同的时间顺序才能保留其含义。
这种过滤和排列系统使人工智能更加高效和准确。结果呢?答案更精确,响应时间更快,错误更少。
步骤 4:确保上下文相关性
人工智能搜索面临的最大挑战之一是确保响应与上下文相关。这是许多系统都无法做到的,尤其是在处理复杂对话时。
例如:
助手:欢迎使用美国公路之旅 AI 助手!
用户:美国最受欢迎的公路旅行路线是哪条?
助手: 66 号公路是一条著名的公路,从芝加
我们如何衡量答案的准确性
哥延伸到圣莫尼卡,全长 2,400 英里。
用户: 66 号公路沿途有哪些必看的站点?
助理:一些受欢迎的景点包括亚 波兰电话区号 利桑那州的大峡谷、德克萨斯州的卡迪拉克牧场和圣路易斯的拱门。
用户:什么时候去旅游最好?
助理: 66号公路的最佳旅游时间是春末 阅读更多按钮 – 如何添加以及最佳实践至初秋(5月至10月),此时天气较为宜人,且大部分景点都开放。
这就是情境理解的作用所在;用户问题本身并不能提供用户所指的具体地点的信息。但是,如果你查看聊天记录,你就知道要提供什么信息。
Kommunicate 增加了一层上下文理解功能,以便理解聊天对话并保持文档各部分的连续性。结果是为用户查询提供准确且高度相关的答案。
实际上,这意味着我们的客户可以获得 布韦岛商业指南 更好的结果,尤其是在使用我们的系统回答高度具体或技术性的问题时。
第五步:快速工程
这是关键部分之一。传递给 AI 系统的指令应该是具体的。必须仔细指示 AI 模型仅从提供的文档中获取答案;否则,来自互联网的答案将面临风险。