14-43 剑和诗人17 - ActiveRAG之主动学习

​​​​​

14-43 剑和诗人17 - ActiveRAG之主动学习

大型语言模型 (LLM) 的出现开启了对话式 AI 的新时代。这些模型可以生成非常像人类的文本,并且比以往更好地进行对话。然而,它们在仅依赖预训练知识方面仍然面临限制。为了提高推理能力和准确性,LLM 需要能够整合外部知识。

检索增强生成 (RAG) 已成为一种利用外部来源的知识增强 LLM 的解决方案。RAG 将提取相关知识段落的检索器模块与神经生成器相结合,以根据检索到的上下文生成答案。这允许结合 LLM 固有知识之外的事实、概念和关系。尽管前景光明,但 RAG 面临着影响整体答案质量的挑战。

让我们介绍ActiveRAG,它是 RAG 框架的增强版,旨在应对这些挑战。我们将讨论 ActiveRAG 的动机、方法和结果。通过积极构建知识并将其紧密集成到 LLM 自身的认知中,ActiveRAG 与标准 RAG 相比实现了更高的准确性和解释连贯性。

积极知识建构的必要性

标准 RAG 的一个关键限制是其集成外部知识的被动方法。检索器模块提取可能相关的段落,并将其与输入查询连接起来。然后,这种上下文混合会调节 LLM 以生成答案。

然而,仅仅提供额外的背景并不能确保与 LLM 的内在知识紧密结合。该模型将检索到的段落视为松散的事实参考,而不是需要主动理解和拼凑的知识。这体现在几个方面:

  • 知识噪音:检索到的段落经常包含无关事实或关系,对回答特定查询没有用处。这会增加 LLM 的信噪比,嘈杂的无关知识会损害答案质量。
  • 知识脱节:即使与查询相关的上下文也常常与 LLM 现有的知识和认知缺乏连贯的联系。如果没有明确的联系,整合就会让人感觉脱节,而不是统一的解释流程。
  • 被动保存:由于对检索到的知识理解程度很低,LLM 被动保存上下文,没有进行更全面的评估或与自己的知识储备进行协调。结果是碎片化的理解,而不是混合的理解。

此外,RAG 的被动方法忽略了建构主义的关键原则,建构主义是一种学习理论,认为知识是由学习者主动构建的,而不是被动接收的。人类通过将新信息与现有结构联系起来、建立新的心理模型、通过矛盾进行推理以及调和冲突来构建知识。RAG 放弃了这些对于深度理解至关重要的建构。

ActiveRAG 简介

为了解决这些差距,ActiveRAG 是一种增强功能,可将主动知识构建注入 RAG。关键原则是:

  • 知识是主动积累的,而不是被动掌握的
  • 将外部知识与 LLM 的内在认知紧密结合
  • 通过评估周期协调和完善知识

基于这些原则,ActiveRAG 实现了包括检索、知识构建和答案生成的三阶段流程。

知识检索

与 RAG 类似,第一阶段使用密集向量相似度检索与查询可能相关的段落。关键区别在于检索较小的知识“”(1-3 个句子)而不是较长的段落。这可以过滤噪音并增强检索到的上下文的针对性。

知识建构

第二阶段利用检索到的块主动构建知识。四个子组件发挥独特的建构主义功能:

  • 语义关联——基于语义相关性将检索到的知识块与现有知识结构联系起来。这可以在现有的认知框架内吸收新信息。
  • 认知锚定——如果检索到的信息与现有知识的语义相关性较低,则建立新的知识参考框架。这扩展了认知边界。
  • 逻辑推理——通过从检索到的内容中得出结论来推断新知识。这建立了解决问题的逻辑链。
  • 认知一致性——识别检索到的组块与现有知识之间的冲突。然后执行解决以完善理解。这可以调和不一致之处。

这些组成部分共同模仿了人类的建构主义:将新知识与旧知识联系起来,形成新的心理模型,通过问题进行逻辑推理,并协调相互冲突的信息。

认知纽带

最后阶段将构建的知识重新整合到 LLM 的内在认知中。首先,LLM 根据其现有知识为查询生成初始思维流。接下来,构建的外部知识会动态地注入到这个思维流中以完善理解。

我们称之为“认知纽带”——来自外部来源的构建知识与 LLM 的内在认知的交集。标准 RAG 中的知识脱节,缺乏这种紧密的整合。

结果

与基线 RAG 相比,在一系列问答任务上对 ActiveRAG 进行了评估。一些关键结果:

  • ActiveRAG 通过减少知识噪音和增强推理能力,将答案准确率提高了约 5%。
  • ActiveRAG 的解释连贯性评级更高,表明检索到的知识与内在认知之间的结合更紧密。
  • 由于额外的知识构建,延迟增加了约 15%,但抵消了更高的准确度提升。

在法学硕士的认知过程中积极构建和吸收知识可以获得更精确的答案和统一的解释流程。

局限性和未来工作

ActiveRAG 虽然前景光明,但在未来的工作中仍存在一些需要解决的限制:

  • 多级流水线会增加延迟,因为知识构建比标准 RAG 增加了 2-3 倍的计算量。这可以通过模型提炼和优化来缓解。
  • 构建知识需要多次查询 LLM,这会增加成本。缓存构建的知识有助于最大限度地减少冗余生成。
  • 在模拟人类的知识构建方面仍然存在差距,例如进行类比、从示例中学习以及分层构建知识。

未来的工作可以增强 ActiveRAG 的建构主义功能,以进一步缩小与人类认知的差距。此外,建构组件与核心 LLM 之间的更紧密耦合可以增强流动性。

ActiveRAG 以其主动的方法表明,仅仅检索知识是不够的。在 LLM 的内在认知中构建、协调和积极整合知识可以带来更准确、更连贯的结果。虽然要达到人类水平的理解还有很长的路要走,但 ActiveRAG 为解锁隐藏在外部知识资源中的宝藏迈出了宝贵的一步。

结论

最后,标准 RAG 为利用外部知识增强 LLM 提供了一种有用但不完整的解决方案。其被动方法导致理解支离破碎。ActiveRAG 引入了主动知识构建和集成来解决这些差距。通过将构建的知识与内在认知紧密联系起来,ActiveRAG 实现了卓越的准确性和解释连贯性。

在神经网络中模拟人类建构主义学习方面仍有许多前沿领域需要探索。但ActiveRAG 提供了一个前进的学习蓝图— — 它不将知识视为静态持有的外部资产,而将其视为一种需要构建、塑造和编织成理解系统的活生生的力量。凭借这种积极的精神,人类知识中蕴藏的宝藏不仅更容易获得,而且成为触及认知本身本质的丰富源泉。

14-43 剑和诗人17 - ActiveRAG之主动学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/782152.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

文件存储的方法一

文章目录 概念介绍实现方法示例代码 我们在上一章回中介绍了"如何实现本地存储"相关的内容,本章回中将介绍如何实现文件存储.闲话休提,让我们一起Talk Flutter吧。 概念介绍 我们在上一章回中介绍的本地存储只能存储dart语言中基本类型的数值…

ffmpeg图片视频编辑器工具的安装与使用

title: ffmpeg图片视频编辑器工具的安装与使用 tags: [ffmpeg, 图片, 音频, 视频, 工具, 流媒体] categories: [工具, ffmpeg] FFmpeg是一个开源的命令行工具,广泛用于处理视频和音频文件,包括转换格式、剪辑、混流、解码、编码等。以下是一些基本的FFmp…

Zabbix 的部署和自定义监控内容

前言 一个完整的项目的业务架构包括 客户端 -> 防火墙 -> 负载均衡层(四层、七层 LVS/HAProxy/nginx) -> Web缓存/应用层(nginx、tomcat) -> 业务逻辑层(php/java动态应用服务) -> 数据缓存/持久层(r…

智慧水利的变革之路:如何通过大数据、物联网和人工智能构建高效、智能、可持续的水利管理新模式

目录 一、引言:智慧水利的时代背景与意义 二、大数据:水利管理的数据基石 (一)数据收集与整合 (二)数据分析与挖掘 三、物联网:水利管理的感知神经 (一)智能感知与监…

Git 操作补充:cherry-pick、变基

1. 挑选提交合并 git cherry-pick 对于多分支的代码库,将代码从一个分支转移到另一个分支是一种常见的需求,这可以分成两种情况:一种情况是,你需要另一个分支的所有代码变动,那么就采用 git merge;另一种情…

【Unity2D 2022:UI】制作角色血条

一、创建血底UI 1. 创建画布(Canvas) 2. 在画布上添加血底图像(Image)子物体 二、编辑血底UI 1. 将血底图片拖入源图像(Source Image)中 2. 点击设置为图片的原大小(Set Native Size&#x…

算法重新刷题

基础算法 前缀和 一维前缀和 [USACO16JAN] Subsequences Summing to Sevens S - 洛谷 这一题主要是需要结合数学知识来求解&#xff0c; #include <iostream> #include <cstring> #include <cstdio> #include <algorithm>using namespace std;con…

java花店管理系统eclipse开发mysql数据库

1 绪论 1.1 系统开发目的 随着人们物质生活水平和经济水平的不断提高&#xff0c;室内绿化布置、家庭园艺装饰、礼仪鲜花等日益受到重视和青睐&#xff0c;以及送鲜花给亲朋好友来表达自己的情谊。传统的花店对于信息的管理的主要方式是基于文本、表格等纸质手工处理&#xf…

【经验篇】Spring Data JPA开启批量更新时乐观锁失效问题

乐观锁机制 什么是乐观锁&#xff1f; 乐观锁的基本思想是&#xff0c;认为在大多数情况下&#xff0c;数据访问不会导致冲突。因此&#xff0c;乐观锁允许多个事务同时读取和修改相同的数据&#xff0c;而不进行显式的锁定。在提交事务之前&#xff0c;会检查是否有其他事务…

mac M1安装 VSCode

最近在学黑马程序员Java最新AI若依框架项目开发&#xff0c;里面前端用的是Visual Studio Code 所以我也就下载安装了一下&#xff0c;系统是M1芯片的&#xff0c;安装过程还是有点坑的写下来大家注意一下 1.在appstore中下载 2.在系统终端中输入 clang 显示如下图 那么在终端输…

【Linux进程】命令行参数 环境变量(详解)

目录 前言 1. 命令行参数 什么是命令行参数? 2. 环境变量 常见的环境变量 如何修改环境变量? 获取环境变量 环境变量的组织方式 拓展问题 导入环境变量 3. 本地变量* 总结 前言 在使用Linux指令的时候, 都是指令后边根命令行参数, 每个指令本质都是一个一个的可执行程…

JAVA集合框架、CAS、AQS

目录 一、java 的集合框架有哪些? 二、说-下 ArrayList 和 LinkedList? 三、HashSet和TreeSet的区别? 四、HashMap 的数据结构是什么? 五、CAS机制 六、AQS理解 一、java 的集合框架有哪些? Collection 是 Java 集合框架中的一个根接口&#xff0c;位于 java.util 包中。它…

亲密数对C++函数

自定义函数 #include<bits/stdc.h> using namespace std; //求n的因子和自定义函数 int yinzihe(int n){//使用2~sqrt(n)成对求解因子和int r0,i;//变量 r 初始值为0&#xff0c;因为要存放因子和for(i2;i<sqrt(n);i) {//回顾sqrt()课程//如果 i 是 n 的因子&#xf…

微笑背后的秘密:理解自闭症儿童的面部表情控制

在星贝育园自闭症儿童康复学校&#xff0c;我们常常遇到家长们提出的一个有趣而引人深思的问题&#xff1a;“为什么我的孩子似乎控制不住面部表情&#xff0c;尤其是频繁地笑&#xff1f;”这个问题背后&#xff0c;隐藏着自闭症谱系障碍&#xff08;ASD&#xff09;儿童独特的…

Caffeinated for Mac v2.0.6 Mac防休眠应用 兼容 M1/M2/M3

Caffeinated 可以防止您的 Mac 进入休眠状态、屏幕变暗或者启动屏幕保护。 应用介绍 您的屏幕是否总是在您不希望的时候变暗&#xff1f;那么Caffeinated就是您解决这个大麻烦的最好工具啦。Caffeinated是在Caffeine这个非常便捷、有用的工具的基础上开发而来的。Caffeinated…

20240707 每日AI必读资讯

&#x1f9e0;中国生成式AI专利数量超过美国 6 倍 - 中国在2014年至2023年期间申请的生成式AI专利数量达到38210个&#xff0c;超过了美国的6倍。 - 腾讯、平安保险集团和百度是GenAI专利数量最多的中国公司。 - 中国的顶级学术机构和技术生态为生成式AI的发展提供了强大支持…

算法简介:什么是算法?——定义、历史与应用详解

引言 在现代计算机科学中&#xff0c;算法是一个核心概念。无论是编程还是数据分析&#xff0c;算法都扮演着至关重要的角色。在这篇博客中&#xff0c;我们将深入探讨算法的定义、历史背景以及它在计算机科学中的地位和实际应用。 什么是算法&#xff1f; 算法是解决特定问题…

DHCP的原理及配置

目录 一、了解DHCP服务 1.什么是DHCP 1.1DHCP广播 2.使用DHCP的好处 2.1为什么使用DHCP 3.DHCP的模式与分配方式 3.1分配方式 3.2模式 二、DHCP工作原理 1.四次回话 2.重新登录 3.更新租约 4.扩展 三、安装DHCP服务 四、DHCP局部配置并且测试 五、使用…

简介空间复杂度

我们承接上一篇博客。我们写了时间复杂度之后&#xff0c;我们就要来介绍一下另一个相关复杂度了。空间复杂度。我觉得大家应该对空间复杂度认识可能比较少一些。我就是这样&#xff0c;我很少看见题目中有明确要求过空间复杂度的。但确实有这个是我们不可忽视的&#xff0c;所…

在门店里造绿色氧吧!康养行业也这么卷了?

拼啥不如拼健康&#xff0c;现在的人算是活明白了&#xff0c;不但中老年人这样想&#xff0c;年轻人也这样干。你可能不知道&#xff0c;现在众多健康养生门店&#xff0c;逐渐成了年轻人“组团养生”的好去处&#xff0c;也是他们吃喝玩乐之外的新兴消费趋势。 而在看得见的…