RAG
2026-04-28
创新:
4
影响:
5
这篇论文提出了Graph Memory Transformer (GMT),通过将Transformer解码器中的Feed-Forward Network (FFN)子层替换为显式学习的记忆图,以保持周围的自动回归架构。GMT使用记忆单元在学习的中心点库上路由标记表示,并通过学习的有向转换矩阵连接。实验表明,GMT在保持解码器架构的同时,通过图介导的记忆导航替换密集的内部标记转换,展示了其可行性和结构可解释性。
入选理由:GMT通过显式学习记忆图保持RAG架构,提升Transformer性能。
Agent
2026-04-28
创新:
4
影响:
4
这篇论文提出了JigsawRL,一个基于管道复用技术的成本效益框架,用于提高强化学习(RL)的并行性。JigsawRL通过将每个管道分解为子阶段图,揭示了隐藏在阶段级系统中的内部和跨工作者的不平衡。通过动态资源分配、迁移长尾回滚以及将协调问题转化为图调度问题,JigsawRL实现了在同步和异步RL上的性能提升。
入选理由:JigsawRL通过管道复用技术提高RL并行性,揭示阶段级系统不平衡。
LLM
2026-04-28
创新:
3
影响:
4
这篇论文提出了ELSA,一种精确线性扫描注意力机制,用于加速和降低视觉Transformer的内存消耗。ELSA通过保持精确的softmax语义,减少并行深度,并在不同硬件上实现,从而提高了处理速度和效率。
入选理由:ELSA通过精确线性扫描注意力机制降低视觉Transformer内存消耗。
RAG
2026-04-28
创新:
4
影响:
5
这篇论文提出了S2G-RAG,一个迭代检索增强问答(RAG)框架,通过结构化的充分性和差距判断来提高多跳问答的性能和鲁棒性。S2G-RAG通过预测当前证据记忆是否支持回答,并输出描述缺失信息的结构化差距项来控制检索过程,从而减少噪声积累。
入选理由:S2G-RAG通过结构化充分性和差距判断提高RAG问答性能和鲁棒性。
Agent
2026-04-28
创新:
4
影响:
5
这篇论文提出了Dr. RTL,一个基于工具的自主代理RTL优化框架,通过工具支持的自我改进在现实评估环境中进行RTL时序优化。它通过多智能体框架进行关键路径分析、并行RTL重写和基于工具的评估,并引入了群体相对技能学习,以提高性能、功耗和面积(PPA)。
入选理由:Dr. RTL通过工具支持的自我改进进行RTL时序优化,提升PPA。
Agent
2026-04-28
创新:
3
影响:
4
这篇论文提出了PhysCodeBench,一个用于评估物理感知符号模拟的基准,并引入了自我纠正多智能体精炼框架(SMRF),通过迭代协作和领域特定验证,实现了物理上准确的模拟,显著提升了物理感知符号模拟的准确性。
入选理由:PhysCodeBench引入SMRF,提升物理感知符号模拟准确性。
LLM
2026-04-28
创新:
4
影响:
4
这篇论文提出了一种名为VIBES的异步协作框架,用于高速公路视频中的远场异常检测。该框架利用视觉语言模型(VLM)和贝叶斯推理,通过在线贝叶斯推理模块动态更新正常驾驶行为的概率边界,从而精确地定位时空中的异常。VLM仅处理由触发器指示的局部视觉区域,以防止注意力稀释,并实现准确的语义推理。
入选理由:VIBES利用VLM和贝叶斯推断实现高速公路视频远场异常检测。
LLM
2026-04-28
创新:
3
影响:
4
这篇论文提出了SIV-Bench,一个用于评估多模态大型语言模型(MLLMs)在社会交互理解与推理方面的能力的新视频基准。SIV-Bench包含大量视频片段和问答对,涵盖了多种社会关系、视频长度和风格,实验表明MLLMs在社交场景理解方面表现良好,但在推理和预测方面仍有不足。
入选理由:SIV-Bench评估MLLMs在社会交互理解与推理方面的能力。
RAG
2026-04-28
创新:
3
影响:
4
这篇论文提出了MultiDx,一个多源知识整合框架,用于诊断推理。该框架通过分析来自网络搜索、SOAP格式病例和临床病例数据库的证据,生成疑似诊断和推理路径,并通过匹配、投票和差异诊断来整合多角度证据,最终生成预测。
入选理由:MultiDx通过多源知识融合框架助力诊断推理,整合多角度证据。