RAG
2025-12-24
创新:
4
影响:
4
这篇论文提出了一种名为Jensen-Shannon Divergence Message-Passing (JSDMP)的新学习范式,用于丰富文本图表示学习。该方法通过考虑结构和文本的相似性以及它们之间的差异,来计算文本节点间的新消息权重,从而使得表示能够从真正相关的文本节点中学习上下文和结构信息。论文提出了两种新的图神经网络,DMPGCN和DMPPRG,在丰富文本数据集上进行了实验,结果表明它们优于其他基线。
入选理由:提出JSDMP新范式,融合结构与文本相似性,提升图表示学习精度,增强上下文建模能力。
Agent
2025-12-24
创新:
5
影响:
5
这篇论文介绍了TongSIM,一个用于训练和评估具身智能代理的高保真、通用平台。TongSIM提供多样化的室内外场景,支持从低级具身导航到高级多智能体社会模拟和人类-人工智能协作的多种活动。它通过提供定制场景、任务自适应保真度、多样化的代理类型和动态环境模拟,为研究人员提供灵活性和可扩展性。
入选理由:构建高保真通用智能体模拟平台TongSIM,支持多场景、多任务与多智能体协同,推动具身智能研究。
LLM
2025-12-24
创新:
4
影响:
5
这篇论文深入分析了DeepSeek-V3模型架构,探讨了如何通过硬件感知的模型协同设计来解决大规模语言模型在硬件架构上的限制,包括内存容量、计算效率和互连带宽。论文提出了多种创新技术,如多头潜在注意力(MLA)、混合专家(MoE)架构、FP8混合精度训练和多平面网络拓扑,以优化内存效率、计算-通信权衡、硬件能力利用和集群级网络开销。
入选理由:深入分析DeepSeek-V3架构,提出硬件感知协同设计,优化内存与计算效率,推动大模型落地。
LLM
2025-12-24
创新:
5
影响:
4
这篇论文提出了一种视觉-语言模拟模型(VLSM),该模型通过结合视觉和文本理解,从布局草图和自然语言提示中合成可执行的FlexScript,从而实现工业模拟系统的跨模态推理。研究构建了首个用于生成数字孪生的超大规模数据集,并提出了三个新的评估指标来全面评估结构完整性、参数精确度和模拟器可执行性。
入选理由:提出视觉-语言模拟模型VLSM,实现工业系统跨模态生成与可执行代码合成,推动数字孪生自动化。
LLM
2025-12-25
创新:
4
影响:
4
这篇论文介绍了ElfCore,一种专为事件驱动感官信号处理设计的28nm数字脉冲神经网络处理器。ElfCore集成了本地在线自监督学习引擎、动态结构化稀疏训练引擎和基于活动依赖的稀疏权重更新机制,实现了多层时序学习、高精度稀疏到稀疏学习,并在手势识别、语音和生物医学信号处理等任务中表现出色。
入选理由:设计28nm神经处理器ElfCore,集成动态稀疏训练与在线自监督学习,提升边缘AI能效与实时性。
Agent
2025-12-25
创新:
5
影响:
4
这篇论文提出了DAO-Agent,一个结合了DAO治理机制、零知识证明(ZKP)和混合链上链下架构的框架,旨在解决在去中心化环境中,大型语言模型(LLM)多智能体系统中的透明协调、不可变日志记录、贡献测量和公平激励分配问题,同时保持智能体的战略隐私和最小化链上计算成本。
入选理由:提出DAO-Agent框架,结合ZKP与链上链下架构,实现去中心化多智能体透明协调与公平激励。
Agent
2025-12-25
创新:
4
影响:
3
暂无摘要
入选理由:提出CoTDeceptor对抗代码混淆技术,增强LLM代码Agent鲁棒性,提升对抗环境下的安全性。