awslabs/amazon-bedrock-agentcore-samples:AI代理通用框架,简化部署
Amazon Bedrock AgentCore Samples项目旨在为开发者提供一套框架和模型无关的AI代理部署和运营解决方案,助力AI代理安全、大规模地投入生产。项目提供了一系列教程和示例,帮助开发者理解、实现和集成AgentCore功能,支持多种框架和大型语言模型,简化了AI代理的开发和部署流程。
精选 13 篇,从 11500+ 条中筛选
Amazon Bedrock AgentCore Samples项目旨在为开发者提供一套框架和模型无关的AI代理部署和运营解决方案,助力AI代理安全、大规模地投入生产。项目提供了一系列教程和示例,帮助开发者理解、实现和集成AgentCore功能,支持多种框架和大型语言模型,简化了AI代理的开发和部署流程。
LiveKit/agents是一个专注于构建实时语音AI代理的框架,旨在为开发者提供构建多模态、可编程的实时参与者工具。该项目定位为开发框架,核心功能包括灵活的集成、内置任务调度、广泛的WebRTC客户端支持等。技术架构上,它基于Python语言,集成了多种模型和API,如STT、LLM、TTS等。在LLM生态中,该项目通过提供一套完整的工具和框架,帮助开发者构建高效、可扩展的实时语音AI应用。
Polymarket/agents项目是一个面向开发者构建AI代理的框架,旨在通过Python API和工具实现自主交易。它填补了预测市场与AI结合的空白,为研究者、应用开发者提供了一套完整的工具和库,支持预测市场的数据源整合、本地和远程RAG支持,以及丰富的LLM工具。项目采用模块化架构,易于扩展和维护,其独特价值在于其集成度和易用性。
TwinFlow-Z-Image-Turbo是一款专注于文本到图像生成的多模态模型,定位为多模态模型。其核心技术为TwinFlow框架,通过自对抗流实现一步和少量步骤的高质量生成。该模型在HuggingFace平台上表现良好,下载量和点赞数均较高。在性能上,模型在特定任务上具有优势,但未提供具体的基准测试结果。实用方面,模型开源,使用Apache-2.0协议,适合在具有适当硬件和推理效率的环境中应用。
这篇论文提出了AdaGReS,一个基于冗余感知的上下文选择框架,用于优化token预算限制下的检索增强生成(RAG)。AdaGReS通过结合查询-片段相关性和集合内冗余惩罚的集合级目标,进行贪婪选择,并引入了实例自适应的相关-冗余权衡参数校准,以消除手动调整并适应候选池统计和预算限制。实验表明,该方法在控制冗余和提升上下文质量方面表现良好,从而提高了端到端的答案质量和鲁棒性。
这篇论文提出了Triple-BERT,一种针对大型订单分配的集中式单代理强化学习方法,用于解决共享出行平台上的订单调度问题。Triple-BERT通过动作分解策略和基于BERT的网络结构,有效处理了大规模的观察空间和动作空间,实现了比现有方法更好的性能。
这篇论文提出了一种基于流匹配的神经过程(NP)模型,该模型能够直接从数据中学习随机过程,并提供了对任意数据点的条件分布的 amortized 预测。该模型简单易实现,可以通过常微分方程(ODE)求解器从条件分布中进行采样,同时提供了准确性和运行时间之间的可控权衡。
这篇论文提出了一种将伦理教育融入自然语言处理(NLP)课程的方法,通过互动式学习、实践操作和教学相长的方式,培养学生的批判性思维和社会责任感。该课程在四年中经过多所机构的实践和调整,产生了可重用的教学材料和产品。
该论文提出了一种结合检测和缓解技术来解决大型语言模型(LLM)中幻觉问题的方法。通过在检索增强生成(RAG)框架中实现缓解,并引入负缺失信息评分系统(NMISS)进行检测,论文在意大利健康新闻文章的上下文中评估了LLM的性能,结果表明GPT-4在生成与参考响应高度一致的答案方面表现最佳。
这篇论文提出了CASCADE,一个自我进化的智能体框架,旨在通过自主发展和进化,将大型语言模型(LLM)从依赖预定义工具转变为能够学习复杂技能。CASCADE通过连续学习和自我反思等元技能,使智能体能够掌握外部工具并编码知识。在SciSkillBench基准测试中,使用GPT-5的CASCADE实现了93.3%的成功率,显著高于没有进化机制的35.4%。
这篇论文提出了HarmTransform,一个多智能体辩论框架,用于将有害查询转换为隐蔽形式,同时保持其潜在的有害意图。该框架通过多个智能体之间的迭代批评和细化来生成高质量的隐蔽有害查询转换,以提高大型语言模型(LLM)的安全性。
R-Debater是一种基于论证记忆的辩论生成框架,通过检索辩论知识库和角色化代理,实现多轮辩论的生成。该系统通过回忆和调整先前论点来维持立场一致性,回应对手,并使用证据支持论点。实验表明,R-Debater在标准化辩论数据集上优于强基线模型,并通过人类评估证明了其在多轮辩论中的连贯性和证据使用。