推广 热搜:   公司  企业  快速  中国  设备  上海  未来  行业   

AI热门论文

   日期:2024-10-31     移动:http://kaire.xrbh.cn/quote/6215.html
大型语言模型(LLM)在数学推理任务中表现出色,例如与Lean等交互证明助手集成时的形式定理证明。现有方法涉及在特定数据集上训练或微调LLM,以在特定领域(如本科数学)表现良好。这些方法在推广到高级数学方面方面面临困难。一个根本性的限制是这些方法在静态领域上操作,无法捕捉数学家通常如何同时或循环地跨越多个领域和项目工作。我们提出了LeanAgent,这是一个新颖的终身学习框架,用于定理证明,可以持续地推广和改进不断扩展的数学知识,而不会忘记先前学习的知识。LeanAgent引入了几个关键创新,包括一种课程学习策略,该策略优化数学难度的学习轨迹,一个动态数据库,用于有效管理不断发展的数学知识,以及渐进式训练,以平衡稳定性和可塑性。LeanAgent成功证明了23个不同的Lean存储库中的162个以前未被人类证明的定理,其中许多来自于高级数学。它的表现比静态LLM基线高出11倍,证明了抽象代数和代数拓扑等领域的具有挑战性的定理,同时展示了从基本概念到高级主题的明显学习进展。此外,我们分析了LeanAgent在关键终身学习指标上的出色表现。LeanAgent在稳定性和向后转移方面取得了异常的分数,其中学习新任务可以提高先前学习任务的表现。这强调了LeanAgent的持续推广和改进,解释了其卓越的定理证明性能。

AI热门论文

本文地址:http://syank.xrbh.cn/quote/6215.html    迅博思语资讯 http://syank.xrbh.cn/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关动态
推荐动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号