九章云极DataCanvas双论文入选国际顶会ACL 2025,科研硬实力再获认证

互联网
2025
06/03
20:43
分享
评论

近日,第63届国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics,简称 ACL)公布ACL 2025的论文收录结果。凭借前沿技术创新,九章云极DataCanvas公司的两篇论文成功入选。其中,九章云极科研团队的研究成果《Can Language Models Serve as Analogy Annotators?》被ACL录用为Findings论文。人民大学AI Box研究团队与九章云极联合完成的论文《YuLan-Mini: Pushing the Limits of Open Data-efficient Language Model》被ACL 2025主会场录用。这两项成果分别就高效大模型训练新范式、语言模型类比推理难题等关键领域,形成从训练到推理的全链路创新,为行业研究提供新的思路和技术路径。

第63届ACL年会将于2025年7月27日至8月1日于奥地利维也纳举行

两项成果闪耀ACL 2025,彰显科研硬实力

ACL是自然语言处理(NLP)领域的顶级学术会议之一,根据中国计算机学会(CCF)的评级,ACL被列为A类会议(最高等级)。ACL论文通常代表着该领域的前沿研究成果,其论文需通过“双盲评审”与领域主席的多轮筛选,最终接收率长年低于25%。这种“优中选优”的评选机制,确保了收录论文的创新性与技术突破性,使其成为衡量学术成果创新性与实用性的黄金标尺。据统计,今年ACL论文总投稿量高达8000多篇,是去年的近2倍,被称为ACL论文收录竞争最为激烈的一年。此次,九章云极DataCanvas两篇论文双双入选ACL 2025,有力印证了九章云极DataCanvas公司在AI研究领域的全球领先性与持续创新能力。

近年来,ACL会议逐渐从“纯学术会议”转向“学术与产业结合”的平台。本次九章云极DataCanvas公司入选的两篇论文亦体现出产学研用深度融合的特色。其中被Findings收录的类比推理研究论文整合了九章云极在工业级大模型训练中积累的实战经验,而被ACL 2025主会场录用的论文YuLan-Mini由九章云极与高校联合创新攻关。作为人工智能基础设施领军企业,九章云极正通过产学研用协同创新的模式,构建产业融合新生态,携手合作伙伴共同推动AI技术赋能千行百业。

技术攻关 突破类比推理机器认知难题

针对大语言模型(LLMs)在类比推理任务中的技术瓶颈,九章云极DataCanvas进行了积极探索,并提出创新解决方案。该研究成果《Can Language Models Serve as AnalogyAnnotators?》被ACL 2025录用为Findings论文,为突破机器类比推理能力提供了重要理论支持。

本次研究中,九章云极DataCanvas通过实证揭示:即便在思维链(CoT)技术的辅助下,当前最先进的语言模型仍难以有效解决类比推理任务。基于此,九章云极DataCanvas创新性地融合认知心理学领域的结构映射理论(SMT),提出多阶段渐进式类比推理框架A3E(Automated Analogy Annotation Expert)。实验证实,该框架首次使大语言模型的类比标注准确率达到人类专家水平,为突破类比推理的机器认知瓶颈提供了可扩展的技术路径。

前沿突破 推动开源大语言模型发展

本次被ACL 2025主会场收录的论文《YuLan-Mini: Pushing the Limits of Open Data-efficient Language Model》,针对大型语言模型(LLMs)预训练过程中存在的关键瓶颈与设计难点进行了探索,并预训练出一个完全开源的高性能基座模型YuLan-Mini。该模型作为 2.4B 小参数量模型,仅在 1.08T Tokens 上预训练,展现出优异的训练高效性,实现比肩商用小模型的性能表现,为资源受限场景下的模型部署提供了全新范式。

YuLan-Mini模型在训练稳定性、数据流程优化、全栈开源实践三大方面实现创新突破,不仅为开源社区进行大模型研究提供了可行的技术路径,更为推动开源大语言模型的发展做出了重要贡献。在训练稳定性方面,九章云极DataCanvas联合研究团队深入研究了Transformer架构的训练稳定性问题,识别出隐藏状态爆炸和RMSNorm表示坍塌等关键因素,提出了创新性的解决方案,有效缓解了训练不稳定性。在数据优化方面,团队构建了一套精细的数据处理流程,创新性融合了数据合成、数据课程与数据筛选等机制。实验结果表明,YuLan-Mini 在同参数规模模型中表现优异,性能可媲美使用更多数据训练的业界领先模型。

此次论文双双入选ACL 2025,不仅展现了九章云极DataCanvas在AI研究领域的前沿实力,更验证了公司产学研用协同模式的有效性,为全球自然语言处理领域的发展贡献了中国方案。在通用人工智能发展的关键窗口期,九章云极DataCanvas将继续聚焦人工智能领域的核心技术问题,持续进行攻关和创新突破,以AI技术创新为多个行业的数智化转型注入创新动能。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表金沙手机网投app 的观点和立场。

相关热点

相关推荐

1
3