当前位置:首页 > 怎么学 > AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法

AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法

2023-01-24怎么学36

羿阁 发自 凹非寺

量子位 | 公众号 QbitAI

AI做数学题的成绩又又又被刷新了!

众所周知,随着谷歌思维链(chain of thought)概念的提出,AI做题时已经能像人类一样生成解题步骤。

这次,来自DeepMind的科学家提出了一个切实的问题:如何确保解题步骤和答案的双重正确率?

AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法

为此,他们在GSM8K数据集上全面对比了基于过程和基于结果的监督方法,并结合二者优势训练出一个最佳模型。

结果表明,新模型的答案错误率从16.8%降低到12.7%,解题步骤的错误率也从14.0%降低到了3.4%。

步骤+答案双重保障

在介绍新研究前,不得不先提到谷歌今年1月在论文中提出的思维链概念。

简单来说,思维链提示就是一种特殊的上下文学习,不同于标准提示只是给出输入-输出对的示例,思维链提示还会额外增加一段推理的过程。

AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法

该方法在LaMDA-137B、GPT-3 175B、PaLM-540B三个大型语言模型上都得到了验证:对比标准提示,新方法在一系列算术推理等任务上的准确率都有了明显的提高。

但该方法存在的一个问题是,在某些情况下,AI能生成正确答案,但推理过程却是错误的。

现在,来自DeepMind的研究人员,针对这一点做出了改进:不仅只关注最终结果,也注重推理过程的准确性。

为此,他们对自然语言处理任务中基于过程和结果的方法进行了首次全面比较。

具体来说,包括以下不同场景:少样本提示、有监督的微调、通过专家迭代的强化学习以及重排序和强化学习的奖励模型。

AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法

而之所以选择GSM8K数据集,一来因为它是由小学数学应用题组成,答案都是整数解,方便准确性统计;

二是GSM8K数据集具有对推理步骤的离线监督,以及在线人工标注。

从结果上看,第一,基于过程和基于结果的方法在最终答案错误率上近乎一致。这也意味着,仅靠结果监督就足以实现较低的答案错误率。

第二,推理步骤准确率的提升则需要过程监督或模仿它的奖励模型。尽管最终答案错误率相似,但从下图可以看出,结果监督(19.8%)比过程监督(11.4%)的推理错误率明显要高。

AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法

除此之外,研究人员还结合二者优势,训练出一个最佳模型,即将监督学习与基于奖励模型的强化学习相结合。

新模型的答案错误率从以前的最佳水平16.8%降低到12.7%,并且,答案正确、推理过程却错误的情况也从14.0%降低到了3.4%。

当允许模型对30%的问题进行回避时,最终答案的错误率甚至能达到2.7%。

AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法

研究团队

本篇论文的研究团队来自DeepMind,共同一作有三位:Jonathan Uesato、Nate Kushman、Ramana Kumar。

AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法

12月3日,Nate Kushman将会就本篇论文在NeurIPS 2022举办的第二届MATH-AI研讨会上做报告,感兴趣的小伙伴可以蹲守一下~

论文链接:

https://arxiv.org/pdf/2211.14275.pdf

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

扫描二维码推送至手机访问。

版权声明:本文由数学怎么学发布,如需转载请注明出处。

本文链接:http://www.sxzmx.com/post/858.html

标签: 数学怎么学

“AI解数学题,答案对过程却错?DeepMind新研究改进谷歌思维链方法” 的相关文章

为什么数学对大多数人来说很难?

为什么数学对大多数人来说很难?

数学似乎很难,因为大多数人学习数学的方式都不够直观和严格,这主要是学校数学教学体系的缺陷。第一个问题是,人们在解决问题时不了解自己在做什么。学生们被教导一系列技巧和公式,他们被告知要接受这些技巧和公式为真,通常很少或没有提供解释,也没有提供任何基本理由来解释为什么这些技巧和公式为真。对许多人来说,数...

五年级数学期末考点梳理卷4套(人教版)期末复习替孩子收藏好

五年级数学期末考点梳理卷4套(人教版)期末复习替孩子收藏好

最新!人教版五年级数学(上册)期末考点梳理卷包括小数乘法、小数除法、简易方程、植树问题、图形与几何、多边形的面积、位置与可能性、位置、可能性等,知识点非常全面、难度适中试卷共四套。都是期末必考知识点,适合孩子考前冲刺复习,巩固基础、查缺补漏。建议家长把 五年级数学期末试卷(附答案).docx 打印给...

高考数学疑难题不会解?名师示范从看到想再到算的全过程

高考数学疑难题不会解?名师示范从看到想再到算的全过程

看到难题就不会,要如何突破这个困境?下面先通过最近学生留言的2道题,我绘制了解题中每个环节的思考解剖图,让大家直观感觉一道题目是怎么想,怎么算的?每一步之间是如何串联起来的。第一题:函数1、解题的出发点就是对题目中的条件逐个处理以及组合起来处理2、处理的过程:有些会用到定义,有些需要专门的方法,有些...

你口中的“笨儿子”可能只是开窍晚,这些处置能帮男孩厚积薄发

你口中的“笨儿子”可能只是开窍晚,这些处置能帮男孩厚积薄发

“文/贝贝豆(原创文章,欢迎个人转载分享)”现在民间流行一种说法,如果家里生了女儿那么就等于是“招商银行”,如果是生的儿子那么就是来了个“建设银行”。这种幽默的说法,一是反应了生儿生女的经济压力不一样,儿子的养育成本要大大高于女儿,另一方面也反应了儿子和女儿的教育方式也不一样,男孩女孩不应该用同样一...

小学数学想逆袭,这套方案能帮你

小学数学想逆袭,这套方案能帮你

昨天写了语文逆袭方案:《低年级的小豆包们,送你一份寒假语文学习逆袭方案》,今天接着说数学。1、数学学习的重要性我个人认为,语文是一切学习的基础,数学是理科的基础,数学学不好,会直接影响以后上中学、上大学的时候,学习物理、化学、生物、计算机、逻辑、天文等等学科(不好意思,我一个中文系学生,说得出来的理...

5分钟学会6种“蒙”题技巧,学渣成功逆袭,数学直逼140!

5分钟学会6种“蒙”题技巧,学渣成功逆袭,数学直逼140!

数学,是高考中的一门大学科,在高考中数学拿到高分能够帮助学生在高考中脱颖而出,甩出别人一大截。很多同学在平时刷题的时候,就只顾着一个劲儿的刷难题,而不去注意分析题型的易错点。到了考试的时候,还是会照样丢分,这样做得不偿失……今天给大家分享高考六种“蒙”题技巧,当然,大家不要认为是不劳而获的猜测碰运气...

如何快速学好数学,掌握窍门,数学就是这么简单

如何快速学好数学,掌握窍门,数学就是这么简单

如何学习好数学,快速提高数学成绩,这里給大家简单介绍一下学好数学的方式方法;方法/步骤重视数学基本概念,数学基本概念是学好数学的敲门砖,灵活运用数学的基本概念是学好数学的关键;计算要准确,乘法口诀表,加法口诀表,要烂熟于胸,计算要快,准,加法乘法口诀在学好数学起到了非常重要的作用;计算要准确,减法口...

学好数学的好方法有哪些?

学好数学的好方法有哪些?

数学怎么轻松学?学好数学的好方法有哪些?上课前预习-多看课本,打好基础。虽然课本上的习题可能很基础没有太高的难度,但是最基本的也是很重要的,万丈高楼平地起,把课本上的例题,定理反复的看,真正的吃透,才能在之后灵活运用。上课时认真-课堂上认真听课,课后及时复习。老师在上课时,一定要认真听课,紧跟老师的...

怎么可以学好数学?提高数学学习成绩?

怎么可以学好数学?提高数学学习成绩?

怎么可以学好数学?提高数学学习成绩?我说一个例子,这个例子很特殊,成绩从不好再到特别好,后来又下来,来解释学好或学不好的原理,希望对你有启发。一个刚进入初三的女孩,脾气温和,为人和善,人缘很好,成绩大概在班里第七,全校40多名的样子,是一个不大的普通初中校,如果这样的成绩到中考,能考一个普通高中,考...

分享:学霸都在用的3个数学学习技巧,学会1个就能提分

分享:学霸都在用的3个数学学习技巧,学会1个就能提分

数学是九年义务教育阶段最难学的科目之一。谈到数学,很多家长和学生会认为,学好数学靠的是高智商,智商不高,一切白搭。其实不然,义务教育阶段的数学远远到不了需要“拼天赋”的难度。著名数学家苏步青教授指出:“学习这东西,是有规律的,必须由浅入深,由易到难,由低到高,循序渐进”。学数学也是如此,需要我们掌握...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。