2024年12月,全国硕士研究生招生考试前夕,给学生们上完培训课后,新东方大学生学习与发展中心考研英语教师李衍葳打开“慧学系统”,开始批改作业。在AI的帮助下,一篇英语作文的批改时间从10分钟缩短到了2分钟,大大提升了她的工作效率。
2024年被业界视为“AI+教育”的变革之年,人工智能与教育的深度融合达到前所未有的高度,企业纷纷加大投入,将AI大模型广泛应用于教育服务,推动教育内容、教学方法、学习体验全面升级。也有不少企业瞄准教师需求,针对特定场景研发推出相应产品及服务,帮助教师工作提质减负增效。
紧跟教育变革的步伐,2024年初,新东方对其考研智能学习系统“慧学系统”AI辅助批改功能进行了升级与模型调试,帮助教师提高批改效率,实现更加智能的教学。
2024年12月31日,新京报教育事业部联合千龙智库舆情风险评估治理中心推出《2024AI大模型赋能教师生态共建分析报告》,并基于多维度评估结果,推选出六个品牌为“AI大模型赋能教师生态共建伙伴”,新东方考研智能学习系统“慧学系统”是其中之一。
用上万篇英语作文训练AI大模型
为了提升学生学习体验和备考效果,新东方大学生学习与发展中心于2022年在“新东方在线”APP端研发上线了考研智能学习系统“慧学系统”。2024年,“慧学系统”全新升级,在AI自生产题目和AI辅助批改等方面进行了进一步的进化迭代。
在考研备考的过程中,练习是非常重要的一环,而考研真题量少是考生备考的一个痛点。新东方建立了丰富的数字题库,并结合历年真题大数据及人工校验,研发了AI大模型赋能的自生产题目系统,可以根据学科核心知识点和考查难度自动生成模拟题,为学生练习巩固提供更多优质资源。
AI辅助批改则是“慧学系统”的又一亮点。纸上作业经拍照后上传至系统,先由系统进行自动批改,再经老师校准后作出反馈。教师可以有更多时间专注在试题的解析上。目前,该应用支持考研全部科目客观题以及考研英语主观题批改,并即将实现考研政治和考研数学的主观题批改。
AI大模型能够多大程度地帮助到教师教学?期间经历哪些不断完善、不断进化的过程?
具体到考研英语作文AI辅助批改功能,在调试模型的过程中,新东方的研发团队需要“喂”给模型大量的考研英语作文真题和学生写的文章,并由20位写作培训师牵头,几百位英语老师一起,把作文的评分标准和教学中学生常犯的错误进行梳理,让大模型去学习。在功能正式推广之前,AI大模型至少经历了上万篇作文的训练。在功能上线之后,教研团队也会和研发团队紧密配合,随时对发现的问题进行反馈升级。“所以在最开始训练模型的时候,就是许多一线教学老师一起参与的。”李衍葳说道。
AI大模型并非在刚出生时就完全“智能”。李衍葳介绍,“AI批改模型的语言习惯、训练材料和国内考试教学会有一些区别。比如在考研写作中,很多考生喜欢写强调句。但在英语表达习惯中,强调句的使用语境较少。我们在复核AI批改的作文时,发现学生如果写了强调句,大模型会把它判断为语法错误,并把它改成一个比较常规的句子。这其实是一个表达习惯的问题。”
发现问题后,老师们会第一时间跟技术沟通,给AI“打上补丁”。李衍葳介绍,教研团队和技术团队有专门的对接群,所有老师反馈的问题会以周为维度进行收集。技术侧响应的速度也非常快,对大模型进行快速的迭代升级。“老师们意见被重视,也会更加愿意去使用大模型来辅助自己的教学。”
AI大模型助力教师减负增效
刚开始接触AI大模型时,李衍葳只是在备课时把AI作为信息收集整理的工具。“在新东方上线AI辅助批改功能之前,我也在市面上看到过一些能批改作文的网址,但说实话准确率都不是特别高。”
2024年初,得知要参与到新东方的AI大模型调试时,部分老师抱着半信半疑的态度。彼时,2024年研考刚刚结束,老师们手中有大量学生写过的作文。一些老师抱着试一试的心态,把学生作文给到大模型进行批改,惊喜地发现“AI找得真的很细”。
李衍葳介绍,对于作文批改来说,大模型要做的是两件事。第一步是识别学生手写的作文,有些学生的字写得不太工整,“在这个部分AI就已经给我们惊喜了,它识别的准确度相当高。”
第二步是要把错误都挑出来。AI的好处是它不会感到疲惫,不会走神。“当AI把作文反馈回来的时候,我们发现它不仅速度很快,而且作文里的错误也都能找到。并且在进行更多的训练和迭代之后,批改的正确率越来越高。”
不过,任何人接触新事物都需要一个过程。AI大模型也并非在上线之初就受到所有教师的欢迎,相当一部教师仍然保留着批改纸质作业的惯性。李衍葳说,2024年春季,上述功能刚上线开放使用的时候,使用的教师相对不是那么多。但到暑假,情况发生了明显变化。随着学生开始大量进行写作练习,越来越多的教师开始尝试用AI大模型辅助教学。
AI大模型,不仅帮助教师提升了工作效率,减轻了工作负担,也为他们进一步优化教学提供了量化依据。
首先,整个教学批改的过程能够留痕。对于学生来说,学习过程变得可视化,学生可以看到自己每一次作文中那些重复出现的问题,也能看到自己写得越来越熟练,分数越来越高。
对于老师来说,在整个系统中,老师不仅能看到自己学生写的文章,也能看到全国各个地区学生的作文情况,有利于教师收集信息和改进教研。“当把所有的数据都做了电子化的留存后,就可以进行平行比较,了解学生在全国范围内处于什么样的水平。”李衍葳提到。
聚焦教育场景的具体问题,让AI大模型赋能更多教师
下一步,AI大模型能否赋能更多的教师?
李衍葳对此很有信心。“在前期研发调试的时候,我们就梳理好了规则,确保教师团队和研发团队的高效配合。如果需要训练更多的学科,比如我们正在研发的考研政治和考研数学的主观题,可能常见错误和难点不同,但是训练的流程和规则是一样的。”
新东方大学生学习与发展中心产品研发高级总监袁荣表示,目前,新东方在对于AI大模型的开发中,主攻的方向是在一个比较稳定可靠的基础模型下,把新东方的教研教学体系和一些混合技术嫁接在模型上,来解决所要面对的教育场景的具体问题。其内核是去复刻老师教学教研的行为,把它尽量用机器表达出来。
对于新东方即将上线的考研数学主观题的AI辅助批改功能,袁荣表示,考研数学主观题批改,对于目前市面上提供基础AI服务的大模型来说是很难做到的。但是新东方在基础AI能力的基础上,“嫁接”教学教研体系和混合技术,基本上能保证准确率达到97%的水平,经人工校准后可实现接近100%准确率。对于学生来说,就可以实现借助少量的老师干预得到迅速的反馈。
与此同时,新东方也着重强调,即使在“教育+AI”方面取得了显著进步,新东方依然将提升教育内容和教师水平作为核心追求。
在2024年12月31日,新京报教育事业部联合千龙智库舆情风险评估治理中心推出《2024 AI大模型赋能教师生态共建分析报告》中,中国教育技术协会学术委员会副主任刘雍潜强调,生成式人工智能是一种辅助教师教学、学生学习的方法,但不是唯一的方法,不能神化,也不要排斥,它是工具的一种,不能取代现在广泛应用的其他智能工具。报告还指出,对于大模型生成的内容要有批判精神,学会鉴别判断,保持学术严谨,加强人工审核,以免出现大量AI生成的错误信源。
“系统只是工具和手段,它的作用不是替代老师,而是去帮助老师。在AI加持下,系统可以提升人的产能和时效短板,而人则可以校准系统失误,同时有更多时间对学生提供针对性的详尽指导。人与系统紧密协作,能够在提升反馈时效的同时提升服务质量,帮助学生最大化提升学习效率和效果。”新东方大学生学习与发展中心在线国内事业部总经理洪喆强调。
文/徐彦琳
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有