塞拉利昂AI辅助学习随机对照试验:数学成绩显著提升
Google DeepMind与Fab AI合作在塞拉利昂开展随机对照试验,评估Gemini引导学习对初中生数学成绩的影响。八周内,使用该工具的学生成绩提升0.258个标准差,相当于1.2至1.7年的学习进步,且学生参与度远超传统教育技术。
衡量塞拉利昂及其他地区人工智能学习的影响今天,我们分享了与Fab AI合作并在塞拉利昂教育部的支持下进行的随机对照试验(RCT)的结果和技术报告。在八周的时间里,我们评估了Gemini的引导学习如何影响塞拉利昂洛科港区12所学校1,763名初中生的数学进步。
这项预先注册的试验的结果表明,人工智能可以成为一个强大的教学合作伙伴——不是通过取代教师,而是通过扩大他们的影响力。这项研究是我们为人工智能对教学的影响建立全球证据库而持续努力的一部分。
超越回答引擎:保护批判性思维一个普遍的担忧是,生成式人工智能可能成为学生的捷径,可能会绕过深入学习所需的具有挑战性但又必不可少的认知努力。
引导式学习旨在解决这一问题:它是根据我们LearnLM多年的研究和工作建立起来的,以教学为基础,并专门调整为优先建立理解而不是提供直接答案。塞拉利昂的数据表明这种方法正在发挥作用。
对我们试验期间交换的超过113,000次互动的分析表明,学生在91.4%的对话中使用该工具建立概念理解,而不是简单地寻求解决方案。
Gemini在76%的信息中提出了支架式问题,仅在2%的情况下提供了直接解决方案。这种“苏格拉底式”互动确保了认知重担仍然由学生承担。教师主导的干预这项试验的成功建立在人工智能和教育工作者之间的合作伙伴关系之上,教师仍然牢牢地处于体验的中心。
教育工作者设计课程、设定目标并促进推动学习的课堂讨论。在焦点小组中,老师们报告说Gemini也支持他们自己的专业成长。通过使用该工具进行备课,他们发现了解释分数等熟悉主题的新方法。
许多人描述了从“讲师”到“促进者”的转变,在课堂上移动,为成对的学生引导自己的学习之旅提供支持。为了帮助其他人实施类似的计划,我们正在发布一份教师培训指南,其中包含与Fab AI合作创建的材料,包括本研究使用的具体协议。
衡量影响量化结果是显著的。使用引导学习的学生的数学成绩比对照组高出0.258个标准差。实际上,这相当于在八周试验期间取得了大约1.2到1.7年的典型学习进步。
在试验期间,教师将Gemini纳入大约一半的课程中,以达到12小时的目标,这些班级的学生进步甚至更高——大约1.8到2.5年的进步。参与度也非常高:69%的学生达到或超过了使用目标,远远超过了志愿教育技术典型的5%(著名的“百分之五问题”)。
这意味着学生们不仅参与其中,而且更喜欢来上课。除了数字之外,我们还看到了行为的深刻转变。学生们报告说他们更喜欢数学,并且在常规教学之外积极参与学习。至关重要的是,随着时间的推移,他们的对话和问题变得更加以学习为导向,转向技能培养,而不是寻求直接解决方案。
具体来说,技能培养问题在最后一周上升至90%(第一周为68%),而寻求解决方案的问题从25%下降至10%,这证明学生不仅仅想要答案,他们想了解他们是如何到达那里的。为了进一步了解引导式学习对学生学习的影响,我们正在全球范围内进行一系列额外的预先注册的随机对照试验。
为了推进开放科学和传播及时的见解,我们还发布了一本关于我们使用Fab AI进行随机对照试验方法的指南,以帮助其他人根据其需求和背景进行更快、可扩展的研究,以发现与技术进步同步的强大本地化证据。
在完成后续的随机对照试验时,我们将继续发布我们的结果和经验教训,以构建更全面的跨国证据库,我们希望这将为整个学习生态系统中人工智能的负责任开发提供信息。此外,我们对全球人工智能学习联盟(GAILA)的支持将通过集体行动加速这些承诺和其他承诺。
前进的道路尽管这些结果令人鼓舞,但它们也突出了“成就差距”的挑战。虽然大多数学生受益,但那些数学能力较强的学生受益最多。这强调了一个重要的需求:提供工具,为最需要的学生带来最大的收益。
展望未来,我们计划将这些试验扩展到其他国家,并更深入地探索元认知和关系智力等领域,以获得更全面的观点,探索学习的微妙复杂性。通过将教师主导的学生课堂的关系基础与人工智能的个性化支架能力相结合,我们可以帮助确保技术成为所有人获得有意义学习机会的桥梁。
我们还得到了Google.org和盖茨基金会的支持来进行试验。EducAid、Laterite和Oxford MeasurEd也与我们合作。
本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。