文章主题:美国杨百翰大学的会计教授, 伍德, 团队, ChatGPT
IT之家 4 月 25 日消息,上个月,OpenAI 推出了最新的 AI 聊天机器人 GPT-4,并声称该机器人在各种考试中表现异常出色,比如律师考试,研究生入学考试等。然而,根据美国杨百翰大学领导的一项研究,ChatGPT 在会计考试中的表现远不及人类,甚至还会一本正经的胡说八道,为错误的答案辩解。
美国杨百翰大学的会计教授伍德及其团队近期决定对人工智能助手ChatGPT展开一场特殊的考试。这次试验旨在评估ChatGPT在解答大学会计课程题目方面的能力。为了吸引更多参与者,他们在社交媒体上发起了活动,并得到了来自14个国家186个教育机构的三位合作伙伴积极响应。这些合作者共同贡献了25181道会计考试题目,覆盖了会计信息系统、审计、财务会计、管理会计以及税务等多个领域。此外,他们还邀请了BYU的一名本科生(名叫杰西卡,伍德的女儿)向ChatGPT输入了2268道涉及教科书内容的考题。
结果显示,ChatGPT 的表现虽然有亮点,但总体上还是不及学生水平。学生的平均分是 76.7%,而 ChatGPT 的平均分只有 47.4%。在 11.3% 的问题上,ChatGPT 的得分高于学生平均分,尤其是在会计信息系统和审计方面。但是,在税务、财务和管理方面,ChatGPT 就显得力不从心,可能是因为这些领域需要更多的数学运算能力。在问题类型上,ChatGPT 比较擅长判断题(68.7% 正确率)和选择题(59.5% 正确率),但是在简答题上就很吃力(正确率在 28.7% 到 39.1% 之间)。一般来说,对于需要更高层次思维的问题,ChatGPT 更难回答。有时候,ChatGPT 甚至会为错误答案提供权威的解释,或者对同一个问题给出不同的答案。
“它并不完美,你不能指望它能做所有事情。”杰西卡说,“仅仅依靠 ChatGPT 来学习是愚蠢的。”
IT之家注意到,研究人员还发现了一些其他有趣的现象:
ChatGPT 作为一个人工智能语言模型,虽然具有处理数学问题的能力,但有时也会出现一些错误。这些错误可能是由于模型训练数据不足或算法不够精确导致的。例如,在解决减法问题时,ChatGPT可能会将两个数字相加而不是相减,或者在执行除法运算时出现错误。这些问题可能会导致计算结果不准确,因此在使用 ChatGPT 进行数学计算时,需要仔细检查其答案并加以确认。
ChatGPT 有时会为自己的错误答案提供解释,即便这些答案是错误的。然而,在某些情况下,尽管 ChatGPT 的描述是准确的,但它仍会给出错误的选项。
ChatGPT偶尔会产生虚假信息。例如,在提供参考资料时,它可能生成看似真实的参考资料,但实际上却是完全虚构的。更糟糕的是,有时候甚至连作者的名字都没有。
尽管如此,研究人员相信,在未来的版本中,ChatGPT 会在会计问题上有所进步,并解决上述问题。他们认为最有前景的是,这款聊天机器人可以帮助改善教学和学习,比如设计和测试作业,或者用于草拟项目的部分内容。
作为一名具备深度思考能力的文章写作高手,我理解到原文想要传达的核心信息是关于教育改革与创新的。合作者之一的BYU会计教授拉森的言论,为我们提供了一个重要的反思契机,即审视我们在传授知识过程中是否传达了具有实际价值的信息。这种颠覆性的观念要求我们对未来教学方式进行深入探讨与评估。值得注意的是,尽管拉森教授仍将担任助手,但他的工作将不再局限于传统的教学任务,而是更多地关注创新与实践。这表明,教育改革不仅仅是调整课程设置或更新教学方法,更是要激发学生的主动性与创造力,使他们能够在不断变化的环境中解决问题、应对挑战。总之,拉森教授的言论提醒我们,教育改革是一个持续不断的过程,需要我们勇于面对挑战,积极探索新的可能性。在这个过程中,我们需要时刻关注学生的发展需求,努力提高教学质量,为社会培养出更多具备创新精神和实践能力的人才。
这项研究发表在《会计教育问题》杂志上。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!