ASAP智库|中小学数字教育下一步怎么走?
亚太政策倡议研究所(ASAP)专栏|张博宇、张芷萱
随着教育局《中小学数字教育发展蓝图》(下称《蓝图》)的正式公布,香港特区政府在推动人工智能教育方面踏出了重要一步。《蓝图》为中小学课程融入人工智能素养订立了清晰的方向与目标,反映特区政府就装备新一代迎接人工智能时代所作的部署。在此基础上,下一个问题自然是如何建立一个定期评估政策成效的机制,并据此作出合适的政策调整。这需要一套可信、可靠、科学化的测量工具,将抽象的“素养”概念转化为可供客观评估的具体指标。
学术界已出现AI素养评估工具
建立此类工具其实毋须从零开始,因为国际及本地学术界已有多套经严谨验证的人工智能素养评估工具,并已发表于具高度公信力的学术期刊。这些期刊的影响因子(Impact Factor)均位列相关领域前25%。
要了解评估工具可信度的一个较直接方法,是查阅该工具是否已发表于具高度公信力的学术期刊。一般而言,在高公信力期刊刊载的评估工具,其信度(Reliability)与效度(Validity)均已通过严谨的学术验证。衡量一本期刊是否具有公信力,学术界有一套客观的标准,其中最常用的指标是“影响因子”(Impact Factor)。简单来说,影响因子反映的是一本期刊的文章平均被其他学者引用多少次。数字越高,代表这本期刊在学界越受重视,发表于其中的研究越具有参考价值。期刊还会根据影响因子被划分为 Q1 至 Q4 四个等级,Q1代表该学科领域中影响力最高的前25%期刊。能够登上 Q1 期刊,意味着文章经过该领域顶尖专家的严格审查,内容站得脚,结论可供其他研究者引用和借鉴。
因此,在选取 AI 素养评估工具时,问卷背后的期刊等级是一个不可忽视的参考。近年,在高公信力期刊中已有多个AI 素养评估工具发表、且被多次引用,本文章会介绍当中的三个评估工具(问卷)。这三份问卷的缩写分别为AILQ、SNAIL 和 MAILS,各有侧重点,共同勾勒出当前环球AI 素养评估方法的大方向。
AILQ:香港“土生土长”的评估工具
在三份问卷中,最贴近香港实况的,是 AILQ(人工智能素养问卷,Artificial Intelligence Literacy Questionnaire)。这份问卷由香港学者开发,以363名香港本地中学生作为测试样本,受访者年龄介乎12至17岁。可以说,它是“土生土长”、为香港学生量身打造的评估工具。
AILQ 并非仅停留于测试学生对 AI 的基本认识,而是进一步衡量学生能否评估并应用 AI,以解决不同情境下的问题。问卷亦设有伦理相关题目,例如询问学生是否认同 AI 系统应经过严格测试以确保其正常运作,以及用户是否有责任了解 AI 系统的目的、运作方式和局限性,从而了解学生有否思考使用 AI 时的社会责任。
AILQ 另一个关键的特点在于其充分考虑了中学课程的知识框架与中学生的日常使用语境,题目按中学生的理解水平作出调整。更重要的是,它的信效度验证是在香港学生身上完成的,意味着它所量出的结果,对比起其他国际问卷,更能反映香港学生的AI素养。
SNAIL:为“非专家”而设的通用工具
SNAIL(Scale for the Assessment of Non-experts’ AI Literacy)则是专为“非专家”群体而设计,即那些没有接受过正式 AI 或电脑科学教育、主要作为 AI 使用者而非开发者的人群。值得注意的是,SNAIL刻意将程式设计技能排除在“AI 素养”的定义之外,因为研究者认为程式设计属于另一套独立能力,并非每个人都需要具备。SNAIL 的适用范围相当广泛,可以在各类教育场景(高中及以上)与职场环境中使用,目标是覆盖尽可能多元的非专家群体。
对于AI素养,SNAIL确立了三个维度进行评估,即“技术理解”、“批判评估”与“实际应用”。这意味着对于一个人是否具备AI素养,不仅是需要知道其是否了解AI的基础知识,更关键的是要懂得判断AI 应用局限性及伦理问题。而“实际应用”的部分侧重在理解受访者是否能够在日常生活和工作场景中辨识哪些技术由 AI 提供支持,以及判断某个问题是否适合用 AI解决。
MAILS:把心理层面纳入素养框架
而问卷 MAILS(Meta AI Literacy Scale)不仅涵盖传统意义上的 AI 素养维度,更将心理层面的因素正式纳入测量框架,构成与其他问卷最根本的差异所在。具体而言,MAILS 特别关注两个心理维度,一是学生在使用 AI 时的情绪状态,尤其是管控焦虑与沮丧的能力;二是学生对自己使用 AI 能力的自我效能感,即“我相不相信自己能够有效地使用 AI”。这些看似“软性”的测量项目,实则是判断学生 AI 素养能否真正转化为行动的关键指标。问卷中的题目会直接探问学生在面对不熟悉的 AI 工具时是否感到不安、在使用 AI 解决问题时是否对自己的判断有信心,甚至在发现 AI 给出错误答案时,是否具备足够的心理素质去质疑和纠正。
这种设计为AI素养问卷的现实意义引入了一个新的反思,就是知识与行动之间,往往隔着一道心理的门槛。MAILS通过把这道门槛纳入测量,能够更立体地还原学生的真实素养状态,不只告诉我们学生“能做什么”,更告诉我们他们“为什么愿意或不愿意去做”。
让“AI素养”变得可测量
AI素养如今是一个人人都念兹在兹的关键词,但具体如何量度?若缺乏严谨的测量工具,学生的AI素养有否上升便无从稽考。学术界已经提供了工具,核心期刊亦已经为这些工具的科学性背书。
现在缺失的拼图,是政策决策者和教育界人士把问卷从期刊页面带进课室,把数据从研究报告带进政策讨论,把“懂不懂 AI”从一个模糊的感觉、一个重要的关键词,变成一可以客观回答的问题、可以量化及长期追踪的指标。我们作为智库,乐意与教育业界和政策制定者共同探讨和落实具体工作,贡献下一代的数字教育和AI素养。
作者张博宇为亚太政策倡议研究所ASAP研究总监;作者张芷萱为亚太政策倡议研究所ASAP研究员。
亚太政策倡议研究所(Asia-Pacific Society for Advocacy and Policy, ASAP)结合严谨精辟的公共政策研究及积极倡议策略,将实证研究转化为政策推动力。
文章仅属作者意见,不代表香港01立场。
01专栏精选不同范畴专家,丰富公共舆论场域,鼓励更多维度思考。