律政思|具身智能时代之二:香港有责任成为全球数据中枢
律政思专栏|邓凯博士
2026年4月12日,创新科技及工业局局长孙东代表特区政府与国家互联网信息办公室签署《关于创新科技发展的合作备忘录》。备忘录将双方合作的重点标的明确锁定于人工智能、数据跨境、区块链三项。政策体系已有国家与特区政府共同搭建,剩下的问题也关乎法律方案是否跟上。如果说本系列文的第一篇关注的是机器人的“身体”硬件,那么这份备忘录所圈定的,恰恰是发展具身智能所需的软体版图。更重要的是,它或许预示着一个极具想像力的产业未来,也即:香港很有可能成为全球少数可以同时调度内地海量场景数据、国际开源资源与国际化合规框架的具身智能软件层枢纽。
具身智能发展遇法律瓶颈
机器人在软件层面的挑战,较一般意义上的“数据合规”而言更为复杂,这是由现时的技术和产业特质所决定的。它同时涉及数据采集与流通的合规边界,数据法律评价以及开源生态的责任切割等。每一重问题都有赖于严谨且富有探索性的法律推敲,也正是在种种未有定论的留白之处,香港的制度优势得以体现。
从技术角度讲,与大语言模型主要依赖文本语料不同,具身智能的训练数据具有显著的“物理性”,机器人要学会在真实的物理世界里执行任务,需要的是包括力回馈、触觉感知、空间导航、动态避障等高度场景化的多模态数据,而这些信息是极其稀缺、匮乏的。这也是制约具身智能从实验室走向规模化商用的关键掣肘之一,也由此诞发出产业界破解“数据荒”的两大核心技术流派,即主张建立物理训练场大规模采集“真机数据”的真机派,以及主张在虚拟仿真环境中低成本生成海量“合成数据”的仿真派。然而也必须承认,不论是走哪种技术路线,都不可避免遭遇法律瓶颈。
例如,真机派在真实物理世界中大规模采集多模态数据,关涉“人—机—场景”的视频、声音、动作与空间资讯,至少在中国内地难免触及个人资讯、敏感资讯、重要数据、测绘数据等法律边界,并受到“知情同意”、“正当必要与最小化收集”以及数据跨境等现行规范的约束。再如仿真派的方案也远非一劳永逸案。尽管经演算法生成的合成数据一定程度上规避了隐私与版权争议(通常被认为是降低了个人可识别性风险的重要技术路径),但“匿名化”标准如何界定,数据权属份额和关系可否厘清(是否构成“衍生数据”等),以及反向工程破解风险等问题,仍然缺乏法律定论。
上述数据合规壁垒的背后则是多重产业痛点,复杂的跨境监管现实当然也催生出某种合理期待。一方面,内地具身智能企业需要获取更多的国际开源数据和模型资源以提升自身技术能力;另一方面,能否合法利用内地全球罕见、高密度的制造业场景数据显然也是海外产业方所急盼的。这二者共同结合,塑造了以具身智能为代表的AI创新在体系间规模化以及链接世界的战略想像力。香港正适合扮演这样一个可信赖的制度中间站。
打造具身智能数据自由港
义大利经济学家、中欧数字协会主席鲁乙己(Luigi Gambardella)近日撰文指出:技术竞争越激烈,信任就越稀缺,而可信赖的通道价值就愈发凸显,也由此,香港的独特价值在于让中国创新更加全球化、更具投资魅力、更可信以及更能跨境规模化。该论断在具身智能语境下亦是切中肯綮,香港有条件也有责任肩负起联通内地与国际的数据中枢职能,进而打造具身智能离岸数据港或称“具身智能全球数据自由港”。
首先,在中央政府和香港特区政府的持续努力下,内地城市与香港之间的数据跨境流动逐步放开且日趋规范。国家网信办与特区政府创新科技及工业局于2023年6月签署的《促进粤港澳大湾区数据跨境流动的合作备忘录》,以及同年12月发布大湾区标准合同实施指引,拉开了数据从内地出境进入香港的帷幕。依托自贸区及大湾区重大合作平台(如河套)的创新实践,内地的数据出境香港则进一步豁免安全评估、订立标准合同以及第三方认证等严格法定要求,这显然为机器人产业发展所需的内地场景数据得以经由合法的简化规则通道输入香港提供极大助益。
在离岸一端,《香港个人资料(私隐)条例》(以下简称《私隐条例》)第33条以搁置生效的取巧方式保证香港与海外数据流动相对通畅,从而形成了“入向有简化通道、离岸无法定限制”的独特数据法架构。这使得香港能在全球数据本地化浪潮中逆势而行,成为罕见的双向自由流动节点。而就具身智能而言,其产业发展所需的高质量、可泛化、可持续的高质量数据供给,天然具有跨国界需求——多语种语音、跨文化行为、多样化场景的采集与标注须在全球范围完成。香港恰恰提供了内地数据合法出海、国际数据合规汇聚的制度通道,此即“具身智能全球数据自由港”的法理基础。
让《私隐条例》成为通行证
仅有自由流动尚不足以成就数据港,国际数据流通的另一端是信任,也即数据输出方须确信其数据在接收地获得与其本国实质相当的保护水准。《私隐条例》恰在此处发挥制度信用的担保角色。《私隐条例》于1996年生效,是亚洲最早的综合数据保护立法之一,其六项保障资料原则以OECD隐私指引为蓝本,与APEC隐私框架实质对齐,在全球主要经济体中具有广泛的法律互认基础。
而相关司法实践也强化了《私隐条例》的可信价值,如在EC Healthcare案中,香港的法律裁判者严格诠释目的限定原则,向国际社会充分证明《私隐条例》绝非“纸面规则”而是实实在在具有约束力的司法规范。故此,数据的自由流动与可信保护在香港构成了数据秩序近乎完美的一体两面:《私隐条例》无疑是数据自由港的“通行证”而非“小院高墙”,它使香港既不同于内地严控数据安全的刚性管制,也区别于完全缺乏数据保护立法的离岸避风港,而是在保护水准国际认可的前提下实现数据的高效流转,更是离岸“可信赖数据枢纽”在法制层面的具象化。
为跨境数据提供法律容器
基于上述制度优势,笔者建议香港在以下方向作出前瞻性的政策与法律部署。其一是创设“具身智能跨境数据特区”。借助河套深港科技创新合作区或北部都会区相关创科平台,建立专门面向具身智能数据的“离岸数据沙盒”,允许内地企业在合规框架下利用国际开源数据进行模型训练,亦认可国际企业在安全、受控环境中处理来自内地的场景数据。技术层面,可依托隐私计算、联邦学习、区块链可信验证等手段实现“数据可用而不可见”,相信这也是本文开篇论及香港与内地双方率先从人工智能、数据跨境以及区块链领域推进创科发展的应有之义。
二是探索建立“具身智能数据信托”(Embodied AI Data Trust)制度。信托是普通法体系下独有的法律工具,香港拥有全球最成熟的信托法律服务生态。将信托法理引入机器人数据治理领域,意味着可以设立一种法定的数据受托人机制:由独立的第三方信托机构代为持有和管理具身智能训练数据,按照预先约定的信托契约向数据提供者和数据使用者分别履行信义义务(fiduciary duty)。这种安排为跨境训练数据共用提供了一个各方可信赖的“法律容器”,既保障数据提供者的权益不被滥用,也给予数据使用者以清晰的合规预期。
确立“责任避风港”规则
三是关于确立面向具身智能开源生态的“责任避风港”规则。开源是具身智能技术进步的重要推动力,从模型架构到仿真数据集,开源共用极大地降低了研发门槛,包括腾讯TAIROS具身智能开放平台(以模组化方式提供具身大模型开发工具和数据服务)以及智元机器人作为全栈部署具身智能生态技术体系的先行者开源其自研机器人操作系统等主流实践,均印证开源开放范式乃大势所趋。然而也必须承认,开源人工智能的法律责任体系至今并无完全厘定,这一悬而未决的法律风险或许也在抑制全球开源社区的参与热情。香港对此能怎么做?
立足开源范式(不论是模型、系统抑或是数据)的公共(非盈利)属性,人工智能透明度增益以及下游控制力受限等朴素考量,香港或可在其知识产权与侵权法框架下确立清晰的开源开发者免责或限责条款,明确在符合一定条件下(如已尽合理披露义务、未参与商业部署决策),开源贡献者不对下游用户的具体应用后果承担侵权责任的新型规则。这种制度供给将有力吸引全球顶尖的具身智能开源专案在港设立社区节点或法律实体。
作者邓凯是香港城市大学法律学院公法与人权论坛高级研究员、法学博士。
“律政思”是由法律专业人士主笔的法律评论专栏,旨在以专业视角,剖析国际、中国内地和香港的法律发展、法治建设及相关社会议题,深化公众的理解。
文章仅属作者意见,不代表香港01立场。
01专栏精选不同范畴专家,丰富公共舆论场域,鼓励更多维度思考。