国外青少年运动健康数据共享经历了从数据孤岛到国际协同、从理念孕育到实践探索、从本土自用到循证决策的转变过程。运用文献资料分析、逻辑分析等方法,梳理国外青少年运动健康数据共享的演进脉络和成功经验,并基于我国情境提出本土化发展路径。研究认为,国外青少年运动健康数据共享的发展经历了基础监测与数据孤岛的初始收集阶段、机制构建与共享初探的探索发展阶段、共享标准化与全球化的成熟拓展阶段。国外青少年运动健康数据共享围绕共享时序、内容覆盖、经济属性和权限管控等方面展开,根据对初始与阶段动态共享机制、全面开放与敏感数据管理、免费开源与成本分摊模式、使用主体身份与共享边界的不同选择形成了不同的共享模式。未来可以从以下方面推进青少年运动健康数据共享:1)构建数据共享时序机制,提升数据时效性与完整性;2)建立多层次的共享框架,平衡全面开放与隐私保护;3)探索多元化经济模式,兼顾公益属性与可持续发展;4)完善分级数据管理体系,强化数据共享与应用效能。
青少年阶段是健康发展的关键窗口期,其发展状况不仅深刻影响个体的终身健康水平,更直接关系到国民健康素质与国家的未来。然而,当前青少年群体仍面临多重严峻的身心健康挑战:近视检出率与肥胖率持续处于高位,脊柱侧弯等体态异常问题日益凸显,焦虑、抑郁等心理健康风险显著攀升(毛振明 等,2024;GBD 2021 Adolescent BMI Collaborators,2025)。“小眼镜、小胖墩、小豆芽、小焦虑”等典型健康问题,集中反映了现有运动健康促进工作在响应青少年个体差异和多元需求上的滞后性(季浏 等,2024)。在数智技术赋能青少年体育高质量发展的背景下,优化青少年运动健康促进效能,亟需依托数据要素的高效流通与深度应用,关键支撑在于运动处方的科学化制定、体育教学方案的个性化设计以及健康监测体系的精准化构建(陈思同 等,2017;董倩 等,2024)。本研究将青少年运动健康数据定义为:在以运动为手段促进个体或群体健康的全流程中,通过技术设备、评估工具、行为记录等方式生成或获取的相关数据集合。包括体育活动次数、时间、类型等运动类数据,立定跳远、握力、坐位体前屈等体质健康类数据,平衡木行走、拍球、跳绳等动作技能类数据。
依据健康科学数据生命周期理论,数据的共享与应用不仅是促进生命周期良性循环的关键步骤,更是健康科学数据管理的核心目标(赵安琪 等,2020)。尤其对于青少年运动健康领域,数据的共享开放至关重要,其成为数据向信息、知识乃至智慧转化,并最终支撑科学决策的桥梁(Ackoff,1989)。部分欧美发达国家对此高度重视,已构建起体系化的政策框架、引领性的技术标准和场景化的应用生态,有力推动了青少年运动健康数据的共享。这种深度应用实现了对青少年健康风险的早期预警与精准干预,促进了相关科研成果的涌现,且反哺了青少年运动健康促进政策的持续优化。在我国,《科学数据管理办法》《国家健康医疗大数据标准、安全和服务管理办法(试行)》等政策的印发推动了数据共享水平快速提升,但青少年运动健康领域的数据共享水平仍有较大提升空间。
针对我国长期存在的青少年运动健康数据共享碎片化、健康风险预警滞后及干预不精准等治理困境,亟需大力推进相关数据的共享应用实践。这不仅是破解我国青少年体质健康治理难题、驱动青少年体育数智化转型的必然要求,也是顺应时代趋势、加快建设体育强国和推进健康中国建设的关键战略支点。鉴于此,本研究旨在系统梳理并解构国外青少年运动健康数据共享的演化脉络,深入阐释其成熟的模式特征与核心经验,基于国际比较视野,探索并提出符合我国国情的青少年运动健康数据共享本土化路径,有效提升数据价值。
国外青少年运动健康数据共享的发展,即从相关概念提出到实践应用尝试再到国际合作推广的演进过程。其发展呈现出健康数据共享理念逐步觉醒并推动技术整合,最终延伸至运动健康的渐进特点。本研究以标志性政策和典型共享案例为依据,将国外青少年运动健康数据共享历程划分为基础监测与数据孤岛的初始收集阶段、机制构建与共享初探的探索发展阶段、共享标准化与全球化的成熟拓展阶段(图1)。
国外科学数据共享理念的萌发可追溯至20世纪中期,其诞生本质上是全球科学合作需求与技术迭代共同驱动的产物。二战后,各国在科技领域的大规模投入催生了海量数据,但数据存储与共享机制的缺失导致大量信息资源流失,这一现状促使前沿科研机构与国家逐步意识到数据共享的战略价值。1966年,国际数据委员会(Committee on Data of the International Science Council,CODATA)的成立成为重要里程碑,该组织致力于提升全球科技领域高价值数据的质量、可靠性、管理与可访问性水平,尤其强调推动科学数据的开放共享和实践应用(中国科学院,2008)。同年,美国《信息自由法》(Freedom of Information Act)的颁布从法律层面确立政府数据公开原则,为科学数据共享提供了制度化保障(连志英,2008)。1972年,美国社会科学界提出“二次分析样本调查”方法论,通过推动人口普查等政府统计数据的脱敏与开放,奠定了社会科学数据再利用的方法论基础。1982年,Science杂志发表专题论述,针对研究领域竞争性权益保护与传统科学数据保密机制提出反思,倡导扩大数据访问权以促进科学思想的自由交流(Dorothy,1982)。此后,互联网技术的兴起为数据远程共享提供了技术支撑,在技术革新和理念传播的双重驱动下,国外开源数据库体系逐步成型,推动数据共享实现了从理念构想向实践层面的发展。
在国外科学数据共享理念孕育萌发的同时,全球范围内的科学数据共享的实践探索亦同步展开。1957年,在国际科学理事会统筹下成立的世界数据中心(World Data System),旨在整合地球科学、空间科学和天文学等学科的离散数据资源,构建全球科学家通用的集中式数据存储和共享平台,标志着国际科学数据共享迈出关键一步(唐源 等,2015)。1962年,密歇根大学搭建了美国校际社会科学数据共享联盟存储库(Inter-university Consortium for Political and Social Research,ICPSR),作为国际上较早的专业化数据存储库之一,其初期以社会科学数据整合与共享为核心职能。1970年,联合国教科文组织通过“人与生物圈计划”,构建了世界海洋数据库,汇集并共享了1772年迄今的海洋剖面数据,涵盖温度、盐度、氧含量等关键参数。1972年,美国国家意见研究中心推出综合社会调查数据集(General Social Survey,GSS),通过持续性采集美国社会多维统计数据,推动社会科学数据的开放共享进程,为后续社会科学研究提供了丰富的数据资源。1990年,人类基因组计划(Human Genome Project,HGP)全面启动,其基因组序列数据依托美国国家生物技术信息中心GenBank等国际数据库实现全球同步共享。早期国外科学数据共享实践主要集中在医学、海洋科学、社会科学等特定领域,奠定了多学科数据整合与共享的技术和范式基础,并逐步拓展了数据共享的学科边界与应用场景。这些探索不仅驱动了学科交叉融合与学术创新,亦促进了数据共享理念的跨领域传播与制度化应用,为后续青少年运动健康数据共享的发展提供了理论参照与实施基础。
第二次世界大战后,伴随城市化加速,青少年身体活动锐减、体质健康水平下滑,超重肥胖等问题频发,引起各国政府关注(燕凌 等,2015)。随着研究证实运动对健康的促进作用(Janssen et al.,2010),国外开始涌现并逐步聚焦青少年运动健康数据收集、共享及应用的政策和数据库构建。1956年美国颁布《国家健康调查法》(National Health Survey Act),作为全球较早为持续健康调查提供立法授权的法规文本,具有标志性意义(National Center for Health Statistics,2015)。美国国家卫生统计中心(National Center for Health Statistics)于1960年启动全国健康检查调查(National Health Examination Survey),系统采集人体测量学、心理健康以及疾病等相关数据。至1970年,伴随饮食习惯与疾病之间关联研究的深化,全国健康检查调查纳入营养状况的调查,更名为全国健康和营养检查调查(National Health and Nutrition Examination Survey,NHANES)。1981年,斯洛文尼亚启动全球运行周期最长的儿童青少年体质健康纵向数据库SLOfit试点,构建了对青少年体质健康数据的系统性追踪记录和存储。翌年,学龄儿童健康行为调查(Health Behaviour in School-aged Children)项目发起,成为最早对儿童青少年健康和福祉进行跨国数据协同收集与分析的研究之一。1986年,美国体质健康监测系统(FITNESSGRAM)全面运行,系统性构建覆盖青少年体质健康及体育运动行为的综合性监测体系。2003年,德国儿童与青少年健康访查调研项目(Studie zur Gesundheit von Kindern und Jugendlichen in Deutschland,KiGGS)启动数据采集工作,包含了运动能力与体力活动参与、心理健康、环境、营养等调查模块(尹晓峰 等,2017)(表1)。同年,世界卫生组织(World Health Organization,WHO)发起的全球学校学生健康调查(Global School-based Student Health Survey)项目,成为国外最早进行全球范围青少年运动健康调查的研究之一。
2005年,WHO主导的全球学校学生健康调查首次将2003年采集的多国调查数据通过官方网站向全球科研机构和公众开放共享。该项目通过标准化问卷测评,系统整合并共享了国际青少年身体活动、卫生疾病、饮食行为、暴力与非故意伤害等多元模块数据,在公共卫生、运动医学及行为科学等学科研究中获得广泛应用,成为运动健康数据共享的全球范本。值得关注的是,全球学校学生健康调查项目在正式启动前已对其调查问卷的信效度进行了科学验证(Alkhraiji et al.,2022),确保其采集数据的可靠性、可信度和可用性水平,最终构建起具有全球性和可比较性的青少年运动健康数据库。同年,西班牙发布的运动习惯调查(Encuesta de Habitos Deportivos)亦通过官网平台开放原始数据,共享了西班牙青少年运动参与水平、运动动机与兴趣等多个指标。这些开创性实践实现了青少年运动健康数据共享从无到有的突破,打破了跨国数据流通的壁垒,不仅为各国数据共享提供了可复制的操作范式与标准参照,更在国际共享合作机制创建层面打下制度性基础,有效释放了青少年运动健康数据的公共价值与研究潜力。
随着国外青少年运动健康数据共享的逐步推进,多源异构数据的系统性整合与制度化共享机制逐步成型。2007年,全球数据和商业智能平台Statista创立,逐渐共享了美国、日本等多个国家的青少年运动频率、运动项目、体育俱乐部参与率等多维数据,标志着多源运动健康数据整合与商业化共享范式的形成。次年,欧洲健康访谈调查(European Health Interview Survey,EHIS)依托Eurostat平台实现标准化数据共享,系统化集成欧洲15岁及以上青少年群体的健康指标数据集,包含了青少年身体活动等运动健康指标,并通过欧盟统计局的权威性核验与认证,成为区域数据协同共享的典型案例(Lange et al.,2017)。同年,德国KiGGS长期追踪项目建立数据共享申请准入机制,要求研究者通过与罗伯特·科赫研究所的科研合作获取数据,初步构建了科研合作与数据安全双轨并行的共享架构。学龄儿童健康行为调查也随后在其网站上共享其跨国追踪数据,涵盖身体活动、社会环境、精神健康、肥胖与身体形象等多维模块,共享了青少年身体活动频率、时长等指标,为全球青少年健康研究提供了具有跨文化可比性的基准数据集,并被应用于多项青少年健康风险因素的前沿研究。在此阶段,国外运动健康数据的共享机制和框架加速完善。2009年,DataCite为科学数据单独注册DOI,完善了数据共享与科研应用的关联(雷雪 等,2024)。2011年全球健康数据交换平台(Global Health Data Exchange)的创建,实现了对流行病学、人口统计与健康系统数据的跨领域动态集成。2012年,科学数据仓储注册系统re3data的上线与国际研究数据联盟的成立,分别从技术标准化与协作制度化双重维度,推动了数据共享的范式形成与规范化流通。
伴随开放政府理念在国际层面的出现和传播,2009年美国政府数据中心通过Data.gov无偿开放涵盖青少年身体活动的政府数据,此举显著降低了青少年运动健康相关研究的准入门槛,是政府主导数据共享范式的重要突破(于梦月 等,2017)。继而,2011年《开放政府声明》(Open Government Declaration)的签署及2013年G8峰会《开放数据宪章》(G8 Open Data Charter)的落地,从政策层面将数据共享确立为全球治理共识与国家战略要务,驱动多国加速构建国家级数据共享体系。法国国家数字局()、欧盟开放数据门户()、澳大利亚国家数据中心()、英国政府数据中心()以及日本政府开放数据门户()等网站相继上线。这些平台系统整合了青少年运动健康监测数据,并向公众共享了青少年身体活动、运动参与行为等数据。此类举措不仅强化了政府主导的数据透明度,更通过欧盟数据目录词汇表(Data Catalogue Vocabulary,DCAT)协议等标准化元数据架构,实现了跨国数据的互操作性。至此,青少年运动健康数据共享机制实现了从科研数据流通共享向政府主导的多维数据开放升级,完成了从区域协作探索共享向全球合作框架建构的发展,为后续全球青少年运动健康数据共享的标准化和协作推进提供了制度范本。
2014年,国际科学数据管理和共享准则FAIR原则首次提出,涵盖可发现(findable)、可访问(accessible)、可互操作(interoperable)、可重用(reusable)4个维度,为科研数据开放共享提供了标准化准则。在90多个国际组织联合签署《赋能FAIR数据承诺声明》(Enabling FAIR Data Commitment Statement)后,成为当前国际范围科研数据共享所遵循的核心原则之一,标志着数据共享实践完成了从技术自发向制度自觉的范式转型(曾粤亮 等,2025)。在此背景下,青少年运动健康数据的测试采集、共享开放及应用推广等国际协作持续深化,MORE data、Global Matrix1.0~ 5.0、Fitback、全球儿童青少年身体活动问卷(Global Adolescent and Child Physical Activity Questionnaire,GAC-PAQ)等数据库或合作项目相继落地并实现数据流通。自2014年起,青少年运动健康数据共享呈现出标准化和全球化的双重特质,全球范围内数据共享实现了从分散探索向系统化共享开放的关键突破。
2014年,国际体育科学领域的首个共享数据库MORE data项目启动,并于2016年投入运行,该数据库系统整合了1974—2018年间青少年坐位体前屈、仰卧起坐、握力、折返跑等23个运动能力数据指标,包含力量、耐力、灵敏和协调4个维度,并累计发布了40个标准化数据集,覆盖了德国、西班牙、斯洛文尼亚等12个国家的数据。同年5月,全球儿童与青少年身体活动水平的监测与比较体系Global Matrix1.0完成建构并发布首份报告,为国际青少年身体活动水平的评估与比较提供了基准参考框架。2015年,美国发起的青少年大脑认知发展研究(Adolescent Brain Cognitive Development,ABCD)共享了青少年身体活动、运动参与类型、大脑发育等认知和运动健康相关数据。随着加速度计等可穿戴设备的普及应用,2017年国际儿童加速度计数据库(International Children’s Accelerometry Database)完成更新上线,在整合欧洲、美国、巴西、澳大利亚等国家原始ActiGraph数据及健康数据的基础上,提供了更多身体活动的纵向数据,为破解身体活动健康效益机制等关键问题提供数据支撑。同年,ICPSR共享青少年身体活动数据,为身体活动行为与社会科学变量的关联性研究提供了依据。2018年,GLOBEM数据库通过手机应用程序和可穿戴设备持续采集并共享了为期4年的身体活动与睡眠行为数据。此外,英国的Active Lives、澳大利亚的AusPlay、欧洲的Fitback等国家及区域性青少年运动健康数据共享平台相继建立数据追踪与共享机制。Global Matrix5.0、GAC-PAQ、全球幸福研究等跨国协作项目的参与国家数量持续增长,青少年运动健康数据共享步入全球协同新阶段。
随着国外青少年运动健康数据共享效能的提升,其对政策制定的科学支撑作用显著增强。在国际“证据文化”兴起并逐渐主导政策制定范式的背景下(吕钶,2024),青少年运动健康数据共享对政策制定的支持价值日益凸显。德国KiGGS作为最权威的青少年健康监测系统之一,其数据有效弥补了政策制定的信息缺口(Mauz et al.,2020)。KiGGS纵向追踪数据指出德国青少年肥胖问题日益明显,为德国联邦卫生部2015年启动COME-ON青少年肥胖预防项目提供了关键的实证证据(Joisten et al.,2022)。2017年,WHO在参考GBD数据库(Mokdad et al.,2016)、WAVE调查(Sonenstein,2014)等发表的全球青少年健康负担以及弱势青少年群体健康福祉等相关研究结果的基础上,发布了《全球加快青少年健康行动(AA-HA!):支持国家实施工作的指导意见》[Global Accelerated Action for the Health of Adolescents (AA-HA!):Guidance to Support Country Implementation],并制定了包含青少年身体活动、心理健康在内的一系列循证干预措施。
青少年运动健康数据共享的价值受到众多发达国家的重视,并相继推出了相关政策,将其纳入国家健康治理体系重要议程。美国、加拿大等北美洲国家聚焦数据平台建设与技术工具迭代,旨在实现地区间数据收集、共享及比较。奥地利、英国、法国、爱尔兰、葡萄牙等欧洲国家则侧重数据交流工具的开发与跨国兼容监测系统的构建,推动跨部门协作及采用国际标准,促进数据的跨部门及跨国共享。新西兰、澳大利亚等大洋洲国家通过完善国家健康调查体系强化数据纵向追踪能力,为健康促进政策制定提供动态循证基础。日本采用分阶段推进策略,从基础数据库建设,到加强数据获取共享,再到数据整合分析系统的构建,打造了青少年运动健康促进的生态体系。如表2所示,国外众多发达国家在运行机制制度化、标准规范体系化、应用推广场景化以及国际合作战略化等方面加大投入,旨在通过资源整合与共享应用的驱动,实现青少年运动健康促进工作的提质增效。
近年来,国外关于青少年运动健康数据共享的相关文件持续涌现与并不断更新,推动其向高效化、标准化和透明化方向纵深发展。2022年,美国国家卫生统计中心推出了数据链接计划(NCHS Data Linkage),通过将NHANES等健康促进数据与其他行政数据联系起来,使研究人员能够分析影响残疾、慢性病、医疗保健利用率、发病率和死亡率的健康促进因素,旨在将人群健康调研数据的科研价值与政策转化效能最大化。同年,WHO颁布了《出于研究目的共享和再利用健康相关数据:WHO政策和实施指南》(Sharing and Reuse of Health-related Data for Research Purposes: WHO Policy and Implementation Guidance),系统构建覆盖数据全生命周期的操作指南及健康数据共享政策框架,明确了国际青少年健康促进相关数据共享的操作流程和实施基准。2025年,国际随机对照试验的报告规范(Consolidated Standards of Reporting Trials,CONSORT)的修订,新增了数据共享条目,将数据共享从“可选附录”修改为“强制性科研伦理”,要求提供获取去标识化的个体参与者数据及其他材料的途径,医学及健康促进研究领域对数据透明度的要求和共享伦理的共识达到了新高度(Hopewell et al.,2025)。
回溯国外青少年运动健康数据共享的发展轨迹,发现数据状态实现了从“数据孤岛”到“壁垒消解”再到“国际协同”的蜕变;数据采集完成了从“基础指标监测”到“主观行为报告”再到“客观量化追踪”的进阶;共享机制完成了从“理念倡导”到“共享探索”再到“制度深化”的转变;应用情况则实现了从“本土自用”到“科研协作”再到“循证决策”的突破。此外,美国国家卫生统计中心数据链接计划、WHO健康数据共享利用指南、随机对照试验报告规范等文件的梯次出台,共同驱动国外青少年运动健康数据共享持续深化。
针对青少年运动健康数据采集后的共享时序策略,即选择初始数据共享或是分阶段动态更新共享,域外已形成两种模式,即初始共享模式和阶段共享模式。初始共享模式是指在项目启动时即确定数据共享框架,实现数据的初始即时共享,并在后续研究中进行动态更新和实时调整,多被应用在多主体协同的联合式或集中式项目的实时数据共享中。例如,德国发起的MORE data数据存储库项目汇集10余个国家(地区)的青少年运动表现数据。但基于资助情况,其发展主要分为两个时期,第一时期侧重于设计共享的总体思路和构建第一版可用的数据存储库,包含了上传、下载、搜索和引用等主要功能。第二时期侧重于数据存储库的可用性和可持续性(Katja et al.,2024)。又如,全球健康数据交换平台在项目启动后就确定了分层共享与权限管理框架,并将从全球范围内收集的各种健康相关数据,按照分类和标签上传至平台共享,后续通过纵向数据补充实现动态持续更新。初始共享模式通过第一时间将青少年运动健康数据进行共享,确保了数据共享的时效性,并提升了数据资源利用效率。阶段共享模式是根据研究周期演进或数据敏感梯度,分批次的共享数据,多见于调查类和追踪类项目。英国的全国性千禧年队列研究通过加速度计记录青少年从5岁开始的身体活动数据,并追踪到17岁,按9个月、3岁、5岁、7岁、11岁、14岁和17岁年龄分7个阶段进行调查,每个阶段完成后通过英国数据档案馆逐步分批次进行共享(Heather et al.,2016)。此外,德国KiGGS也采用队列研究设计(图2),在完成每个阶段的调查后,基线等纵向波段数据经过处理和质量控制后分批次生成独立的数据集进行共享,并且在保证核心指标持续追踪的基础上,KiGGS不同阶段调查也包含不同维度的数据,基线调查采用访谈、问卷和测试全面采集基础健康数据,阶段1通过电话访谈和问卷补充了健康行为数据,阶段2则延续访谈、问卷和测试的形式,新增了环境健康数据的收集(Mauz et al.,2017),通过不同阶段数据维度的渐进拓展,满足青少年长期健康促进和研究的需要。青少年运动健康数据的分阶段共享,有助于提升数据的质量控制水平和指标多样性,灵活匹配研究需要,并促进多维度和跨领域的研究合作。
不同维度数据的共享涉及共享开放与隐私保护的平衡,是青少年运动健康数据实现共享需解决的核心问题。全维度数据共享模式是将不包含直接或间接标识符且披露风险极低的数据,进行全域开放与直接获取,登录网站可以直接下载使用数据。根据主导机构的不同将其分为政府主导和科研机构主导两种范式。随着开放透明政府理念的推广,美国政府上线了国家级数据共享平台Data.gov,对政府机构的数据集进行整合和共享,其中包含了青少年身体活动的全维度数据(Marc et al.,2014)。该政府主导数据共享模式,遵循美国政府提出的8项核心原则:1)完整性,所有公共数据均应公开;2)原始性,数据应以在源头收集时的原始形式提供;3)及时性,数据应在必要时尽快公开,以保持数据的价值;4)可访问性,数据应向最广泛的用户群体以最广泛的目的开放;5)可处理性,数据的结构合理,能够实现自动化处理;6)非歧视性,数据向任何人开放,无需注册;7)非专有性,提供多种格式的数据,而不是仅使用单一的专有格式;8)无许可性,数据不受任何版权、专利或商业秘密法规的约束。相较于政府主导模式聚焦保持数据的公开透明性,科研机构主导模式则更加侧重于全维度数据存储管理以及检索和共享的精准性。如德国卡尔斯鲁厄理工学院构建的MORE data运动科学数据库,可通过单个或组合搜索词,按照测试项目、年龄、性别等变量精准检索全维度的青少年运动科学数据。并且,MORE data构建了指标映射功能,帮助科研人员将所上传的数据指标与数据库的指标体系进行自动匹配,保证了全维度数据的精准共享。
青少年运动健康数据共享的经济模式选择,即采取免费共享或是分级收费策略,以及收费策略的制定,均是数据库实现可持续共享的核心命题。
首先,对青少年运动健康数据进行免费共享的国外数据库资助来源一般包括政府补贴和非营利组织。例如美国ICPSR、西班牙运动习惯调查、美国青少年风险行为监测系统(Youth Risk Behavior Surveillance System)分别得到了联邦政府、西班牙高级体育委员会和美国疾病控制与预防中心等政府机构的资金支持,数据无需申请权限且不收取任何访问或使用费用。并且,美国青少年风险行为监测系统在共享的基础上配套提供了YRBS Explorer在线数据分析工具,免费提供多层次数据筛选、跨区域数据比较、交互式数据可视化以及健康行为趋势分析等服务(Brener et al.,2024)。非营利组织的资助对国外青少年运动健康数据实现共享也发挥着重要作用。如MORE data数据库源于卡尔斯鲁厄理工学院的体育与运动研究所启动的“运动研究数据的eResearch基础设施”项目,如图3所示,该项目在2014—2023年的两个阶段内获得了德国研究基金会的资助,推动MORE data数据库实现可持续运营。
其次,当青少年运动健康数据共享平台涉及多个国家的国际合作时,其资助模式主要包括:1)成员国自筹,参与合作的每个成员国和地区自行承担本国研究经费。如学龄儿童健康行为调查要求各参与方自行负责经费,且大部分成员国的政府机构均进行了资助。2)发起国资助,由项目发起方提供国际合作项目经费。如GAC-PAQ项目由发起国加拿大的卫生研究院直接资助,在覆盖六大洲的14个国家开展了身体活动问卷研发与验证,数据在成员国间共享(Larouche et al.,2025)。3)国际或区域组织注资,国际或区域政府机构、非营利组织为数据共享提供资金。如欧洲的fitback项目,得到了欧盟的“伊拉斯谟+合作伙伴关系”的捐款资助,旨在促进体育领域的国际合作与创新(Joensuu et al.,2024)。
首先,完全共享模式对数据使用主体的身份限制较少,大部分政府共享的运动健康数据均采用无需注册直接共享下载的形式,例如美国政府数据开放平台及西班牙运动习惯调查等,无需注册即可直接下载;部分平台如全球健康数据交换平台需收集姓名、单位、数据用途等个人信息,并向所有注册者开放数据访问权限;国家健康访谈调查(National Health Interview Survey,NHIS)等数据库要求未经授权不得用于商业,国外青少年运动健康相关数据库和平台通过注册机制、信息验证和商业用途限制在一定程度上保障了数据安全与公共利益。
其次,科研共享模式侧重于将数据共享给经过认证的科研人员和团队。如国际儿童加速度计数据库,要求申请者具备相应研究能力和资质,且隶属于高校、科研机构、政府部门或非营利组织等单位,并需提交包含研究目的、假设、计划、时间进度等内容的申请表。而对于学生群体,则需有担保人才能使用数据,如ICPSR平台规定学生须在教师担保人监督下才能访问使用其受限数据(Hemphill et al.,2022)。
最后,部分国外项目采用合作共享模式,参与合作项目的成员可以优先获得数据共享使用权限。这类模式以学龄儿童健康行为调查和全球学校学生健康调查为代表,学龄儿童健康行为调查的数据在完成汇总后的3年内仅对学龄儿童健康行为调查成员国团队开放申请使用权限,此后才向公众开放获取。此外,WHO发起的全球学校学生健康调查为负责该国调查的协调员提供“两年窗口期”,在数据公布之前有两年的数据优先使用和发表的权限。国外不同权限管控的青少年运动健康数据共享模式在满足数据安全与合规要求的同时,也对数据的传播速度、使用范围及应用场景产生了深远影响,进而作用于数据共享的整体效率。
在国外青少年运动健康数据共享的浪潮中,我们既要洞察国外先进模式的突出亮点,也要察觉其中潜在的问题与局限,应聚焦本土场景并审慎辨析域外经验对我国适用性与排异性的边界。目前我国已逐渐形成了多个涉及青少年运动健康数据的数据库。2008年,由北京大学实施的中国家庭追踪调查采集并共享了青少年运动频率与时长等数据。2012年,中国教育追踪调查由中国人民大学发起,共享了青少年体育锻炼、课外体育活动等数据。2015年,山东大学团队创建了青少年健康主题数据库,共享了青少年体育锻炼次数与时长等运动行为数据。此外,国家学生体质健康监测数据平台整合了青少年体质健康数据,为政策决策提供了依据。
但当前我国青少年运动健康数据共享存在一定不足:1)数据整合层面,相比国外成熟实践,国内相关数据大多处于“数据孤岛”的状态,且数据共享的标准化缺失并存在互通壁垒,共享开放不足制约了青少年运动干预策略的科学性和普适性;2)制度设计层面,缺少敏感数据信息的处理原则和依据,难以建立统一的数据共享机制和框架,导致对青少年隐性健康问题的防控存在盲区;3)资金支撑层面,相较国内健康、医疗、教育等领域的数据库建设,数据平台的运营模式及经费来源单一,共享应用的科学性和可持续性仍有待提升;4)应用靶向层面,相比国内中老年群体运动健康数据的应用,聚焦青少年群体的专用数据库匮乏,限制了数据价值的释放与应用效果,数据应用的规范性和效率仍有待提升。因此,基于域外案例的成功经验,针对国内现存问题提出可行的本土路径。
青少年运动健康数据的动态更新与全周期管理是保障数据价值的基础,其关键在于构建兼顾数据时效性和完整性的共享机制。推动从静态统计共享向实时监测更新的模式转变,强调“注重数量”与“突出质量”相结合,精准刻画我国青少年健康成长动态。以有效解决我国当前绝大多数的数据仍处于“数据孤岛”状态,共享开放水平较低的问题。
强化共享系统的功能适配与智能化水平,嵌入动态权限管理、多维检索及可视化分析模块。注重系统设计的基层用户导向,在深度理解我国学校体育教师、基层教练员、校医、班主任、相关科研人员的工作场景、技术能力和实际需求的基础上。开发个性化数据定制服务,支持按性别、年龄段、健康问题等标签生成定制数据集,降低数据共享门槛。并且,还可以嵌入青少年异常数据智能预警和区域健康风险评估模型,辅助政策的动态调整与实时决策,以解决当前我国青少年健康问题预警及运动干预滞后性的问题。如斯洛文尼亚SLOfit在应对COVID-19时开发的体质健康晴雨表基于对20 000余名青少年体质健康数据接近实时的持续追踪,划分了4个体质健康水平等级,并将体质健康监测结果向政府部门和公众共享开放。当SLOfit晴雨表显示青少年整体体质健康水平显著下降时,斯洛文尼亚政府部门会启动青少年健康生活方式的国家干预方案。该方案涵盖增加体育课程、强制课间休息、促进户外活动等多项措施,已被证实能够显著提升青少年运动效率、体质健康水平并降低肥胖率(Jurak et al.,2021)。
针对青少年长期健康需求,需建立分层共享框架,基于数据敏感梯度、研究需要和应用场景划分共享层级。如体质健康指标、运动频率等基础数据应实时开放共享,确保公共决策的时效性;心理健康变化等追踪类数据可按年龄或追踪周期分阶段共享,并在共享后动态补充增量数据并修订历史数据,以保证数据的应用价值和范围。如中国健康与养老追踪调查(China Health and Retirement Longitudinal Study,CHARLS)收集并共享了一套代表中国45岁及以上中老年人家庭和个人的高质量微观数据。CHARLS在试调查后,于2011年开展了全国基线年开展追踪调查,分阶段开放共享数据,保证了数据的时效性和应用价值,在多个学科领域均得到了广泛应用(卢旭蕊 等,2025;唐志东 等,2025)。此外,针对目前国内青少年运动健康数据库主要采用主观问卷收集数据的不足,还可考虑在数据追踪采集中增加ActiGraph GT3X-BT型三轴加速度传感器等可穿戴设备的应用比例,提升数据采集的精准性和客观性。
破除教育、体育、卫健等部门的数据壁垒,以青少年个体为中心,构建统一的标准化接口,避免权限僵化的问题。通过开发多源数据映射规则,实现青少年医疗体检、运动处方、体质、心理及营养健康等异构数据的精准匹配与共享应用。如美国国家卫生统计中心通过数据链接计划,将NHANES数据库与国家死亡指数(national death index)、美国肾脏数据系统、儿童健康保险计划、城市发展部门相联通,扩大了数据辐射范围和应用场景。我国可参考此思路将学生校园体育课程、校外运动行为记录与体质健康测试数据、体检数据、校外就医数据相关联,通过统一数据采集标准,将中国家庭追踪调查、中国教育追踪调查、青少年健康主题数据库以及体质健康监测等数据链接起来,形成“运动−健康”闭环链条的“青少年运动健康促进档案”。
维系青少年运动健康数据共享开放与隐私安全间的动态平衡,需以分类分级管理模式为核心。以专项政策为引领、数据分级为支柱、法规伦理为底线,促进“技术加持”与“监管补位”落实,构建多层次的共享框架,以弥补我国在青少年运动健康数据共享方面针对性指导政策和机制的缺失。
建议由教育部、体育总局、卫健委等多部门联合制定“青少年运动健康数据共享管理办法”,明确数据采集流程、指标范围、应用开发标准、共享边界与权责归属,依托国家智慧教育公共服务平台,构建跨部门协同机制,整合体质健康监测、学校体育教学、卫生体检档案、医院就医诊断等分散数据资源,建立统一的数据共享目录与分级共享清单。且所制定的管理办法还需与《中国教育现代化2035》《“十五五”体育发展规划》《关于全面加强和改进新时代学校体育工作的意见》《“健康中国2030”规划纲要》等相关战略规划之间协同呼应、相互补充,构建起完整的数据共享开放规划。此外,还应加强对数据共享的监管工作,可在学生卫生保健中心设立青少年运动健康数据共享审查和监督专员,对工作人员的审查职责、监督职权和技术规范加以明确。
2021年我国颁布并实施了《中华人民共和国个人信息保护法》,为青少年运动健康数据的共享扫除了关键障碍。但在我国,青少年运动健康数据共享存在与其他数据共享所不同的特殊性和对隐私泄漏的高敏感性,须结合完善《中华人民共和国未成年人保护法》配套细则,明确数据采集的“最小必要”原则,禁止越界使用;建立数据共享伦理审查机制,要求第三方机构签署数据安全协议并接受动态审查;加强未成年人数字素养教育,提升其数据主权意识,以规避青少年同意能力不足、数据滥用可能加剧的教育不公平或伦理风险。综上,构建“技术防护−制度约束−主体自律”三位一体的治理体系,通过政策引导、技术赋能与法律保障的协同,实现青少年运动健康数据价值释放与隐私保护的双重目标。
我国青少年运动健康数据具有服务国家战略、主体特殊性和区域差异大三重属性,其公共价值与市场潜力需通过创新经济共享模式实现有机协同,需探索政府主导、社会参与、市场调节的多元路径,以兼顾其共享的公益属性与可持续发展。主要路径包括优化政府补贴的评估机制、发挥非营利组织的作用以及探索分层分类收费机制,从而推动“政府帮扶”与“社会参与”并进,化解我国青少年运动健康数据共享可持续性水平较低的问题。
政府补贴应建立以数据库共享成效为核心的动态评估体系,将青少年运动健康数据引用量、学术成果转化率、社会服务覆盖面等量化指标纳入考核的核心范畴,强化对数据质量和应用成效的精准考核,定期调整补贴资助的优先级。如美国国家科学基金会、英国经济与社会研究理事会等许多科研资助机构,定期要求受资助机构提交数据管理计划,并统计各数据集使用情况的信息,生成数据利用率报告,评估数据开放共享的成效,追踪数据价值实现,据此优化资源配置与存储策略(黄如花 等,2014)。通过建立系统的共享应用成效考核标准和机制,促进我国青少年运动健康相关数据库优化数据共享服务,实现数据的广泛应用和开发。
依托社会力量拓宽数据共享的资金来源,鼓励中国青少年发展基金会、中国关心下一代健康体育基金会等非营利组织通过联合研究、公益捐赠等方式参与数据库建设。同时,在国际合作中构建灵活的成本分摊框架,如按区域或需求比例分担跨国数据采集、标准化处理等环节的成本,形成“技术共研、数据共享、责任共担”的协同模式。促进我国参与东盟、亚欧等区域以及更多国际青少年运动健康的联合调查和数据共享工作,并推动从项目参与到主导合作的角色转变,提升我国在全球青少年运动健康相关数据治理中的线 拓展数据服务增值空间,探索分层分类的收费服务机制
针对高敏感性数据与定制化需求,可采用“基础公益+定制服务”模式。在保障免费基础数据共享的前提下,提供青少年运动健康促进的AI分析工具、青少年个性化运动处方生成等增值服务。以有效弥补当前我国青少年运动健康数据共享形式单一、可持续性水平较低等不足。如Statista平台根据数据库收集的数据并基于大型语言模型、语义搜索嵌入、检索增强生成等技术开发AI工具,回答青少年运动健康的相关问题,将多源异构的青少年数据转化为个性化的运动健康促进建议。此外,收费机制需兼顾公益属性与技术研发成本,通过市场化收益反哺数据库的运营维护,形成“数据开放—服务增值—资金回馈”的良性循环。
青少年运动健康数据共享权限的合理配置是实现数据资源高效利用与风险防控平衡的核心环节,其核心在于通过精准界定使用主体身份与共享边界,构建差异化的数据共享与使用规则。推动“指南引导”“科研开放”“政策反哺”相结合,以提升我国青少年运动健康数据开发应用水平。
3.4.1 推动从“开放共享”到“开发应用”的跃迁,打造科研共享生态系统
推动体育类期刊编辑部联合制定《体育学期刊论文关联数据共享指南》,明确数据提交格式、元数据标准、共享范围、使用流程以及引用格式等。要求作者在投稿时同步上传青少年运动健康类研究数据集或提供规范的数据获取声明,形成一套完整的青少年运动健康相关论文关联数据共享流程(图4)。特别是2022年《中国科协办公厅 中国科学院办公厅关于组织开展期刊论文关联数据汇交工作的通知》发布了《科技期刊论文关联数据汇交实施方案》,为科技期刊论文关联数据共享提供了政策框架和《数据可用性声明》模版,并要求各学科期刊出版单位参照该方案,结合本学科领域研究特点和期刊工作基础,制定论文关联数据汇交政策,在期刊官网上正式发布,为体育学期刊数据共享指南的制定提供了参照。
贯彻科技部《科研失信行为调查处理规则》,明确将“记入科研诚信严重失信行为数据库”作为处理措施,处理结果通过科研诚信管理信息系统汇交,实现跨部门信息共享和惩戒联动。依托国家科技管理信息系统建立科研人员数字身份认证体系,探索通过区块链技术实现数据调用全流程留痕。要求数据使用者签署合规承诺书,明确青少年运动健康数据滥用、篡改或泄露的追责条款,形成科研诚信黑名单联动惩戒机制。
3.4.3 注重从“共享应用”到“价值实现”的闭环,提升数据应用转化效率
青少年运动健康数据往往涉及个体身份、心理健康等敏感数据,需采用动态脱敏、权限控制等技术,通过远程桌面、加密下载等共享途径向科研人员和政策制定者共享,以支持科研与政策分析,最终反哺青少年运动健康专项政策和干预策略的制定。如包含青少年健康主题数据库等在内的国家人口健康科学数据共享平台,采用虚拟桌面远程使用的数据共享模式,并要求申请人必须经过机构认证,且提供详细的数据申请目的、用途及研究计划等信息,保证了敏感数据的安全使用(National Population Health Data Center,2022)。特别是应树立并践行循证决策理念,依托有效的青少年运动健康需求及其证据制定相关政策和干预策略。以有效缩短当前对青少年运动健康相关政策和方案制定的决策时长,提升运动健康干预的时效性和准确性。通过以学术规范为标尺、科研诚信为护栏、政策反哺为引擎,推动青少年运动健康数据资源的转化效能和价值释放。
青少年运动健康数据共享是数智时代深化体卫融合、驱动青少年体育高质量发展的关键路径。系统分析国外相关实践经验,旨在为我国充分发挥制度与后发优势、实现从域外借鉴到本土化超越提供关键参考。然而,当前我国在此领域仍面临数据孤岛效应明显、政策协同不足、共享机制缺位等现实挑战。国外经验提示,建立分层分阶段的共享时序机制、构建平衡数据开放与隐私保护的治理框架、创新多元可持续的经济模式、完善分级管理体系,是充分释放青少年运动健康数据要素价值的核心举措。面向未来,可考虑以国家智慧教育公共服务平台为枢纽,整合教育、体育、卫健等多部门数据资源,建立全链条的标准化共享机制;借鉴国外分级分类管理模式,构建“公益共享—科研服务—增值应用”协同发展的生态体系;应用区块链、隐私计算等前沿技术,保障数据安全流通并促进价值高效转化。通过政策引导、机制创新与技术创新三者的协同推进,有效破解青少年运动健康数据共享的瓶颈问题,为构建更高水平的青少年公共体育服务体系奠定坚实的数据基础,从而持续为体育强国与健康中国建设注入新动能。