越来越多“沉睡”在医院中的“隐形资产”正在被交易。 不久前,首都医科大学附属北京同仁医院与拜耳集团、恒瑞医药签署数据交易协议,完成全球首个眼科全维度随访数据集交易。今年1月,估值达45万余元的福建闽清县总医院神内、心内、老年科专病库数据资源,在北京国际大数据交易所达成交易。 2023年12月,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,提到健康医疗等12个领域要有序释放数据价值。不过,有专家指出,部分医疗机构不知道数据资产的概念。更多公众关心的是:数据交易过程中,自己的隐私是否会被泄露? “99%的数据都无法直接出售” 首都医科大学附属北京同仁医院院长袁进说,本次交易的眼科数据集包含全年龄段、共覆盖10万人,涵盖角膜病、干眼症、近视等临床高发眼病。拜耳集团处方药事业部副总裁、中国眼科业务总经理陈白平表示,眼病数据会为拜耳眼科产品线的研发决策提供循证支持,也有助于基于眼底影像的人工智能模型开发。 医疗数据的市场需求始终存在。医疗战略咨询公司Latitude Health创始人赵衡告诉《中国新闻周刊》,在医疗数据被允许出售前,许多企业通过与医院合作的形式获得需要的医疗数据,例如在院内开展联合研发项目,并支付相较出售交易形式更高的价格。这样得到的数据基于院企双方多年合作。在允许数据交易后,企业能更自主地使用数据。 药企是医疗数据的常见买主,通过购入数据缩短药物的研发周期。近几年,人工智能(AI)行业也助推了数据交易热潮,相关企业需要通过数据训练医疗智能体,提升智能体对各种临床信息的反应能力。一些保险公司会通过医疗数据计算发病规律,确定“百万医疗险”产品的服务内容。 今年4月,山东第一医科大学第一附属医院将包含“肝病临床谱系与移植状态”的数据集,以3万元的价格交易给山东山科智心科技有限公司(以下简称“山科智心”),系山东首笔医疗数据交易。 在这笔交易成交前,山东第一医科大学第一附属医院正高级工程师、山东省数据开放创新应用实验室主任邢鲁民早已感知到医疗数据的价值。邢鲁民日常负责医疗领域的人工智能应用,他发现,相较于算力和算法,真正决定一个大模型能否应用于临床的是数据质量。但在实际场景中,许多医院的诊疗数据分散于不同系统,且普遍存在数据标准不统一、错项缺项等问题。更重要的是,一些以日常对话形式记录的临床诊断,无法直接“喂”给AI训练。 这种基于自然语言描述的数据被称为非结构化数据。医疗数据中非结构化数据约占70%。“我们日常查房会问患者‘今天精神状态怎么样’,对于医生的临床工作来说,这种非结构化文本信息就足够了。但AI需要的是结构化数据,比如肝脏的长、宽、高都要量化成具体参数。” 朱同玉认为,当前多数AI问诊模型的知识面都远超医生,但诊断的精准度却常难以让人满意。“例如用户描述肚子疼,AI可能会理解成很严重的病症。”而导致大模型产生“幻觉”的原因之一,便是缺乏高质量的医疗数据。他表示,医院系统内99%的数据都无法直接出售,国内一些医院即便做好了数据集,若不经过高质量治理,也无法形成交易。 邢鲁民和团队从2023年起就着手进行医院医疗数据的加工工作,横向加工一般包括常见病、慢性病等大体量数据,纵向则囊括一些专病、关键技术的数据集。 此次交易的“肝病临床谱系与移植状态”数据集属于后者,该数据集涵盖1000多例临床病例,主要聚焦肝功能衰竭、肝病评估等跨度近10年的数据。邢鲁民说,山科智心受到一个团队的委托,进行肝病相关的模型构建和训练,但凭借手头和公开的数据集难以达成诉求。于是,山科智心找到邢鲁民团队,希望通过购买治理后的肝病数据提升模型性能。 不过,在现实中,不少医院因信息科人手、经费不足等,难以完成数据加工工作。“目前,不少医院尚未搭建自己的数据中台,也就是数据加工的‘中央厨房’,这种情况下,数据加工的成本也会随之增高。”贵阳大数据交易所(以下简称“贵数所”)市场部行业总监周源说。 朱同玉认为,医院从内部的信息系统(英文缩写为HIS)中挖取数据本就是一件较困难的事。“基本上各家医院的HIS都经过多版本迭代,甚至改换过不同系统。一旦改换不同系统,原来储存的数据就可能大量丢失。” 与此同时,由于早年就医未实行实名制,许多时间跨度长的医疗数据难以形成连贯性。接受采访前几天,朱同玉刚接诊过一名做完肾移植手术22年的患者。“我想找患者做手术时的数据,但已找不到了,22年前他是用别的名字开的刀。”朱同玉说,就器官移植数据而言,长期存活器官的数据才真正有价值。 部分医院会选择与专业企业团队合作,将数据加工外包给企业。西安佑君医疗信息有限公司(以下简称“佑君医疗”)承接过当地多家医院的数据处理工作。佑君医疗隶属于西安国际医学投资股份有限公司,该公司副总裁王爱萍介绍,处理数据时,首先会根据科室进行分类,再依照国际医疗通用编码对疾病进一步分类分级,同时整理核磁共振、病理切片等影像资料。
“告知交易售卖用途” 不少患者担心:自己的医疗数据被出售,是否会产生隐私泄露风险?依据北京市卫生健康大数据与政策研究中心2025年12月发布的《健康医疗数据匿名化技术规范(试行)》,健康医疗数据持有方对原始数据进行治理,要确保数据使用方无法识别特定自然人且不能复原。针对健康医疗数据流通利用的特定场景,采用保留必要字段(如性别)或对某些字段(如年龄、居住地)采取适度泛化等技术手段,在保留数据价值的同时有效控制数据流通安全风险。 “医疗数据交易的核心是价值释放,而不是把患者的隐私当成产品,这是数据资产化过程中必须遵守的边界。”邢鲁民说。 一篇2025年发表于《卫生软科学》的论文提到,医疗数据交易过程中,常面临二次使用超出原始采集目的的伦理风险。北京中医药大学医药卫生法学教授邓勇对《中国新闻周刊》指出,一些医院售卖诊疗数据前,并未征求患者的专项知情同意。有院方认为,患者就诊时已签署通用知情同意书,且数据经过匿名化脱敏处理,无法定位到个人。实际上,患者就医时签署的常规知情同意书,内容通常仅限定医疗数据用于临床诊疗、院内科研等场景,未提及数据可进行商业售卖、市场化交易等用途。患者签署文件的初衷,也仅是配合完成就医流程,并未默许自身健康信息流入市场。 北京红飒律师事务所主任律师黄启瑞表示,《中华人民共和国个人信息保护法》规定,医院在收集、使用、提供患者个人信息前,应真实、准确、完整地向患者告知收集、使用个人信息的目的、使用方式等事项。如果医院未履行告知义务,而出售包含患者信息的医疗数据,则违反法律规定。这种情况下,医院应通过优化知情同意书条款或其他有效方式,将交易售卖用途如实告知患者。记者了解到,由于医疗数据交易属于近几年逐渐升温的新兴事物,国内尚未有征询患者同意的统一规范。 也有医院担心,由于数据天然具有可复制性,将原始数据交给代加工企业同样会产生泄露、盗用的风险。可信数据空间被视为应对这种担忧的有效解法,即通过对数据进行本地化治理,使相关企业只能带走结果,原始数据仍留在可信数据空间内。 2024年7月,广州市卫生健康委联合广州数字科技集团启动广州卫生健康行业可信数据空间建设。目前,已有40多家医院入驻该空间,完成超千万条医疗数据交易。 可信数据空间建成后,广州医科大学附属妇女儿童医院完成了首笔医疗数据交易。“当时有一家生产新生儿黄疸仪的器械公司希望对设备优化升级,我们与医院合作,将新生儿黄疸数据用于评估设备,通过数据沙箱等技术,在可信数据空间内推出了黄疸仪设备测试评估报告。”李梦君说,相较于原本的“医疗数据不出院”,可信数据空间实现了数据“从医院到空间”,符合“原始数据不出域,数据可用不可见”原则。 尚无统一定价标准 医疗数据交易流程中,医院通常会将加工后的数据在数据交易所上架销售。目前,佑君医疗已在贵数所登记70余个高质量医疗数据集,聚焦肺癌、肝癌等高发癌种及多专科疑难重症,数据全部来源于西安头部医院的真实诊疗场景。 医疗数据上架交易前,贵数所会首先审核主体资质,其次审核数据来源,确保数据采集流程符合法律法规要求。 除了提供促成交易的平台外,贵数所还为合规数据产品出具数据要素登记凭证。“这一凭证如同房产证一般,为数据流通交易背书。在材料齐全的情况下,登记证书一般2—3个工作日即可发证。” 周源说道。 目前,医疗数据交易尚未出台统一定价标准,交易价格主要通过协商敲定,一般会考虑采集成本、稀缺性、质量等因素。周源介绍,贵数所上线了全国首款数据产品交易价格计算器,依托评估模型,为数据产品定价提供参考区间。 邢鲁民认为,当前医疗数据交易落地面临的一大堵点是如何对个体医疗数据进行时间线串联。“人的流动性很强,患者在不同医院看病时,如何获得同一个患者的所有医疗数据,是很现实的问题。” “当前的医疗数据交易使买卖双方受益,这些数据还应造福于患者。目前患者对于自己的数据‘可用不可得’,建议每家医院为患者提供类似于银行流水打印服务的数据下载和打印接口,让患者更加了解自己的原始健康数据。”朱同玉说。 |
电话:647-830-8888|www.66.ca 多伦多六六网
GMT-4, 2026-5-24 03:25 PM , Processed in 0.045002 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.