最新版栏目
牵头单位:上海申康医院发展中心
参与单位:上海数据集团有限公司、万达信息股份有限公司
医疗人工智能的发展高度依赖大规模、高质量、标准化的训练数据,但现实中数据获取困难、标注成本高昂、研发与应用链路脱节等问题,严重制约 AI 在临床的规模化落地。上海申康医院发展中心在上海市卫生健康委、数据局的指导支持下,依托医联平台真实诊疗数据,构建高质量医疗影像数据集,打造“一体化 AI 研发平台+可信数据流通机制”的基础设施体系,为医学 AI 从研发到应用提供全链路支撑,形成可复制、可推广的上海实践。
一是汇聚多源高质量医疗影像数据,构建标准化训练资源池。汇聚来自上海37 家三甲医院的真实医学影像数据,重点覆盖心脑血管、肿瘤、呼吸、消化等8 个关键部位,围绕24 类常见及重大疾病,形成以CT、MR、DR、X 线等为主的专病影像数据资源。通过统一的“筛选-清洗-脱敏-整合”标准化流程进行处理,为后续高质量数据集构建奠定坚实基础。
二是创新治理与可信流通机制,确保数据质量与安全合规。一方面,过“两标一审”数据标注与质控机制,有效保障数据标注的准确性与可信度,构建形成包含 46 万例高质量训练数据与 4.4 万例金标准测试数据的标准化数据集。另一方面,搭建“线上数据沙箱+线下安全空间+区块链存证”的可信流通体系,遵循“数据不出域、模型可进来”原则,实现医疗数据在安全可控、合规可监管环境下的授权使用与价值流通。
三是支撑AI 研发全流程与多场景应用,显著提升研发效能。打造“高质量数据集+一体化训练平台”双支撑体系。依托集成算力、工具与算法的一体化AI 研发平台,实现从开发、训练到验证的全流程统一管理与协同。通过数据沙箱调用数据资源,并结合深度学习、影像分割等技术,已在放疗靶区自动勾画、冠脉血流计算、肺栓塞智能分诊、乳腺癌早筛等多个核心临床场景中实现AI 模型的应用验证与落地。
四是形成可复制的要素化模式,经济社会效益显著。降低AI研发成本约60%,缩短研发周期50%,整体研发效率提升3 倍以上,并推动多款医学影像AI 产品在多家三甲医院投入应用。通过构建可持续、可监管的医疗数据要素化模式,不仅带动产业链上下游企业的协同创新,更为我国医疗健康产业的智能化发展提供了“上海经验”与实践支撑。
附件: