T/JSIA 0004—2024 健康医疗大数据数据质量管理规范-团体标准
目录
标准详细信息 | |
---|---|
标准状态 | 现行 |
标准编号 | T/JSIA 0004—2024 |
中文标题 | 健康医疗大数据数据质量管理规范 |
英文标题 | Specification for healthcare big data quality management |
国际标准分类号 | 35.080 |
中国标准分类号 | |
国民经济分类 | I659 其他信息技术服务业 |
发布日期 | 2024年01月23日 |
实施日期 | 2024年01月30日 |
起草人 | 刘云、何明、景慎旗、单涛、卢姗、凡豪志、张小亮、罗雨宁、徐佳妮、罗玲、韩伟、徐兵、孙雪非、牛彦杰、窦万春、曹汛、高阳、任桐炜、周作建、刘羽 |
起草单位 | 南京医科大学、中国人民解放军陆军工程大学、南京大学、中科雨辰科技公司、江苏华康信息技术有限公司 |
范围 | |
主要技术内容 | 4.2 数据质量管理的基本原则 数据质量管理应遵循以下原则: a)适用性:是指收集的统计数据是否有用,是否满足用户的需求; b)准确性:数据要真实,反映实际情况,误差小; c)时效性:及时提供数据; d)可比性:国际可比、国内可比,统计口径保持一致;年度间的可衔接; e)完整性:数据元内容完整,不能残缺不全。 f)简便性:信息简明扼要、少而精; g)可获取性:获取数据以及相关统计信息咨询服务便利; h)全程性:覆盖数据的计划、获取、存储、共享、维护、应用、消亡全生命周期的每个阶段; 4.3 数据质量管理的流程 数据采集,格式检查,内容校验,数据整合,数据审核。 5 分级体系 5.1 数据质量分级 a)应建立数据质量分级标准,根据填报数据的完整性及用户评价两方面进行综合评定,结果动态更新。 b)数据质量级别至少应包括质量Ⅰ级和质量Ⅱ级两个级别。 数据质量Ⅰ级:所有数据符合数据规范要求并通过数据格式校验和数据内容校验的; 数据质量Ⅱ级:所有必填数据符合数据规范要求并通过数据格式校验和数据内容校验,但非必填数据不完全符合数据规范要求的。 质量Ⅱ级数据是后续数据改正和补录的主要对象。 5.2 数据使用分级 应根据数据的含义、包含内容、适用范围对其设置数据使用等级,按照等级来管理数据开放程度、数据共享范围。一般设置为可以在线共享和离线共享两个等级: a)在线共享:用户可以通过数据工程数据中心服务门户、各专属数据中心服务门户、各共建数据中心服务门户等查询、浏览和下载数据,包括公开共享、授权共享。 公开共享是指注册用户登陆后可以在线下载公开数据。 授权共享是指部分隐私数据通过授权在线下载,依据各单位的职能,授予相应隐私数据下载权限。 b)离线共享:包括申请共享、延伸共享。申请共享是指用户向相应的数据中心提出数据使用申请,经各中心相应主管机关批准后,在安全技术手段支撑下,通过光盘方式获得数据。延伸共享是指用户提出数据更专业化、深入的加工申请,数据生产者按照用户申请进行数据计算、加工后,在安全技术手段支撑下,通过光盘方式提供用户。 5.3 数据安全分级 a)梳理敏感数据域 某些密级程度较高的数据集合称为敏感数据域。因 “分级”涉及到敏感数据,这些数据不以业务为导向,只以其自身的属性决定等级归属,即字段含义即为对应数据域。常见的梳理方法中,将敏感数据域划分为公共敏感数据域(法律角度)、行业敏感数据域(行业规范角度)、机构敏感数据域(内部规范角度)。公共敏感数据域和行业敏感数据域通常在法规文件里会有定义,机构敏感数据域的梳理则依赖参与人员对业务系统的理解程度。 b)制定敏感等级 与数据类别以业务驱动不同,敏感等级是以数据的密级程度进行划分。制定敏感等级的方法可以根据数据泄露所造成的影响范围、影响对象、影响程度来进行划分。 c)制定数据类别 通常情况下的将业务范畴划分为“祖类”、“父类”、“子类”、“孙类”或更多,数据域可作为最小分类。 d)元数据归属数据域 梳理完敏感数据域后,将字段划分到敏感数据域下,以便后续归级操作。如具备元数据的管理能力,或在梳理敏感数据域时已经将字段进行了预处理,则可忽略此阶段。否则,需要对字段进行敏感数据域的归属处理,该过程可依靠智能发现软件辅助完成。 e)数据归类归集 可通过建设元数据管理系统,直接将数据域进行归类处理。如果未建设元数据管理系统,则需对业务系统中涉及的每个数据库的每张表的每个字段进行归类归级处理,该过程可依靠智能软件辅助完成。 f)多套分类分级 在实际应用中,由于业务关注点可能有所不同,并不一定只建设一套分类分级体系,必要时可以建立多套分类分级体系来应对不同业务需求。如果是为满足监管要求而做的分类分级,首要满足合规性要求。此项工作可由法务和咨询团队,根据业务范围梳理出必须要遵守的法律法规。 |
是否包含专利信息 | 否 |
标准文本 | 不公开 |
团体详细信息 | |||
---|---|---|---|
团体名称 | 江苏省软件行业协会 | ||
登记证号 | 5132000050918018XW | 发证机关 | 江苏省民政厅 |
业务范围 | 行业调研、信息技术服务、编辑出版、咨询服务 | ||
法定代表人/负责人 | 徐凯 | ||
依托单位名称 | |||
通讯地址 | 江苏省南京市中山北路285号电子大楼4楼 | 邮编 : 210003 |