知识图谱标准体系-梳理学习

知识图谱标准体系框架,有利于围绕知识图谱技术研究及应用的标准化工作开展,面向市场和技术发展需求逐步开展相关标准化工作。同时,做好总体设计和布局,加强基础共性标准的研制,形成系列协调配套的关键标准,提升我国知识图谱标准的先进性和国际竞争力。

1、知识图谱标准体系结构

知识图谱标准体系结构包括“A 基础共性”、“B 数字基础设施”、“C 关键技术”、“D 产品/服务”、“E 行业应用”、“F 运维/安全”等六个部分,主要反映标准体系各部分的组成关系,如图所示。

图 知识图谱标准体系结构图

基础共性标准包括术语和定义、参考架构、数据、管理、测试评估等标准,规范了知识图谱技术领域中的专业术语及术语间的关系,提出了参考架构,并明确了知识图谱输入数据、管理、测试评估等方面的要求。基础共性标准为体系结构中的其他部分提供支撑,有助于准确理解知识图谱技术内容并促进技术交流和研究。

数字基础设施标准主要针对平台、工具及开源知识库等基础设施3个方面展开,具体包括知识获取工具、知识建模工具、知识存储平台、知识推理工具、数据获取工具、基础开发平台,如基础云平台、基础大数据平台等,为知识图谱构建与应用提供的基础设施、网络系统、数据采集、数知识图谱标准化白皮书据存储、数据处理等多层次支撑。

关键技术标准主要针对知识获取、知识表示、知识建模、知识融合、知识存储、知识计算、知识运维及自然语言处理等相关支撑技术融合等方面展开,覆盖知识图谱生命周期全链条,为技术开发与应用提供保障。

产品/服务标准主要从产品和服务2个维度展开,主要包括知识图谱领域形成的系统或平台、产品、新服务模式等标准。

行业应用标准位于知识图谱标准体系结构的最顶层,面向不同行业的不同需求,对其他部分标准进行细化和落地支撑各行业推进知识图谱技术发展。

运维/安全标准包括质量保障和安全保障,为知识图谱安全运行与隐私保护、运行维护与风险管控等提供标准支撑。

2、标准体系框架

依托知识图谱技术特点、标准化需求、当前各行业应用的初步实践及未来技术发展趋势,结合知识图谱标准体系结构图,知识图谱标准体系框架如图7.3所示。

(1)基础共性标准

该类标准主要用于统一知识图谱相关概念,解决知识图谱基础共性关键问题,包括术语和定义、参考架构、数据、管理、测试评估等。针对知识图谱术语相关标准,围绕知识图谱发展现状开展标准制修订工作,统一规范领域内的技术术语和定义,便于领域内做进一步技术沟通;深入研究知识图谱构建相关技术及产业链,开展知识图谱参考架构等标准研制工作;结合知识图谱领域发展需求,开展用于知识库构建、知识图谱构建的数据类型规范、数据标注规范等数据资源相关标准的研制工作;针对知识图谱技术、行业发展较为成熟的领域,提出图谱存储、图谱查询等管理标准;开展知识图谱质量评估原则及模型、算法的泛化性等性能测试及知识图谱成熟度分级要求等标准研制工作。

知识图谱标准体系框架
基础共性
术语和定义
参考架构
数据
管理
测试评估
其他
数据标注规范
其他
测试方法
评估模型
数字基础设施
基础开发平台
知识表示工具
知识获取工具
知识建模工具
知识存储平台
知识推理工具
开源知识库
其他
基础云平台
基础大数据平台
其他
关键技术
知识表示
知识建模
知识存储
知识获取
知识融合
知识计算
知识运维
支撑技术融合
基于符号的知识表示
基于向量的知识表示
规则建模
时空建模
事件建模
其他
基于表结构的存储
基于图结构的存储
概念抽取
关系抽取
属性抽取
概念层融合
数据层融合
知识推理
知识统计与图挖掘
知识更新
资源管理
分词/词性标注
文本分布式表示
依存分析
其他
产品/服务
产品
服务
语义搜索
知识问答
演化分析
对话理解
画像分析
其他
知识库构建服务
知识云服务接口
知识资源管理服务
其他
行业应用
智慧金融
智慧医疗
智能制造
智慧教育
智慧政务
智慧司法
智慧交融
智能家居
智能电网
智能公安
智慧农业
社交网络
新零售
智慧城建
智慧外交
其他
运维/安全
质量保障
安全保障
评估
改进
其他
隐私保护
数据安全
平台安全
其他
其他

(2)数字基础设施标准

该类标准主要针对知识图谱底层平台、工具等数字基础设施进行规范,平台类包括基础开发平台,如基础云平台、基础大数据平台等,工具类包括知识获取工具、知识建模工具、知识存储平台、知识推理工具、数据获取工具等。云平台、大数据平台等技术已有较完善的标准体系,具备一定的研究基础。知识获取工具、知识建模工具、知识推理工具等方面的标准研制,重点围绕工具的架构、功能要求、接口规范、性能测试要求与测试方法、计算能力要求等方面开展研制。

(3)关键技术标准

知识图谱关键技术标准用于对构建知识图谱过程中各环节关键技术进行规范和统一,包括知识获取、知识表示、知识建模、知识融合、知识存储、知识计算、知识运维及自然语言处理等相关支撑技术融合等。其中,由于国内外自然语言处理技术应用及产业发展仍处于起步阶段,自然语言处理与知识图谱融合相关的标准化工作方向需考虑分词/词性标注、文本分布式表示、依存分析、文本内容准确率评估方法、内容相关度分析方法等。

(4)产品/服务标准

产品/服务标准包括语义搜索、演化分析、知识问答、对话理解、关联推荐等通用知识图谱应用系统产品标准以及知识库构建、知识云接口等服务标准。针对系统产品标准的制定,可从系统产品功能性、性能效率、安全性、可维护性等方面进行质量评估。

(5)行业应用标准

行业应用类标准主要是针对知识图谱为各行业所能提供的知识服务角度出发制定相关标准。其中包括各领域根据其特性产生的专用知识图谱,涉及智慧金融、智慧医疗、智能制造、智慧教育、智慧政务、智慧司法、智慧交通、智能家居、智能电网、智能公安、智慧农业、社交网络、新零售等领域。

(6)运维/安全标准

运维/安全标准包括质量保障和安全保障标准,质量保障包括评估、改进等;安全保障包括数据安全、平台安全等。质量评估标准的研究重点围绕知识库构建质量、知识图谱构建质量、平台工具质量、知识获取质量、知识建模质量,以及改进措施、改进情况监督等方面开展;数据安全、隐私保护、平台安全等标准的研究是支撑知识图谱相关系统正常运行的基础,重点集中于安全管理体系、安全监测预警等标准的研制。

来源:知识图谱标准化白皮书(2019版)