T_SCBDIF 001—2024 AI大模型应用能力成熟度评价标准-团体标准
目录
标准详细信息 | |
---|---|
标准状态 | 现行 |
标准编号 | T/SCBDIF 001—2024 |
中文标题 | AI大模型应用能力成熟度评价标准 |
英文标题 | AI Large Model Application Capability Maturity Evaluation Standard |
国际标准分类号 | 35.020 |
中国标准分类号 | |
国民经济分类 | I659 其他信息技术服务业 |
发布日期 | 2024年09月30日 |
实施日期 | 2024年12月01日 |
起草人 | 朱小军、王艳、徐思宇、蓝青、沈跃锦、姜啸、廖显、左川民、傅彦、郑敏芝、严帅、孟胜、张何君、雍瑞雯、叶珩、邵郑涵、陈长志 |
起草单位 | 四川省大数据产业联合会(四川省大数据产业联合会先进算力研究中心)、中国电信股份有限公司四川分公司、北京百度网讯科技有限公司、成都百智云行科技有限公司、成都智算中心、华为技术有限公司(四川代表处)、云南南天电子信息产业股份有限公司、成都数之联科技股份有限公司、金蝶软件(中国)有限公司四川省公司、用友网络科技股份有限公司四川区、成都明途科技有限公司、成都同步新创科技股份有限公司 、钉钉(中国)信息技术有限公司、四川生学教育科技有限公司、北森云计算有限公司 |
范围 | 本标准旨在为AI大模型在不同应用场景下的能力成熟度提供评估框架和方法,确保评估的严谨性、细致性和实用性。 本标准适用于评估AI大模型在各类应用场景中的性能表现、稳定性、可靠性及用户满意度等。 |
主要技术内容 | 以下是主要内容: 1、标准背景与目的: 强调AI大模型在当代人工智能技术革新中的前沿地位,及其对各行业数字化转型和智能化升级的推动作用。 指出不同种类大模型缺乏统一能力评价体系的问题,强调编制此标准对促进人工智能产业健康发展的积极意义。 2、标准适用范围: 适用于评估AI大模型在各类应用场景中的性能表现、稳定性、可靠性及用户满意度等。 3、术语与定义: 定义了“大模型”、“模型开发”、“模型能力”、“应用能力”等关键术语,为后续评价提供基础。 4、评价原则: 确立了评价AI大模型应用能力成熟度的基本原则,如客观性、公正性、透明性和可操作性。 5、评价维度: 包括任务支持度、场景丰富度、行业覆盖度和服务成熟度,全面覆盖AI大模型的应用能力。 6、总体评价方法: 采用定量和定性两种评估方法,确保评价的准确性和全面性。 7、各维度评价方法和流程: 针对不同评价维度,详细阐述了评价方法和流程,包括评估准备、评估过程、性能差异分析、原因分析、错误分析以及优化建议等。 8、服务成熟度评价: 强调服务成熟度是衡量模型在实际部署与运维过程中效能与稳定性的关键指标,包括平台化服务能力、模型部署与集成、推理速度、资源消耗等方面的评价。 |
是否包含专利信息 | 是 |
标准文本 | 查看 |
团体详细信息 | |||
---|---|---|---|
团体名称 | 四川省大数据产业联合会 | ||
登记证号 | 51510000MJQ648663F | 发证机关 | 四川省民政厅 |
业务范围 | 大数据产业调查研究、咨询服务、技能培训、产业交流、宣传推广、会务、展览展示、行业自律、新技术推广等。 | ||
法定代表人/负责人 | 朱小军 | ||
依托单位名称 | |||
通讯地址 | 四川省成都市高新区高朋大道5号B座401室 | 邮编 : 610000 |