T_CES 320—2024 基于大模型的电力企业向量知识库及增强检索应用技术框架-团体标准
目录
| 标准详细信息 | |
|---|---|
| 标准状态 | 现行 |
| 标准编号 | T/CES 320—2024 |
| 中文标题 | 基于大模型的电力企业向量知识库及增强检索应用技术框架 |
| 英文标题 | Framework for vector knowledge base and enhanced retrieval application technology based on large models in electric power enterprises |
| 国际标准分类号 | 35.240.50 信息技术在工业中的应用 |
| 中国标准分类号 | L 77 |
| 国民经济分类 | D441 电力生产 |
| 发布日期 | 2024年12月23日 |
| 实施日期 | 2024年12月30日 |
| 起草人 | 李强、庄莉、梁懿、王秋琳、宋立华、丘志强、郑耀松、张晓东、陈江海、吕志超、 李炳森、邱镇、黄晓光、苏江文、陈又咏、林钊、俞成强、王燕蓉、伍臣周 |
| 起草单位 | 国网信息通信产业集团有限公司、福建亿榕信息技术有限公司 |
| 范围 | 本标准规定了基于大模型的电力企业向量知识库及增强检索应用技术框架和要求。 本标准适用于国内电力企业为满足企业生产经营活动智能化需求开展的基于大语言模型的企业向量知识库构建及增强检索应用工作。 |
| 主要技术内容 | 一、核心技术框架 企业向量知识库构建 知识数据归集与预处理:要求数据重复率、错误率低于1%,清洗后需格式化、标准化,标注规范遵循《电力智能交互文本训练语料标注规范》(T/CES 156-2022)。 向量模型训练:模型需支持512个以上tokens输入,语义相似度不低于95%,训练数据需覆盖多样化的电力业务场景。 知识向量化:通过块状分解和向量转换保留语义完整性,向量维度需平衡表达力与计算效率。 向量知识库维护:每周更新知识库,每月更新模型,支持增量更新和版本控制。 增强检索应用 意图识别检索:准确率达95%以上,覆盖98%的意图类型,支持新意图快速扩展。 知识检索与整合:支持多源异构数据(文本、图像、视频等),提供相关性、权威性评估,检索结果需去重排序。 内容生成与优化:基于大语言模型生成流畅、准确的答案,支持多轮对话优化和语法校正。 二、关键技术特点 高精度与高效性 向量模型训练要求语义相似度≥95%,知识数据准确性≥99%,完整性≥98%。 检索意图识别响应快速,支持动态更新索引,确保毫秒级检索性能。 安全与合规性 数据加密、脱敏处理,符合《生成式人工智能服务管理暂行办法》要求,保护商业秘密和个人隐私。 标注数据需可追溯,操作日志完整记录,满足审计需求。 动态适应能力 知识库支持增量更新,模型可通过在线学习优化,适应电力业务变化。 检索模块可自定义策略,灵活适配不同业务场景。 三、核心参数指标 数据质量:错误率<1%,噪声数据占比<1%。 模型性能:token输入≥512,语义相似度≥95%,意图识别覆盖率≥98%。 更新频率:知识库每周更新,模型每月训练。 该标准通过融合大语言模型与向量检索技术,实现了电力领域知识的高效管理和智能应用,兼具专业性、安全性和可扩展性。 |
| 是否包含专利信息 | 否 |
| 标准文本 | 不公开 |
| 团体详细信息 | |||
|---|---|---|---|
| 团体名称 | 中国电工技术学会 | ||
| 登记证号 | 51100000500006049 | 发证机关 | 中华人民共和国民政部 |
| 业务范围 | 学术交流、国际合作、专业展览、业务培训、书刊编辑、咨询服务 | ||
| 法定代表人/负责人 | 贾利民 | ||
| 依托单位名称 | |||
| 通讯地址 | 北京市西城区莲花池东路102号天莲大厦10层 | 邮编 : 100055 | |