T/BDAEA 003—2023 多模态人机交互技术要求-团体标准
目录
标准详细信息 | |
---|---|
标准状态 | 现行 |
标准编号 | T/BDAEA 003—2023 |
中文标题 | 多模态人机交互技术要求 |
英文标题 | Technical requirements for multimodal human-machine interaction |
国际标准分类号 | 35.240.99 信息技术在其他领域中的应用 |
中国标准分类号 | |
国民经济分类 | I651 软件开发 |
发布日期 | 2023年08月17日 |
实施日期 | 2023年09月17日 |
起草人 | 钟涛、张开婷、张方冰、蔺陆洲、陈艳艳、赵媛媛、付雨欣、管洋、章明辉、霍盈盈、胡勇、方靖涛、张超、岳俊丽、沈志墙、汪琮棠、李若晗、王丹、王雨楠、景之涌、王欣、何志龙、李强、周立荣、张迪。 |
起草单位 | 全图通位置网络有限公司、北京朴津智能科技有限公司、深圳北斗平台通信有限公司、全图通轨道交通技术有限公司 |
范围 | |
主要技术内容 | 本文件规定了多模态人机交互技术在环境中的术语、定义、测试方法,测试标准及技术要求,确保交互系统的易用性、可靠性和互操作性,为用户提供更智能、便利和舒适的出行环境。 本部分适用于在地铁、商场、银行、地下停车场等内的多模态人机交互场景。 5.4.1 技术要求 (1) 具备关键词语音识别能力,在低噪环境(噪声强度在 50 dB 以下)中,关键词语音识别的字正确率应在90%以上;在高噪环境(噪声强度在 60 dB~65 dB)中,关键词语音识别的字正确率宜在85%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词,并根据关键词提供具体服务。 (2) 具备连续语音识别能力。在低噪环境(声强度在 50 dB 以下)中连续语音识别的字正确率宜在85%以上:在高噪环境(噪声强度在 60 dB~65 dB)中,连续语音识别的字正确率官在80%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词,并根据关键词提供具体服务。 (3) 智能客服语音交互系统数字语音识别要求包括:应支持数字识别及服务,宜支持不同数字表达方式的识别示例并且正确率应在99%以上。 5.5 声源定位 5.5.1 技术要求 (1) 定位准确度: 最大角度误差:定位结果与实际声源位置之间的最大角度误差不得超过±5°。 (2) 最大空间距离误差:定位结果与实际声源位置之间的最大空间距离误差不得超过0.5米。 (3) 动态响应: 系统应在声源位置变化后的1000毫秒内,完成声源定位并输出结果。 (4) 实时性: 系统的声源定位响应延迟应不超过500毫秒。 5.5.2 测试要求 (1) 时间差法测试:使用多个微型麦克风阵列,同时记录声源信号到达每个麦克风的时间,通过计算时间差来确定声源方向。 (2) 幅度差法测试: 使用多个微型麦克风阵列,同时记录声源信号到达每个麦克风的幅度差,通过计算幅度差来确定声源方向。 (3) 波束形成测试: 使用波束形成算法和多个麦克风,测试算法对声源定位的准确性和鲁棒性。 (4) 声源跟踪测试: 测试声源定位系统对运动声源的跟踪能力,包括声源的速度和加速度变化等。 |
是否包含专利信息 | 否 |
标准文本 | 查看 |
团体详细信息 | |||
---|---|---|---|
团体名称 | 北京经济技术开发区企业协会 | ||
登记证号 | 51110000500308204L | 发证机关 | 北京市民政局 |
业务范围 | 开展开发区企业协调服务、专业研究、经验交流、咨询服务、新产品战评推广、承办委托。 | ||
法定代表人/负责人 | 闫禛 | ||
依托单位名称 | |||
通讯地址 | 北京经济技术开发区荣华中路19号朝林广场A座736室 | 邮编 : 102600 |