T/BDAEA 003—2023 多模态人机交互技术要求-团体标准

大约 1 分钟 #T_BDAEA 003—2023;#多模态人机交互技术要求;#

目录

收录自团体标准信息平台，认准啦(RenZhunLa.com)为执行该团体标准的产品或服务提供推介展位，欢迎留言交流。

标准详细信息
标准状态	现行
标准编号	T/BDAEA 003—2023
中文标题	多模态人机交互技术要求
英文标题	Technical requirements for multimodal human-machine interaction
国际标准分类号	35.240.99 信息技术在其他领域中的应用
中国标准分类号
国民经济分类	I651 软件开发
发布日期	2023年08月17日
实施日期	2023年09月17日
起草人	钟涛、张开婷、张方冰、蔺陆洲、陈艳艳、赵媛媛、付雨欣、管洋、章明辉、霍盈盈、胡勇、方靖涛、张超、岳俊丽、沈志墙、汪琮棠、李若晗、王丹、王雨楠、景之涌、王欣、何志龙、李强、周立荣、张迪。
起草单位	全图通位置网络有限公司、北京朴津智能科技有限公司、深圳北斗平台通信有限公司、全图通轨道交通技术有限公司
范围
主要技术内容	本文件规定了多模态人机交互技术在环境中的术语、定义、测试方法，测试标准及技术要求，确保交互系统的易用性、可靠性和互操作性，为用户提供更智能、便利和舒适的出行环境。本部分适用于在地铁、商场、银行、地下停车场等内的多模态人机交互场景。 5.4.1　技术要求 (1)　具备关键词语音识别能力，在低噪环境(噪声强度在 50 dB 以下)中,关键词语音识别的字正确率应在90%以上;在高噪环境(噪声强度在 60 dB~65 dB)中,关键词语音识别的字正确率宜在85%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词，并根据关键词提供具体服务。 (2)　具备连续语音识别能力。在低噪环境(声强度在 50 dB 以下)中连续语音识别的字正确率宜在85%以上:在高噪环境(噪声强度在 60 dB~65 dB)中,连续语音识别的字正确率官在80%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词，并根据关键词提供具体服务。 (3)　智能客服语音交互系统数字语音识别要求包括:应支持数字识别及服务,宜支持不同数字表达方式的识别示例并且正确率应在99%以上。 5.5　声源定位 5.5.1　技术要求 (1)　定位准确度：最大角度误差：定位结果与实际声源位置之间的最大角度误差不得超过±5°。 (2)　最大空间距离误差：定位结果与实际声源位置之间的最大空间距离误差不得超过0.5米。 (3)　动态响应：系统应在声源位置变化后的1000毫秒内，完成声源定位并输出结果。 (4)　实时性：系统的声源定位响应延迟应不超过500毫秒。 5.5.2　测试要求 (1)　时间差法测试：使用多个微型麦克风阵列，同时记录声源信号到达每个麦克风的时间，通过计算时间差来确定声源方向。 (2)　幅度差法测试：使用多个微型麦克风阵列，同时记录声源信号到达每个麦克风的幅度差，通过计算幅度差来确定声源方向。 (3)　波束形成测试：使用波束形成算法和多个麦克风，测试算法对声源定位的准确性和鲁棒性。 (4)　声源跟踪测试：测试声源定位系统对运动声源的跟踪能力，包括声源的速度和加速度变化等。
是否包含专利信息	否
标准文本	查看

团体详细信息
团体名称	北京经济技术开发区企业协会
登记证号	51110000500308204L	发证机关	北京市民政局
业务范围	开展开发区企业协调服务、专业研究、经验交流、咨询服务、新产品战评推广、承办委托。
法定代表人/负责人	闫禛
依托单位名称
通讯地址	北京经济技术开发区荣华中路19号朝林广场A座736室		邮编 : 102600

认准啦(RenZhunLa.com)为

收录自团体标准信息平台，认准啦(RenZhunLa.com)为执行该团体标准的产品或服务提供推介展位，欢迎留言交流。