T/BDAEA 003—2023 多模态人机交互技术要求-团体标准

目录


收录自团体标准信息平台,认准啦(RenZhunLa.com)为执行该团体标准的产品或服务提供推介展位,欢迎留言交流。


标准详细信息
标准状态  现行
标准编号  T/BDAEA 003—2023
中文标题  多模态人机交互技术要求
英文标题  Technical requirements for multimodal human-machine interaction
国际标准分类号  35.240.99 信息技术在其他领域中的应用
中国标准分类号  
国民经济分类  I651 软件开发
发布日期  2023年08月17日
实施日期  2023年09月17日
起草人  钟涛、张开婷、张方冰、蔺陆洲、陈艳艳、赵媛媛、付雨欣、管洋、章明辉、霍盈盈、胡勇、方靖涛、张超、岳俊丽、沈志墙、汪琮棠、李若晗、王丹、王雨楠、景之涌、王欣、何志龙、李强、周立荣、张迪。
起草单位  全图通位置网络有限公司、北京朴津智能科技有限公司、深圳北斗平台通信有限公司、全图通轨道交通技术有限公司
范围  
主要技术内容  本文件规定了多模态人机交互技术在环境中的术语、定义、测试方法,测试标准及技术要求,确保交互系统的易用性、可靠性和互操作性,为用户提供更智能、便利和舒适的出行环境。
本部分适用于在地铁、商场、银行、地下停车场等内的多模态人机交互场景。
5.4.1 技术要求
(1) 具备关键词语音识别能力,在低噪环境(噪声强度在 50 dB 以下)中,关键词语音识别的字正确率应在90%以上;在高噪环境(噪声强度在 60 dB~65 dB)中,关键词语音识别的字正确率宜在85%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词,并根据关键词提供具体服务。
(2) 具备连续语音识别能力。在低噪环境(声强度在 50 dB 以下)中连续语音识别的字正确率宜在85%以上:在高噪环境(噪声强度在 60 dB~65 dB)中,连续语音识别的字正确率官在80%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词,并根据关键词提供具体服务。
(3) 智能客服语音交互系统数字语音识别要求包括:应支持数字识别及服务,宜支持不同数字表达方式的识别示例并且正确率应在99%以上。
5.5 声源定位
5.5.1 技术要求
(1) 定位准确度: 最大角度误差:定位结果与实际声源位置之间的最大角度误差不得超过±5°。
(2) 最大空间距离误差:定位结果与实际声源位置之间的最大空间距离误差不得超过0.5米。
(3) 动态响应: 系统应在声源位置变化后的1000毫秒内,完成声源定位并输出结果。
(4) 实时性: 系统的声源定位响应延迟应不超过500毫秒。
5.5.2 测试要求
(1) 时间差法测试:使用多个微型麦克风阵列,同时记录声源信号到达每个麦克风的时间,通过计算时间差来确定声源方向。
(2) 幅度差法测试: 使用多个微型麦克风阵列,同时记录声源信号到达每个麦克风的幅度差,通过计算幅度差来确定声源方向。
(3) 波束形成测试: 使用波束形成算法和多个麦克风,测试算法对声源定位的准确性和鲁棒性。
(4) 声源跟踪测试: 测试声源定位系统对运动声源的跟踪能力,包括声源的速度和加速度变化等。
是否包含专利信息  
标准文本  查看
团体详细信息
团体名称北京经济技术开发区企业协会
登记证号51110000500308204L发证机关北京市民政局
业务范围开展开发区企业协调服务、专业研究、经验交流、咨询服务、新产品战评推广、承办委托。
法定代表人/负责人闫禛
依托单位名称
通讯地址北京经济技术开发区荣华中路19号朝林广场A座736室邮编 : 102600
认准啦(RenZhunLa.com)为

收录自团体标准信息平台,认准啦(RenZhunLa.com)为执行该团体标准的产品或服务提供推介展位,欢迎留言交流。