近日,在瑞士日内瓦举行的国际电信联盟第十二组(ITU-T SG12)全体会议中,由阿里巴巴钉钉牵头,联合之江实验室及北京理工大学共同提出的一项音频质量国际标准(实时通信服务中噪声抑制性能的主观测试方法),正式批准立项。这也是在该领域中,首个由中国公司牵头制定的新一代音频质量国际标准。
该标准建立了音视频通话中噪声对于主观听觉影响的映射,并基于此映射研发了一套音质评价指标,结合信号处理和 AI 的评测算法,最终形成一套评价技术与标准。对于用户来说,这项标准能够更准确地反应在真实噪声场景下的通话体验。
音频质量的优劣在实时音视频产品中占据了关键作用。过去,人们只能凭耳朵去判断声音的好坏,既不精确也无法统一评价;国际标准建立后,音视频行业就等于有了科学、完整的音质评价体系。
“国际电联制定的标准是当今信息通信技术网络运行的根本,钉钉此次的提案将为行业音频质量的提升提供一份可落地的参考框架。” ITU-T SG12 主席 Barriac Vincent 表示。
关于 ITU-T SG12
国际电信联盟电信标准分局(ITU-T)是致力于制定全球电信标准的权威机构,拥有 4G/5G 标准、视频 H.264/265 标准等知名标准。
其旗下的 SG12 研究组自 2001 年成立以来专注于通信服务的质量研究与标准制定,关注领域涉及音频服务的质量评估、体验评价及人工智能等,是 ITU 中最活跃的研究组之一。其代表性的研究内容包含 MOS 分(Mean Opinion Score)、POLQA、E-Model 等,为通信行业音频领域的发展奠定了基础。
相较于其他 SG 小组,SG12 的立项对中国代表团来说更具挑战性。
首先,以往这类技术的标准制定多是由西方国家主导,其他国家代表团参会目的多以学习、吸收为主。SG12 内部目前没有中国成员担任召集人角色,中国在主要项目(例如 Q7、Q9 等)中也尚未有成功立项的案例。其次,SG12 领域的技术难度和门槛相对较高,需要通信、信号处理等多领域的长期积累。
两个因素共同构成了中国代表团所面临的挑战,但这一次,国内团队不仅积极参与其中,更是首次在 SG12 的主项中成功立项。
中国标准走进国际视野
作为本次国际标准的牵头单位,阿里巴巴钉钉在音频质量方面具有完整的技术创新体系和工程系统研发能力。经过 100 多个软件和版本以及超过 5 万条测试用例的评测,钉钉自研的音质评价体系为其音视频会议产品的研发提供了技术支撑,针对各类业务场景提供端到端的服务质量保证,也验证了该体系在实际应用中的先进性和准确性。
该评价体系的特色在于全自动化和多维度评价,能自动生成音质评分表,无需人工干预。它综合评估了噪声抑制、回声消除、音量控制、网络传输等维度,服务于不同测试环境和应用场景。
此次成功立项,将填补中国在这一领域的国际标准空白,极大地提升中国在电信国际标准化进程中的话语权和影响力,也标志着以钉钉为代表的中国科技公司在实时音视频领域的技术受到国际高度认可,将技术优势进一步推向国际舞台。
钉钉蜂鸣鸟音频实验室负责人冯津伟表示,“对我们来说,如何将钉钉在实时音视频方面的领先优势转换成标准,贡献到业界,是一件既有挑战,也有意义的事情。未来,我们会在这个领域持续深耕,并希望通过建立标准推动更多行业合作伙伴共同发展。”