“脱离”现实+空间拟真声网凤鸣AI引擎来袭

3月23日，实时互动云服务商声网在北京举办“凤鸣AI引擎”发布会，正式发布了囊括 AI降噪、AI回声消除、空间音频、最佳音效在内的声网新一代音频技术智能引擎。

RTE场景不断丰富，高音质互动需求急需满足

(相关资料图)

实时音视频技术的发展带出大量的创新场景，伴随着场景的不断扩展，用户对实时音视频体验的诉求也越来越高。

传统的RTC概念，从信息传递的角度出发，音频功能仅提供简单的语音沟通，满足单一的场景和通话标准，对于音质并无太高的需求，也就是所谓的“能够沟通”。声网发现，伴随着实时互动创新场景的涌现，用户对于音频体验的需求也产生了从量变到质变的进化。同时音频体验的提升能够增强平台用户的核心体验。针对以上痛点和需求，声网凤鸣AI引擎应势而生。

3大音频能力+优质音效实践回归互动本真

通过AI驱动的方式，声网打通了音频采集、前后处理、云端传输、编解码等链路，旨在为用户打造更纯净、更动听、更沉浸的语音体验，在现有实时互动玩法的基础上锦上添花，赋能行业开发者和企业。

想要在“脱离现实”的环境中办公、娱乐，屏蔽外界干扰是基础。相比于传统的降噪算法，凤鸣·AI降噪的效果有显著提升，可以一次性解决100+种突发性噪声。

凤鸣·AI降噪在强降噪的同时还能兼顾高保真，即使在人声密集场景下，也能实现纯净通话体验，甚至还实现了在不增加额外运算量的前提下，对远场语音具有明显的混响抑制能力。

此外，声网自研的AI推理引擎还可以使得AI降噪算法在Android、iOS、Mac、Windows、Web等主流平台以低精度损伤、高性能、低功耗方式运行，使用户的设备不卡不烫。经数据测算，仅开启凤鸣·AI降噪功能，相应设备CPU消耗增幅平均值<1%。

回声是影响音视频通话质量的主要因素之一，尤其在线上会议、在线K歌、多人连麦等场景中，不仅损害通话质量，影响用户体验，还可能导致带宽增加。凤鸣·AI回声消除利用算法对环境中产生的回声混响进行有效抑制，智能适应各类环境，实现精准音源分离，从混合的近端信号中消除不必要的远端信号，保留近端人声发送到远端，全面消除回声，实现高保真音频体验。

凤鸣·空间音频通过纯软件算法方案，模拟头部球面区域立体声场，利用范围音频、人声模糊、空气衰减模拟等能力，模拟现实听觉感受。当用户操作相应角色在虚拟场景里移动，可以实现根据虚拟人物的面部朝向、音源朝向、远近距离与上下高度，呈现不同声音效果。据数据测算，开启凤鸣·空间音频功能后，相应设备CPU消耗增幅平均值<0.7%，内存消耗增幅平均值<2M。

多年来，声网汇总梳理语聊领域各类头部App的音效配置，综合声网超过万亿分钟的用户音效偏好的数据模型，并结合声网音频专家的多年沉淀与研究，能够为平台提供针对各种语音场景的最佳音效配置，助力平台用户享受行业顶尖的音效体验。目前已上线的最佳音效包括语聊社交、K歌、游戏陪玩、专业主播等场景。

据声网音频娱乐产品负责人杨帆介绍，凤鸣AI引擎目前正在开发变声这一功能，用户将可以体验20+变声风格，多样角色扮演花式玩转语聊场景。声网算法专家许冉指出，凤鸣AI引擎代表声网在 RTC音频领域针对核心技术的长期投入和产出，以及声网基于音频核心能力衍生出各种复杂功能和高端效果的决心，未来声网将基于凤鸣AI引擎形成新一代RTC音频解决方案，比如探索更个性化的语音方案、语音超分、co-experiencing场景等。

在发布会的圆桌讨论环节，与会嘉宾围绕“音频社交行业现状及海内外趋势展望”，“音频技术与行业发展”等话题展开讨论。

关键词：

责任编辑：Rex_24

“脱离”现实+空间拟真 声网凤鸣AI引擎来袭

“脱离”现实+空间拟真声网凤鸣AI引擎来袭