|    业界首创:缺少网给资料上传者真金白银现金回报,按月结算支付 上传:95570  发放金额:118800.5
RSS

实时混音的实现



摘要 本文主要讨论多路声音实时混叠的实现方法,以及实现过程中对一些特殊情况的处理。关键词 Wave 混音 混音器

1.引言

  将多个Wave文件或多路Wave数据同时在Wave设备上输出,就可同时听到多个不同的声音,达到混音的效果。如果是将多个不同端点的话音数据经局域网络传输到达某一个端点再经该端点的Wave设备输出,就能同时听到多个人的话音,从而实现局域网络中多方的话音交谈。

  在网络上实现话音交谈,特别强调实时性,要尽量保证话音的平滑、连续,因此为了保证话音数据连续,减少话音数据存储带来的延时,在具体实现中,话音的录制和播放都不采用文件的形式,录制和播放的话音数据都存在缓冲区中。在Windows系统中,一般情况下,高层Wave接口函数无法直接播放缓冲区中的话音数据,而必须用底层函数来实现,常用的是Windows API中的Wave函数。将Wave数据在Wave设备上输出使用的是WaveOutWrite函数,但是该函数不支持多路Wave数据的同时播放,为了能达到多路Wave数据同时播放的效果,对缓冲区中多路Wave数据进行必要的预处理后,再提交给Wave输出设备播放。实现原理如图1所示。

图1 多路Wave混音的实现原理

2.实现原理

  实时地混音,就是将多路Wave数据进行相互叠加处理到另一个目的缓冲区,最终将该目的的缓冲区提交给Wave输出设备。

将每一路Wave数据作为一个单独通道,分别从每个通道取一数据片段,把取得的几个数据片段相互叠加,然后存进另外一个目的缓冲区中。为了便于处理,缓冲区通常采用数组的形式存放Wave数据。

如果话音数据,采用采样频率1025Hz,8位单声道的数据格式,那么一秒的话音数据量为11025个字节。

为了达到实时的效果,目的缓冲区通常都设置比较小,大约可存放1/8秒的话音数据量,对于前述的话音格式,目的缓冲区的大小为11025/8=1375个字节。

下面具体看一下Wave数据以数组形式存放时的混音过程。如图2所示。

图2 多路Wave数据的叠加过程

假设有4路Wave数据,目的缓冲区的大小为1378,混音子函数调用为 Mixer(lpDest,rgpCDdata,4,1378)。

下面给出混音子函数的实现。其中lpDest为目的缓冲区,rgWaveSrc为多路Wave数据源,iNumWaves为Wave数据源的通道数,wLen为目的缓冲区长度。

本新闻共2页,当前在第1页  1  2  

今日推荐
发表评论

[收藏此网页到]
[我们为您推荐]
[您可能感兴趣]
[最热点击]
[声明]
      本网站为公益性网站,刊载内容以共享和研究为目的,不存在任何商业考虑,刊登的对象如有异议,请与我们联系。谢谢您的支持与理解!
联系我们 | 客服论坛 | 帮助中心 | 版权声明 | |友情链接
7×24客服:028-87018259 Email:
使用本网站即表示接受缺少网作品版权声明资料上传协议
2008 © Queshao.com Some Rights Reserved 蜀ICP备06015828号