pcm音频格式详解
1、pcm是什么?
pcm是脉冲编码调制,是数字音频的存储格式。
2、pcm的组成
pcm音频文件由两部分组成:
- 头部信息
- 音频数据
2-1、头部信息
头部信息中包含了音频文件的采样率、声道数等信息,用于描述音频文件的属性。
2-2、音频数据
音频数据是实际的波形数据,以二进制形式存储在文件中。
3、pcm的采样率
采样率是指每秒从录音设备或声音文件里采样的次数,它描述了音频文件的长度。
采样率越高,音频文件的长度就越长。
采样率越低,音频文件的长度就越短。
常见的采样率有:
- 8kHz:电话
- 16kHz:CD
- 22.05kHz:低音炮
- 44.1kHz:CD
- 48kHz:DVD
采样率越高,音质就越好。
采样率越低,音质就越差。
采样率越高,文件大小就越大。
采样率越低,文件大小就越小。
用高于采样率的播放器播放高于采样率的音频文件,会降低音质。声音比较尖锐。
用低于采样率的播放器播放低于采样率的音频文件,会降低音质。声音比较模糊、低沉。
4、pcm的采样位数
采样位数是指每个采样点占用的二进制位数。
常见的采样位数有:
- 8位:表示每个采样点占用的二进制位数为8位
- 16位:表示每个采样点占用的二进制位数为16位
- 24位:表示每个采样点占用的二进制位数为24位
- 32位:表示每个采样点占用的二进制位数为32位
采样位数越高,音质越好。
采样位数越低,音质就越差。
采样位数越高,文件大小就越大。
采样位数越低,文件大小就越小。
5、pcm的声道数
声道数是描述音频文件中的声音来源和数量的术语。
- 单声道:只有一个声音源
- 双声道:有两个声音源
6、文件大小
文件大小 = 采样率 * 时长 * 声道数 * 采样位数 / 8
当送数据播放时,如果送的太快,就会造成声音的撕裂。
采样8000Hz,16位,双声道,时长5s的文件大小 = 8000 * 16 * 2 * 5 / 8 = 320kb
可以将16000,转换成8000,只需要将每两个字节删掉一个就可以实现。
双声道有存储顺序问题,需要具体分析。
7、pcm的编码格式
pcm音频文件一般不直接播放,需要先进行编码,常见的编码格式有:
- WAV:微软公司开发的音频文件格式
- AAC:高级音频编码
- MP3:高压缩比音频编码
- OGG:开源音频编码
- FLAC:无损音频编码
- AMR:音频码率压缩格式
扩展:
g711:G.711是ITU-T语音编码的推荐标准之一。
g711采样率:8kHz
g711采样位数:8位
g711声道数:单声道
g711编码格式:PCM
调试音频用0db音频文件调试
相关软件Cool Edit Pro。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 naro!