DSP

关于libmad开源mp3音频解码库的使用

2019-07-13 18:42发布

MAD(libmad)是一个开源的高精度MPEG音频解码库。libmad提供24-bit的PCM输出,完全定点计算。使用libmad提供的一系列API可以实现MP3文件的解码。 这里仅介绍这个库的相关使用方法。
1,首先下载libmad的源码包 libmad-0.15.0b.tar.gz并解压
2.在解压出来的目录下编译规则文件Makefile, ./comfigure -prefix /usr/
3.之后会生成Makefile文件,make编译(注意:编译可能会出错,查找原因后,在Makefile文件中去掉-fforce-mem即可)
4.make install
这之后我们就可以使用libmad的API了,但是我们还没有音频输出的驱动,要加载相应的音频播放驱动,执行 modprobe snd-psm-oss,就可以在/dev下看到 dsp或是dsp1了,这就是mp3音频输出的设备节点。 主要结构体(mad.h):
主要数据结构
struct mad_stream
存放解码前的Bitstream数据
struct mad_synth
存放解码合成滤波后的PCM数据
struct mad_pcm
定义了音频的采样率,声道个数和PCM采样数据,用来初始化音频
struct mad_frame
记录MPEG帧解码后PCM数据的数据结构,其中的mad_header用来记录MPEG帧的基本信息,比如MPEG层数、声道模式、流比特率、采样比特率。声道模式包括单声道、双声道、联合立体混音道以及一般立体声。 主要的一些API函数:
void mad_stream_init(struct mad_stream *)
void mad_synth_init(struct mad_synth *);
void mad_frame_init(struct mad_frame *);
以上3个 API 初始化解码需要的数据结构。 void mad_stream_buffer(struct mad_stream , unsigned char const , unsigned long);
此函数把原始的未解码的 MPEG 数据和 mad_stream 数据结构关联,以便使用 mad_frame_decode( ) 来解码 MPEG 帧数据。 int mad_frame_decode(struct mad_frame , struct mad_stream );
把 mad_stream 中的 MPEG 帧数据解码。 void mad_synth_frame(struct mad_synth , struct mad_frame const );
把解码后的音频数据合成 PCM 采样。 void mad_stream_finish(struct mad_stream *);
void mad_frame_finish(struct mad_frame *);
mad_synth_finish(struct mad_synth);
以上 3 个 API 在解码完毕后使用,释放 libmad 占用的资源等。 还有一些其他的API的使用方法和作用可以在头文件 mad.h中查看。(头文件mad.h已经在源码包解压的目录下)但是下面给出的例程已经能完成音频的解码播放,所以只需要了解 libmad的运行机制(回调函数机制),然后在相应的回调函数中稍加改动就可以使用了。 下面将给出一个简单的例程: # include # include # include # include # include # include # include # include # include # include "mad.h" struct buffer { unsigned char const *start; unsigned long length; }; static int sfd; // static int decode(unsigned char const *, unsigned long); // int main(int argc, char *argv[]) { struct stat stat; void *fdm; char const *file=NULL; int fd; //打开的音频文件 char str[]="/home/gaoyuzhe/music/我去你大爷.mp3"; file = (str); printf("%s ",file); fd = open(file, O_RDONLY); //打开设备,这里的设备名为dsp1 if ((sfd = open("/dev/dsp1", O_WRONLY)) < 0) { printf("can not open device!!! "); return 5; } ioctl(sfd, SNDCTL_DSP_SYNC, 0); //控制端口,这句话可以不用 if (fstat(fd, &stat) == -1 || stat.st_size == 0) return 2; //mmap内存映射函数,将音频文件映射至fdm(映射区域的指针) fdm = mmap(0, stat.st_size, PROT_READ, MAP_SHARED, fd, 0); if (fdm == MAP_FAILED) return 3; decode(fdm, stat.st_size); // 定义的解码函数decode if (munmap(fdm, stat.st_size) == -1) return 4; ioctl(sfd, SNDCTL_DSP_RESET, 0); close(sfd); return 0; } // 每个回调函数会返回一个枚举类型mad_flow,通过mad_flow可以控制解码的过程 // 应该input,output各一个mad_flow回调函数 // 这个input函数表示将数据全部读进缓冲区,之后将缓冲区长度置0 static enum mad_flow input(void *data, struct mad_stream *stream) { struct buffer *buffer = data; int a=buffer->length; printf("buffer->length=%d ",a); if (!buffer->length) return MAD_FLOW_STOP; //把原始的未解码的 MPEG 数据和 mad_stream 数据结构关联,以便使用 mad_frame_decode( ) 来解码 MPEG 帧数据 mad_stream_buffer(stream, buffer->start, buffer->length); buffer->length = 0; return MAD_FLOW_CONTINUE; } static inline signed int scale(mad_fixed_t sample) { sample += (1L << (MAD_F_FRACBITS - 16)); if (sample >= MAD_F_ONE) sample = MAD_F_ONE - 1; else if (sample < -MAD_F_ONE) sample = -MAD_F_ONE; return sample >> (MAD_F_FRACBITS + 1 - 16); } static enum mad_flow output(void *data, struct mad_header const *header, struct mad_pcm *pcm) { unsigned int nchannels, nsamples, n; mad_fixed_t const *left_ch, *right_ch; unsigned char Output[6912], *OutputPtr; int fmt, wrote, speed; nchannels = pcm->channels; n = nsamples = pcm->length; left_ch = pcm->samples[0]; right_ch = pcm->samples[1]; fmt = AFMT_S16_LE; speed = pcm->samplerate * 2; //播放速度为采样率两倍 ioctl(sfd, SNDCTL_DSP_SPEED, &(speed)); ioctl(sfd, SNDCTL_DSP_SETFMT, &fmt); ioctl(sfd, SNDCTL_DSP_CHANNELS, &(pcm->channels)); OutputPtr = Output; while (nsamples--) { signed int sample; sample = scale(*left_ch++); *(OutputPtr++) = sample >> 0; *(OutputPtr++) = sample >> 8; if (nchannels == 2) { sample = scale(*right_ch++); *(OutputPtr++) = sample >> 0; *(OutputPtr++) = sample >> 8; } } n *= 4; //数据长度为pcm音频的4倍 OutputPtr = Output; while (n) { wrote = write(sfd, OutputPtr, n); OutputPtr += wrote; n -= wrote; } OutputPtr = Output; return MAD_FLOW_CONTINUE; } static enum mad_flow error(void *data, struct mad_stream *stream, struct mad_frame *frame) { return MAD_FLOW_CONTINUE; } static int decode(unsigned char const *start, unsigned long length) { struct buffer buffer; //上面定义的buffer,内有内存起点和大小 struct mad_decoder decoder; //struct mad_decoder 定义解码器结构体 int result; buffer.start = start; buffer.length = length; // 传送给结构体 //mad_decoder_init 初始化函数 // 参数如下,decoder,buffer,input,output,error mad_decoder_init(&decoder, &buffer, input, 0, 0, output, error, 0); mad_decoder_options(&decoder, 0); // mad_decoder_run解码函数,解码过程中output函数被不断调用 result = mad_decoder_run(&decoder, MAD_DECODER_MODE_SYNC); mad_decoder_finish(&decoder); return result; } 在这里我们可以看到,在定义的decode函数中,主要的就是mad_decoder_init函数进行初始化,里面包含了指向输入、输出、滤波、错误和消息回调函数的指针,在这里我们只需要输入、输出、错误的回调函数的指针,所以只需要定义这几个回调函数就可以了。
在上面程序中,我们可以看到,回调函数input输入函数、output输出函数、error报错函数的返回值都是mad_flow枚举类型,关于mad_flow枚举类型,我们可以在mad.h中看到:

在这个枚举类型中,我们可以看到continue(继续)、stop(停止)、break(终断)、ignore(跳过这一帧数据)等,相当于对当前解码过程的指令。
这里要加以说明一下:libmad通过回调函数机制来实现解码,当mad_decoder_init初始化完成后,程序执行 mad_decoder_run,这时候程序就会不断调用回调函数来进行每帧数据的解码(上面的例程是照着官方例程改的,即一次性解码整个音频文件)。每个回调函数执行完毕后会返回一个枚举类型mad_flow的返回值,通过mad_flow可以控制解码的过程。MAD在每进行一帧的解码结束后都会询问mad_flow的状态,以决定是否进行下一帧的解码。大部分时候,我们会编写程序让回调函数返回MAD_FLOW_CONTINUE,但有时候,我们可以扩展功能,例如在特殊情况下让程序暂停对mp3文件的解码和播放。这个时候,我们可以让回调函数返回MAD_FLOW_BREAK,或者当该帧数据解码出错时,让回调函数返回MAD_FLOW_IGNORE。