关于libmad开源mp3音频解码库的使用

DSP

关于libmad开源mp3音频解码库的使用

2019-07-13 18:42发布生成海报

站内文章 / DSP

12972 0

MAD(libmad)是一个开源的高精度MPEG音频解码库。libmad提供24-bit的PCM输出，完全定点计算。使用libmad提供的一系列API可以实现MP3文件的解码。这里仅介绍这个库的相关使用方法。
1,首先下载libmad的源码包 libmad-0.15.0b.tar.gz并解压
2.在解压出来的目录下编译规则文件Makefile， ./comfigure -prefix /usr/
3.之后会生成Makefile文件，make编译（注意：编译可能会出错，查找原因后，在Makefile文件中去掉-fforce-mem即可）
4.make install
这之后我们就可以使用libmad的API了，但是我们还没有音频输出的驱动，要加载相应的音频播放驱动，执行 modprobe snd-psm-oss,就可以在/dev下看到 dsp或是dsp1了，这就是mp3音频输出的设备节点。主要结构体（mad.h）：
主要数据结构
struct mad_stream
存放解码前的Bitstream数据
struct mad_synth
存放解码合成滤波后的PCM数据
struct mad_pcm
定义了音频的采样率，声道个数和PCM采样数据,用来初始化音频
struct mad_frame
记录MPEG帧解码后PCM数据的数据结构，其中的mad_header用来记录MPEG帧的基本信息，比如MPEG层数、声道模式、流比特率、采样比特率。声道模式包括单声道、双声道、联合立体混音道以及一般立体声。主要的一些API函数：
void mad_stream_init(struct mad_stream *)
void mad_synth_init(struct mad_synth *);
void mad_frame_init(struct mad_frame *);
以上3个 API 初始化解码需要的数据结构。 void mad_stream_buffer(struct mad_stream , unsigned char const , unsigned long);
此函数把原始的未解码的 MPEG 数据和 mad_stream 数据结构关联，以便使用 mad_frame_decode( ) 来解码 MPEG 帧数据。 int mad_frame_decode(struct mad_frame , struct mad_stream );
把 mad_stream 中的 MPEG 帧数据解码。 void mad_synth_frame(struct mad_synth , struct mad_frame const );
把解码后的音频数据合成 PCM 采样。 void mad_stream_finish(struct mad_stream *);
void mad_frame_finish(struct mad_frame *);
mad_synth_finish(struct mad_synth);
以上 3 个 API 在解码完毕后使用，释放 libmad 占用的资源等。还有一些其他的API的使用方法和作用可以在头文件 mad.h中查看。（头文件mad.h已经在源码包解压的目录下）但是下面给出的例程已经能完成音频的解码播放，所以只需要了解 libmad的运行机制（回调函数机制），然后在相应的回调函数中稍加改动就可以使用了。下面将给出一个简单的例程：

# include      
# include      
# include      
# include      
# include      
# include      
# include      
# include      
# include      
# include "mad.h"     
struct buffer {     
    unsigned char const *start;     
    unsigned long length;     
};     
static int sfd;         //
static int decode(unsigned char const *, unsigned long); //


int main(int argc, char *argv[])     
{     
    struct stat stat;     
    void *fdm;     
    char const *file=NULL;     
    int fd; 
    //打开的音频文件
    char str[]="/home/gaoyuzhe/music/我去你大爷.mp3";    
    file = (str); 
    printf("%s
",file);    
    fd = open(file, O_RDONLY); 

    //打开设备，这里的设备名为dsp1
    if ((sfd = open("/dev/dsp1", O_WRONLY)) < 0) {     
    printf("can not open device!!!
");     
    return 5;     
    } 

    ioctl(sfd, SNDCTL_DSP_SYNC, 0); //控制端口，这句话可以不用
    if (fstat(fd, &stat) == -1 || stat.st_size == 0) 
    return 2; 

    //mmap内存映射函数，将音频文件映射至fdm（映射区域的指针）
    fdm = mmap(0, stat.st_size, PROT_READ, MAP_SHARED, fd, 0);  
    if (fdm == MAP_FAILED)     
    return 3;  

    decode(fdm, stat.st_size);   // 定义的解码函数decode
    if (munmap(fdm, stat.st_size) == -1)     
    return 4;  

    ioctl(sfd, SNDCTL_DSP_RESET, 0);     
    close(sfd);     
    return 0;     
}   


// 每个回调函数会返回一个枚举类型mad_flow,通过mad_flow可以控制解码的过程
// 应该input，output各一个mad_flow回调函数

// 这个input函数表示将数据全部读进缓冲区，之后将缓冲区长度置0
static
enum mad_flow input(void *data, struct mad_stream *stream)     
{     
    struct buffer *buffer = data; 
    int a=buffer->length;
    printf("buffer->length=%d
",a);    
    if (!buffer->length)     
    return MAD_FLOW_STOP;
    //把原始的未解码的 MPEG 数据和 mad_stream 数据结构关联，以便使用 mad_frame_decode( ) 来解码 MPEG 帧数据
    mad_stream_buffer(stream, buffer->start, buffer->length);     
    buffer->length = 0;     
    return MAD_FLOW_CONTINUE;     
}  


static inline signed int scale(mad_fixed_t sample)     
{     
    sample += (1L << (MAD_F_FRACBITS - 16));     
    if (sample >= MAD_F_ONE)     
    sample = MAD_F_ONE - 1;     
    else if (sample < -MAD_F_ONE)     
    sample = -MAD_F_ONE;     
    return sample >> (MAD_F_FRACBITS + 1 - 16);     
}   

static
enum mad_flow output(void *data,     
             struct mad_header const *header, struct mad_pcm *pcm)     
{     
    unsigned int nchannels, nsamples, n;     
    mad_fixed_t const *left_ch, *right_ch;     
    unsigned char Output[6912], *OutputPtr;     
    int fmt, wrote, speed;     

    nchannels = pcm->channels;     
    n = nsamples = pcm->length;     
    left_ch = pcm->samples[0];     
    right_ch = pcm->samples[1];     

    fmt = AFMT_S16_LE;     
    speed = pcm->samplerate * 2;    //播放速度为采样率两倍
    ioctl(sfd, SNDCTL_DSP_SPEED, &(speed));     
    ioctl(sfd, SNDCTL_DSP_SETFMT, &fmt);     
    ioctl(sfd, SNDCTL_DSP_CHANNELS, &(pcm->channels));     
    OutputPtr = Output;     
    while (nsamples--) {     
    signed int sample;     
    sample = scale(*left_ch++);     
    *(OutputPtr++) = sample >> 0;     
    *(OutputPtr++) = sample >> 8;     
    if (nchannels == 2) {     
        sample = scale(*right_ch++);     
        *(OutputPtr++) = sample >> 0;     
        *(OutputPtr++) = sample >> 8;     
    }     
    }     
    n *= 4;         //数据长度为pcm音频的4倍
    OutputPtr = Output;     
    while (n) {     
    wrote = write(sfd, OutputPtr, n);     
    OutputPtr += wrote;     
    n -= wrote;     
    }     
    OutputPtr = Output;     

    return MAD_FLOW_CONTINUE;     
}     


static
enum mad_flow error(void *data,     
            struct mad_stream *stream, struct mad_frame *frame)     
{     
    return MAD_FLOW_CONTINUE;     
}     

static
int decode(unsigned char const *start, unsigned long length)     
{     
    struct buffer buffer;  //上面定义的buffer，内有内存起点和大小   
    struct mad_decoder decoder;   //struct mad_decoder 定义解码器结构体
    int result;     
    buffer.start = start;     
    buffer.length = length; // 传送给结构体

    //mad_decoder_init 初始化函数
    // 参数如下，decoder,buffer,input,output,error
    mad_decoder_init(&decoder, &buffer, input, 0, 0, output, error, 0);    
    mad_decoder_options(&decoder, 0); 
    // mad_decoder_run解码函数，解码过程中output函数被不断调用
    result = mad_decoder_run(&decoder, MAD_DECODER_MODE_SYNC);     
    mad_decoder_finish(&decoder);     
    return result;     
}

在这里我们可以看到，在定义的decode函数中，主要的就是mad_decoder_init函数进行初始化，里面包含了指向输入、输出、滤波、错误和消息回调函数的指针，在这里我们只需要输入、输出、错误的回调函数的指针，所以只需要定义这几个回调函数就可以了。
在上面程序中，我们可以看到，回调函数input输入函数、output输出函数、error报错函数的返回值都是mad_flow枚举类型，关于mad_flow枚举类型，我们可以在mad.h中看到：

在这个枚举类型中，我们可以看到continue（继续）、stop（停止）、break（终断）、ignore(跳过这一帧数据)等，相当于对当前解码过程的指令。
这里要加以说明一下：libmad通过回调函数机制来实现解码，当mad_decoder_init初始化完成后，程序执行 mad_decoder_run，这时候程序就会不断调用回调函数来进行每帧数据的解码（上面的例程是照着官方例程改的，即一次性解码整个音频文件）。每个回调函数执行完毕后会返回一个枚举类型mad_flow的返回值,通过mad_flow可以控制解码的过程。MAD在每进行一帧的解码结束后都会询问mad_flow的状态，以决定是否进行下一帧的解码。大部分时候，我们会编写程序让回调函数返回MAD_FLOW_CONTINUE，但有时候，我们可以扩展功能，例如在特殊情况下让程序暂停对mp3文件的解码和播放。这个时候，我们可以让回调函数返回MAD_FLOW_BREAK，或者当该帧数据解码出错时，让回调函数返回MAD_FLOW_IGNORE。

关于libmad开源mp3音频解码库的使用

Ta的文章更多 >>

热门文章

关于libmad开源mp3音频解码库的使用

Ta的文章 更多 >>

热门文章

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

Ta的文章更多 >>