您当前的位置:首页 > 计算机 > 文件格式与编码

AAC音频格式详解和实战解析

时间:08-17来源:作者:点击数:

一.基本概念

AAC:即MPEG-2 Advanced Audio Coding,分为流格式和文件格式。文件格式主要用于文件存储和文件播放,流格式主要用于流媒体在线播放。

文件格式:adif格式


adif格式

该格式特点:只有开头有一个头部信息,后面都是AAC裸数据。适应磁盘存储和文件播放

流格式:adts_frame格式


adts_frame格式

该格式特点:每一帧数据=固定头(fixed_header)+ 可变头(variable_header)+帧数据(raw_data),适合流媒体在线播放。

流式AAC可以简单理解如下图:

固定头如下:

syncword 同步字The bit string ‘1111 1111 1111’,说明一个ADTS帧的开始。

ID MPEG 标示符, 设置为1.

layer Indicates which layer is used. Set to ‘00’

protection_absent 表示是否误码校验

profile 表示使用哪个级别的AAC,如01 Low Complexity(LC)--- AACLC

sampling_frequency_index 表示使用的采样率下标

channel_configuration 表示声道数

frame_length 一个ADTS帧的长度包括ADTS头和raw data block.

可变头如下:

adts_buffer_fullness 0x7FF 说明是码率可变的码流

number_of_raw_data_blocks_in_frame

表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧.

所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有一个AAC数据块并不是说没有。

其他字段为定义,可以忽略。

Raw数据块:

一个帧包含1024个采样

Duration算法:

一个AAC原始帧包含一段时间内1024个采样及相关数据。

一个AAC音频帧的播放时间=一个AAC帧对应的采样样本的个数/采样率。总时间t=总帧数x一个AAC音频帧的播放时间

时间t=总帧数x一个AAC音频帧的播放时间

二. 实战演练

1)使用ffmpeg抽取一个mp4文件中的aac音频如下:

ffmpeg.exe-i CCTV-2-dszg-1.mp4 -vn -y -acodec copy audio.aac

2)利用工具分析该aac音频固定头和可变头字段如下:


adts头解析

3)使用程序代码解析

#include "stdafx.h"
#include<windows.h>
typedef struct _AdtsHeader
{
    unsigned int nSyncWord;
    unsigned int nId;
    unsigned int nLayer;
    unsigned int nProtectionAbsent;
    unsigned int nProfile;
    unsigned int nSfIndex;
    unsigned int nPrivateBit;
    unsigned int nChannelConfiguration;
    unsigned int nOriginal;
    unsigned int nHome;

    unsigned int nCopyrightIdentificationBit;
    unsigned int nCopyrigthIdentificationStart;
    unsigned int nAacFrameLength;
    unsigned int nAdtsBufferFullness;

    unsigned int nNoRawDataBlocksInFrame;
} AdtsHeader;
int _tmain(int argc, _TCHAR* argv[])
{
    FILE *fd = fopen("D:\\ffmpeg-4.1-tool\\bin\\audio.aac", "rb+");
    if (fd == NULL)
    {
        printf("fopen is failed,err %d\n", GetLastError());
    }
    char adts[7];
    int adtslen = 7;
    int ret = fread(adts, adtslen, 1, fd);
    if (ret != 1)
    {
        printf("fread is failed,err %d\n", GetLastError());
    }
    char *p = adts;
    GetAdtsSpecificConfig(p, &tAdtsHeader);
    printf("AAC key param: \n");
    printf("id: %d\n", tAdtsHeader.nId);
    printf("layer: %d\n", tAdtsHeader.nLayer);
    printf("ProtectionAbsent: %d\n", tAdtsHeader.nProtectionAbsent);
    printf("Profile: %d\n", tAdtsHeader.nProfile);
    printf("SfIndex: %d\n", tAdtsHeader.nSfIndex);
    printf("PrivateBit: %d\n", tAdtsHeader.nPrivateBit);
    printf("ChannelConfiguration: %d\n", tAdtsHeader.nChannelConfiguration);
    printf("Original: %d\n", tAdtsHeader.nOriginal);
    printf("nHome: %d\n", tAdtsHeader.nHome);
    printf("nCopyrigthIdentificationStart: %d\n", tAdtsHeader.nCopyrigthIdentificationStart);
    printf("nAacFrameLength: %d\n", tAdtsHeader.nAacFrameLength);
    printf("nAdtsBufferFullness: %d\n", tAdtsHeader.nAdtsBufferFullness);
    printf("NoRawDataBlocksInFrame: %d\n", tAdtsHeader.nNoRawDataBlocksInFrame);
    getchar();
    return 0;
}

编译运行结果如下:

由此可见:代码读出来的参数和工具分析参数一致。

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门