在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称:AVDataProcess开源软件地址:https://gitee.com/dezhihuang/AVDataProcess开源软件介绍:视音频数据处理入门准备yuv视频下载: yuv播放器:修改了一个YUV/RGB播放器
分离YUV420P像素数据中的Y、U、V分量
yuv420p像素数据排列如下图。原图像分辨率为256 * 256,所以Y分量分辨率为256 * 256,U分量分辨率为128 * 128,V分量分辨率为128 * 128: yuv420_split.cpp 程序中的函数可以将YUV420P数据中的Y、U、V三个分量分离开来并保存成三个文件。 调用方法:
上述代码运行后,将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件分离成为三个文件:
分离YUV444P像素数据中的Y、U、V分量
调用方法:
上述代码运行后,将会把一张分辨率为256x256的名称为lena_256x256_yuv444p.yuv的YUV444P格式的像素数据文件分离成为三个文件:
分离YUV422P像素数据中的Y、U、V分量(还有问题,图像显示不完整)
调用方法:
上述代码运行后,将会把一张分辨率为256x256的名称为lena_256x256_yuv422p.yuv的YUV422P格式的像素数据文件分离成为三个文件:
将YUV420P像素数据去掉颜色(变成灰度图)
调用方法:
上述代码运行后,将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件处理成名称为output_420p_gray.yuv的YUV420P格式的像素数据文件。 将YUV420P像素数据的周围加上边框
调用方法:
上述代码运行后,将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件处理成名称为output_420p_border.yuv的YUV420P格式的像素数据文件。输入的原图如下所示。
将YUV420P像素数据的亮度减半
调用方法:
上述代码运行后,将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件处理成名称为output_420p_half_y.yuv的YUV420P格式的像素数据文件。 分离RGB24像素数据中的R、G、B分量
调用方法:
上述代码运行后,将会把一张分辨率为500x500的名称为cie1931_500x500.rgb的RGB24格式的像素数据文件分离成为三个文件:
输入的原图是一张标准的CIE 1931色度图。该色度图右下为红色,上方为绿色,左下为蓝色,如下图所示: R数据图像如图所示: G数据图像如图所示: B数据图像如图所示: 将RGB24格式像素数据封装为BMP图像
调用方法:
该程序完成了主要完成了两个工作:
BMP文件是由BITMAPFILEHEADER、BITMAPINFOHEADER、RGB像素数据共3个部分构成 //位图文件头结构体//这个结构体的长度是固定的14个字节。//考虑到结构体的字节对齐,将bfType单独提取出来,否则会造成该结构体为16个字节。static unsigned short bfType = 0x4D42;//指定文件类型,必须是0x424D, //即字符串“BM”,也就是说所有.bmp文件的头两个字节都是“BM”。 //'BM'表示这是Windows支持的位图格式。typedef struct { unsigned int bfSize; //指定文件大小,以字节为单位,包括这14个字节。 unsigned short bfReserved1; //为保留字,不用考虑 unsigned short bfReserved2; //为保留字,不用考虑 unsigned int bfOffBits; //位图文件头到数据的偏移量,以字节为单位 }BITMAPFILEHEADER;//位图信息头结构体typedef struct { unsigned int biSize; //该结构大小,字节为单位,一般为40个字节 unsigned int biWidth; //指定图象的宽度,单位是象素。 unsigned int biHeight; //指定图象的高度,单位是象素。 //注:这个值除了用于描述图像的高度之外,它还有另一个用处, //就是指明该图像是倒向的位图,还是正向的位图。 //如果该值是一个正数,说明图像是倒向的,如果该值是个负数,则说明图像是正向的。 //大多数的BMP文件都是倒向的位图,也就是高度值是一个正数。 unsigned short biPlanes; //为目标设备说明颜色平面数,必须为1,不用考虑 unsigned short biBitCount; //颜色深度,每个象素所需要的位数 unsigned int biCompression; //位图的压缩类型 unsigned int biSizeImage; //位图的大小,以字节为单位 unsigned int biXPelsPerMeter; //位图水平分辨率,每米像素数 unsigned int biYPelsPerMeter; //位图垂直分辨率,每米像素数 unsigned int biClrUsed; //位图实际使用的颜色表中的颜色数 unsigned int biClrImportant; //位图显示过程中重要的颜色数 }BITMAPINFOHEADER; BMP采用的是小端(Little Endian)存储方式。这种存储方式中“RGB24”格式的像素的分量存储的先后顺序为B、G、R。由于RGB24格式存储的顺序是R、G、B,所以需要将“R”和“B”顺序作一个调换再进行存储。
将RGB24格式像素数据转换为YUV420P格式像素数据
调用方法:
注意:
生成RGB24格式的彩条测试图
输出结果如图所示: H.264视频码流解析H.264原始码流(又称为“裸流”)是由一个一个的NALU组成的。 其中每个NALU之间通过startcode(起始码)进行分隔。 起始码分成两种:0x000001(3Byte)或者0x00000001(4Byte)。 如果NALU对应的Slice为一帧的开始就用0x00000001,否则就用0x000001。 H.264码流解析的步骤:
NALU头结构:NALU类型(5bit)、重要性指示位(2bit)、禁止位(1bit)。
分离PCM16LE双声道音频采样数据的左声道和右声道
////本程序中的函数可以将PCM16LE双声道数据中左声道和右声道的数据分离成两个文件。//#include <stdio.h>#include <stdlib.h>#include <string.h>int pcm16le_split(const char *file){ if (file == NULL) { printf("文件路径为空!\n"); return 0; } FILE *fp = fopen(file, "rb+"); if (fp == NULL) { printf("文件打开失败!\n"); return 0; } FILE *fp_l = fopen("./output/output_l.pcm", "wb+"); if (fp_l == NULL) { printf("左声道文件打开或创建失败!\n"); return 0; } FILE *fp_r = fopen("./output/output_r.pcm", "wb+"); if (fp_r == NULL) { printf("右声道文件打开或创建失败!\n"); return 0; } unsigned char buf[4] = {0}; //PCM16LE双声道数据中左声道和右声道的采样值是间隔存储的。 //每个采样值占用2Byte空间。 while (!feof(fp)) { fread(buf, 1, 4, fp); //保存左声道的数据,一个采样值16位,两个字节 fwrite(buf, 1, 2, fp_l); //保存右声道的数据 fwrite(buf+2, 1, 2, fp_r); } fclose(fp); fclose(fp_l); fclose(fp_r); return 1;} int main(){ char file[] = "./mediadata/NocturneNo2inEflat_44.1k_s16le.pcm"; if (pcm16le_split(file)) { printf("操作成功!!!\n"); } else { printf("操作失败!!!\n"); }} 从代码可以看出,PCM16LE双声道数据中左声道和右声道的采样值是间隔存储的。每个采样值占用2Byte空间。代码运行后,会把NocturneNo2inEflat_44.1k_s16le.pcm的PCM16LE格式的数据分离为两个单声道数据:output_l.pcm:左声道数据。output_r.pcm:右声道数据。 将PCM16LE双声道音频采样数据中左声道的音量降一半
////本程序中的函数可以将PCM16LE双声道数据中左声道的音量降低一半。//#include <stdio.h>#include <stdlib.h>#include <string.h>int pcm16le_halfvolumeleft(const char *file){ if (file == NULL) { printf("原始文件为空!\n"); return 0; } FILE *fp = fopen(file, "rb+"); if (fp == NULL) { printf("原始文件打开失败!\n"); return 0; } FILE *fp1 = fopen("./output/output_halfleft.pcm", "wb+"); if (fp1 == NULL) { printf("文件打开或创建失败!\n"); return 0; } unsigned char buf[4] = {0}; while(!feof(fp)) { //从文件中读取一次采样值,因为是16位的,所以需读取4个字节 //左右声道采样值间隔存储 //前两个字节为左声道采样值,后两个字节为右声道采样值 fread(buf, 1, 4, fp); //将前两个字节(左声道采样值)强制转换为 short类型 short *sample = (short *)buf; //将左声道采样值减半 *sample = *sample / 2; //将减半的左声道采样值写入文件 fwrite(sample, 1, 2, fp1); //将原始的右声道采样值写入文件 fwrite(buf+2, 1, 2, fp1); } fclose(fp); fclose(fp1); return 1;}int main(){ char file[] = "./mediadata/NocturneNo2inEflat_44.1k_s16le.pcm"; if (pcm16le_halfvolumeleft(file)) { printf("操作成功!!!\n"); } else { printf("操作失败!!!\n"); }} 从源代码可以看出,本程序在读出左声道的2 Byte的取样值之后,将其当成了C语言中的一个short类型的变量。将该数值除以2之后写回到了PCM文件中。 将PCM16LE双声道音频采样数据的声音速度提高一倍
////本程序中的函数可以通过抽象的方式将PCM16LE双声道数据的速度提高一倍。//#include <stdio.h>#include <stdlib.h>#include <string.h>int pcm16le_doublespeed(const char *file){ if (file == NULL) { printf("原始PCM文件为空!\n"); return 0; } FILE *fp = fopen(file, "rb+"); if (fp == NULL) { printf("原始PCM文件打开失败!\n"); return 0; } FILE *fp1 = fopen("./output/output_doublespeed.pcm", "wb+"); if (fp1 == NULL) { printf("文件打开或创建失败!\n"); return 0; } int count = 0; //采样计数 unsigned char buf[4] = {0}; while( !feof(fp) ) { //从文件中读取一次采样值,因为是16位的,所以需读取4个字节 //左右声道采样值间隔存储 //前两个字节为左声道采样值,后两个字节为右声道采样值 fread(buf, 1, 4, fp); //只把偶数次采样值写入文件 if (count%2 == 0) { //保存左声道的数据,一个采样值16位,两个字节 fwrite(buf, 1, 2, fp1); //保存右声道的数据,一个采样值16位,两个字节 fwrite(buf+2, 1, 2, fp1); } count++; } fclose(fp); fclose(fp1); return 1;}int main(){ char file[] = "./mediadata/NocturneNo2inEflat_44.1k_s16le.pcm"; if (pcm16le_doublespeed(file)) { printf("操作成功!!!\n"); } else { printf("操作失败!!!\n"); }} 从源代码可以看出,本程序只采样了每个声道偶数点的样值。处理完成后,原本22秒左右的音频变成了11秒左右。音频的播放速度提高了2倍,音频的音调也变高了很多。 将PCM16LE双声道音频采样数据转换为PCM8音频采样数据
////本程序中的函数可以通过计算的方式将PCM16LE双声道数据16bit的采样位数转换为8bit。//#include <stdio.h>#include <stdlib.h>#include <string.h>int pcm16le_to_pcm8(const char *file){ if (file == NULL) { printf("原始PCM文件为空!\n"); return 0; } FILE *fp = fopen(file, "rb+"); if (fp == NULL) { printf("原始PCM文件打开失败!\n"); return 0; } FILE *fp1 = fopen("./output/pcm16le_to_pcm8.pcm", "wb+"); if (fp1 == NULL) { printf("文件打开或创建失败!\n"); return 0; } unsigned char buf[4] = {0}; while ( !feof(fp) ) { //从文件中读取一次采样值,因为是16位的,所以需读取4个字节 //左右声道采样值间隔存储,前两个字节为左声道采样值,后两个字节为右声道采样值 fread(buf, 1, 4, fp); //将前两个字节(左声道采样值)强制转换为 short类型,因为short类型长度为两个字节 short *sample = (short *)buf; //右移8位,相当于除以256(2的8次方) //将pcm16(short类型)的值以256为除数取模,作为pcm8的采样值 unsigned char pcm8 = (*sample) >> 8; //因为short类型的范围为-32768~32767,经过上一步获得的结果为-128~127 //所以转成unsigned char需要加上128,unsigned char类型的范围为0~255 pcm8 = pcm8 + 128; //写入左声道的采样值 fwrite(&pcm8, 1, 1, fp1); //将前两个字节(右声道采样值)强制转换为 short类型 sample = (short *)(buf + 2); pcm8 = (*sample) >> 8; //-128~127 => 0~128 pcm8 = pcm8 + 128; //写入右声道的采样值 fwrite(&pcm8, 1, 1, fp1); } fclose(fp); fclose(fp1); return 1;}int main(){ char file[] = "./mediadata/NocturneNo2inEflat_44.1k_s16le.pcm"; if (pcm16le_to_pcm8(file)) { printf("操作成功!\n"); } else { printf("操作失败!\n"); } return 0;} PCM16LE格式的采样数据的取值范围是-32768到32767,而PCM8格式的采样数据的取值范围是0到255。所以PCM16LE转换到PCM8需要经过两个步骤:第一步是将-32768到32767的16bit有符号数值转换为-128到127的8bit有符号数值,第二步是将-128到127的8bit有符号数值转换为0到255的8bit无符号数值。在本程序中,16bit采样数据是通过short类型变量存储的,而8bit采样数据是通过unsigned char类型存储的。 |
请发表评论