1.语音信号的分帧enframe(matlab)
用法:(1)f = enframe(x,n) %将语音信号分成长度为n的一帧一帧的信号
(2)f = enframe(x,hamming(n,‘periodic’),n/4)% 用一个有3/4 重叠的汉明窗进行分帧
例 :f = enframe(y1,100);
f(10,:) %f此时列为100的一个矩阵 ,可以通过这样的方法来得到不同的帧,并在此基础上对一帧进行处理。
2.sparse 和 full 函数的用法
S=sparse(X)—将矩阵X转化为稀疏矩阵的形式,即矩阵X中任何零元素去除,非零元素及其下标(索引)组成矩阵S。 如果X本身是稀疏的,sparse(X)返回S。
>> a=[1,0,2;0,0,1;0,0,6];
>> a
a =
1 0 2
0 0 1
0 0 6
>> b=sparse(a)
b =
(1,1) 1
(1,3) 2
(2,3) 1
(3,3) 6
A=full(X)—把稀疏矩阵X转换为全矩阵存储形式A;功能:把稀疏矩阵转为全矩阵。
>> c=full(b)
c =
1 0 2
0 0 1
0 0 6
3.size 函数
size(X,1),返回矩阵X的行数;
size(X,2),返回矩阵X的列数;
N=size(X,2),就是把矩阵X的列数赋值给N
3.离散余弦变换 DCT
离散余弦变换(Discrete Cosine Transform,DCT)是可分离的变换,其变换核为余弦函数。DCT除了具有一般的正交变换性质外, 它的变换阵的基向量能很好地描述人类语音信号和图像信号的相关特征。因此,在对语音信号、图像信号的变换中,DCT变换被认为是一种准最佳变换。
一维DCT定义如下: 设{f(x)|x=0, 1, …, N-1}为离散的信号列。
4. 适量量化 https://blog.csdn.net/lg1259156776/article/details/52126697 点击打开链接
得到mfcc特征参数之后要。目前选择的做法是采用矢量量化器来进行分类识别
5.matlab的一些用法,下面这个网站不错
https://www.yiibai.com/matlab/matlab_colon_notation.html