盛大开源头算法
https://github.com/owensss/sdhumming
两只老虎的片段
pitch提取, 求diff ,插值等
五点均值化
后处理 resample
去除很小接近0的的,都给磨平
除去毛刺
降1/5采样率
取log2
去除slience地方vad
卡限 6.35 到 8 算下来是 81.5719 到 256hz
转化成音符
根据算法,一个音符持续长度单位是 10ms*5 = 50ms
简谱和音符,中音的Dao,是C4
7相当于7*50ms = 350ms
使用midi工具
https://github.com/kts/matlab-midi/tree/master/src
生成midi