语言合成开源库
webrtc开源库 | speex开源库 | audacity开源库 | 音频算法开源库 | |
语言降噪 | 回音消除 | VAD AGC | 音频均衡器/环绕音/低音增强音效算法 | |
NLP语言处理常用算法
HMM隐马尔可夫 | 维特比算法 | jieba开源库(分词,词性标注,命名实体识别) | jieba开源库 |
Gensim开源库 |
CRF条件随机场 | TextRank关键字提取 | 吉布斯采样 | 百度情感识别系统 | 百度FAQ自动问答系统 |
TF/IDF关键字提取 | LSA/LAI/LDA关键字提取 | PLSA算法 | 正向最大匹配原则/分词 | 逆向最大匹配原则/分词 |
SVM支持向量机 | 双向最大匹配原则/分词 | |||
PCFG句法分析(最流行) | PTB 宾州树库 句法分析 |
中文宾州树库CTB | 清华树库TCT | 主流句法分析评测PARSEVAL评测体系 |
基于CRF句法分析 | 短语结构树为目标的句法分析器 | 基于最大间隔马尔可夫网络句法分析 | ||
基于移进-归约的句法分析模型 | Standford Parser开源句法分析器(java实现) |
|||
文本向量化(重点知识) | ||||
word2vec词向量化 | doc2vec文本向量化 | 词袋模型(Bag of word) | 神经网络语言模型NNLM | |
C&W模型 | CBOW模型 | Skip-gram模型 | doc2vecDM模型/DBOW模型 | |
情感分析技术/词法分析 | 情感分析技术/基于机器学习分析 | 情感分析技术/混合分析 | 了解 PMC多项式朴素贝叶斯 | |
分类模型SVM支持向量机 | 分类模型LR逻辑回归 | 情感分析CNN卷积神经网络 | 情感分析RNN循环神经网络 | |
RNN变种 长短时记忆网络(Long Short Term Memory) LSTM | ||||
机器学习算法 | ||||
有监督学习 | 无监督学习 | 半监督学习 | 分类/聚类/回归/降维 | |
分类算法 | 朴素贝叶斯 | SVM支持向量机 | LR逻辑回归 | |
KNN k近邻居 | 决策树(Decision Tree)DT | 神经网络(NN) | 决策树升级版-随机森林 | |
机器学习聚类算法/k-means算法 | ||||
最优化算法 | 梯度下降 | 随机梯度下降 | 批量梯度下降 | |
丢弃法 | ||||
激活函数 | Sigmoid(很少使用了) | tanh | ReLU | |
成功训练模型四个要素 数据/转换数据的模型/衡量数据好坏的损失函数/一个调整模型权重以便最小化损失函数的算法 | ||||
Sep2Sep问答机器人 |
||||
数学知识
Tensorflow相关知识点
语音识别关键字统计
webrtc开源库 | speex开源库 | audacity开源库 | 语言降噪 | 回音消除 | VAD AGC |
音频均衡器/环绕音/低音增强音效算法 | |||||
机器学习关键字统计
Pandas | SARSA | boosting | |||
Numpy | SVM | ||||
Q-learning | LR |
算法工程师关键字统计