MachineLP:
其实事物发展有自己的潮流和规律,当你身处潮流之中的时候,要紧紧抓住潮流的机会,想办法脱颖而出,即使没有成功,也会更加洞悉时代的脉搏,收获珍贵的知识和经验。而如果潮流已经退去,这个时候再去往这个方向上努力,只会收获迷茫与压抑,对时代、对自己都没有什么帮助。
但是时代的浪潮犹如海滩上的浪花,总是一浪接着一浪,只要你站在海边,身处这个行业之中,下一个浪潮很快又会到来。你需要敏感而又深刻地去观察,略去那些浮躁的泡沫,抓住真正潮流的机会,奋力一搏,不管成败,都不会遗憾。
切记:求精不求多,有舍才有得;不做旁观者,不拒绝身边的任何小事。
MachineLP博客:
1、MachineLP博客目录:https://blog.csdn.net/u014365862/article/details/78422372
Kaldi中英文手册:
(1)中文:https://shiweipku.gitbooks.io/chinese-doc-of-kaldi
(2)英文:http://kaldi-asr.org/doc/
算法相关:
1、https://github.com/MachineLP/MachineLP-CodeFun :该项目包含以下几个模块:语言(python、scala、c++等)、数据结构和算法、深度学习、机器学习、AutoML/DL、模型部署、SQL模块,一步一步成为合格的数据科学家。
2、图解什么是 Transformer:https://www.jianshu.com/p/e7d8caa13b21
3、Pytorch 中的数据增强方式最全解释:https://cloud.tencent.com/developer/article/1528683
spark:
1、spark面试题(1):https://zhuanlan.zhihu.com/p/49169166
2、spark面试题(2):https://zhuanlan.zhihu.com/p/49185277
3、spark面试题(3):https://zhuanlan.zhihu.com/p/51011021
4、通过 .!! 隐式方法直接执行系统命令:https://www.yangbajing.me/2019/03/22/scala%E5%AE%9E%E6%88%98%EF%BC%9A%E8%BF%81%E7%A7%BB%E6%96%87%E4%BB%B6/
用户画像构建:
1、用户画像—打用户行为标签: https://mp.weixin.qq.com/s/Fe_foVgH2vlcMfvaf1WCAQ
2、用户画像之标签权重算法:https://mp.weixin.qq.com/s/oaXSG-VaWqcUntesRO1ZXQ
数据结构和算法系列:
1、leetcode:https://github.com/MachineLP/py_workSpace/tree/master/leetCode
2、剑指offer:https://github.com/MachineLP/py_workSpace/tree/master/data_structure_and_algorithm/Sword_Offer
特征工程系列:
1、特征选择之tree的feature_importance的缺陷和处理方法 part1:https://zhuanlan.zhihu.com/p/83168277
2、模型中存在共线性问题,该怎么破?:https://zhuanlan.zhihu.com/p/79592785
3、多重共线性:python中利用statsmodels计算VIF和相关系数消除共线性:https://blog.csdn.net/ab1112221212/article/details/100133066
4、特征选择之tree的feature_importance的null importance part2:https://zhuanlan.zhihu.com/p/83301509
5、特征选择之tree的feature_importance的boruta part3:https://zhuanlan.zhihu.com/p/83259347
6、马东什么(算法工程师):https://www.zhihu.com/people/he-he-he-he-77-19-21/posts
语音识别:
1、基于清华大学中文语料库end2end语音识别:https://github.com/xxbb1234021/speech_recognition
2、基于清华大学中文语料库训练声学模型与语言模型:https://github.com/audier/DeepSpeechRecognition
3、语音识别:kaldi的安装与yes no模型、aishell试运行:https://zhuanlan.zhihu.com/p/48973623
4、OpenSLR开源数据镜像:https://dev.ailemon.me/openslr/
比赛系列:
1、厦门国际银行风控比赛--中期总结:https://zhuanlan.zhihu.com/p/88754018
2、OCR:https://github.com/MachineLP/OCR_repo;https://github.com/MachineLP/baiduyun_deeplearning_competition 。
3、点击率:https://www.jb51.net/article/164573.htm
****************************************************************************************
train_cnn_v0: 实现基础cnn训练,数据读取方式慢。
train_cnn_v1: 优化数据读取的方式,学习率加入衰减。
train_cnn-rnn:在train_cnn_v0基础上加入rnn。
train_cnn-rnn-attention_v0:在train_cnn_v0基础上加入rnn、attention。
train_cnn_multiGPU_v0:使用多GPU训练(默认两块gpu),以上其他框架使用多GPU,只需把train.py替换掉就可以了。
train_cnn_multilabel: 多任务多标签训练及其总结。
train_cnn_GANs: GANs训练及其总结。
TensorFlow基础教程:理论及其代码实践。
python实践教程:MachineLP的日常代码。
李宏毅老师:http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS17.html
李宏毅机器学习笔记(LeeML-Notes): https://datawhalechina.github.io/leeml-notes/#/
李宏毅机器学习视频:https://www.bilibili.com/video/av10590361?from=search&seid=8516959386096686045
deeplearning.ai:https://mooc.study.163.com/university/deeplearning_ai#/c
sklearn:http://scikit-learn.org/stable/modules/multiclass.html
sklearn中文开发文档:http://sklearn.apachecn.org/#/
keras文档:https://keras.io/models/model/
TF python API:https://tensorflow.google.cn/api_docs/python/
Neural Networks and Deep Learning:http://neuralnetworksanddeeplearning.com
Tensorflow API中文版:https://www.w3cschool.cn/tensorflow_python/tensorflow_python-lbm22c8b.html
pythorch中文文档:https://pytorch.apachecn.org/#/ ; https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html#
全栈数据工程师养成攻略:https://study.163.com/course/courseMain.htm?courseId=1003520028
Tensorflow中文社区:http://www.tensorfly.cn
Tensorflow Model Server:https://tensorflow.google.cn/tfx/serving/setup#installing_using_apt-get
SWIG: http://www.swig.org (SWIG是个帮助使用C或者C++编写的软件能与其它各种高级编程语言进行嵌入联接的开发工具)
hello girl: https://www.jqhtml.com/12944.html
有意思的DeepLearning项目网址:http://deeplearninggallery.com/
不错的专栏:https://www.52cv.net/?cat=19
AI届的state of the art :https://www.stateoftheart.ai
AI研习社:https://ai.yanxishe.com/page/resources
不错的TF个人笔记:https://bookdown.org/leovan/TensorFlow-Learning-Notes/
pycuda开发文档:https://documen.tician.de/pycuda/
mxnet--动手学深度学习:http://zh.d2l.ai/index.html
OpenAI Spinning Up:https://spinningup.readthedocs.io/zh_CN/latest/index.html ; 练习:https://github.com/openai/spinningup/tree/master/spinup
pyspark API文档:http://spark.apache.org/docs/latest/api/python/index.html
spark:http://spark.apache.org/docs/latest/index.html
mlflow:https://www.mlflow.org/docs/latest/python_api/mlflow.spark.html#mlflow.spark.load_model
深度学习理论与实践:提高篇:http://fancyerii.github.io/2019/03/14/dl-book/