用来收集各类资源,各大包括机器学习ML、深度学习DL、自然语言处理NLP、机器视觉等方向,更新ing~
课程资源
很多视频课程网易云课堂、腾讯课堂、MOOC等视频学习类网站都有资源,but,基本上B站上都有搬运工 ,有弹幕解释,有评论提供资料、作业、解析等,所以——B站大法好!
1.软件基础
视频教程:
- 莫烦python:python入门学习视频教程,小哥哥讲的很好
- Tensorflow中文社区:tensorflow教程,最流行的深度学习框架之一
书籍/文献教程:
- scikit-learn (sklearn) 官方文档中文版:scikit-learn 是基于 Python 语言的机器学习工具
- scikit-learn (sklearn) 官方文档英文版
2.数理基础
书籍/文献教程:
- 李航 统计学习方法:统计学相关理论
3.机器学习
视频教程:
- 吴恩达 机器学习:机器学习入门课程,很适合入门级选手
- Hinton 面向机器学习的神经网络
- 台湾大学林轩田 机器学习基石
- 台湾大学林轩田 机器学习技法
- 台湾大学李宏毅的机器学习课程2017
书籍/文献教程:
- 周志华 机器学习:西瓜书,机器学习理论
4.深度学习
视频教程:
书籍/文献教程:
- 伊恩·古德费洛 深度学习:花书,深度学习理论
5.自然语言处理
视频教程:
- CS224n 斯坦福深度自然语言处理:原名 Deep Learning for Natural Language Processing (深度自然语言处理),是全球 NLP 领域最受欢迎的课程之一,让你在了解丰富的深度自然语言处理应用案例的同时,学会在实践中搭建出最先进的自然语言处理模型。
- 斯坦福大学CS224d课程的中文版内容笔记:由寒小阳和龙心尘翻译和整理,得到斯坦福大学课程@Richard Socher教授的授权翻译与发表
- 牛津大学&DeepMind 自然语言处理
书籍/文献教程:
- 国际计算语言学协会(ACL,The Association for Computational Linguistics):ACL成立于1962年,是自然语言处理(NLP)领域影响力最大、最具活力的顶级国际学术组织。多查阅ACL论文,有助于了解更多更新的知识
6.计算机视觉
视频教程:
书籍/文献教程:
7.语音识别
实战经验:
- 用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践:北邮毕业,就职阿里搜索排序,深度学习在文本分类中应用时总结的经验心得,很受用
- NLP文本分类实战: 传统方法与深度学习:对比传统机器学习方法和深度学习方法在NLP中的使用
- Understanding Convolutional Neural Networks for NLP:CNN在NLP领域的理解,文章写得很通俗易懂,值得多看几次
竞赛教程:
- 知乎“看山杯” 夺冠记:多学习大神们的竞赛思路,在工程应用和竞赛中都有帮助
- Sebastian Ruder:NLP领域中一个大神的网站,对NLP的理解和看法
开放平台/开源模型
直接调用开放平台的API接口或SDK
谷歌最强 NLP 模型 BERT
github项目地址https://github.com/google-research/bert
论文原文https://arxiv.org/pdf/1810.04805.pdf
- 两行代码玩转 Google BERT 句向量词向量:使用bert迁移学习教程
百度AI开放平台
腾讯AI开放平台
网易AI平台
自然语言处理NLP
词向量
腾讯AI实验室中文词向量语料库【Tencent AI Lab Embedding Corpus for Chinese Words and Phrases】
https://ai.tencent.com/ailab/nlp/embedding.html
tensorflow/tensor2tensor
https://github.com/tensorflow/tensor2tensor
图像识别
腾讯AI Lab正式开源业内最大规模多标签图像数据集
https://github.com/Tencent/tencent-ml-images
本次正式开源,其主要内容包括:
- ML-Images数据集的全部图像URLs,以及相应的类别标注。因原始图像版权问题,此次开源将不直接提供原始图像,用户可利用腾讯AI Lab提供的下载代码和URLs自行下载图像。
- ML-Images数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法,以及图像的标注数量等统计量。
- 完整的代码和模型。腾讯AI Lab提供的代码涵盖从图像下载和图像预处理,到基于ML-Images的预训练和基于ImageNet的迁移学习,再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例,以方便用户快速体验该训练流程。项目还提供了具有极高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。