Artificial Intelligence Term
前言
阅读书籍DEEP LEARNING
后, 术语解释.
- AI难点
- deep learning (深度学习)
- AI knowledge base (AI知识库)
- hard-code (硬编码)
- representation learning (表示学习)
- machine learning (机器学习)
下图为AI包含关系的维恩图, 该图出自书籍DEEP LEARNING.
Terminology interpretation
AI的任务
解决对人来说很容易执行, 但很难形式化描述的任务. 如识别人类说的话(自然语言), 或物体的图像等.
深度学习
通过较简单的概念来构建较复杂的概念, 这样会得到一个层次化的概率, 使用这种层次化的概念来让计算机实现类似人的不容易被人形式化描述的能力.
通过简单的概念逐渐叠加构建更复杂的概念, 绘制出表示这些概念如何建立在彼此之上的图, 我们能到得到一张
“深”(层次很多)的图, 基于这种原因, 这类方法被称为深度学习
.
深度学习中典型的模型为前馈深度网络
或多层感知机(multilayer perceptron, MLP)
ps: 点动成线, 线动成面, 面动成体. 亦或者我们画个太阳, 是一动笔就画太阳的细节(如发出的光), 还是先画个简单的圆.
MLP
MLP是一个将一组输入值映射到输出值的数学函数, 该数学函数由许多较简单的函数复合而成.
知识库
通过将关于世界的知识用形式化的程序语言进行hard-code(硬编码)
, 计算机可以使用逻辑推理规则来自动地理解这些形式化语言中的声明, 这也就是AI的知识库(knowledge base)
方法.
其中最著名的项目为Cyc
, Cyc包括一个推断引擎和一个使用CycL语言描述的声明数据库. 这些声明是由人类监督者输入的. 这是一个很笨拙的过程, 人们设法设计出足够复杂的形式化规则来精确地描述世界.
hard-code
from wikipedia: 将数据直接嵌入到程序或其他可执行对象的源代码中的软件开发实践,而不是从外部源获取数据或在运行时生成数据。硬编码数据通常只能通过编辑源代码和重新编译可执行文件来修改,尽管可以使用调试器或十六进制编辑器在内存或磁盘上进行更改。
表示学习
使用机器学习来发掘表示
本身, 而不仅仅只是把表示
映射到输出, 这种方法被称作表示学习.
表示学习的经典例子为自编码器
.
表示(representation)
这里的表示的意思是指数据的表示(或描述等等类似的概念), 如使用阿拉伯数字计算和使用罗马数字计算的效果是不一样的, 虽然它们计算的结果是一样的. 有点类似于使用两种不同的语言C和python来实现同一个功能, 它们的效果是不同的, 但功能结果是相同的.
而表示学习中所说的发掘表示
本身, 其意为学习并发掘出表示
本身的模式, 并生产另一种表示形式.
我将它理解为: 提取原有事物的表示方式, 并升华出更合适或更有效的表示方式, 将表示的方式更加精细化.
自编码器
自编码器由一个编码器函数和解码器函数构成, 编码器函数会将原有的表示编码成另一种表示方式, 而解码器则是将转换后的表示方式转换为原来的方式.
机器学习
AI系统具有自己获取知识的能力, 即从原始的数据中提取模式
的能力, 这种能力被称为机器学习.
简单的机器学习算法如逻辑回归(logistic regression)
和朴素贝叶斯(naive Bayes)
.