AI前沿论坛会议—文字智能和游戏智能总结篇

在2018年10月16日在北京理工大学参加一场AI前沿论坛，在会议上听老师讲AI方面的相关知识，AI可以做文字智能、图片智能、游戏智能、机器人智能、语音智能，这些和我们的生活息息相关的，相信在未来的生活一定是AI智能生活。

文字智能

在会议上清华大学孙老师讲到他去内蒙古出差想买小米（食品），可是通过地图搜索，搜到的是小米数码产品、小米的线下店在哪里，这体现出搜索引擎的需要继续提升的，孙老师主要做的是文字研究这块领域，进行分词的相关算法，有效的提高搜索，比如我搜索高频词“肉”、那么搜索出来的会是猪肉、鸡肉、鸭肉。我如果搜“龙肉”，现在的引擎是搜索不到内容的，通过分词的算法，可以搜索到，肉相关的内容，比如猪肉、驴肉。孙老师有做通过文字进行作诗这块，链接地址在下边，大家可以看看，我感觉十分有意思。

清华大学九歌--计算机诗词创作系统

游戏智能

中国科学院研究员自动化所的张老师主要讲了实时战略游戏AI研究进展。

游戏AI发展史？

1996年IBM深蓝国际象棋AI

2006年语音识别、图像识别、文本翻译

2016年AlphaGo Zero 围棋AI

2017年DeepStack Libratus 德州扑克AI

2018年OpenAI Five Dota2游戏AI

DeepMind星际争霸正在研究中

为什么要研究游戏AI?

计算机智能

能存会算会查找，以科学运算、逻辑处理、统计查询等形式规则化算为核心。

感知智能

能听会说能看会然，以图像理解、语音识别、语音翻译为代表，基于深度学习模型。

认知决策智能

能理解会思考认知，以理解推理、思考和决策为代表，强调认知推理、自主学习能力等。

为什么要研究即使游戏AI?

即时游戏和回合制游戏相比更接近现实世界，现实的多数问题更接近实时游戏：

现实世界的时间是连续的，而非以回合为单位。

多数回合制游戏是多个玩家轮流决策的，现实世界的多个智能体是并发决策的。

工业中的3D仿真环境在技术上等同于即时游戏

3D仿真常用于飞行员训练、机器人模拟、消防应急演习、手机模拟、建筑虚拟漫游、指挥推演等。

目前在无人驾驶领域亦采取3D仿真环境来做端到端的测试。

自动化所在陆军战术兵棋推演大赛中：

17年11月，全国兵棋精英邀请赛选拔赛AI作为初赛‘考官’进行2400场人机对抗；

17年12月，全国兵器精英邀请赛测试赛12:4战胜全国16强。

星际争霸AI最近进展——加州大学博客利分校

论文：Modular Architecture for StarCraft ll width Deep Reinforcement Learning

主要创新点：

类似UAIbertaBot架构，用强化学习Agent替代不同的模块。

先用规则实现所有模块。然后逐个模块用强化学习来替代。

优点：

在不同的地图的泛化能力较高。

可采用自我对抗的方式训练提升性能。

不足：

未替换UalbertBot所有模块。

只能预测4个兵种。

底层决策依然计语规则。