在2018年10月16日在北京理工大学参加一场AI前沿论坛,在会议上听老师讲AI方面的相关知识,AI可以做文字智能、图片智能、游戏智能、机器人智能、语音智能,这些和我们的生活息息相关的,相信在未来的生活一定是AI智能生活。
文字智能
在会议上清华大学孙老师讲到他去内蒙古出差想买小米(食品),可是通过地图搜索,搜到的是小米数码产品、小米的线下店在哪里,这体现出搜索引擎的需要继续提升的,孙老师主要做的是文字研究这块领域,进行分词的相关算法,有效的提高搜索,比如我搜索高频词“肉”、那么搜索出来的会是猪肉、鸡肉、鸭肉。我如果搜“龙肉”,现在的引擎是搜索不到内容的,通过分词的算法,可以搜索到,肉相关的内容,比如猪肉、驴肉。孙老师有做通过文字进行作诗这块,链接地址在下边,大家可以看看,我感觉十分有意思。
游戏智能
中国科学院研究员自动化所的张老师主要讲了实时战略游戏AI研究进展。
游戏AI发展史?
1996年IBM深蓝国际象棋AI
2006年语音识别、图像识别、文本翻译
2016年AlphaGo Zero 围棋AI
2017年DeepStack Libratus 德州扑克AI
2018年OpenAI Five Dota2游戏AI
DeepMind星际争霸正在研究中
为什么要研究游戏AI?
计算机智能
能存会算会查找,以科学运算、逻辑处理、统计查询等形式规则化算为核心。
感知智能
能听会说能看会然,以图像理解、语音识别、语音翻译为代表,基于深度学习模型。
认知决策智能
能理解会思考认知,以理解推理、思考和决策为代表,强调认知推理、自主学习能力等。
为什么要研究即使游戏AI?
即时游戏和回合制游戏相比更接近现实世界,现实的多数问题更接近实时游戏:
现实世界的时间是连续的,而非以回合为单位。
多数回合制游戏是多个玩家轮流决策的,现实世界的多个智能体是并发决策的。
工业中的3D仿真环境在技术上等同于即时游戏
3D仿真常用于飞行员训练、机器人模拟、消防应急演习、手机模拟、建筑虚拟漫游、指挥推演等。
目前在无人驾驶领域亦采取3D仿真环境来做端到端的测试。
更多AI事件
2016年11月,DeepStack击败了11位职业德州扑克选手中的10为。
2017年1月,Libratus击败了四位更加优秀的职业选手,赢得约180万美元的筹码。
自动化所在陆军战术兵棋推演大赛中:
17年11月,全国兵棋精英邀请赛选拔赛AI作为初赛‘考官’进行2400场人机对抗;
17年12月,全国兵器精英邀请赛测试赛12:4战胜全国16强。
星际争霸AI最近进展——加州大学博客利分校
论文:Modular Architecture for StarCraft ll width Deep Reinforcement Learning
主要创新点:
类似UAIbertaBot架构,用强化学习Agent替代不同的模块。
先用规则实现所有模块。然后逐个模块用强化学习来替代。
优点:
在不同的地图的泛化能力较高。
可采用自我对抗的方式训练提升性能。
不足:
未替换UalbertBot所有模块。
只能预测4个兵种。
底层决策依然计语规则。