作者：禅与计算机程序设计艺术

1.简介

一、动机

深度学习和强化学习近年来得到越来越多的关注，但同时也受到越来越多学者们的质疑，其原因很多，但是不可否认的是，近些年来人工智能领域最热门的方向之一就是建立具有高度抽象能力和智能性的神经网络系统，而深度学习的发明则是在这个基础上做出的重大贡献，而强化学习则可以为这一进程提供必要的控制因素。

近年来，强化学习已经被应用到许多重要的任务中，例如在游戏领域，AlphaGo使用强化学习技术成功地战胜了人类顶尖围棋选手李世乭；在医疗保健领域，医生根据患者的病情，采用强化学习技术规划出最佳治疗方案；在机器人领域，人机交互过程中，利用强化学习技术使机器人按照策略行动，达到更好的控制效果等。随着深度学习和强化学习技术的不断进步，对于大型复杂任务的解决能力也越来越强。那么，如何有效地使用强化学习技术训练神经网络架构呢？如何利用强化学习自动优化神经网络结构，并逐渐适应目标任务呢？本文试图通过对相关算法的讲解，从理论与实践两方面，揭开这项前沿研究的面纱。

二、前提知识

本文假设读者熟悉相关计算平台（如Linux，Windows或MacOS）的基本使用，了解机器学习、强化学习以及神经网络的一些基础概念。读者需具备一定的数据分析、编程、数学等背景知识，包括Python、C++或Java语言的使用、数据结构、算法、线性代数、概率统计等常用技能。

三、文章组织结构

本文共分七章，各章节将按如下顺序依次进行。

摘要：

如何有效地使用强化学习技术训练神经网络架构呢？如何利用强化学习自动优化神经网络结构，并逐渐适应目标任务呢？本文试图通过对相关算法的讲解，从理论与实践两方面，揭开这项前沿研究的面纱

1.简介

一、动机

二、前提知识

三、文章组织结构

猜你喜欢