Hello World

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

阅读更多

Background of Reinforcement Learning

增强学习

增强学习的思想来自于对自然学习的观察,比如人类获取知识的主要途径就是通过与环境的交互iteractions。增强学习问题研究what to do,即如何从situations映射到actions,从而最大化一个数值形式的reward。本质上看,这是个闭环问题closed-loop,因为actions会影响后来的输入,即situations。最有趣,也是最有挑战性的一点是,actions不光影响即时的reward,也会影响后续所有的rewards。

阅读更多

Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

摘要

本文提出了一个全新的追踪器,通过由深度增强学习得到的动作来控制。和现有的其他使用深度网络的追踪器不同,该追踪器的计算量很小,并且在位置和尺度上的精度都很高。来控制action的深度网络使用各种训练序列进行预训练,并在追踪过程中进行微调,以适应目标和背景的变化。预训练过程既利用了深度增强学习,还利用了监督学习。增强学习能够成功地利用那些部分标注数据进行半监督学习。在OTB测试中,本追踪器能够达到一个非常有竞争力的performance,同时比那些基于深度网络的最新的算法快三倍,能够在GPU上达到实时。

阅读更多