Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

摘要

本文提出了一个全新的追踪器,通过由深度增强学习得到的动作来控制。和现有的其他使用深度网络的追踪器不同,该追踪器的计算量很小,并且在位置和尺度上的精度都很高。来控制action的深度网络使用各种训练序列进行预训练,并在追踪过程中进行微调,以适应目标和背景的变化。预训练过程既利用了深度增强学习,还利用了监督学习。增强学习能够成功地利用那些部分标注数据进行半监督学习。在OTB测试中,本追踪器能够达到一个非常有竞争力的performance,同时比那些基于深度网络的最新的算法快三倍,能够在GPU上达到实时。

阅读更多

翻译 Region of interest pooling explained

原文链接:
https://deepsense.io/region-of-interest-pooling-explained/

阅读更多

Background of Reinforcement Learning

增强学习

增强学习的思想来自于对自然学习的观察,比如人类获取知识的主要途径就是通过与环境的交互iteractions。增强学习问题研究what to do,即如何从situations映射到actions,从而最大化一个数值形式的reward。本质上看,这是个闭环问题closed-loop,因为actions会影响后来的输入,即situations。最有趣,也是最有挑战性的一点是,actions不光影响即时的reward,也会影响后续所有的rewards。

阅读更多

SiamFC算法改进思路

视频追踪问题中,目标通常是连续可微的。

SiamFC利用全卷积孪生网络结构对搜索域和样本图像进行相似度匹配,实现追踪目标。

本文分析了SiamFC在vot2015数据集上的追踪结果,总结出以下问题,并提出针对性的改进方案。

表现鲁棒

    阅读更多

    深度网络训练中的一些技巧

    epoch

    机器学习,或者说神经网络训练中,一个很重要的参数就是epoch。一个epoch就表示网络对整个数据集完成了一次训练。

    iteration

    迭代次数。即在一个epoch中,分成iteration个小的数据批次即minibatch,进行训练。例如样本总数为N,每个minibatch的batchsize为n,则$iteration = N / n$。

    阅读更多

    Intro of Siamese Instance Search for Tracking

    特点

    • 孪生结构
    • 没有应用模型更新
    • 没有遮挡检测
    • 没有采用追踪器集合

    阅读更多

    目标追踪算法之研究背景

    研究背景

    目标追踪之定义

    目标跟踪就是在一段序列图像中的每幅图像中实时地找到感兴趣的运动目标。

    在计算机视觉应用中,追踪是一个非常重要的部分,涉及活动分析分类(activity analysis classification)、目标识别(object recognition)以及人机交互(human computer interference)。在军事制导、视觉导航、安全监控、智能交通等等领域有着广泛的应用。

    阅读更多

    Hello World

    Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

    阅读更多