本文基于维基百科相关词条整理
信息论中,熵(entropy)代表了消息中所包含的信息的平均量,是不确定性的度量。熵$H(X) = E[I(X)] = E[-ln(P(X))]$其中P为随机变量X的概率质量函数,E为期望,I(X)代表X的信息量。当X为离散随机变量时,可以写成:$H(x) = \sum_{i}P(x_i)\log_2{P(x_i)}$
阅读更多
过去20年间,神经科学中对于Reward-based Learning的研究已经收敛到了一类规范的模式上:神经递质多巴胺通过调整神经元之间的突触连接强度,以在情景、动作和奖励之间建立关联。但是,近期越来越多的发现开始挑战这一标准模型。因此,本文提出一种新的基于奖励的学习机制:多巴胺系统训练了另一个大脑区域————前额叶,来将其作为独立的学习系统。这个全新的视角既能够继承标准模型的那些依据,也能够很好地处理宽泛的经验观察,为未来的研究提供全新的基础。
[TOC]
待补充
expand方法并不会开辟新的内存,只是在已有tensor上创建了新的view,修改原tensor,会影响到expand返回的变量。举例:123456789a.unsqueeze_(1)b = a.expand(-1,4)b = 1 1 1 1 2 2 2 2 3 3 3 3a[1] = 4b = 1 1 1 1 4 4 4 4 3 3 3 3
123456789
a.unsqueeze_(1)b = a.expand(-1,4)b = 1 1 1 1 2 2 2 2 3 3 3 3a[1] = 4b = 1 1 1 1 4 4 4 4 3 3 3 3
最近在和同学一起做阿里天池的服装属性识别的竞赛,训了几个不同架构的分类网络,然后手动融合了一下结果。但是感觉黔驴技穷,不知道该怎么提升了。所以今天跟实验室的Kaggle大神师兄讨教了一下,学到了很多做比赛的经验,在此记录。
因为项目要求,先需要设计一个软件界面。业务逻辑主要是基于深度学习实现图像的自动文字描述。界面主要要包括基本的菜单栏、待处理图像的展示、文字生成结果展示、图像批次切换按键等。
原文链接:https://deepsense.io/region-of-interest-pooling-explained/
机器学习,或者说神经网络训练中,一个很重要的参数就是epoch。一个epoch就表示网络对整个数据集完成了一次训练。
迭代次数。即在一个epoch中,分成iteration个小的数据批次即minibatch,进行训练。例如样本总数为N,每个minibatch的batchsize为n,则$iteration = N / n$。
目标追踪之定义
目标跟踪就是在一段序列图像中的每幅图像中实时地找到感兴趣的运动目标。
在计算机视觉应用中,追踪是一个非常重要的部分,涉及活动分析分类(activity analysis classification)、目标识别(object recognition)以及人机交互(human computer interference)。在军事制导、视觉导航、安全监控、智能交通等等领域有着广泛的应用。
视频追踪问题中,目标通常是连续可微的。
SiamFC利用全卷积孪生网络结构对搜索域和样本图像进行相似度匹配,实现追踪目标。
本文分析了SiamFC在vot2015数据集上的追踪结果,总结出以下问题,并提出针对性的改进方案。