行人属性“Person Attribute Recognition with a Jointly-trained Holistic CNN Model”
来源:互联网 发布:知乎怎样查航班动态 编辑:程序博客网 时间:2024/06/08 02:33
不考虑人体姿态,part及上下文信息,仅使用图像作为输入,训练CNN进行所有属性的预测。另外,提出了N/A标记,即对目标的属性不确定。如下图的人向左走,就无法确定其右手是否带包。
人体属性一般是二值的语义,如( is male? wears a tshirt? carries a bag in the left hand?),或者多项输出(orientation - left, right, front, or back),可以用于图像检索,语义检索数据库。
ACN网络
网络的结构如下图所示:
对于N/A的样本,梯度设置为0。每个属性有一个损失函数,通过BP累积。最小化两个离散分布的KL 散度,Q是预测的结果,P是实际属性二值状态:
目标空间是每个属性的交叉积,是一个结构化预测问题。
网络是一个两步训练过程,使用额外的fc层替换原来的损失层。额外的fc层是对每个属性学习带有隐含层的MLP,每个属性最有的隐含节点是64个。对目标任务的每个属性,增加分类及损失层。训练过程使用了一些数据增强技术:将原始输入框resize到不同的尺寸,水平镜像,PCA jittering。测试时使用所有crop的平均。
Reject Option
1. Reject Region 使用伯努利变量控制,阈值决定拒绝区域。
2. Softmax,训练具有N+1个输出的softmax损失。
3. Hierarchical Softmax,两步法,考虑两个变量A和B,p(A)标识属性是否可以检测到,p(B)标识属性为真的概率,A使用logistic损失,B使用softmax损失,最终属性预测为p(A)和p(B|A)的乘积。
数据库
HATDB
Berkeley-行人属性数据集
PaRSE-27k数据集
实验结果
自己在PARSE-27k数据集上的对比
在Berkeley行人属性数据集上与其他方法的对比
- 行人属性“Person Attribute Recognition with a Jointly-trained Holistic CNN Model”
- 行人属性“Contextual Action Recognition with R*CNN”
- 行人属性“Fully-adaptive Feature Sharing in Multi-Task Networks with Applications in Person Attribute Cl”
- 行人属性“Human Attribute Recognition by Deep Hierarchical Contexts”
- 行人属性“Multi-attribute Learning for Pedestrian Attribute Recognition in Surveillance Scenarios”
- 行人属性“Generative Adversarial Models for People Attribute Recognition in Surveillance”
- 行人属性“Attribute Recognition by Joint Recurrent Learning of Context and Correlation”
- 行人属性“Weakly-supervised Learning of Mid-level Features for Pedestrian Attribute Recognition and Loca”
- A Discriminatively Trained, Multiscale, Deformable Part Model
- Contextual Action Recognition with R*CNN
- #Paper Reading# Mining Aspect-Specific Opinion using a Holistic Lifelong Topic Model
- Speech Recognition with Hidden Markov Model
- [论文笔记5]A Discriminatively Trained, Multiscale, Deformable Part Model
- How to invoke a trained TensorFlow model from Java programs
- 行人属性“Improving Facial Attribute Prediction using Semantic Segmentation”
- 阅读A Discriminatively Learned CNN Embedding for Person Re-identification
- Contextual Action Recognition with R*CNN-论文阅读
- 【Person Re-id】A Discriminatively Learned CNN Embedding for Person Re-identification
- java面试题-java虚拟机(JVM)
- c++ string和其他类型互转
- tomcat对https配置
- [BZOJ1076]奖励关-状压+期望
- 全面理解Android中的Px,DPI,DIP,Density,Sp等概念
- 行人属性“Person Attribute Recognition with a Jointly-trained Holistic CNN Model”
- hbase集群搭建
- ubuntu16.04(64位)兼容32位程序
- 表
- js 解决 select option 过多 ,筛选过滤功能
- 利用SWIG转换C++接口到Java接口
- javaSE实战--(API)中的集合框架
- 极光推送
- js 之间的页面传值的