论文阅读笔记:“Progressive Relation Learning for Group Activity Recognition”
sixwalter Lv6

Convolutional Relational Machine for Group Activity Recognition (CVPR 2019)

引言分析

该论文所采用的方法没有显示地检测或跟踪任何个体。它提出了模型CRM,并在该模型中引入了基于行为的中间表示activity map。它是一种提取个体之间空间联系的方法。 此外论文在训练时使用了多阶段的方法来逐步优化activity map,以学习到一个预测错误率更小的activity map。最终优化过的activity map和图像或视频特征进行结合,来进行组行为的预测。

核心亮点

image-20220928125630152

Activity Map

行为图实际上是2D域表示的集合(域可以理解为通道)。其2D域的个数是个体行为和组行为类别个数和。每个域实际上表示一个类别,其域表示的计算需要考虑图像中的bounding box。对于每个个体m,其个体行为为i,其组行为为g,我们会定义一个如下的2D高斯概率密度函数:

image-20220927102117896

通过该函数我们可以计算个体m的行为图的域i和域NI+g。一个双变量高斯图会在bounding box 上进行计算。最终所有的个体行为图会进行对齐,即对于每个域的同一个位置,我们取最大值来得到最终的activity map A。对于一个单独的输入来说,其组行为是确定的,即只有一个组行为类别的域非零,其他域均为0。

Refinement

image-20220928132852350

采用如图的公式即可迭代地对activity map进行改进

Aggregation

image-20220928133338397

如上式,最终的组行为表示的计算公式即结合了特征图F和改进过的activity map。

Training Objectives

image-20220928133719382

La实际上是预测行为图和真实行为图之间的欧几里得损失,Lg是群体行为的分类交叉熵损失。

实验结果

对比实验

image-20220928134116594

SOTA

image-20220928134235878

可视化

image-20220928134851617
  • Post title:论文阅读笔记:“Progressive Relation Learning for Group Activity Recognition”
  • Post author:sixwalter
  • Create time:2023-08-05 11:14:26
  • Post link:https://coelien.github.io/2023/08/05/paper-reading/paper_reading_048/
  • Copyright Notice:All articles in this blog are licensed under BY-NC-SA unless stating additionally.
 Comments