-
Empowering Relational Network by Self-Attention Augmented Conditional Random Fields for Group Activity Recognition(eccv 2020)...
-
VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text(nips 2021)核心亮点VATT整体框架
上图是VATT的整体...
-
HiGCIN: Hierarchical Graph-based Cross Inference Network for Group Activity Recognition(TPAMI 2020)引言分析在组行为识别中,为了对组行为进行推理,我们需...
-
Joint Learning of Social Groups, Individuals Action and Sub-group Activities in Videos(eccv 2020)引言分析在一个真实场景中,它可能会包含多个人,每个个体可...
-
Deformable Convolutional Networks引言分析cnn对于集合变换的建模主要来自,丰富的数据增强,大的模型容量以及一些简单的手工模块(max pooling)。CNN 不能对大的未知的变换进行建模。CNN模块的几何结构是固定...
-
Progressive Relation Learning for Group Activity Recognition(cvpr2020)核心思想个体特征提取
首先使用目标跟踪器得到人的边界框。之后对其使用卷积得到Person CNN,生成的空...
-
Convolutional Relational Machine for Group Activity Recognition (CVPR 2019)引言分析该论文所采用的方法没有显示地检测或跟踪任何个体。它提出了模型CRM,并在该模型中引入了基于行...
-
Social Adaptive Module for Weakly-supervised Group Activity Recognition核心亮点SAM(Social Adaptive Module)
对于弱监督GAR,SAM可以自适应地选择具有...
-
Hunting Group Clues with Transformers for Social Group Activity Recognition网络框架
Deformable trans encoder
使用修改过的特征图和位置编码P作为输入...
-
Temporal Pyramid Network for Action Recognition(2020)引言分析文章一开始就点明了时间节奏对识别行为的重要性,对于类间与类内的在时间节奏上的变化进行精确建模,可以对行为识别带来巨大的性能提升。之前尝试...