实验记录04.03.2023
sixwalter Lv6

实验记录04.03.2023

  1. 使用decoder作为maxpooling的替代:
image-20230402144715992

在训练过程中,query向量会自适应的学习群体特征(在不断变化),使用decoder对群体行为进行解码:

image-20230403095704429

目前baseline的MCA是91.55%,加入group trans之后的准确率提高了约0.5%

  1. 在上面的实验基础上加入全局信息:

即在img特征层面先使用tokenizer的思想进行分patches,得到L个patches,这里自适应地学习16个patches,这样可以大幅度减少后续encoder的计算量,再加入一个trans encoder,获得全局场景特征:

image-20230403102626953 image-20230403101046565 image-20230403134825526
  • Post title:实验记录04.03.2023
  • Post author:sixwalter
  • Create time:2023-04-03 00:00:00
  • Post link:https://coelien.github.io/2023/04/03/deep-learning/第一章/实验记录4.2/
  • Copyright Notice:All articles in this blog are licensed under BY-NC-SA unless stating additionally.
 Comments