Civilization Museum
The Dark Forest
目录
0%
概述
1、概述
1.1、数据集
1.2、发展史
1.3、实验
2、DeepVideo阶段(IEEE 2014)
3、双流网络
3.1、双流网络(NeurIPS 2014)
3.2、Beyond Short Snippets(CVRR 2015)
3.1、Sports-1M
3.2、UCF101
3.3、Early Fusion(CVPR 2016 )
3.4、TSN
3、3D网络
3.1、C3D网络
3.2、I3D网络
3.3、Non-local Neural Networks
3.4、R(2+1)D
3.5、SlowFast
4、Transformer
4.1、TimeSformer
5、实验效果
DeepVideo(IEEE 2014)
1、网络架构
2、多分辨率卷积网络
双流网络(NeurIPS 2014)
1、Spatio Stream Convet
2、temporal stream convet
2.1、光流
3、融合
4.1、空间网络
4.2、时间流网络
4.3、模型效果
Beyond Short Snippets——Two stream + LSTM、CNN(CVRR 2015)
1、CNN+Pooling
1.1、Conv Pooling
1.2、Late Pooling
1.3、Slow Pooling
1.4、Local Pooling
1.5、Time-Domain Convolutio
2、CNN+LSTM
3.1、池化操作(Sports-1M)
3.2、LSTM操作(Sports-1M)
3.3、特征提取层(Sports-1M)
3.4、效果(UCF-101)
Two-Stream+Early Fusion(CVPR 2016 )
1、概述
1.1、问题
1.2、解决方法
2、Spatial fusion
2.1、不同的空间融合策略
2.2、不同位置的融合效果
3、temporal fusion
3.1、3D pooling
3.2、实验结果
4、整体结构
TSN(长视频理解,ECCV 2016)
1、结构
2、技巧
2.1、初始化
2.2、正则化
2.3、数据增强
3、实验设置
3.1、数据集
3.2、超参数
4、消融实验
4.1、训练策略的影响
4.2、不同输入模式
4.3、共识函数
4.4、Backbone
5、实验效果
C3D(ICCV 2015)
1、主要贡献
2、符号说明
3、模型结构
3.1、数据流
4、实验结果
4.1、与DeepVideo的对比
4.2、UCF101数据集
I3D(双流网络的3D实现、CVPR 2017)
1、相关研究
1.1、概述
1.2、输入
2、网络结构
2.1、参数初始化
3、实验结果
3.1、 相关研究对比
3.2、预训练
3.3、迁移能力
3.4、与历史模型对比
Non-local Neural Networks(CVPR 2018)
1、Non-local Block结构
1.1、注意力计算方式
2、实验结果
2.1、baseline
2.2、消融实验
2.3、对比其它模型
R(2+1)D(CVPR 2018)
1.1、对比实验
2、R(2+1)D结构
3、实验说明
3.1、实验设置
3.2、网络对比
3.3、R(2+1)D与R3D的训练误差比较
3.3、模型对比
SlowFast(ICCV 2019 )
1、模型结构
1.1、Slow pathway
1.2、Fast pathway
1.3、横向连接
2、前向过程
3、实验结果
TimeSformer
1、网络结构
1.1、网络结构
1.2、注意力机制的可视化
2、实验部分
2.1、网络结构
2.2、显存对比
2.3、模型效果对比
2.4、长视频对比
2.5、预训练和数据集规模的重要性
0%