1 引言
近年来,随着相关技术的发展,及短视频平台的崛起,视频成功取代了图片成为最主流的信息媒介。对视频理解(viodeo understanding)的研究已经成为学术界和工业界的热点。其中视频时序动作检测(temporal action detection)是当前主要研究任务之一。
简而言之,视频时序动作检测就是给定一段视频,既要给出该视频中动作实例的分类,还要给出各个动作实例开始和结束的具体时刻。
而 ActivityNet 是当前时序动作检测任务最大的数据集,也是最通用的数据集之一。
2 ActivityNet简介
ActivityNet 听名字与ImageNet十分相似,是目前视频动作分析方向最大的数据集,包含分类和检测两个任务。目前的ActivityNet dataset版本为v1.3,包括20000个Youtube 视频(训练集包含约10000个视频,验证集和测试集各包含约5000个视频),共计约700小时的视频,平均每个视频上有1.5个动作标注(action instance)。
ActivityNet 涵盖了200种不同的日常活动,例如:’walking the dog’, ‘long jump’, and ‘vacuuming floor’等。数据量分布:train(~50%), validation(~25%), test(~25%)。
ActivityNet官网:http://activity-net.org/
官方介绍:
Our benchmark aims at covering a wide range of complex human activities that are of interest to people in their daily living. We illustrate three scenarios in which ActivityNet can be used to compare algorithms for human activity understanding: global video classification,trimmed activity classification and activity detection.
但是ActivityNet数据集仅提供视频的youtube链接,而不能直接下载视频,所以还需要用python中的youtube下载工具来自动下载。
但是因为众所周知的原因,如果你参考网上的下载方法,结果是不成功的,因为youtube在我们这里没有v*n是无法访问的,结果是类似下面这样的。
而即使有v*n的小伙伴,由于ActivityNet数据集高达几百G的大小,一般人应该也消费不起这样的高资费。可能有朋友会说:没事,我们老师会报销。可是由于有些YouTube视频已经被原作者下架了或者失效了,导致你最后费了巨大力气下载的数据集并不是完整的数据集。
小汤也是做动作检测这个方向的,也是费了好大力气在获取这个数据集。而且国内的开源精神貌似有点不太强,我在网上联系了几个有数据集的朋友,发邮件请求分享一下,结果都被婉拒了,或者直接没有回复。
但最终小汤还是获得了官方全部数据集,并且是百度网盘形式的。
本着StrongerTang 一直坚持的分享原则,于是便有了这篇文章,希望将这个数据集分享给和我一样做这个方向但苦于没有数据集可用的朋友。也欢迎朋友们在文章点个赞,让更多有需要的朋友看到。
3 数据集免费获取
最后,ActivityNet数据集已经打包完毕,需要的朋友可以按照以下方式获取:
1.搜索公,众-号:StrongerTang
2.后台发送关键词:ActivityNet
声明:此资料免费分享,仅作学术交流,勿用于任何商业用途。赠人玫瑰,手有余香!
推荐阅读:(点击蓝字阅读)
视频动作检测最新发展调研
视频动作识别调研
Representation Flow for Action Recognition论文解读
时序动作定位:Rethinking the Faster R-CNN Architecture for Temporal Action Localization(TAL-Net)
HMDB: a large human motion database人类动作视频数据集介绍及百度云下载链接分享