目前目标检测比较好的两种方法是Fast-RCNN和OverFeat。我更喜欢OverFeat,因为OverFeat完全使用CovNet来做Classification,Localization和detection,比Pip Line的方法好多了,简洁并且减少经验性的东西。最终也方便做到end-end的Training。
尝试一下如何使用OverFeat。OverFeat的代码包是sklearn-theano。
安装sklearn-theano。
一般搞图像的Python环境应该都装好了。然后按照这个说明来就可以了。
http://sklearn-theano.github.io/install.html
对于开发者是不是都应该选develop的版本?
运行一个例子
将这个简单的测试代码example-plot-multiple-localization-py保存到本地。然后运行
python example-plot-multiple-localization-py
可能会有错误,找不到net_weights.zip。因为训练好的网络比较大,没有放到安装包里,而是测试的时候去下载。下载地址可能被墙了。
需要*下载net_weights.zip这个文件,然后:
mv net_weights.zip ~/sklearn_theano_data/overfeat_weights/
应该就能看到结果:
再运行一个例子:
python plot_localization_tutorial.py