研究生做的稍微有点水平的就这两个项目了:一个是利用SVM做手绘草图的分类,另一个是利用JointBoost+CRF做手绘草图的分割。总结得出的经验是做研究的方法就是将别人大神的代码看懂然后改成适合自己项目的代码,转而这次记录的是另一个项目就是利用JointBoost+CRF做手绘草图的分割。
引言
手绘草图的分割就是语义上的分割,如下面两个图:
左图是未标记的"手绘草图",右图是人工标记了的手绘草图,我们想训练一个分类模型能够对手绘草图上的样点进行语义分类,即判断某点所属类别(头、脚、身体或者尾巴)。而我们采用的方法就是Conditional Random Field 称为条件随机场。虽然名字高大上,但是思想还是很简单的,而这个方法的实现是来自一篇论文,见参考文献1。借用该论文的一段话,来将手绘草图分割的任务具体化:
Many tasks in computer vision involve assigning a label (such as disparity) to every pixel. A common constraint is that the labels should vary smoothly almost everywhere while preserving sharp discontinuities that may exist, e.g., at object boundaries. These tasks are naturally stated in terms of energy minimization.
能量函数是什么
上面英文翻译就是:在机器视觉中的许多任务都要涉及到为每一块像素加标签。一个常规的约束就是所加的标签要尽可能的平滑,然而在物体边界上所加标签的要保留较强的不连续性,然后这样的任务(要求)通常可以用能量函数的最小化表示。我的理解就是如上右图,我们既需要保持同一标签的样点的内部不会突然出现其他标签(smoothly),也要保持在不同标签边界处的标签混淆更少(sharp discontinuities)。上面这段话总结来说就是要解决两个问题:这个能量函数怎么设计,和能量函数怎么最小化。
E_smooth项的选取
V的性质(度量与半度量)
GraphCut迭代算法总流程
a-b-swap、a-expansion是什么
图割是什么?
证明:求一个图的最小割等价于步骤3.1
参考文献与代码
参考文献1. Fast Approximate Energy Minimization via Graph Cut
参考文献2. Learning 3D Mesh Segmentation and Labeling
参考文献3. Sharing Visual Features for Multiclass and Multiview Object Detection
本人论文. Component Segmentation of Sketches Used in 3D model retrieval
图割参考代码:http://vision.ucla.edu/~brian/gcmex.html
JointBoost参考代码:https://people.cs.umass.edu/~kalo/papers/LabelMeshes/index.html
最后
只能说学到了一种基于序列数据的机器学习的算法,但是感觉高大上应该还有更基础的算法可以学学吧。后面写点Hadoop的东西了,毕业了,工作要用,这个CRF最后的大坑也算填上了。