k-means可以在不同的聚类点间加入计算该方向类内方差的方法改进,可以获得更好的效果;
可以通过爬虫方法在facebook上爬取与happy、sad相关的图片进行图片情感分类,并通过语义分析的方法提高对于文本情感的判断以提高分类准确率;
可以在图片分类前对图片进行轮廓线或者某种数学统计上的预处理,使得照片中的物体朝向尽量一致,以此来提高分类的准确率;在生成模型中这个办法也可以奏效,在现在很多生成模型生成的图片中,动物都是两个头的,如果对于输入图片进行朝向的调整,就可以缓解这种状况。
在输入前对数据库进行预处理,计算过程中对方向进行调整,预处理过程可以分为利用annotation和不利用annotation两种。
对小的数据库采用google和baidu的搜索图片进行填充,扩大数据量以得到更好的结果。
用去除头和尾巴上的特征点的别的特征点的均值来作为中心点,用方差的方式来控制鸟在图中的大小,用脚和头还有尾的位置来控制翻转与否,用头和尾的位置来控制旋转角度。
提取bbox,用均值找中心点,将中心点移动到图片中心,用用头尾和脚的位置来控制翻转和旋转,旋转要保证头尾和对角线夹角一致,然后根据特征点到边框距离不得小于该方向的八分之一的标准,扩大bbox,然后将旋转和扩大后的黑色区域填上与其最接近的非黑像素的颜色,然后整个bbox比例不变,要么短边600,要么长边800