文件名称:malnyun_faces:학습기
文件大小:19.93MB
文件格式:ZIP
更新时间:2024-04-06 09:58:28
image-generation image-to-image-translation
생성모델 介绍 出于纯粹的好奇心,我建立了的数据集,并测试了最近提出的一些深度生成模型。 借助预先训练的人脸生成模型和特殊的训练技术,我能够在一个仅使用500张图像的RTX 2080ti GPU上,在大约10小时内以256x256的分辨率训练一个发生器。 资料准备 我使用了的网络漫画图像。 最初的尝试是在漫画图像上使用简单的面部检测器,但是opencv中提供的人脸级联分类器在此卡通域上效果不佳。 也没有,所以我决定手动标记盒子并最终得到500张卡通人脸图像。 由于人脸的大小会因场景而异,因此我使用将小图像放大到256x256分辨率。 GAN + FreezeD 冻结了经过训练的判别器的前几层,并在新数据集上了模型。 我使用了在FFHQ数据集上训练的styleGAN模型,并且在我的环境中花了大约10个小时来微调预训练模型5万步。 有趣的是,在训练的早期阶段,一些最初学习的语义特征被
【文件预览】:
malnyun_faces-master
----imgs()
--------lgan-150k.jpg(802KB)
--------stylegan2+ugatit-3.gif(1.03MB)
--------factor-2.gif(480KB)
--------stylegan2+ugatit.gif(879KB)
--------placeholder(1B)
--------factor-randomseed.gif(480KB)
--------stylegan2+ugatit-1.gif(555KB)
--------malnyun.gif(39KB)
--------stylegan2+ugatit-2.gif(1.34MB)
--------FreezeD-stylemixing.jpg(419KB)
--------factor-1.gif(360KB)
--------malnyunfaces500.png(180KB)
--------factor-mouth.gif(399KB)
--------FreezeD-FID.png(11KB)
--------stylegan2-from-scratch.jpg(251KB)
--------stylegan2.jpg(242KB)
--------stylegan2+ugatit-4.gif(1002KB)
--------FreezeD-progress.gif(4.37MB)
--------factor-tilt.gif(476KB)
--------FreezeG.jpg(4.21MB)
--------factor-4.gif(592KB)
--------face-detection.jpg(862KB)
--------factor-3.gif(441KB)
--------ugatit.jpg(68KB)
--------ganspace.jpg(437KB)
--------factor-hair.gif(603KB)
----README.md(7KB)