以下是一些应该试着了解的性能指标:
- 每只眼睛50次绘制调用。unity5更精确地将其称为SetPass Calls。
- 场景中顶点数少于50K~100K 且面数少于50~100K 。
下面是一些简单的技巧,用于满足上述要求:
静态批处理
场景中可能存在大量的静态几何体,例如墙体,椅子,灯光和从不移动的网格。在编辑器中将它们标记为静态对象。为烘焙光照贴图,请确保将其标记为静态贴图。不要让每个对象都会导致一次绘制调用,而是把对象标记为可被组合成一个网格的静态对象。
静态批处理有个关键要求:所有对象必须使用相同的材质。若静态墙带有木头材质,静态椅子带有铁材质,所有墙会被批量处理为一次绘制调用,椅子作为单独网格进行另外的绘制调用。
纹理集
如之前所说,每个材质引发一次绘制调用。直觉可能是木门和铁椅子需要使用不同的材质,由于它们的纹理不同。然而,若使用相同的着色器,就可以用纹理集为它们创建共用的材质。纹理集就是一个包含所有小纹理的大纹理。我们可以使用一个材质加载一个纹理,而非使用多个材质加载多次。每个对象可以对应到纹理集中不同坐标的一个纹理。
你可以的绘制管线中手动生成纹理集,但是Juan Sebastian的Pro Draw Call Optimizer工具非常有用。它可以生成纹理集,并且在替换新对象时不会搞混资源。
动态批处理
非静态对象可以动态批处理为一个单独的绘制调用。我曾注意到该过程大量占用CPU且每帧都在计算,但这是一个很好的优化。这只对使用相同材质且顶点数少于900的对象有效。使用纹理集为所有的动态对象创建一个材质,就可以进行简单的动态批处理啦。
LODs(多细节层次)
LOD组是改善性能的简便方法。使用有多个LOD的资源,并用低分辨率的几何体渲染离相机远的对象。Unity可以自动随着相机临近在各个LOD间转换。
填充率,过度绘制及裁剪
这是个值得关注的 话题 。减少过度绘制,最远的对象最先绘制,随后上面依次绘制更近的对象。这个在平均分辨率为1080P的PC显示器上没什么 问题 ,但对于有极高分辨率的VR和手机设备来说问题就比较严重。大量的过度绘制组成了大量像素从而影响填充率。纹理填充率是限制GPU性能的关键。
一些解决方案提供了遮挡剔除和视锥体剔除。视锥体剔除是指不渲染位于相机视锥体外的对象。不渲染看不到的对象!遮挡剔除是剔除被其它对象挡住的对象。比如,门后的房间可以被整体剔除。默认情况下,遮挡剔除是针对整个场景的,如果关卡设计得当甚至可以让你剔除游戏中的整个关卡。
LOD组当然也可以裁剪离场景很远的对象,进一步使填充率最小化。
关卡设计
若游戏涉及到玩家从一个房间移到另一个房间,简单的解决方法是一个关卡包含整个游戏。缺点在于内存的消耗。尽管每个房间中的各对象和材质都不可见,但其仍会被加载到内存中。将每个房间放置于单独的关卡中,在代码中智能的异步加载关卡可以改善性能。