全文出处:http://www.infoq.com/cn/articles/C-sharp-performance-optimization
1.性能
主要指两个方面:内存消耗和执行速度。性能优化简而言之,就是在不影响系统运行正确性的前提下,使之运行地更快,完成特定功能所需的时间更短。
2.理解瓶颈
99%的性能消耗是由于1%的代码造成的。大部分性能优化都是针对这1%的瓶颈代码进行的。具体实施也就分为两步:“发现瓶颈”和“消除瓶颈”。
3.切忌过度
性能优化本身是有成本的。这个成本不单单体现在做性能优化所付出的工作量,还包括为性能优化而写出复杂的代码导致额外的维护成本,比如引入新的Bug,额外的内存开销等。性能优化常常需要在收益和成本之间做出权衡。
4.如何发现性能瓶颈
性能优化的第一步是发现性能瓶颈,下面是一些定位性能瓶颈的实践。
A.如何获取内存消耗
以下代码可以获取某个操作的内存消耗:
long start = GC.GetTotalMemory(true);
// 在这里写需要被测试内存消耗的代码,例如,创建一个GcMultiRow
var gcMulitRow1 = new GcMultiRow();
GC.Collect();
// 确保所有内存都被GC回收
GC.WaitForFullGCComplete();
long end = GC.GetTotalMemory(true);
long useMemory = end - start;
B.如何获取时间消耗
以下代码可以获取某个操作时间消耗:
System.Diagnostics.Stopwatch watch = new System.Diagnostics.Stopwatch();
watch.Start();
for (int i = ; i < ; i++)
{
gcMultiRow1.Sort();
}
watch.Stop();
var useTime = (double)watch.ElapsedMilliseconds / ;
----为了获得更加稳定的时间消耗,这里把一个操作循环执行了1000次,取时间消耗的平均值以排除不稳定数据。
5.性能优化的方法和技巧
A.优化程序结构
B.缓存
缓存(Cache)是性能优化中最常用的手段,针对需要频繁的获取一些数据,同时每次获取数据需要的时间比较长的场景。如果使用了缓存的优化方法,需要特别注意缓存数据的同步:如果真实的数据发生了变化,应该及时的清除缓存数据,确保不会因为缓存而使用了错误的数据。使用缓存的情况比较多, 最简单的情况就是缓存到一个Field或临时变量里。
for(int i = ; i < gcMultiRow.RowCount; i++)
{
// Do something;
}
以上代码一般情况下是没有问题的,但是,如果GcMultiRow的行数比较大。而RowCount属性的取值又比较慢的时候,就需要使用缓存来做性能优化。
int rowCount = gcMultiRow.RowCount;
for (int i = ; i < rowCount; i++)
{
// Do something;
}
C.延迟加载
大多时候,对于创建需要花费较长时间的对象,往往并不是所有的场景下都需要使用。这时,使用懒构造的方法可以有效提高程序启动性能。
举例来说,对象A需要内部创建对象B。对象B的构造时间比较长。 一般做法:
public class A
{
public B _b = new B();
}
一般做法下,由于构造对象A的同时要构造对象B,导致A的构造速度也变慢了。
优化做法:
public class A
{
private B _b;
public B BProperty
{
get
{
if(_b == null)
{
_b = new B();
}
return _b;
}
}
}
优化后,构造A的时候就不需要创建B对象,有效的提高了A的构造性能。
D.优化算法
E.正确的使用既有数据结构
.NET平台有很多现成的数据结构。我们应该了解这些数据结构,提升我们程序的性能。
例如:
1. String的加运算符和StringBuilder:
字符串的操作是我们经常遇到的基本操作之一。 我们经常会写这样的代码 string str = str1 + str2。当操作的字符串很少的时候,这样的操作没有问题。但是如果大量操作的时候(例如文本文件的Save/Load, Asp.net的Render),这样做就会带来严重的性能问题。这时,我们就应该用StringBuilder来代替string的加操作。
2. Dictionary 和 List:
Dictionary和List是最常用的两种集合类。选择正确的集合类可以很大的提升程序的性能。为了做出正确的选择,我们应该对Dictionary 和List的各种操作的性能比较了解。 下表中粗略的列出了两种数据结构的性能比较。
操作 List Dictionary 索引 快 慢 Find(Contains) 慢 快 Add 快 慢 Insert 慢 快 Remove 慢 快
3.TryGetValue: 对于Dictionary的取值,比较直接的方法是如下代码:
if(_dic.ContainKey("Key")
{
return _dic["Key"];
}
当需要大量取值的时候,这样的取法会带来性能问题。优化方法如下
object value;
if(_dic.TryGetValue("Key", out value))
{
return value;
}
后一种用法要比前一种用法取值性能提高一倍。
4. 为Dictionary选择合适的Key:
Dictionary的取值性能很大情况下取决于做Key的对象的Equals和GetHashCode两个方法的性能。如果可以的话,使用Int做Key性能最好。如果是一个自定义的Class做Key的话,最好保证以下两点:
1)不同对象的GetHashCode重复率低。
2)GetHashCode和Equals方法简单,效率高。
5. List的Sort和BinarySearch性能很好,如果能满足功能需求,推荐直接使用。
List<int> list = new List<int>{, , }; list.BinarySearch(); // 对于存在的值,结果是1 list.BinarySearch(); // 对于不存在的值,会使用负数表示位置, // 如查找8时,结果是-2, 查找0结果是-1,查找100结果是-4.