一直对LINQ简洁高效的语法青睐有加,对于经常和资料库,SQL语法打交道的C#开发者来说,LINQ无疑是一个非常不错的选择,当要在List<T>(T为一个普通对象)集合中查找满足某些条件的某个对象时,写成 form t in T where t. Property1 == "A" && t. Property2== "B" …select t或者写成T.Where(t=>t. . Property1 == "A" && t. Property2== "B" …),是再自然不过的了。乍看之下,反正List<T>已被存在记忆体,无需顾忌反复查询所产生的连续成本,而且where条件也十分通俗易懂。但是当你需要频繁检索某个集合中的满足某些条件的对象时,比如需要求两个集合中的差集时,你有没有考虑过性能问题呢?最近的项目遇到频繁检索资料库,对比查询的多个对象的性能瓶颈问题,于是做了下面这个测试,下面我们来看一个对比测试:
public static class LinqOrDictioanry { public static string GetLinqSingle(List<Model> model, string id, string sbName) { return model.Single(o => o.Id == id && o.SbName == sbName).JuName; } public static string GetDictionaryValue(Dictionary<string, Model> dictionaryModel, string id, string sbName) { return dictionaryModel[string.Format("{0}\t{1}", id, sbName)].JuName; } }
[TestMethod] public void TestMethod1() { var model = new List<Model>(); ; ; var random = new Random(count); ; i < count; i++) { model.Add(new Model() { Id = Guid.NewGuid().ToString(), JuName = , ), SbName = , ), Dydj = , ), ZhangChang = , ), YcHang = , ), Time = DateTime.Now, Total = random.Next(, ) }); } var dictionary = model.ToDictionary(d => string.Format("{0}\t{1}", d.Id, d.SbName), d => d); var toModel = new List<Model>(); , ); ; i < tempCount; i++) { var sample = model[random.Next(model.Count)]; toModel.Add(new Model() { Id = sample.Id, SbName = sample.SbName }); } Console.WriteLine("Count={0}>{1}", model.Count, tempCount); ; i < time; i++) { Console.WriteLine("第 {0}次检索{1} 个对象", i, tempCount); var sw = new Stopwatch(); sw.Start(); ; j < tempCount; j++) { var model1 = toModel[j]; model1.JuName = LinqOrDictioanry.GetLinqSingle(model, model1.Id, model1.SbName); } sw.Stop(); Console.WriteLine("耗时 {0}ms", sw.ElapsedMilliseconds); Console.WriteLine(].JuName, toModel[tempCount / ].JuName, toModel[tempCount - ].JuName); } Console.WriteLine(""); ; i < time; i++) { Console.WriteLine("第 {0}次检索{1}个对象", i, tempCount); var sw = new Stopwatch(); sw.Start(); ; j < tempCount; j++) { var model1 = toModel[j]; model1.JuName = LinqOrDictioanry.GetDictionaryValue(dictionary, model1.Id, model1.SbName); } sw.Stop(); Console.WriteLine("耗时 {0}ms", sw.ElapsedMilliseconds); Console.WriteLine(].JuName, toModel[tempCount / ].JuName, toModel[tempCount - ].JuName); } }
随机构造一个容量为10万的List<T>集合和Dictionary<string,T>集合,产生一个随机数作为检索的“频率”,也就是在这10万个对象中要检索的次数(这里产生了1639个检索对象),执行结果让人大吃一惊,耗时相差尽然如此之大。
从测试结果来看,两者的效率天壤之别,而且随着检索集合的容量大小和检索频率成”正比”趋势: 使用LINQ Where检索,执行三次平均检索1600多次13秒左右;而Dictionary执行三次检索1600多次也不超过10ms! LINQ to Object的Where的查询不像数据库可以靠索引加速检索,当查询元素的对象很多,并且查询检索非常频繁时,可以考虑使用Dictionary<string, T>等做法取代Where条件检索,避免不必要的性能损失。
结论:依赖LINQ的Where查询在大量资料库中频繁检索数据是,很容易形成效率瓶颈。遇到这样的需求,可通过ToDictionary()简单转换成Dictionary,可以获得大幅度的性能提升。
有人质疑list 转成 dictionary 的时间开销,这里就把本测试的list 转成 dictionary 的时间开销也发出来,
鄙人能力有限,以上测试纯属个人知识点查缺补漏应用,不敢强加应用场景,以免误人子弟,若有不妥或者错误的地方,还望各位大神斧正。