在C#中,如果要实现两个列表的左链接查询,我们的一般用法就是用的linq表达式就是
List<Pet> pets =
new List<Pet>{ new Pet { Name="Barley", Age=8 },
new Pet { Name="Boots", Age=4 },
new Pet { Name="Whiskers", Age=1 } };
List<Pet2> pets2 =
new List<Pet2>{ new Pet2 { Name="Barley", Sex = "男" },
new Pet2 { Name="Boots", Sex = "男"}, };
var list2 = from x in pets join y in pets2 on x.Name equals y.Name into ptelist from z in ptelist.DefaultIfEmpty(new Pet2())
select new { Name = x.Name, Age = x.Age, Sex = z.Sex };
但很多人估计不喜欢这种写法,因为拉姆达表达式在书写和理解上都更加的清晰快捷。
但怎么写,我查了一下,发现资料很少,于是自己写盲写一个
var list3 = pets.Join(pets2, x => x.Name, y => y.Name, (x, y) => new { Name = x.Name, Age = x.Age, Sex = y.Sex }).DefaultIfEmpty();
var list4 = pets.Join(pets2.DefaultIfEmpty(), x => x.Name, y => y.Name, (x, y) => new { Name = x.Name, Age = x.Age, Sex = y.Sex }).DefaultIfEmpty();
但这两种写法都是有明显的逻辑BUG,又实在想不好怎么办,于是调试看下,发现果然是错误的。
然后查看msdn,关于join有这么明显的一句话:
在关系数据库术语中,Join 方法实现内部同等联接。' “内部”表示结果中仅包含在另一序列中具有匹配项的元素。 “同等联接”是在其中比较键是否相等的联接。 左外部联接操作没有专用的标准查询运算符,但可以使用 GroupJoin 方法执行此操作。 请参见联接运算。
于是乎,就需要用GroupJoin了。先看一下定义
public static IEnumerable<TResult> GroupJoin<TOuter, TInner, TKey, TResult>(this IEnumerable<TOuter> outer, IEnumerable<TInner> inner, Func<TOuter, TKey> outerKeySelector,
Func<TInner, TKey> innerKeySelector, Func<TOuter, IEnumerable<TInner>, TResult> resultSelector);
可以看出,这是将A列表的每一项和B列表中的0-N个项对应,得到一个A对象+B对象列表的结果。
那我们根据这个定义,就可以写出左链接了,下面给出完成代码
List<Pet> pets =
new List<Pet>{ new Pet { Name="Barley", Age=8 },
new Pet { Name="Boots", Age=4 },
new Pet { Name="Whiskers", Age=1 } };
List<Pet2> pets2 =
new List<Pet2>{ new Pet2 { Name="Barley", Sex = "男" },
new Pet2 { Name="Boots", Sex = "男"}, };
var list = pets.GroupJoin(pets2, x => x.Name, y => y.Name, (x, y) => y.DefaultIfEmpty(new Pet2()).Select(z => new { Name = x.Name, Age = x.Age, Sex = z.Sex })).SelectMany(x =
> x);
在A列表和B列表确定对应关系以后,使用B列表的list结果(为空则用DefaultIfEmpty创造一个),将A和B链接起来,最后使用selectmany,将一个列表的列表改造成一个列表,得出和linq写法一样的结果。