今天,我们将着眼于五个用于序列的聚合运算。很多时候当我们在对序列进行操作时,我们想要做基于这些序列执行某种汇总然后,计算结果。
Enumerable 静态类的LINQ扩展方法可以做到这一点 。就像之前大多数的LINQ扩展方法一样,这些是基于IEnumerable <TSource>序列的操作。
SUM() - 计算整个序列的总和
它有两种形式:
-
SUM( )
- 计算整个序列的总值。
- 源类型必须是以下类型之一: int,long,double,decimal,single 或这些类型的可空变种(int?, long?, double?…) 。
-
Sum(Func<TSource, X> projection)
- 计算序列投影值的和。
- 从MSDN上,我们得知X必须是以下类型之一:int,long,double,decimal,single 或这些类型的可空变种(int?, long?, double?…) 。
在这里请注意几件事情。
首先,尽管在C#中支持许多类型,SUM()方法-非投影式-只支持int,long,double,decimal,single 。
1: // 正确
2: double[] data = { 3.14, 2.72, 1.99, 2.32 };
3: var result = data.Sum();
4:
5: //不支持
6: short[] shortData = { 1, 2, 5, 7 };
7:
8: // 出现编辑错误
9: var shortResult = shortData.Sum();
还要注意的是,你可以操作上面这些类型允许Null 的可空值变种。在之前我们讨论过,可为空的类型可以是一个棘手的事情,但用SUM()时我们不用担心,因为所有的空值在求和时都排除了 :
var data = new List<int?> { 1, 3, 9, 13, null, 7, 12, null };
var result = data.Sum();
第二,投影形式是一个比较有趣和有用的方法:
为了说明这一点,让我们假设一个简单的POCO Employee:
public sealed class Employee
{
public string Name { get; set; }
public double Salary { get; set; }
public short Dependents { get; set; }
}
var employees = new List<Employee>
{
new Employee { Name = "Bob", Salary = 35000.00, Dependents = 0 },
new Employee { Name = "Sherry", Salary = 75250.00, Dependents = 1 },
new Employee { Name = "Kathy", Salary = 32000.50, Dependents = 0 },
new Employee { Name = "Joe", Salary = 17500.00, Dependents = 2 },
};
然后我们就可以使用投影方式获得Salary 的总值:
var totalSalary = employees.Sum(e => e.Salary);
虽然投影形式表面上似乎被限制在了上述的类型里(int,long,single,double,decimal),但是如果我们使用lambda表达式或匿名表达,投影的形式将允许较短的类型:
employees.Sum(e => e.Dependents);
employees.Sum(delegate(Employee e) { return e.Dependents; });
这是因为lambda表达式和匿名委托的结果可以自动扩大小数值类型(如 short)到 int。
Average() - 返回序列的平均值
Average()方法,就像SUM()一样,只不过它是用总和除以实际涉及到的项目数。涉及到的是什么意思?请记住,SUM( )不包括空值 。Average()是将所有非null值求平均。例如:
var intList = new int?[] { 10, 20, 30, null };
// 返回 20
Console.WriteLine(intList.Average());
MIN() - 返回最小的序列值
MIN()扩展方法用于研究序列,并返回从它的最小值 :
-
Min()
- 查找序列中最小的值。
- 抛出异常,如果没有实现IComparable或IComparable<T>。
- 抛出异常,如果序列是空的,源类型是值类型。
- 如果序列是空的,X是引用类型或者Nullable的值类型,则返回 null 。
-
Min(Func<TSource, X> projection)
- 返回泛型序列中的最小值
- 如果 TSource 类型实现 IComparable<T>,则此方法使用该实现比较值。 否则,如果 TSource 类型实现 IComparable,则使用该实现比较值。
- 抛出异常,如果序列是空的,X是值类型。
-
如果 TSource 为引用类型,且源序列为空或仅包含为 null 的值,则此函数返回 null。
MIN()支持几乎任何类型,只要该类型实现IComparable或IComparable <T>。因此,它是不限制的数值类型,可以用于任何比较的对象(包括像值类型的DateTime,TimeSpan):
var shortList = new short[] { 1, 3, 7, 9, -9, 33 };
// 返回 -9
var smallest = shortList.Min();
// 根据家庭成员数量找到最小值
var minDependents = employees.Min(e => e.Dependents);
此外,MIN()不使用泛型约束限制那些支持IComparable 接口的类型参数。相反,它抛出一个运行异常来回应如果序列非空,没有在它的对象实现IComparable的接口。
因此如果使用我们的之前定义的Employee类,下面的第一次调用将返回Null(序列为空),第二次调用会抛出(非空,但不包含IComparable的对象序列) 。
最后,请注意,对于值类型,如果序列是空,将抛出异常, 所以下面两个都会抛出异常:
var result1 = Enumerable.Empty<Employee>().Min();
var result2 = employees.Min();
var result3 = Enumerable.Empty<int>().Min();
var result4 = Enumerable.Empty<Employee>().Min(e => e.Dependents);
MAX() - 返回最大的序列值
MAX()MIN()的行为完全一样,只不过它返回最大值,而不是最小值。因此,我们可以使用这些序列中的最大值,或从一个序列的预测最大值:
///返回33
VAR biggestShort = shortList.Max();
//返回75250.0
VAR highestSalary = employees.Max(E => e.Salary);
其他方面,请参考Min()。
Aggregate() - 序列的自定义累加器
有三种形式的Aggregate():
-
Aggregate(Func<TSource, TSource, TSource> function)
- 适用于一个函数,它接受一个累加器值和下一个值,并返回结果。
- 值和序列类型是相同的。
- 种子值是序列中的第一个值。
-
Aggregate(TAccumulate seed, Func<TAccumulate, TSource, TAccumulate> function)
- 应用序列中的一个函数,累加器值和下一个项目,并返回一个结果。
- 值和序列类型可以不同或相同。
- 必须提供一个种子值来初始化,将指定的种子值用作累加器初始值。
-
Aggregate(TAccumulate seed, Func<TAccumulate, TSource, TAccumulate> function, Func<TAccumulate, TResult> resultProjection)
- 同上述,将指定的种子值用作累加器的初始值,并使用指定的函数选择结果值。
这可能看起来相当复杂。只要记住 “此方法的工作原理是对 source 中的每个元素调用一次 func。 每次调用 func 时,都将传递序列中的元素和聚合值(作为 func 的第一个参数)。 并用 func 的结果替换以前的聚合值。”
例如,如果我们想要做一个序列中的所有数字的乘法:
var numbers = new int[] { 1, 3, 9, 2 };
// 使用当前总值乘以下一个数值得到新的总值
var product = numbers.Aggregate((total, next) => total * next);
最后的值是: 1 X 3 X 9 X 2 = 54。
下面看看怎么用更复杂的聚合计算, 可能我们想得到这样一个结果 -- 用每个雇员的工资除以家庭总人口数(包括他自己),再将这些数相加:
var weirdCalculation = employees.Aggregate(0.0,
(result, next) => result + next.Salary / (next.Dependents + 1));
参照上面的Empolyee 定义,得到的结果是 110458.8333, 为方便理解请看下面的Excel 表格:
所以你看,我们可以做相当复杂的聚合计算,关键是要记住,你所提供的函数留给下一个“元素”,并把它应用到正在运行的“总值”。
摘要
四个简单的和一个可能有点复杂的,这一组功能相当强大!这些方法可以很容易地对序列进行聚合,使你不需要进行循环和自己计算。他们很运行快也很容易使用,他们很容易阅读,他们也被全面测试过了。敬请享受!