Java8 函数式编程

时间:2023-01-14 19:04:35

一、函数接口

接口 参数 返回类型 描述
Predicate<T> T boolean 用来比较操作
Consumer<T> T void 没有返回值的函数
Function<T, R> T R 有返回值的函数
Supplier<T> None T 工厂方法-返回一个对象
UnaryOperator<T> T T 入参和出参都是相同对象的函数
BinaryOperator<T> (T,T) T 求两个对象的操作结果

为什么要先从函数接口说起呢?因为我觉得这是 java8 函数式编程的入口呀!每个函数接口都带有 @FunctionalInterface 注释,有且仅有一个未实现的方法,表示接收 Lambda 表达式,它们存在的意义在于将代码块作为数据打包起来。

没有必要过分解读这几个函数接口,完全可以把它们看成普通的接口,不过他们有且仅有一个抽象方法(因为要接收 Lambda 表达式啊)。

@FunctionalInterface 该注释会强制 javac 检查一个接口是否符合函数接口的标准。 如果该注释添加给一个枚举类型、 类或另一个注释, 或者接口包含不止一个抽象方法, javac 就会报错。

二、Lambda 表达式和匿名内部类

先来复习一下匿名内部类的知识:

  • 如果是接口,相当于在内部返回了一个接口的实现类,并且实现方式是在类的内部进行的;
  • 如果是普通类,匿名类相当于继承了父类,是一个子类,并可以重写父类的方法。
  • 需要特别注意的是,匿名类没有名字,不能拥有一个构造器。如果想为匿名类初始化,让匿名类获得一个初始化值,或者说,想使用匿名内部类外部的一个对象,则编译器要求外部对象为final属性,否则在运行期间会报错。
 new Thread(new Runnable() {
     @Override
     public void run() {
         System.out.println(123);
     }
 }).start();
new Thread(()-> System.out.println(123)).start();

如上,和传入一个实现某接口的对象不同, 我们传入了一段代码块 —— 一个没有名字的函数。() 是参数列表, 和上面匿名内部类示例中的是一样的。 -> 将参数和 Lambda 表达式的主体分开, 而主体是之后操作会运行的一些代码。

Lambda 表达式简化了匿名内部类的写法,省略了函数名和参数类型。即参数列表 () 中可以仅指定参数名而不指定参数类型。

Java 是强类型语言,为什么可以不指定参数类型呢?这得益于 javac 的类型推断机制,编译器能够根据上下文信息推断出参数的类型,当然也有推断失败的时候,这时就需要手动指明参数类型了。javac 的类型推断机制如下:

  • 对于类中有重载的方法,javac 在推断类型时,会挑出最具体的类型。
  • 如果只有一个可能的目标类型, 由相应函数接口里的参数类型推导得出;
  • 如果有多个可能的目标类型, 由最具体的类型推导得出;
  • 如果有多个可能的目标类型且最具体的类型不明确, 则需人为指定类型。

三、Lambda 表达式和集合

java8 在 java.util 包中引入了一个新的类 —— Stream.java。java8 之前我们迭代集合,都只能依赖外部迭代器 Iterator 对集合进行串行化处理。而 Stream 支持对集合顺序和并行聚合操作,将更多的控制权交给集合类,是一种内部迭代方式。这有利于方便用户写出更简单的代码,明确要达到什么转化,而不是如何转化。

Stream 的操作有两种,一种是描述 Stream ,如 filter、map、peek 等最终不产生结果的行为称为"惰性求值";另外一种像 foreach、collect 等是从 Stream 中产生结果的行为称为"及早求值"。

接下来让我们瞧瞧 Stream 如何结合 Lambda 表达式优雅的处理集合...

1、及早求值

收集器:一种通用的、从流生成复杂值的结构。只要将它传给 collect 方法, 所有的流就都可以使用它了。在 java.util.stream.Collectors 中提供了一些有用的收集器。比如 toList、toSet、toMap 等。

在一个有序集合中创建一个流时,流中的元素就按出现顺序排列;如果集合本身就是无序的,由此生成的流也是无序的。需要注意的是,forEach 方法不能保证元素是按顺序处理的,如果需要保证按顺序处理,应该使用forEachOrdered 方法。当然,我们可以使用 sorted 方法对Stream 中的元素进行自定义排序。

foreach/forEachOrdered - 迭代集合

list.forEach(e -> System.out.println(e));

map.forEach((k, v) -> {
    System.out.println(k);
    System.out.println(v);
});

对 Stream 进行自定义排序

List<String> collectSort = collect.stream().sorted(Comparator.comparing(String::length)).collect(Collectors.toList());

allMatch、anyMatch、noneMatch - 检查元素是否匹配

private boolean isPrime(int number) {
    return IntStream.range(2, number)
            .allMatch(x -> (number % x) != 0);
}

collect(toList()) - 由Stream里的值生成一个 List/Set/自定义 集合

List<String> list = Stream.of("java", "C++", "Python").collect(Collectors.toList());
等价于:
List<String> asList = Arrays.asList("java", "C++", "Python");
Set<String> set = Stream.of("java", "python", "php").collect(Collectors.toSet());
TreeSet<String> treeSet = Stream.of("java", "python", "php").collect(Collectors.toCollection(() -> new TreeSet<>()));

collect(toMap()) - 由Stream里的值生成一个 Map 集合

使用 toMap() 需要注意的是:Map中的key不能重复,如果重复的话,会抛出异常,因为 JVM 弄不清楚我是用新的Value、还是要用旧的Value呢?所以代码写成了如下的样子~~

Map<String, String> strMap = Stream.of("java", "python", "php").collect(Collectors.toMap(String::new, String::new, (oldValue,newValue) -> oldValue));

如上使用 toMap() 仍然会有一个问题,就是 toMap 转化的时候,如果 value 为 null,会报一个 NullPointerException ,可用如下方式解决:

Map<Object, Object> mapResult = Stream.of("java", "python", "php").collect(HashMap::new, (map, str) -> map.put(str, str), HashMap::putAll);

collect(maxBy())、collect(minBy())、collect(averagingInt()) - 求值操作

Optional<String> optionalMaxBy = Stream.of("java", "python", "php").collect(Collectors.maxBy(Comparator.comparing(str -> str.length())));
System.out.println(optionalMaxBy.get());

Optional<String> optionalMinBy = Stream.of("java", "python", "php").collect(Collectors.minBy(Comparator.comparing(str -> str.length())));
System.out.println(optionalMinBy.get());

Double aDouble = Stream.of("java", "python", "php").collect(Collectors.averagingInt(String::length));
System.out.println(aDouble);

collect(Collectors.joining()) - 字符串拼接操作

String joinStr = Stream.of("java", "python", "php").collect(Collectors.joining(",", "[", "]"));

joining() 的三个参数依次为 分隔符、前缀、后缀。

collect(partitioningBy())、collect(groupingBy()) - 聚合统计操作

List<String> collect = Stream.of("java", "python", "php").collect(Collectors.toList());
// 数据分堆,按照 Boolean 值,将数据分成两堆
Map<Boolean, List<String>> listMap = collect.stream().collect(Collectors.partitioningBy(str -> str.equals("java")));

// 数据分组,有点像 SQL 的 GROUP BY 用法,按照对象的某个属性分组
Map<Integer, List<String>> collectGroudBy = collect.stream().collect(Collectors.groupingBy(String::hashCode));

// 分组统计(类似SQL分组统计) - 先将集合分组,然后统计分组的值 - 比如计算每个城市的姓氏集合-> 先按城市分组,再计算姓氏的集合。
Map<Integer, Long> longMap = collect.stream().collect(Collectors.groupingBy(String::length, Collectors.counting()));
Map<Integer, List<Integer>> listMap = collect.stream().collect(Collectors.groupingBy(String::length, Collectors.mapping(String::length, Collectors.toList())));

2、惰性求值

range - 以步长为1的循环

private boolean isPrime(int number) {
    return IntStream.range(2, number)
            .allMatch(x -> (number % x) != 0);
}
等价于:
for (int i = 2; i < number ; i++) { ... }

filter - 遍历并检查过滤其中的元素

long count = list.stream().filter(x -> "java".equals(x)).count();

distinct - 对流中的元素去重

流中的元素去重根据的是对象的 equal() 方法,对于有序列的流,相同的元素以第一个为准;对于无序列的流,去重的稳定性不做保证。

Stream.of("java", "python", "php", "java").distinct().forEach(e -> System.out.println(e));

findAny、findFirst - 返回一个流中的元素

Optional<String> first = Stream.of("java", "python", "php").findFirst();
Optional<String> any = Stream.of("java", "python", "php").findAny();

map、mapToInt、mapToLong、mapToDouble - 将流中的值转换成一个新的值

List<String> mapList = list.stream().map(str -> str.toUpperCase()).collect(Collectors.toList());

List<String> list = Stream.of("java", "javascript", "python").collect(Collectors.toList());
IntSummaryStatistics intSummaryStatistics = list.stream().mapToInt(e -> e.length()).summaryStatistics();
System.out.println("最大值:" + intSummaryStatistics.getMax());
System.out.println("最小值:" + intSummaryStatistics.getMin());
System.out.println("平均值:" + intSummaryStatistics.getAverage());
System.out.println("总数:" + intSummaryStatistics.getSum());

mapToInt、mapToLong、mapToDouble 和 map 操作类似,只是把函数接口的返回值改为 int、long、double 而已。

peek - 逐个处理流中的元素,无返回值

Stream.of("one", "two", "three", "four")
        .filter(e -> e.length() > 3)
        .peek(e -> System.out.println("Filtered value: " + e))
        .map(String::toUpperCase)
        .peek(e -> System.out.println("Mapped value: " + e))
        .collect(Collectors.toList());

peek 和 map 的区别在于:peek 接受的是 Consumer 高阶函数,无返回值;map 接受的是 Function 高阶函数,有返回值。

flatMap - 将多个 Stream 连接成一个 Stream

List<String> streamList = Stream.of(list, asList).flatMap(x -> x.stream()).collect(Collectors.toList());

flatMap 方法的相关函数接口和 map 方法的一样, 都是 Function 接口, 只是方法的返回值限定为 Stream 类型罢了。

reduce - 聚合操作,从一组元素中生成一个值,sum()、max()、min()、count() 等都是reduce操作,将他们单独设为函数只是因为常用

Integer sum1 = Stream.of(1, 2, 3).reduce(0, (acc, e) -> acc + e);

String maxStr = list.stream().max(Comparator.comparing(e -> e.length())).get();
String minStr = list.stream().min(Comparator.comparing(e -> e.length())).get();

上述执行求和操作,有两个参数: 传入 Stream 中初始值和 acc。 将两个参数相加,acc 是累加器,保存着当前的累加结果。

3、Stream 的并行操作

在 Java8 中,编写并行化的程序很容易。并行化操作流只需改变一个方法调用。如果已经有一个Stream对象,调用它的 parallel 方法就能让其拥有并行操作的能力。如果想从一个集合类创建一个流,调用 parallelStream 就能立即获得一个拥有并行能力的流。在底层,并行流还是沿用了 fork/join 框架。fork 递归式地分解问题,然后每段并行执行,最终由 join 合并结果,返回最后的值。

List<String> paraList = Stream.of("java", "php", "python").parallel().collect(Collectors.toList());
List<String> resultList = paraList.parallelStream().collect(Collectors.toList());

需要注意的是:在要对流求值时,不能同时处于两种模式,要么是并行的,要么是串行的。如果同时调用了 parallel 和 sequential 方法,最后调用的那个方法起效。

并行化流操作的用武之地是使用操作处理大量数据。在处理少量数据时,效果并不明显,因为要把时间花销在数据的分块上。

影响并行流性能的五要素是:数据大小、源数据结构、值是否装箱、可用的 CPU 核数量以及处理每个元素所花的时间。

性能 例子 描述
ArrayList、数组或IntStream.range 这些数据结构支持随机读取,也就是说它们能轻而易举地被任意分解。
一般 HashSet、TreeSet 这些数据结构不易公平地被分解,但是大多数时候分解是可能的。
LinkedList、Streams.iterate和BufferedReader.lines 数据结构难以分解或是长度未知,很难预测该在哪里分解。

在讨论流中单独操作每一块的种类时,可以分成两种不同的操作:无状态的和有状态的。无状态操作整个过程中不必维护状态,有状态操作则有维护状态所需的开销和限制。如果能避开有状态,选用无状态操作,就能获得更好的并行性能。无状态操作包括 map、filter 和 flatMap,有状态操作包括 sorted、distinct 和 limit。

四、默认方法

java8 中新增了 Stream 操作,那么第三方类库中的自定义集合 MyList 要怎么做到兼容呢?总不能升级完 java8,第三方类库中的集合实现全都不能用了吧?

为此,java8 在接口中引入了"默认方法"的概念!默认方法是指接口中定义的包含方法体的方法,方法名有 default 关键字做前缀。默认方法的出现是为了 java8 能够向后兼容。

public interface Iterable<T> {
    /**
     * Performs the given action for each element of the {@code Iterable}
     * until all elements have been processed or the action throws an
     * exception.  Unless otherwise specified by the implementing class,
     * actions are performed in the order of iteration (if an iteration order
     * is specified).  Exceptions thrown by the action are relayed to the
     * caller.
     *
     * @implSpec
     * <p>The default implementation behaves as if:
     * <pre>{@code
     *     for (T t : this)
     *         action.accept(t);
     * }</pre>
     *
     * @param action The action to be performed for each element
     * @throws NullPointerException if the specified action is null
     * @since 1.8
     */
    default void forEach(Consumer<? super T> action) {
        Objects.requireNonNull(action);
        for (T t : this) {
            action.accept(t);
        }
    }
}

看 java8 中的这个 Iterable.java 中的默认方法 forEach(Consumer<? super T> action),表示“如果你们没有实现 forEach 方法,就使用我的吧”。

默认方法除了添加了一个新的关键字 default,在继承规则上和普通方法也略有差别:

  • 类胜于接口。如果在继承链中有方法体或抽象的方法声明,那么就可以忽略接口中定义的方法。
  • 子类胜于父类。果一个接口继承了另一个接口, 且两个接口都定义了一个默认方法,那么子类中定义的方法胜出。
  • 如果上面两条规则不适用, 子类要么需要实现该方法, 要么将该方法声明为抽象方法。

五、其他

  • 使用 Lambda 表达式,就是将复杂性抽象到类库的过程。
  • 面向对象编程是对数据进行抽象, 而函数式编程是对行为进行抽象。
  • Java8 虽然在匿名内部类中可以引用非 final 变量, 但是该变量在既成事实上必须是final。即如果你试图给该变量多次赋值, 然后在 Lambda 表达式中引用它, 编译器就会报错。
  • Stream 是用函数式编程方式在集合类上进行复杂操作的工具。
  • 对于需要大量数值运算的算法来说, 装箱和拆箱的计算开销, 以及装箱类型占用的额外内存, 会明显减缓程序的运行速度。为了减小这些性能开销, Stream 类的某些方法对基本类型和装箱类型做了区分。比如 IntStream、LongStream 等。
  • Java8 对为 null 的字段也引进了自己的处理,既不用一直用 if 判断对象是否为 null。但是需要注意的是:使用任何像 Optional 的类型作为字段或方法参数都是不可取的. Optional 只设计为类库方法的, 可明确表示可能无值情况下的返回类型. Optional 类型不可被序列化, 用作字段类型会出问题的。
public static List<AssistantVO> getAssistant(Long tenantId) {
    // ofNullable 如果 value 为null,会构建一个空对象。
    Optional<List<AssistantVO>> assistantVO = Optional.ofNullable(ASSISTANT_MAP.get(tenantId));
    // orElse 如果 value 为null,选择默认对象。 
    assistantVO.orElse(ASSISTANT_MAP.get(DEFAULT_TENANT));
    return assistantVO.get();
}
  • java8 对Map集合中value为 null 的情况也引起了自己的处理,利用 computeIfAbsent 方法,当 get()方法得到的value为 null 时,会把新的value放进集合并返回。
Map<String, String> map = new HashMap<>(8);
map.put("java", "java");
map.put("php", "php");
String python = map.computeIfAbsent("python", k -> k.toUpperCase());
  • 从某种角度来说,大量代码塞进一个方法会让可读性变差是决定如何使用 Lambda 表达式的黄金法则。
  • 在过去十年中,人们批评单例模式让程序变得更脆弱,且难于测试。敏捷开发的流行,让测试显得更加重要,单例模式的这个问题把它变成了一个反模式:一种应该避免使用的模式。
  • 软件开发最重要的设计工具不是什么技术,而是一颗在设计原则方面训练有素的头脑。