Java8 Stream代码详解+BenchMark测试

时间:2023-12-23 13:47:38

1、基本介绍

目录

1、创建方式

1、Array的Stream创建
1、直接创建
// main
Stream stream = Stream.of("a", "b", "c");
String [] strArray = new String[] {"a", "b", "c"};
stream = Stream.of(strArray);

// Stream.of()
@SafeVarargs
@SuppressWarnings("varargs") // Creating a stream from an array is safe
public static<T> Stream<T> of(T... values) {
return Arrays.stream(values);
}
2、直接使用Arrays.stream工具创建
// main
String [] strArray = new String[] {"a", "b", "c"};
stream = Arrays.stream(strArray);

​ 下面是Arrays.stream的具体实现

// Arrays.stream()
public static <T> Stream<T> stream(T[] array) {
return stream(array, 0, array.length);
}
/**
* Arrays.stream()
* @param startInclusive 起始坐标
* @param endExclusive 最终坐标
*/
public static <T> Stream<T> stream(T[] array, int startInclusive, int endExclusive) {
return StreamSupport.stream(spliterator(array, startInclusive, endExclusive), false);
}

​ StreamSupport.stream的实现使用的是ReferencePipeline.Head<>这个方法,注意这个方法,这个方法是Stream流水线解决方案的核心之一

// StreamSupport.stream()
public static <T> Stream<T> stream(Spliterator<T> spliterator, boolean parallel) {
Objects.requireNonNull(spliterator);
return new ReferencePipeline.Head<>(spliterator,
StreamOpFlag.fromCharacteristics(spliterator),
parallel);
}

​ 注意这里的Spliterator,这个类是Stream实现并行的核心类。这里Array生成的spliterator的特征值是ordered和immutable。(目前没看到关于特征值的相关操作,具体解释可以看源码的注释)

/**
* ReferencePipeline.Head<>()
* 默认生成一个ordered、immutable的Spliterator
*/
public static <T> Spliterator<T> spliterator(T[] array, int startInclusive, int endExclusive) {
return Spliterators.spliterator(array, startInclusive, endExclusive,
Spliterator.ORDERED | Spliterator.IMMUTABLE);
}
2、Collection的Stream创建
// main
List<Integer> integers = new ArrayList<>();
integers.stream();

​ Collection的Stream的创建使用的是Collection.stream方法

// Collection.stream()
default Stream<E> stream() {
return StreamSupport.stream(spliterator(), false);
}

​ 这个spliterator(),创建的是Spliterator下的特增值为sized、subSized的Spliterator

// Collection.spliterator()
@Override
default Spliterator<E> spliterator() {
return Spliterators.spliterator(this, 0);
}
// Spliterators.spliterator()
public static <T> Spliterator<T> spliterator(Collection<? extends T> c,
int characteristics) {
return new IteratorSpliterator<>(Objects.requireNonNull(c),
characteristics);
}
/**
* IteratorSpliterator<>()
* 默认生成一个sized、subSized的Spliterator
*/
public IteratorSpliterator(Collection<? extends T> collection, int characteristics) {
this.collection = collection;
this.it = null;
this.characteristics = (characteristics & Spliterator.CONCURRENT) == 0
? characteristics | Spliterator.SIZED | Spliterator.SUBSIZED
: characteristics;
}

​ 最后还是将Spliterator放入ReferencePipeline.Head<>方法创建了Stream

// ReferencePipeline.Head<>
public static <T> Stream<T> stream(Spliterator<T> spliterator, boolean parallel) {
Objects.requireNonNull(spliterator);
return new ReferencePipeline.Head<>(spliterator,
StreamOpFlag.fromCharacteristics(spliterator),
parallel);
}
3、其他创建方式
1、Stream.iterate()
Stream.iterate(1,i->i++)

​ 该方法放入一个seed值作为种子值,使用第二个参数方法生成一个无限大小的Stream,特征值与Array的Stream特征值相同。

public static<T> Stream<T> iterate(final T seed, final UnaryOperator<T> f) {
Objects.requireNonNull(f);
final Iterator<T> iterator = new Iterator<T>() {
@SuppressWarnings("unchecked")
T t = (T) Streams.NONE; @Override
public boolean hasNext() {
return true;
} @Override
public T next() {
return t = (t == Streams.NONE) ? seed : f.apply(t);
}
};
return StreamSupport.stream(Spliterators.spliteratorUnknownSize(
iterator,
Spliterator.ORDERED | Spliterator.IMMUTABLE), false);
}
2、Stream.generate()
Stream.generate(Math::random)

​ 该方法没有放入种子值,放入的是一个Supplier,该类就是java1.8以后加入的函数式接口,该接口只有一个方法就是get()方法,用于提供生成Stream需要的每一个的数据,最后生成长度最大为9223372036854775807L(2的63次方-1)的Stream。

public static<T> Stream<T> generate(Supplier<T> s) {
Objects.requireNonNull(s);
return StreamSupport.stream(
new StreamSpliterators.InfiniteSupplyingSpliterator.OfRef<>(Long.MAX_VALUE, s), false);
}
@FunctionalInterface
public interface Supplier<T> { /**
* Gets a result.
*
* @return a result
*/
T get();
}

2、中间操作(intermediate operation)

​ 每一个流能有多个中间操作,中间操作的作用就是将原始的流转化为需要的流,并且为惰性操作,关于惰性操作后面会有具体介绍。并且中间操作可分为有状态和无状态两种,两种不同的操作在构成Stream流水线时会使用不同的创建方式和操作。

1、有状态操作(statefulOp)

​ 1、Stream<T> distinct();// 除去流种重复的元素

​ 2、Stream<T> limit(long maxSize);// 只取前几个元素

​ 3、Stream<T> skip(long n);// 跳过前几个元素

​ 4、Stream<T> sorted();// 根据自然排序对流排序

​ 5、Stream<T> sorted(Comparator<? super T> comparator);// 根据自己实现的排序对流排序

2、无状态操作(statelessOp)

​ 1、Stream<T> filter(Predicate<? super T> predicate);// 根据过滤规则过滤流种的元素

​ 2、<R> Stream<R> map(Function<? super T, ? extends R> mapper);// 将每一个元素映射成另一个元素

​ 3、<R> Stream<R> flatMap(Function<? super T, ? extends Stream<? extends R>> mapper);// 和上一个map映射不同的是,扁平映射会将流中的最基础的元素映射出来

​ 4、Stream<T> peek(Consumer<? super T> action);// 每一个元素都要做一下这个action

​ 5、IntStream mapToInt(ToIntFunction<? super T> mapper);// 映射为IntStream

​ 6、LongStream mapToLong(ToLongFunction<? super T> mapper);// 映射为LongStream

​ 7、DoubleStream mapToDouble(ToDoubleFunction<? super T> mapper);// 映射为DoubleStream

2、结束操作(terminal operation)

​ 每个流只能有一个结束操作,结束操作会将和之前的中间操作一同起作用,在使用了结束操作后该流便被消费掉了,不能再次使用。由于流可以是无限大的,所以也会有短路操作,当无限大的流使用了短路操作并且满足了短路条件时便会直接结束。

1、非短路操作

​ 1、void forEach(Consumer<? super T> action);// 每一个元素都要做一下这个aciton

​ 2、void forEachOrdered(Consumer<? super T> action);// 确保并行时保持顺序执行这个action

​ 3、Object[] toArray();// 转化成Object数组

​ 4、<A> A[] toArray(IntFunction<A[]> generator);// 转化成自己定义的数组

​ 5、T reduce(T identity, BinaryOperator<T> accumulator);// 汇聚,有起始值,操作

​ 6、Optional<T> reduce(BinaryOperator<T> accumulator);// 汇聚,无起始值,返回的是Optional对象

​ 7、<U> U reduce(U identity,BiFunction<U, ? super T, U> accumulator,BinaryOperator<U> comb iner);// 汇聚,有起始值,操作,合并

​ 8、<R> R collect(Supplier<R> supplier,BiConsumer<R, ? super T> accumulator,BiConsumer<R, R> combiner);// 可变汇聚,自己实现汇聚,容器、操作、合并操作

​ 9、<R, A> R collect(Collector<? super T, A, R> collector);// 可变汇聚,Collectors有封装工具

​ 10、Optional<T> min(Comparator<? super T> comparator);// 封装了reduce,使用自己的比较器找到最小的

​ 11、Optional<T> max(Comparator<? super T> comparator);// 封装了reduce,使用自己的比较器找到最大的

​ 12、long count();// 封装了reduce,把每个数变成1再求和

2、短路操作(short-circuiting)

​ 1、boolean anyMatch(Predicate<? super T> predicate);// 有一个符合判断

​ 2、boolean noneMatch(Predicate<? super T> predicate);// 没有一个符合判断

​ 3、Optional<T> findFirst();// 有序的,找到第一个

​ 4、Optional<T> findAny();// 不要求有序的,找到一个

​ 5、boolean (Predicate<? super T> predicate);// 全部符合判断

2、Stream流水线解决方案

1、ReferencePipeLine

​ Stream中使用Stage的概念来描述一个完整的操作,并用某种实例化后的PipelineHelper来代表Stage,将具有先后顺序的各个Stage连到一起,就构成了整个流水线。跟Stream相关类和接口的继承关系图示。

Java8 Stream代码详解+BenchMark测试

​ 下面是源码,Head表示Source stage,例如Collection.stream(),这里面没有对数据的操作,StatelessOp和StatefuleOp分别对应无状态和有状态的中间操作

    /**
* Source stage of a ReferencePipeline.
*
* @param <E_IN> type of elements in the upstream source
* @param <E_OUT> type of elements in produced by this stage
* @since 1.8
*/
static class Head<E_IN, E_OUT> extends ReferencePipeline<E_IN, E_OUT> @Override
final Sink<E_IN> opWrapSink(int flags, Sink<E_OUT> sink) {
throw new UnsupportedOperationException();
}
	/**
* Base class for a stateless intermediate stage of a Stream.
*
* @param <E_IN> type of elements in the upstream source
* @param <E_OUT> type of elements in produced by this stage
* @since 1.8
*/
abstract static class StatelessOp<E_IN, E_OUT>
extends ReferencePipeline<E_IN, E_OUT>
	/**
* Base class for a stateful intermediate stage of a Stream.
*
* @param <E_IN> type of elements in the upstream source
* @param <E_OUT> type of elements in produced by this stage
* @since 1.8
*/
abstract static class StatefulOp<E_IN, E_OUT>
extends ReferencePipeline<E_IN, E_OUT>

​ 通过之前就可以看到的ReferencePipeline.Head<>生成第一个Source stage,紧接着调用一系列的中间操作,不断产生新的Stream。这些Stream对象以双向链表的形式组织在一起,构成整个流水线,由于每个Stage都记录了前一个Stage和本次的操作以及回调函数,依靠这种结构就能建立起对数据源的所有操作。这就是Stream记录操作的方式。

Java8 Stream代码详解+BenchMark测试

2、Sink

​ 上面讲到的是Stream流水线如何流水操作计算,但是如何组合就要看Sink这个接口了,该接口包含以下方法

方法名 作用
void begin(long size) 开始遍历元素之前调用该方法,通知Sink做好准备。
void end() 所有元素遍历完成之后调用,通知Sink没有更多的元素了。
boolean cancellationRequested() 是否可以结束操作,可以让短路操作尽早结束。
void accept(T t) 遍历元素时调用,接受一个待处理元素,并对元素进行处理。Stage把自己包含的操作和回调方法封装到该方法里,前一个Stage只需要调用当前Stage.accept(T t)方法就行了。

​ 通过以上方法,各个Stage之间的调用就实现了,每个Stage将自己的操作封装到Sink中,然后只需要访问下一个Stage的accept方法即可。

​ 下面分别举无状态中间操作和有状态中间操作对这几个方法的实现。

​ 首先是map的实现

// Stream.map()
@Override
@SuppressWarnings("unchecked")
public final <R> Stream<R> map(Function<? super P_OUT, ? extends R> mapper) {
Objects.requireNonNull(mapper);
return new StatelessOp<P_OUT, R>(this, StreamShape.REFERENCE,
StreamOpFlag.NOT_SORTED | StreamOpFlag.NOT_DISTINCT) {
@Override/*opWripSink()方法返回由回调函数包装而成Sink*/
Sink<P_OUT> opWrapSink(int flags, Sink<R> sink) {
return new Sink.ChainedReference<P_OUT, R>(sink) {
@Override
public void accept(P_OUT u) {
downstream.accept(mapper.apply(u));// 将数据处理并且交给下游
}
};
}
};
}

​ sorted的实现

	/**
* Stream.sort()
* {@link Sink} for implementing sort on reference streams.
*/
private static final class RefSortingSink<T> extends AbstractRefSortingSink<T> {
private ArrayList<T> list; RefSortingSink(Sink<? super T> sink, Comparator<? super T> comparator) {
super(sink, comparator);
} @Override
public void begin(long size) {
if (size >= Nodes.MAX_ARRAY_SIZE)
throw new IllegalArgumentException(Nodes.BAD_SIZE);
// 创建一个存放排序元素的列表
list = (size >= 0) ? new ArrayList<T>((int) size) : new ArrayList<T>();
} @Override
public void end() {
list.sort(comparator);// 只有元素全部接收之后才能开始排序
downstream.begin(list.size());
if (!cancellationWasRequested) {// 下游Sink不包含短路操作
list.forEach(downstream::accept);// 将处理结果传递给流水线下游的Sink
}
else {// 下游Sink包含短路操作
for (T t : list) {// 每次都调用cancellationRequested()询问是否可以结束处理。
if (downstream.cancellationRequested()) break;
downstream.accept(t);// 将处理结果传递给流水线下游的Sink
}
}
downstream.end();
list = null;
} @Override
public void accept(T t) {
list.add(t);// 使用当前Sink包装动作处理t,只是简单的将元素添加到中间列表当中
}
}

​ 上述代码完美的展现了Sink的四个接口方法是如何协同工作的:

​ 1、首先begin()方法告诉Sink参与排序的元素个数,方便确定中间结果容器的的大小;

​ 2、之后通过accept()方法将元素添加到中间结果当中,最终执行时调用者会不断调用该方法,直到遍历所有元素;

​ 3、最后end()方法告诉Sink所有元素遍历完毕,启动排序步骤,排序完成后将结果传递给下游的Sink;

​ 4、如果下游的Sink是短路操作,将结果传递给下游时不断询问下游cancellationRequested()是否可以结束处理。

3、整合与执行

​ Sink完美封装了Stream每一步操作,并给出了[处理->转发]的模式来叠加操作。那么整个操作的启动动力就是结束操作(Terminal Operation),一旦调用某个结束操作,就会触发整个流水线的执行。

​ 结束操作会创建一个包装了自己操作的Sink,这也是流水线中最后一个Sink,这个Sink只需要处理数据而不需要将结果传递给下游的Sink(因为没有下游)。对于Sink的[处理->转发]模型,结束操作的Sink就是调用链的出口。

​ Stream设置了一个Sink AbstractPipeline.opWrapSink(int flags, Sink downstream)方法来得到Sink,该方法的作用是返回一个新的包含了当前Stage代表的操作以及能够将结果传递给downstream的Sink对象。使用opWrapSink()将当前操作与下游Sink(上文中的downstream参数)结合成新Sink。

​ 从流水线的最后一个Stage开始,不断调用上一个Stage的opWrapSink()方法直到最开始(不包括source stage,因为source stage代表数据源,不包含操作),就可以得到一个代表了流水线上所有操作的Sink,用代码表示就是这样:

// AbstractPipeline.wrapSink()
// 从下游向上游不断包装Sink。如果最初传入的sink代表结束操作,
// 函数返回时就可以得到一个代表了流水线上所有操作的Sink。
final <P_IN> Sink<P_IN> wrapSink(Sink<E_OUT> sink) {
...
for (AbstractPipeline p=AbstractPipeline.this; p.depth > 0; p=p.previousStage) {
sink = p.opWrapSink(p.previousStage.combinedFlags, sink);
}
return (Sink<P_IN>) sink;
}

​ 流水线上从开始到结束的所有的操作都被包装到了一个Sink里,执行这个Sink就相当于执行整个流水线,执行Sink的代码如下:

// AbstractPipeline.copyInto(), 对spliterator代表的数据执行wrappedSink代表的操作。
final <P_IN> void copyInto(Sink<P_IN> wrappedSink, Spliterator<P_IN> spliterator) {
...
if (!StreamOpFlag.SHORT_CIRCUIT.isKnown(getStreamAndOpFlags())) {
wrappedSink.begin(spliterator.getExactSizeIfKnown());// 通知开始遍历
spliterator.forEachRemaining(wrappedSink);// 迭代
wrappedSink.end();// 通知遍历结束
}
...
}

​ 上述代码首先调用wrappedSink.begin()方法告诉Sink数据即将到来,然后调用spliterator.forEachRemaining()方法对数据进行迭代,最后调用wrappedSink.end()方法通知Sink数据处理结束。

3、Stream并行实现原理

1、执行结束操作的默认实现,以findFirst为例

@Override
public final Optional<P_OUT> findFirst() {
return evaluate(FindOps.makeRef(true));
}

​ 并行的实现在AbstractPipeline的evaluate中的evaluateParallel中

final <R> R evaluate(TerminalOp<E_OUT, R> terminalOp) {
assert getOutputShape() == terminalOp.inputShape();
if (linkedOrConsumed)
throw new IllegalStateException(MSG_STREAM_LINKED);
linkedOrConsumed = true; return isParallel()
? terminalOp.evaluateParallel(this, sourceSpliterator(terminalOp.getOpFlags()))
: terminalOp.evaluateSequential(this, sourceSpliterator(terminalOp.getOpFlags()));
}
	![](http://images2015.cnblogs.com/blog/1116549/201707/1116549-20170724151158934-1122314196.png)
@Override
public <P_IN> O evaluateParallel(PipelineHelper<T> helper,
Spliterator<P_IN> spliterator) {
return new FindTask<>(this, helper, spliterator).invoke();
}
private static final class FindTask<P_IN, P_OUT, O>
extends AbstractShortCircuitTask<P_IN, P_OUT, O, FindTask<P_IN, P_OUT, O>> {
private final FindOp<P_OUT, O> op; FindTask(FindOp<P_OUT, O> op,
PipelineHelper<P_OUT> helper,
Spliterator<P_IN> spliterator) {
super(helper, spliterator);
this.op = op;
}

​ 这里一FindOps的实现为例,这四个操作都是创建一个Task的示例,然后执行invoke方法。这些Task的继承关系如图:

Java8 Stream代码详解+BenchMark测试

​ 这里可以看出Stream的并行实现都继承了jdk7中的ForkJoin并行框架的ForkJoinTask。

​ 下面是AbstractShortCircuitTask的并行计算方法

@Override
public void compute() {
Spliterator<P_IN> rs = spliterator, ls;
long sizeEstimate = rs.estimateSize();
long sizeThreshold = getTargetSize(sizeEstimate);
boolean forkRight = false;
@SuppressWarnings("unchecked") K task = (K) this;
AtomicReference<R> sr = sharedResult;
R result;
while ((result = sr.get()) == null) {
if (task.taskCanceled()) {
result = task.getEmptyResult();
break;
}
if (sizeEstimate <= sizeThreshold || (ls = rs.trySplit()) == null) {
result = task.doLeaf();
break;
}
K leftChild, rightChild, taskToFork;
task.leftChild = leftChild = task.makeChild(ls);
task.rightChild = rightChild = task.makeChild(rs);
task.setPendingCount(1);
if (forkRight) {
forkRight = false;
rs = ls;
task = leftChild;
taskToFork = rightChild;
}
else {
forkRight = true;
task = rightChild;
taskToFork = leftChild;
}
taskToFork.fork();
sizeEstimate = rs.estimateSize();
}
task.setLocalResult(result);
task.tryComplete();
}

​ 这里面的主要逻辑是

​ 1、通过estimateSize方法预估工作量总数

​ 2、通过getTargetSize(sizeEstimate)获得最后能把工作量分成多少分,具体如下图,获得当前可用核数减1,然后乘以4,再用预估工作量总数除以该数得到目标工作量

protected final long getTargetSize(long sizeEstimate) {
long s;
return ((s = targetSize) != 0 ? s :
(targetSize = suggestTargetSize(sizeEstimate)));
}
public static long suggestTargetSize(long sizeEstimate) {
long est = sizeEstimate / LEAF_TARGET;
return est > 0L ? est : 1L;
} static final int LEAF_TARGET = ForkJoinPool.getCommonPoolParallelism() << 2; if (parallelism < 0 && // default 1 less than #cores
(parallelism = Runtime.getRuntime().availableProcessors() - 1) <= 0)
parallelism = 1;
this.config = (parallelism & SMASK) | mode;
int par = common.config & SMASK; // report 1 even if threads disabled
commonParallelism = par > 0 ? par : 1;

​ 3、在将工作全部fork开之前不断循环将当前任务分为左右子任务

​ 4、退出循环后尝试结束,调用子类实现的doLeaf方法,完成最小计算单元的计算任务,然后设置到当前任务的localResult中

​ 5、再使用tryComplete方法进行最终任务的扫尾工作,如果该任务pending 值不等于0,则原子的减1,如果已经等于0,说明任务都已经完成,则调用onCompletion 回调,如果该任务是叶子任务,则直接销毁中间数据结束;如果是中间节点会将左右子节点的结果进行合并

​ 6、检查如果这个任务已经没有父级任务了,则将该任务置为正常结束,如果还有则尝试递归的去调用父级节点的onCompletion回调,逐级进行任务的合并

/**
* If the pending count is nonzero, decrements the count;
* otherwise invokes {@link #onCompletion(CountedCompleter)}
* and then similarly tries to complete this task's completer,
* if one exists, else marks this task as complete.
*/
public final void tryComplete() {
CountedCompleter<?> a = this, s = a;
for (int c;;) {
if ((c = a.pending) == 0) {
a.onCompletion(s);
if ((a = (s = a).completer) == null) {
s.quietlyComplete();
return;
}
}
else if (U.compareAndSwapInt(a, PENDING, c, c - 1))
return;
}
}

总结:最后可以看出Stream并行的实现本质上就是在ForkJoin上进行了一层封装,将Stream不断分解成更小的Spliterator进行计算。

2、自己控制线程数

ForkJoinPool pool = new ForkJoinPool(2);
Long result = pool.submit(() -> LongStream.range(1, 10)
.parallel()
.map(x -> x + 1)
.filter(x -> x < 5)
.reduce((x,y) -> x+y)
.getAsLong()
).get();
System.out.println(result);

4、测试,Benchmark

1、JAVA版本

​ java version "1.8.0_131"

2、机器的配置

​ 处理器:1.4GHz Intel Core i5

​ 内存:8GB 1600 MHz DDR3

3、Benchmark配置

​ 2 个JVM、5 次预热迭代和 5 次测量迭代来测试平均时间

4、检验的方法:

普通for循环

public int forMaxInteger() {
int max = Integer.MIN_VALUE;
for (int i = 0; i < size; i++) {
max = Math.max(max, integers.get(i));
}
return max;
}

简写for循环(forEach)

public int forMaxSimpleInteger() {
int max = Integer.MIN_VALUE;
for (Integer n : integers) {
max = Math.max(max, n);
}
return max;
}

iterator循环

public int iteratorMaxInteger() {
int max = Integer.MIN_VALUE;
for (Iterator<Integer> it = integers.iterator(); it.hasNext(); ) {
max = Math.max(max, it.next());
}
return max;
}

forEach+Lambda

public int forEachLambdaMaxInteger() {
final Wrapper wrapper = new Wrapper();
wrapper.inner = Integer.MIN_VALUE;
integers.forEach(i -> helper(i, wrapper));
return wrapper.inner.intValue();
} public static class Wrapper {
public Integer inner;
} private int helper(int i, Wrapper wrapper) {
wrapper.inner = Math.max(i, wrapper.inner);
return wrapper.inner;
}

stream

public int streamMaxInteger() {
OptionalInt max = integers.stream().mapToInt(i->i.intValue()).max();
return max.getAsInt();
}

parallelStream

public int parallelStreamMaxInteger() {
OptionalInt max = integers.parallelStream().mapToInt(i->i.intValue()).max();
return max.getAsInt();
}

5、测试结果

1、找到最大的数

1、10万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark.forEachLambdaMaxInteger avgt 10 0.703 ± 0.024 ms/op
StreamBenchmark.forMaxSimpleInteger avgt 10 0.148 ± 0.003 ms/op
StreamBenchmark.forMaxInteger avgt 10 0.135 ± 0.005 ms/op
StreamBenchmark.iteratorMaxInteger avgt 10 0.150 ± 0.003 ms/op
StreamBenchmark.parallelStreamMaxInteger avgt 10 0.186 ± 0.002 ms/op
StreamBenchmark.streamMaxInteger avgt 10 0.353 ± 0.006 ms/op
2、100万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark.forEachLambdaMaxInteger avgt 10 8.870 ± 0.094 ms/op
StreamBenchmark.forMaxSimpleInteger avgt 10 1.870 ± 0.036 ms/op
StreamBenchmark.forMaxInteger avgt 10 1.979 ± 0.034 ms/op
StreamBenchmark.iteratorMaxInteger avgt 10 1.890 ± 0.065 ms/op
StreamBenchmark.parallelStreamMaxInteger avgt 10 1.895 ± 0.297 ms/op
StreamBenchmark.streamMaxInteger avgt 10 3.738 ± 0.087 ms/op
3、1000万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark.forEachLambdaMaxInteger avgt 10 84.733 ± 1.989 ms/op
StreamBenchmark.forMaxSimpleInteger avgt 10 20.063 ± 0.559 ms/op
StreamBenchmark.forMaxInteger avgt 10 21.301 ± 0.712 ms/op
StreamBenchmark.iteratorMaxInteger avgt 10 19.838 ± 0.585 ms/op
StreamBenchmark.parallelStreamMaxInteger avgt 10 15.481 ± 0.677 ms/op
StreamBenchmark.streamMaxInteger avgt 10 37.521 ± 0.689 ms/op

2、累加

1、10万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark.forEachLambdaMaxInteger avgt 10 0.840 ± 0.275 ms/op
StreamBenchmark.forMaxInteger avgt 10 0.139 ± 0.012 ms/op
StreamBenchmark.forMaxSimpleInteger avgt 10 0.177 ± 0.017 ms/op
StreamBenchmark.iteratorMaxInteger avgt 10 0.172 ± 0.012 ms/op
StreamBenchmark.parallelStreamMaxInteger avgt 10 0.126 ± 0.080 ms/op
StreamBenchmark.streamMaxInteger avgt 10 0.715 ± 0.008 ms/op
2、100万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark.forEachLambdaMaxInteger avgt 10 11.053 ± 1.540 ms/op
StreamBenchmark.forMaxInteger avgt 10 1.882 ± 0.194 ms/op
StreamBenchmark.forMaxSimpleInteger avgt 10 1.860 ± 0.038 ms/op
StreamBenchmark.iteratorMaxInteger avgt 10 1.892 ± 0.039 ms/op
StreamBenchmark.parallelStreamMaxInteger avgt 10 2.407 ± 1.767 ms/op
StreamBenchmark.streamMaxInteger avgt 10 2.868 ± 3.522 ms/op
3、1000万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark.forEachLambdaMaxInteger avgt 10 91.385 ± 14.993 ms/op
StreamBenchmark.forMaxInteger avgt 10 13.175 ± 0.188 ms/op
StreamBenchmark.forMaxSimpleInteger avgt 10 16.285 ± 0.466 ms/op
StreamBenchmark.iteratorMaxInteger avgt 10 15.999 ± 0.244 ms/op
StreamBenchmark.parallelStreamMaxInteger avgt 10 29.746 ± 0.251 ms/op
StreamBenchmark.streamMaxInteger avgt 10 10.196 ± 0.194 ms/op

3、模拟数据处理

1、10万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark3.forEachLambdaTrans avgt 10 3.100 ± 0.169 ms/op
StreamBenchmark3.forTrans avgt 10 2.863 ± 0.204 ms/op
StreamBenchmark3.forTransSimple avgt 10 2.667 ± 0.126 ms/op
StreamBenchmark3.iteratorTrans avgt 10 2.648 ± 0.140 ms/op
StreamBenchmark3.parallelStreamTrans avgt 10 2.118 ± 0.058 ms/op
StreamBenchmark3.streamTrans avgt 10 2.896 ± 0.049 ms/op
2、100万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark3.forEachLambdaTrans avgt 10 37.726 ± 7.249 ms/op
StreamBenchmark3.forTrans avgt 10 31.871 ± 1.802 ms/op
StreamBenchmark3.forTransSimple avgt 10 30.901 ± 1.921 ms/op
StreamBenchmark3.iteratorTrans avgt 10 31.023 ± 0.876 ms/op
StreamBenchmark3.parallelStreamTrans avgt 10 25.768 ± 0.985 ms/op
StreamBenchmark3.streamTrans avgt 10 31.347 ± 1.519 ms/op
3、1000万数据
Benchmark Mode Cnt Score Error Units
StreamBenchmark3.forEachLambdaTrans avgt 10 3171.935 ± 195.461 ms/op
StreamBenchmark3.forTrans avgt 10 3088.757 ± 373.870 ms/op
StreamBenchmark3.forTransSimple avgt 10 3073.300 ± 224.154 ms/op
StreamBenchmark3.iteratorTrans avgt 10 3083.537 ± 223.975 ms/op
StreamBenchmark3.parallelStreamTrans avgt 10 3347.938 ± 485.051 ms/op
StreamBenchmark3.streamTrans avgt 10 3203.518 ± 357.881 ms/op

4、影响并行流的主要五个因素

1、数据大小

​ 输入数据的大小会影响并行化处理,当只有足够大、每个数据处理管道花费的时间足够多时,并行化才有意义

2、源数据结构

​ 一般都是基于集合进行并行化

3、装箱

​ 处理基本类型比处理装箱类型要快

4、核的数量

​ 只有在多核的机器上使用才有意义,并且是运行时能够使用的多核

5、单元处理开销

​ 原先处理耗时较长,使用并行化才有意义

5、资料:

1、http://ifeve.com/stream

2、http://lvheyang.com/?p=87

3、http://www.cnblogs.com/CarpenterLee/p/6637118.html


转载请标明出处:http://www.cnblogs.com/MoEee/p/6490573.html