Java 8 新特性之并行流与串行流

Reading time ~1 minute

1. 概述

1.1 简介

并行流就是把一个内容分成多个数据块,并用不同的线程分别处理每个数据块的流

Java 8 中将并行进行了优化,我们可以很容易的对数据进行并行操作,Stream API 可以声明性地通过 parallel()sequential() 在并行流与顺序流之间进行切换。

1.2 了解 Fork/Join 框架

Fork/Join 框架就是在必要的情况下,将一个大任务,进行拆分(fork)成若干个小任务(拆到不可再拆是),再将一个个的小任务运算的结果进行 join 汇总

Java 8

1.3 Fork/Join 框架与传统线程池的区别

采用“工作窃取”模式(work-stealing) : 当执行新的任务时它可以将其拆分分成更小的任务执行,并将小任务加到线程队列中,然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。

相对于一般的线程池实现,Fork/Join 框架的优势体现在对其中包含的任务的处理方式上。在一般的线程池中,如果一个线程正在执行的任务由于某些原因无法继续运行,那么该线程会处于等待状态。而在 Fork/Join 框架实现中,如果某个子问题由于等待另外一个子问题的完成而无法继续运行。那么处理该子问题的线程会主动寻找其他尚未运行的子问题来执行。这种方式减少了线程的等待时间,提高了性能。

2. Fork/Join 使用

这里我们的需求是对 0 到一亿进行累加操作,下面是 Fork/Join 的处理方法

public class ForkJoinCalculate extends RecursiveTask<Long> {

    private long start;
    private long end;

    private static final long THRESHOLD = 10000L; //临界值

    public ForkJoinCalculate(long start, long end) {
        this.start = start;
        this.end = end;
    }

    @Override
    protected Long compute() {
        long length = end - start;

        if (length <= THRESHOLD) {
            long sum = 0;

            for (long i = start; i <= end; i++) {
                sum += i;
            }

            return sum;
        } else {
            long middle = (start + end) / 2;

            ForkJoinCalculate left = new ForkJoinCalculate(start, middle);
            left.fork(); //拆分,并将该子任务压入线程队列

            ForkJoinCalculate right = new ForkJoinCalculate(middle + 1, end);
            right.fork();

            return left.join() + right.join();
        }
    }
}

测试方法

@Test
public void test1(){
    long start = System.currentTimeMillis();

    ForkJoinPool pool = new ForkJoinPool();
    ForkJoinTask<Long> task = new ForkJoinCalculate(0L, 100000000L);

    long sum = pool.invoke(task);
    System.out.println(sum);

    long end = System.currentTimeMillis();

    System.out.println("耗费的时间为: " + (end - start));
}

3. Java 8 使用并行流

其实 Java 8 的并行流底层使用的就是 Fork/Join 框架,但是它帮我们简化了操作

@Test
public void test3(){
    long start = System.currentTimeMillis();

    Long sum = LongStream.rangeClosed(0L, 100000000L)
            .parallel()
            .sum();

    System.out.println(sum);

    long end = System.currentTimeMillis();

    System.out.println("耗费的时间为: " + (end - start));
}

4. 并行流线程安全问题

Java8 并行流 ParallelStreamStream 的区别就是支持并行执行,提高程序运行效率。但是如果使用不当可能会发生线程安全的问题。Demo如下:

@Test
public void t21() {
    List<Integer> list = new ArrayList<>();
    list.add(1);
    list.add(7);
    list.add(8);
    list.add(2);
    list.add(9);
    list.add(5);
    list.add(10);
    list.add(13);
    list.add(3);
    list.add(12);
    list.add(6);
    list.add(4);
    list.add(11);

    System.out.print("串行流执行结果 : ");
    list.stream().sorted().forEach(x -> System.out.print(x + " "));
    System.out.println("");
    
    System.out.print("并行流执行结果 : ");
    list.parallelStream().sorted().forEach(x -> System.out.print(x + " "));
}

结果如下 :

串行流执行结果 : 1 2 3 4 5 6 7 8 9 10 11 12 13 
并行流执行结果 : 4 2 3 1 6 5 11 10 12 13 7 9 8 

并行流输出的结果并不是我们期待输出的结果,这是由于在并行情况下,会出现线程安全问题

可以使用最后调用 collect(Collectors.toList()) 的方式,这种收集起来所有元素到新集合是线程安全的。

List<Integer> collect = list.parallelStream().sorted().collect(Collectors.toList());
System.out.print("并行流toList执行结果 : ");
collect.forEach(x -> System.out.print(x + " "));

转载请注明出处:
文章地址:Java 8 新特性之并行流与串行流
文章作者:凌风
原始连接:https://lingfeng.me/blog/java/java8-parallel/
许可协议:转载请注明原文链接及作者。

HomeBrew 安装及常用命令

HomeBrew 是 Mac OSX 上的软件包管理工具,能在 Mac 中方便的安装软件或者卸载软件, 使用命令,非常方便。 Continue reading