|
| 1 | +# Lambda and Streams |
| 2 | + |
| 3 | +你可能还没意识到Java对Lambda表达式的重要程度,看看Java 8加入函数式编程扩充多少类就清楚了。Java 8之所以费这么大功夫引入函数式编程,原因有二: |
| 4 | + |
| 5 | +1. __代码简洁__,函数式编程写出的代码简洁且意图明确,使用*stream*接口让你从此告别*for*循环。 |
| 6 | +2. __多核友好__,Java函数式编程使得编写并行程序从未如此简单,你需要的全部就是调用一下`parallel()`方法。 |
| 7 | + |
| 8 | +这一节我们要学习*stream*,也就是Java函数式编程的主角。对于Java 7来说*stream*完全是个陌生东西,*stream*并不是某种数据结构,它只是数据源的一种视图。这里的数据源可以是一个数组,Java容器或I/O channel等。正因如此要得到一个*stream*通常不会手动创建,而是调用对应的工具方法,比如: |
| 9 | + |
| 10 | +- 调用`Collection.stream()`或者`Collection.parallelStream()`方法 |
| 11 | +- 调用`Arrays.stream(T[] array)`方法 |
| 12 | + |
| 13 | +常见的*stream*接口继承关系下如: |
| 14 | + |
| 15 | +<img src="./Figures/Java_stream_Interfaces.png" width="400px" alt="Java_stream_Interfaces"/> |
| 16 | + |
| 17 | +上图中4种*stream*接口继承自`BaseStream`,其中`IntStream, LongStream, DoubleStream`对应三种基本类型(`int, long, double`,注意不是包装类型),*stream*对应所有剩余类型的*stream*视图。为不同数据类型设置不同*stream*接口,可以1.提高性能,2.增加特定接口函数。 |
| 18 | + |
| 19 | +<img src="./Figures/WRONG_Java_stream_Interfaces.png" width="400px" alt="WRONG_Java_stream_Interfaces"/> |
| 20 | + |
| 21 | +你可能会奇怪为什么不把`IntStream`等设计成`Stream`的子接口?毕竟这接口中的方法名大部分是一样的。答案是这些方法的名字虽然相同,但是返回类型不同,如果设计成父子接口关系,这些方法将不能共存,因为Java不允许只有返回类型不同的方法重载。 |
| 22 | + |
| 23 | +虽然大部分情况下*stream*是容器调用`Collection.stream()`方法得到的,但*stream*和*collections*有一下不同: |
| 24 | + |
| 25 | +- **无存储**。*stream*不是一种数据结构,它只是某种数据源的一个视图,数据源可以是一个数组,Java容器或I/O channel等。 |
| 26 | +- **为函数式编程而生**。对*stream*的任何修改都不会修改背后的数据源,比如对*stream*执行过滤操作并不会删除被过滤的元素,而是会产生一个不包含被过滤元素的新*stream*。 |
| 27 | +- **惰式执行**。*stream*上的操作并不会立即执行,只有等到用户真正需要结果的时候才会执行。 |
| 28 | +- **可消费性**,*stream*只能被“消费”一次,一旦遍历过就会失效,就像容器的迭代器那样,想要再次遍历必须重新生成。 |
| 29 | + |
| 30 | +对*stream*的操作分为为两类,**中间操作(*intermediate operations*)和结束操作(*terminal operations*)**,二者特点是: |
| 31 | + |
| 32 | +1. __中间操作总是会惰式执行__,调用中间操作只会生成一个标记了该操作的新*stream*,仅此而已。 |
| 33 | +2. __结束操作会触发实际计算__,计算发生时会把所有中间操作积攒的操作以*pipeline*的方式执行,这样可以减少迭代次数。计算完成之后*stream*就会失效。 |
| 34 | + |
| 35 | +如果你熟悉Apache Spark RDD,对*stream*的这个特点应该不陌生。 |
| 36 | + |
| 37 | +下表汇总了`Stream`接口的部分常见方法: |
| 38 | + |
| 39 | +|操作类型|接口方法| |
| 40 | +|--------|--------| |
| 41 | +|中间操作|concat() distinct() filter() flatMap() limit() map() peek() <br> skip() sorted() parallel() sequential() unordered()| |
| 42 | +|结束操作|allMatch() anyMatch() collect() count() findAny() findFirst() <br> forEach() forEachOrdered() max() min() noneMatch() reduce() toArray()| |
| 43 | + |
| 44 | +区分中间操作和结束操作最简单的方法,就是看方法的返回值,如果返回值是*stream*的是中间操作,否则是结束操作。 |
| 45 | + |
| 46 | +## stream方法使用 |
| 47 | + |
| 48 | +*stream*跟函数接口关系非常紧密,没有函数接口*stream*就无法工作。回顾一下:__函数接口是指内部只有一个抽象方法的接口__。通常函数接口出现的地方都可以使用Lambda表达式,所以不必记忆函数接口的名字。 |
| 49 | + |
| 50 | +### forEach() |
| 51 | + |
| 52 | +我们对`forEach()`方法并不陌生,在`Collection`中我们已经见过。方法签名为`void forEach(Consumer<? super E> action)`,作用是对容器中的每个元素执行`action`指定的动作,也就是对元素进行遍历。 |
| 53 | + |
| 54 | +```Java |
| 55 | +// 使用Stream.forEach()迭代 |
| 56 | +Stream<String> stream = Stream.of("I", "love", "you", "too"); |
| 57 | +stream.forEach(str -> System.out.println(str)); |
| 58 | +``` |
| 59 | +由于`forEach()`是结束方法,上述代码会立即执行,输出所有字符串。 |
| 60 | + |
| 61 | +### filter() |
| 62 | + |
| 63 | +函数原型为`Stream<T> filter(Predicate<? super T> predicate)`,作用是返回一个只包含满足`predicate`条件元素的`Stream`。 |
| 64 | + |
| 65 | +```Java |
| 66 | +// 保留长度>3的字符串 |
| 67 | +Stream<String> stream= Stream.of("I", "love", "you", "too"); |
| 68 | +stream.filter(str -> str.length()==3) |
| 69 | + .forEach(str -> System.out.println(str)); |
| 70 | +``` |
| 71 | +<img src="./Figures/Stream.filter.png" width="300px" alt="Stream filter"/> |
| 72 | + |
| 73 | +上述代码将输出为长度等于3的字符串`you`和`too`。注意,由于`filter()`是个中间操作,如果只调用`filter()`不会有实际计算,因此也不会输出任何信息。 |
| 74 | + |
| 75 | +### distinct() |
| 76 | + |
| 77 | +函数原型为`Stream<T> distinct()`,作用是返回一个去除重复元素之后的`Stream`。 |
| 78 | + |
| 79 | +```Java |
| 80 | +Stream<String> stream= Stream.of("I", "love", "you", "too", "too"); |
| 81 | +stream.distinct() |
| 82 | + .forEach(str -> System.out.println(str)); |
| 83 | +``` |
| 84 | + |
| 85 | +上述代码会输出去掉一个`too`之后的其余字符串。 |
| 86 | + |
| 87 | +### sorted() |
| 88 | + |
| 89 | +排序函数有两个,一个是用自然顺序排序,一个是使用自定义比较器排序,函数原型分别为`Stream<T> sorted()`和`Stream<T> sorted(Comparator<? super T> comparator)`。 |
| 90 | + |
| 91 | +```Java |
| 92 | +Stream<String> stream= Stream.of("I", "love", "you", "too"); |
| 93 | +stream.sorted((str1, str2) -> str1.length()-str2.length()) |
| 94 | + .forEach(str -> System.out.println(str)); |
| 95 | +``` |
| 96 | + |
| 97 | +上述代码将输出按照长度升序排序后的字符串,结果完全在预料之中。 |
| 98 | + |
| 99 | +### map() |
| 100 | + |
| 101 | +函数原型为`<R> Stream<R> map(Function<? super T,? extends R> mapper)`,作用是返回一个包含对当前*stream*执行*mapper*指定的方法之后的元素组成的`Stream`。 |
| 102 | + |
| 103 | +```Java |
| 104 | +Stream<String> stream = Stream.of("I", "love", "you", "too"); |
| 105 | +stream.map(str -> str.toUpperCase()) |
| 106 | + .forEach(str -> System.out.println(str)); |
| 107 | +``` |
| 108 | +上述代码将输出源字符串的大写形式。 |
| 109 | + |
| 110 | +### flatMap() |
| 111 | + |
| 112 | +函数原型为`<R> Stream<R> flatMap(Function<? super T,? extends Stream<? extends R>> mapper)`,作用是对每个元素执行`mapper`指定的操作,并用所有`mapper`返回的`Stream`中的元素组成一个新的`Stream`作为最终分会结果。说起来太拗口,通俗的讲`flatMap()`的作用就相当于把原*strem*中的所有元素都"压平"之后组成的`Stream`。 |
| 113 | + |
| 114 | +```Java |
| 115 | +Stream<List<Integer>> stream = Stream.of(Arrays.asList(1,2), Arrays.asList(3, 4, 5)); |
| 116 | +stream.flatMap(list -> list.stream()) |
| 117 | + .forEach(i -> System.out.println(i)); |
| 118 | +``` |
| 119 | + |
| 120 | +上述代码中,原来的`stream`中有两个元素,分别是两个`List<Integer>`,执行`flatMap()`之后,将每个`List`都“压扁”成了一个个的数字,所以会新产生一个由5个数字组成的`Stream`。所以最终将输出1~5这5个数字。 |
| 121 | + |
| 122 | + |
| 123 | + |
| 124 | + |
| 125 | + |
| 126 | + |
| 127 | + |
| 128 | + |
| 129 | + |
| 130 | + |
| 131 | + |
| 132 | + |
| 133 | + |
| 134 | + |
| 135 | + |
| 136 | + |
0 commit comments