Java 丟了好多年,最近在揀起來(lái),首先當(dāng)然是了解這么多年來(lái)它的變化,于是發(fā)現(xiàn)了 Java 8 的
java.util.stream
。在學(xué)習(xí)和試驗(yàn)的過(guò)程中,相比較于 C# 和 javascript,有那么些心得,作文以記之。早些時(shí)間寫(xiě)過(guò)一篇《ES6 的 for..of 和 Generator,從偽數(shù)組 jQuery 對(duì)象說(shuō)起》,和這個(gè)主題有點(diǎn)關(guān)系。其實(shí)我記得還有一篇講 C# 的,沒(méi)找到,也許只是想過(guò),沒(méi)寫(xiě)成,成了虛假記憶。
之所以把 C#、JavaScript 和 Java 三種語(yǔ)言的實(shí)現(xiàn)寫(xiě)在一起,主要是為了放在一起有一個(gè)類(lèi)比,可能會(huì)有助于理解。
C# 的集合數(shù)據(jù)基類(lèi)是 Collection<T>,它實(shí)現(xiàn)了 ICollection<T>接口,而 ICollection<T>
又從 IEnumerable<T> 接口繼承——實(shí)際上要討論的內(nèi)容都基于 IEnumerable<T>
接口。另外還有一個(gè)非泛型的 IEnumerable
接口,不過(guò)建議大家盡量使用泛型,所以這個(gè)非泛型的接口就當(dāng)我沒(méi)說(shuō)。順便提一句,數(shù)組也是實(shí)現(xiàn)了 IEnumerable<T>
接口的。System.Linq
中提供的擴(kuò)展大大方便了集合處理過(guò)程。
JavaScript 最常見(jiàn)的集合數(shù)據(jù)類(lèi)型就是數(shù)組,自 ES6 發(fā)布以后,這個(gè)范圍擴(kuò)展到了 iterable 對(duì)象。不過(guò)這里要討論的內(nèi)容都是在 Array.prototype 中實(shí)現(xiàn)的。除此之外,underscore、lodash 這些第三方庫(kù)中也實(shí)現(xiàn)了很多集合數(shù)據(jù)處理的方法,但不在本文討論內(nèi)容之內(nèi)。
Java 的集合類(lèi)型由 Collection<E> 接口定義。本文討論的內(nèi)容是 Java 8 的特性,在 java.util.stream
包中實(shí)現(xiàn),由 Collection<E>.stream()
引入。
后面示例中的部分 C# 語(yǔ)句可能需要支持 6.0 語(yǔ)言版本的編譯器,如 Visual Studio 2015 或者 Visual Studio "15"
JavaScript 代碼都使用了 ES6 語(yǔ)法,目前大部分瀏覽器支持,Node 5 也完全支持。
Java 要求 Java 8(或 1.8)版本
給定一個(gè)名稱(chēng)列表,數(shù)組類(lèi)型, ["Andy", "Jackson", "Yoo"]
,要求遍歷出到的控制臺(tái)。
對(duì)于集合來(lái)說(shuō),最常用的就是遍歷,不過(guò) for
,foreach
, while
之類(lèi)大家都耳熟能詳了,不再多說(shuō)。這里說(shuō)的是 forEach()
方法。
很遺憾,C# 的 Linq 擴(kuò)展 里沒(méi)有提供 ForEach()
方法,不過(guò) All(IEnumerable<T>, Func<T, Boolean>)
和 Any(IEnumerable<T>, Func<T, Boolean>)
都可以代替。這兩個(gè)方法的區(qū)別就在于第二個(gè)參數(shù) Func<T, Boolean>
的返回值。這兩個(gè)方法都會(huì)遍歷集合,對(duì)集合中的每個(gè)元素依次調(diào)用第二個(gè)參數(shù),Func<T, Boolean>
所指的委托方法,并檢查其返回值,All()
檢查到 false
中止遍歷,而 Any()
檢查到 true
中止遍歷。
All()
的意思是,所有元素都符合條件則返回true
,所有只要有一個(gè)不符合條件,返回了false
,則中止遍歷,返回false
;Any()
的意思是只要發(fā)現(xiàn)有元素符合條件則返回true
。
Func<T, Boolean>
是一個(gè)公用委托。Func<...>
系列公用委托都用于委托帶有返回值的的方法,所有Func<..., TResult>
都是最后一個(gè)參數(shù)TResult
代表返回值類(lèi)型。
因此,C# 的遍歷輸出可以這樣實(shí)現(xiàn)
string[] names = { "Andy", "Jackson", "Yoo" };
names.All(name => {
Console.WriteLine(name);
return true;
});
string[] names = { "Andy", "Jackson", "Yoo" };
names.Any(name => {
Console.WriteLine(name);
return false;
});
有 Lambda 就是好
JavaScript 的 Array 實(shí)現(xiàn)了 forEach
實(shí)例方法,即 Array.prototype.forEach()。
對(duì)于 JavaScript 的數(shù)組,可以這樣遍歷
var names = ["Andy", "Jackson", "Yoo"];
names.forEach(name => {
console.log(name);
});
對(duì)于 JavaScript 的偽數(shù)組,可以這樣
var names = {
0: "Andy",
1: "Jackson",
2: "Yoo",
length: 3
};
[].forEach.call(names, name => {
console.log(name);
});
jQuery 是一個(gè)常用的 JavaScript 庫(kù),它封裝的對(duì)象都是基于偽數(shù)組的,所以 jQuery 中經(jīng)常用到遍歷。除了網(wǎng)頁(yè)元素集合外,jQuery 也可以遍歷普通數(shù)組,有兩種方式
可以直接把數(shù)組作為第一個(gè)參數(shù),處理函數(shù)作為第二個(gè)參數(shù)調(diào)用 $.each()
。
const names = ["Andy", "Jackson", "Yoo"];
$.each(names, (i, name) => {
console.log(name);
});
也可以把數(shù)組封裝成一個(gè) jQuery 對(duì)象($(names)
),再在這個(gè) jQuery 對(duì)象上調(diào)用 eash()
方法。
const names = ["Andy", "Jackson", "Yoo"];
$(names).each((i, name) => {
console.log(name);
});
兩種方法的處理函數(shù)都一樣,但是要注意,這和原生 forEach()
的處理函數(shù)有點(diǎn)不同。jQuery 的 each()
處理函數(shù),第一個(gè)參數(shù)是序號(hào),第二個(gè)參數(shù)是數(shù)組元素;而原生 forEach()
的處理函數(shù)正好相反,第一個(gè)參數(shù)是數(shù)組元素,第二個(gè)參數(shù)才是序號(hào)。
另外,$.each()
對(duì)偽數(shù)組同樣適用,不需要通過(guò) call()
來(lái)調(diào)用。
String[] names = { "Andy", "Jackson", "Yoo" };
List<String> list = Arrays.asList(names);
list.forEach(name -> {
System.out.println(name);
});
給出一組整數(shù),需要將其中能被 3 整除選出來(lái)
[46, 74, 20, 37, 98, 93, 98, 48, 33, 15]
期望結(jié)果
[93, 48, 33, 15]
Where()
擴(kuò)展int[] data = { 46, 74, 20, 37, 98, 93, 98, 48, 33, 15 };
int[] result = data.Where(n => n % 3 == 0).ToArray();
注意:Where()
的結(jié)果即不是數(shù)組也不是 List,需要通過(guò) ToArray()
生成數(shù)組,或者通過(guò) ToList()
生成列表。Linq 要在 ToArray()
或者 ToList()
或者其它某些操作的時(shí)候才會(huì)真正遍歷,依次執(zhí)行 Where()
參數(shù)提供的那個(gè)篩選函數(shù)。
const data = [46, 74, 20, 37, 98, 93, 98, 48, 33, 15];
const result = data.filter(n => {
return n % 3 === 0;
});
Java 中可以通過(guò) java.util.stream.IntStream.of()
來(lái)從數(shù)組生成 stream 對(duì)象
final int[] data = { 46, 74, 20, 37, 98, 93, 98, 48, 33, 15 };
int[] result = IntStream.of(data)
.filter(n -> n % 3 == 0)
.toArray();
需要注意的是,Arrays.asList(data).stream()
看起來(lái)也可以生成 stream 對(duì)象,但是通過(guò)調(diào)試會(huì)發(fā)現(xiàn),這是一個(gè) Stream<int[]>
而不是 Stream<Integer>
。原因是 asList(T ...a)
其參數(shù)可變參數(shù),而且要求參數(shù)類(lèi)型是類(lèi),所以 asList(data)
是把 data
作為一個(gè) int[]
類(lèi)型參數(shù)而不是 int
類(lèi)型的參數(shù)數(shù)據(jù)。如果要從 int[]
生成 List<Integer>
,還得通過(guò) IntStream
來(lái)處理
List<Integer> list = IntStream.of(data)
.boxed()
.collect(Collectors.toList());
映射處理是指將某種類(lèi)型的集合,將其元素依次映射成另一種類(lèi)型,產(chǎn)生一個(gè)新類(lèi)型的集合。新集合中的每個(gè)元素都與原集中的同樣位置的元素有對(duì)應(yīng)關(guān)系。
這里提出一個(gè)精典的問(wèn)題:成績(jī)轉(zhuǎn)等級(jí),不過(guò)為了簡(jiǎn)化代碼(switch 或多重 if 語(yǔ)句代碼比較長(zhǎng)),改為判斷成績(jī)是否及格,60 分為及格線。
偷個(gè)懶,就用上個(gè)問(wèn)題的輸入 [46, 74, 20, 37, 98, 93, 98, 48, 33, 15]
,
期望結(jié)果:
["REJECT","PASS","REJECT","REJECT","PASS","PASS","PASS","REJECT","REJECT","REJECT"]
Select()
來(lái)進(jìn)行映射處理。int[] scores = { 46, 74, 20, 37, 98, 93, 98, 48, 33, 15 };
string[] levels = scores
.Select(score => score >= 60 ? "PASS" : "REJECT")
.ToArray();
const scores = [46, 74, 20, 37, 98, 93, 98, 48, 33, 15];
const levels = scores.map(score => {
return score >= 60 ? "PASS" : "REJECT";
});
mapToObj()
等方法處理映射final int[] scores = { 46, 74, 20, 37, 98, 93, 98, 48, 33, 15 };
String[] levels = IntStream.of(scores)
.mapToObj(score -> score >= 60 ? "PASS" : "REJECT")
.toArray(String[]::new);
與“篩選”示例不同,在“篩選”示例中,由于篩選結(jié)果是 IntStream
,可以直接調(diào)用 InStream::toArray()
來(lái)得到 int[]
。
但在這個(gè)示例中,mapToObj()
得到的是一個(gè) Stream<String>
,類(lèi)型擦除后就是 Stream
,所以 Stream::toArray()
默認(rèn)得到的是一個(gè) Object[]
而不是 String[]
。如果想得到 String[]
,需要為 toArray()
指定 String[]
的構(gòu)造函數(shù),即 String[]::new
。
查找表在數(shù)據(jù)結(jié)構(gòu)里的意義還是比較寬的,其中通過(guò)哈希算法實(shí)現(xiàn)的稱(chēng)為哈希表。C# 中通常是用 Directory<T>
,不過(guò)它是不是通過(guò)哈希實(shí)現(xiàn)我就不清楚了。不過(guò) Java 中的 HashMap
和 Hashtable
,從名稱(chēng)就看得出來(lái)是實(shí)現(xiàn)。JavaScript 的字面對(duì)象據(jù)稱(chēng)也是哈希實(shí)現(xiàn)。
現(xiàn)在有一個(gè)姓名列表,是按學(xué)號(hào)從 1~7 排列的,需要建立一個(gè)查找到,使之能通過(guò)姓名很容易找到對(duì)應(yīng)的學(xué)號(hào)。
["Andy", "Jackson", "Yoo", "Rose", "Lena", "James", "Stephen"]
期望結(jié)果
Andy => 1
Jackson => 2
Yoo => 3
Rose => 4
Lena => 5
James => 6
Stephen => 7
string[] names = { "Andy", "Jackson", "Yoo", "Rose", "Lena", "James", "Stephen" };
int i = 1;
Dictionary<string, int> map = names.ToDictionary(n => n, n => i++);
C# Linq 擴(kuò)展提供的若干方法都沒(méi)有將序號(hào)傳遞給處理函數(shù),所以上例中采用了臨時(shí)變量計(jì)數(shù)的方式來(lái)進(jìn)行。不過(guò)有一個(gè)看起來(lái)好看一點(diǎn)的辦法,用 Enumerable.Range() 先生成一個(gè)序號(hào)的序列,再基于這個(gè)序列來(lái)處理
string[] names = { "Andy", "Jackson", "Yoo", "Rose", "Lena", "James", "Stephen" };
IEnumerable<int> indexes = Enumerable.Range(0, names.Length);
Dictionary<string, int> map = indexes.ToDictionary(i => names[i], i => i + 1);
JavaScript 沒(méi)有提供從 []
到 {}
的轉(zhuǎn)換函數(shù),不過(guò)要做這個(gè)轉(zhuǎn)換也不是好麻煩,用 forEach
遍歷即可
var map = (function() {
var m = {};
names.forEach((name, i) => {
m[name] = i + 1;
});
return m;
})();
為了不讓臨時(shí)變量污染外面的作用域,上面的示例中采用了 IEFE 的寫(xiě)法。不過(guò),如果用 Array.prototype.reduce 則可以讓代碼更簡(jiǎn)潔一些
var map = names.reduce((m, name, i) => {
m[name] = i + 1;
return m;
}, {});
Java 的處理函數(shù)也沒(méi)有傳入序號(hào),所以在 Java 中的實(shí)例和 C# 類(lèi)似。不過(guò),第一種方法不可用,因?yàn)?Java Lambda 的實(shí)現(xiàn)相當(dāng)于是匿名類(lèi)對(duì)接口的實(shí)現(xiàn),只能訪問(wèn)局部的 final
變量,i
要執(zhí)行 i++
操作,顯然不是 final
的,所以只能用第二種辦法
final String[] names = { "Andy", "Jackson", "Yoo", "Rose", "Lena", "James", "Stephen" };
Map<String, Integer> map = IntStream.range(0, names.length)
.boxed()
.collect(Collectors.toMap(i -> names[i], i -> i + 1));
我只能說(shuō)
.boxed()
是個(gè)大坑啊,一定要記得調(diào)。
匯總處理就是合計(jì)啊,平均數(shù)啊之類(lèi)的,使用方式都差不多,所以以合計(jì)(Sum)為例。
匯總處理其實(shí)是聚合處理的一個(gè)特例,所以就同一個(gè)問(wèn)題,再用普通的聚合處理方式再實(shí)現(xiàn)一次。
已知全班成績(jī),求班總分,再次用到了那個(gè)數(shù)組
[46, 74, 20, 37, 98, 93, 98, 48, 33, 15]
期望結(jié)果:562
C# 可以直接使用 Sum()
方法求和
int[] scores = { 46, 74, 20, 37, 98, 93, 98, 48, 33, 15 };
int sum = scores.Sum();
聚合實(shí)現(xiàn)方式(用 Aggregate()
)
int[] scores = { 46, 74, 20, 37, 98, 93, 98, 48, 33, 15 };
int sum = scores.Aggregate(0, (total, score) => {
return total + score;
});
聚合實(shí)現(xiàn)方式要靈活得多,比如,改成乘法就可以算階乘。當(dāng)然用于其它更復(fù)雜的情況也不在話下。前面生成查找表的 JavaScript 部分就是采用聚合來(lái)實(shí)現(xiàn)的。
const scores = [46, 74, 20, 37, 98, 93, 98, 48, 33, 15];
const sum = scores.reduce((total, score) => {
return total + score;
}, 0);
注意 C# 的初始值在前,JavaScript 的初始值在后,這是有區(qū)別的。參數(shù)順序嘛,注意一下就行了。
IntStream
提供了 sum()
方法
final int[] scores = { 46, 74, 20, 37, 98, 93, 98, 48, 33, 15 };
final int sum = IntStream.of(scores).sum();
同樣也可以用 reduce
處理
final int[] scores = { 46, 74, 20, 37, 98, 93, 98, 48, 33, 15 };
final int sum = IntStream.of(scores)
.reduce(0, (total, score) -> total + score);
已知全班 7 個(gè)人,按學(xué)號(hào) 從 1~7 分別是
["Andy", "Jackson", "Yoo", "Rose", "Lena", "James", "Stephen"]
這 7 個(gè)人的成績(jī)按學(xué)號(hào)序,分別是
[66, 74, 43, 93, 98, 88, 83]
有 Student
數(shù)組結(jié)構(gòu)
Student {
number: int
name: string
score: int
}
要求得到全班 7 人的 student 數(shù)組,且該數(shù)組按分?jǐn)?shù)從高到低排序
sealed class Student {
public int Number { get; }
public string Name { get; }
public int Score { get; }
public Student(int number, string name, int score) {
Number = number;
Name = name;
Score = score;
}
public override string ToString() => $"[{Number}] {Name} : {Score}";
}
Student[] students = Enumerable.Range(0, names.Length)
.Select(i => new Student(i + 1, names[i], scores[i]))
.OrderByDescending(s => s.Score)
.ToArray();
注意 C# 中排序有 OrderBy
和 OrderByDescending
兩個(gè)方法,一般情況下只需要給一個(gè)映射函數(shù),從原數(shù)據(jù)里找到要用于比較的數(shù)據(jù)即可使用其 >
、<
等運(yùn)算符進(jìn)行比較。如果比例起來(lái)比較復(fù)雜的,需要提供第二個(gè)參數(shù),一個(gè) IComparer<T>
的實(shí)現(xiàn)
class Student {
constructor(number, name, score) {
this._number = number;
this._name = name;
this._score = score;
}
get number() {
return this._number;
}
get name() {
return this._name;
}
get score() {
return this._score;
}
toString() {
return `[${this.number}] ${this.name} : ${this.score}`;
}
}
const names = ["Andy", "Jackson", "Yoo", "Rose", "Lena", "James", "Stephen"];
const scores = [66, 74, 43, 93, 98, 88, 83];
var students = names
.map((name, i) => new Student(i + 1, name, scores[i]))
.sort((a, b) => {
return b.score - a.score;
});
JavaScript 的排序則是直接給個(gè)比較函數(shù),根據(jù)返回的數(shù)值小于0、等于0或大于0來(lái)判斷是小于、等于還是大于。
final class Student {
private int number;
private String name;
private int score;
public Student(int number, String name, int score) {
this.number = number;
this.name = name;
this.score = score;
}
public int getNumber() {
return number;
}
public String getName() {
return name;
}
public int getScore() {
return score;
}
@Override
public String toString() {
return String.format("[%d] %s : %d", getNumber(), getName(), getScore());
}
}
final String[] names = { "Andy", "Jackson", "Yoo", "Rose", "Lena", "James", "Stephen" };
final int[] scores = { 66, 74, 43, 93, 98, 88, 83 };
Student[] students = IntStream.range(0, names.length)
.mapToObj(i -> new Student(i + 1, names[i], scores[i]))
.sorted((a, b) -> b.getScore() - a.getScore())
.toArray(Student[]::new);
更多建議: