Spark SQL是應(yīng)用于Spark的一個組件,至于它的具體用途,會在本教程當(dāng)中為諸位進行講解。
Apache Spark是一種快速計算的快速集群計算。 它建立在Hadoop MapReduce之上,它擴展了MapReduce模型,以有效地使用更多類型的計算,包括交互式查詢和流處理。 這是一個簡短的教程,解釋Spark SQL編程的基礎(chǔ)。
適用人群
本教程是為期望使用Spark Framework學(xué)習(xí)大數(shù)據(jù)分析基礎(chǔ)知識并成為Spark開發(fā)人員的專業(yè)人士準(zhǔn)備的。 此外,它對于Google Analytics專業(yè)人員和ETL開發(fā)人員也很有用。
學(xué)習(xí)前提
在開始執(zhí)行本教程之前,我們假設(shè)您先前已經(jīng)學(xué)習(xí)了Scala編程,數(shù)據(jù)庫概念和任意Linux操作系統(tǒng)風(fēng)格。
相關(guān)手冊
Scala教程:http://www.o2fo.com/Scala/
SQL教程:http://www.o2fo.com/sql/
Linux教程:http://www.o2fo.com/linux/
JAVA教程:http://www.o2fo.com/java/
拓展閱讀
Spark SQL官方文檔:http://spark.apache.org/docs/latest/sql-programming-guide.html
Spark SQL下載地址:http://spark.apache.org/downloads.html
Spark SQL實例介紹:http://spark.apache.org/examples.html