Apache Pig TextLoader()函數(shù)

2018-01-03 07:33 更新

Pig Latin函數(shù) TextLoader() 是一個Load函數(shù),用于以UTF-8格式加載非結(jié)構(gòu)化數(shù)據(jù)。

語法

下面給出了 TextLoader() 函數(shù)的語法。

grunt> TextLoader()

假設(shè)在名為 /data/ 的HDFS目錄中有一個名為 stu_data.txt 的文件,如下所示。

001,Rajiv_Reddy,21,Hyderabad 
002,siddarth_Battacharya,22,Kolkata 
003,Rajesh_Khanna,22,Delhi 
004,Preethi_Agarwal,21,Pune 
005,Trupthi_Mohanthy,23,Bhuwaneshwar 
006,Archana_Mishra,23,Chennai 
007,Komal_Nayak,24,trivendram 
008,Bharathi_Nambiayar,24,Chennai

現(xiàn)在讓我們使用 TextLoader() 函數(shù)加載上述文件。

grunt> details = LOAD 'hdfs://localhost:9000/pig_data/stu_data.txt' USING TextLoader();

你可以使用Dump運算符驗證加載的數(shù)據(jù)。

grunt> dump details;
   
(001,Rajiv_Reddy,21,Hyderabad) 
(002,siddarth_Battacharya,22,Kolkata) 
(003,Rajesh_Khanna,22,Delhi) 
(004,Preethi_Agarwal,21,Pune) 
(005,Trupthi_Mohanthy,23,Bhuwaneshwar) 
(006,Archana_Mishra,23,Chennai) 
(007,Komal_Nayak,24,trivendram) 
(008,Bharathi_Nambiayar,24,Chennai)


以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號