Teradata 散列算法

2018-01-12 15:00 更新

基于主索引值將行分配給特定的AMP。 Teradata使用散列算法來確定哪個(gè)AMP獲取行。

以下是散列算法的高級圖。

散列算法的高級圖

以下是插入數(shù)據(jù)的步驟。

  • 客戶端提交查詢。

  • 解析器接收查詢并將記錄的PI值傳遞給散列算法。

  • 散列算法散列主索引值,并返回一個(gè)32位數(shù),稱為行散列。

  • 散列算法散列主索引值,并返回一個(gè)32位數(shù),稱為行散列。...

  • BYNET將數(shù)據(jù)發(fā)送到標(biāo)識的AMP。

  • AMP使用32位行散列來定位其磁盤中的行。

  • 如果存在具有相同行散列的任何記錄,則它遞增作為32位數(shù)的唯一性ID。 對于新行散列,唯一性ID分配為1,并在每次插入具有相同行散列的記錄時(shí)遞增。

  • 行散列和唯一性ID的組合稱為行ID。

  • 行ID為磁盤中的每個(gè)記錄。

  • AMP中的每個(gè)表行都按其行ID進(jìn)行邏輯排序。

如何存儲表

表按其行ID(行散列+唯一性id)排序,然后存儲在AMP中。 行ID與每個(gè)數(shù)據(jù)行一起存儲。

行哈希唯一性ID員工不名字
2A01 26112A01 2611...101MikeJames
2A01 26120000 0001104AlexStuart
2A01 26130000 0001102RobertWilliams
2A01 26140000 0001105RobertJames
2A01 26150000 0001103PeterPaul
以上內(nèi)容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號