HBase表格模式經驗法則

2018-03-15 14:05 更新

HBase表格模式經驗法則

在 HBase 中有許多不同的數據集,具有不同的訪問模式和服務級別期望。因此,這些經驗法則只是一個概述。

  • 目標區(qū)域的大小介于10到50 GB之間。
  • 目的是讓單元格不超過10 MB,如果使用 mob,則為50 MB 。否則,請考慮將您的單元格數據存儲在 HDFS 中,并在 HBase 中存儲指向數據的指針。
  • 典型的模式在每個表中有1到3個列族。HBase 表不應該被設計成模擬 RDBMS 表。
  • 對于具有1或2列族的表格,大約50-100個區(qū)域是很好的數字。請記住,區(qū)域是列族的連續(xù)段。
  • 盡可能短地保留列族名稱。列族名稱存儲在每個值 (忽略前綴編碼) 中。它們不應該像在典型的 RDBMS 中一樣具有自我記錄和描述性。
  • 如果您正在存儲基于時間的機器數據或日志記錄信息,并且行密鑰基于設備 ID 或服務 ID 加上時間,則最終可能會出現一種模式,即舊數據區(qū)域在某個時間段之后永遠不會有額外的寫入操作。在這種情況下,最終會有少量活動區(qū)域和大量沒有新寫入的較舊區(qū)域。對于這些情況,您可以容忍更多區(qū)域,因為您的資源消耗僅由活動區(qū)域驅動。
  • 如果只有一個列族忙于寫入,則只有該列族兼容內存。分配資源時請注意寫入模式。
以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號