- HBase是架構在HDFS上的分散式資料庫
- 使用row and column為索引存取資料值
- 每一筆資料都有timestamp,可以一不同時間存取多筆資料
index = row key
一個column family就是column label的集合,label可以新增而不用重新設定table
舉例:
使用('row key', 'family:label', 'timestamp')
('ricky', 'score', 'T5') 得到 ricky, T5, Eng:30
特點:
- 可以將資料表分為許多region,region是由一到數列所組成,並存放在不同主機,存放region的主機就是region server
- 還有master server用來記錄每一個region對應的region server
- master server自動將不能工作的region重新分配到其他refion server
- 提供MapReduce的城市當做資料來源或儲存媒介,提供TableMapper/Reducer類別讓程式中的Mapper/Reducer類別繼承,可以把MapReduce中的Key,Value更方便從HBase取出存入。
NOSQL
沒有留言:
張貼留言