發表于 2018-01-15 10:03
傳統來講,大數據平臺主要分為三部分:數據接入,數據處理,數據分析。
如何快速的搭建一個大數據平臺呢?從產品層面來說,數據接入是將數據寫入數據存儲中,也就是我們常說的數據整合。因為在企業中,數據分為外部數據和內部數據,外部數據通常是企業使用第三方系統產生的數據和一些公開的數據,內部數據是企業內部的IT系統產生的數據。這些數據一般都是獨立分布的,并沒有什么關聯,是沒有任何意義的。數據接入就是將這些內外部的數據整合到一起。
數據處理是對已經接入的數據進行數據脫敏、清洗和建模,將各個數據表之間的關系建立起來。
數據分析是在數據處理后的數據基礎上進行維度和數值的可視化分析,最后分析的結果通過可視化的形式呈現出來,從而支撐業務人員和決策人員。
按照數據處理的順序可以將大數據平臺分為傳統型平臺和敏捷型平臺,傳統型大數據平臺是在將數據送入數據存儲里面之前做,存入數據倉庫里面的數據已經定義好維度模型關系,業務人員可以直接進行查詢,但是實時性和靈活性會大打折扣,如果業務人員需要分析一個倉庫里面沒有的數據,需要去跟技術人員反饋,技術人員來完成處理。而敏捷型大數據平臺是將數據處理放到了后面,這樣業務人員可以根據自己的需要去自己建模和進行數據分析,但是對系統的性能要求較高。
Copyright ?2005-2021 勤智數碼科技股份有限公司 川公網安備 51019002003506號 蜀ICP備11012966號-7