發表于 2017-09-25 14:19
大數據有在線和離線兩種形式。在線大數據是指為了支持操作型應用程序及其用戶,實時創建、采集、轉換、管理和/或分析的數據。大數據是以在線形式誕生的。要滿足服務等級協議 (SLA) 和用戶對現代應用程序性能的期望,這些應用程序的延遲必須很低,可用性必須很高。這包括大量應用程序,從社交網絡新聞動態消息、實時廣告服務器的分析到復雜的客戶關系管理 (CRM) 應用程序,不一而足。在線大數據數據庫的例子包括 MongoDB 和其他 NoSQL 數據庫。
離線大數據涵蓋批量采集、轉換、管理和/或分析大數據的應用程序。它們通常不創建新數據。對于這些應用程序,響應時間可能很慢(長達數小時或數天),而對于此類用途,這通常是可以接受的。由于它們產生的通常是靜態輸出數據(而不是操作輸出數據),例如報告或信息中心,它們甚至可以臨時離線,而不會影響整體目標或最終產品。離線大數據應用程序的例子包括:基于 Hadoop 的工作負載;現代數據倉庫;提取、轉換、加載 (ETL) 應用程序;商業智能工具。
組織機構在評估采用哪種大數據技術時,應當考慮使用數據的目的。對于希望構建支持實時操作用途的應用程序的組織機構來說,它們需要像 MongoDB 這樣的操作型數據存儲。而對于需要離線執行長時間分析的組織機構來說,像 Hadoop 這樣的離線解決方案可能是有效的工具。追求兩種用途的組織機構可以將二者結合起來,找到在線和離線大數據技術的集成方案。例如,MongoDB 提供與 Hadoop 的集成。
Copyright ?2005-2021 勤智數碼科技股份有限公司 川公網安備 51019002003506號 蜀ICP備11012966號-7