數 據 平 臺
DATA PLATFORM
技術平臺
智能引擎
基于Hadoop的GemPile移動大數據平臺集成了多種語言等工具,實現對海量數據進行清洗、轉化、裝載,支持PB級數據的處理,并對這些數據進行處理分析,以統計出用戶的位置、行為習慣及標簽信息,以及深度的內容識別。適用于全網用戶分群及應用、基于全網用戶上網行為的用戶畫像及應用等領域,能有效地建立客戶社交網識別模型以及用戶全方位的畫像特征信息,劃分客戶的社交網,根據用戶畫像標簽,可以精準投放業務產品。
(1) 面向技術人員大數據應用平臺,提供友好使用界面,支持SQL腳本的自定義編寫和數據輸出。
(2) 面向業務人員,支持標簽式的數據提取和統計,無需輸入專業的SQL腳本。
(3) 結合市場熱點情況,自定義業務報表,輸出準實時統計數據。
支持對海量數據的精準實時處理和分析:能支撐用戶數據的快速膨脹,實現對PB級速度增長的信令數據的處理以及對海量數據的統一采集、統一處理、統一存儲、統一分析,以統計出用戶的位置、行為習慣及標簽信息,建立用戶位置及軌跡、用戶標簽和行為的全方位多維度的畫像信息。
通過客戶的交往圈、位置等信息的分析,建立客戶社交網識別模型,有效的劃分客戶的社交網。
根據用戶的上網搜索、瀏覽行為以及所使用的app等,分析用戶的特征和偏好,建立用戶全方位的畫像特征信息。根據用戶畫像標簽,可以精準投放業務產品。
以hadoop架構為代表的分布式計算平臺具備高擴展性、 成本低、高效率、高可靠性等特點,能滿足日益復雜的用戶行為分析。
建立客戶社交網識別模型,劃分客戶的社交網。對移動用戶社交關系鏈的影響力展開研究,挖掘社交影響力大的用戶,繼而探索出一種基于社交影響力推廣的新型營銷模型提升營銷成功率。
構建全面豐富的客戶標簽庫,完善客戶畫像,提升客戶細分能力。建立用戶全方位的畫像特征信息,不但能夠全面掌握客戶移動生活特征,感知客戶的行為變化,實時或非實時地執行運營動作和營銷生產動作,以支持市場工作開展,還能支撐商業模式拓展,面向未來探索和開辟新市場。
機器學習是人工智能的核心,是使計算機具有智能的根本途徑。MLlib 是Spark對常用的機器學習算法的實現庫,同時包括相關的測試和數據生成器。MLlib 目前支持四種常見的機器學習問題:決策樹、二元分類、線性回歸、聚類以及協同過濾,同時也包括一個底層的梯度下降優化基礎算法。
Mintaka共享數據處理集群提供一個基于Spark MLlib機器學習的智能學習引擎,用來支持用戶標簽規則定義以及用戶標簽統計計算以及用戶行為及消費預測。
它實現了對用戶位置及軌跡的分析,基于Spark Streaming的實時數據計算,以保證用戶位置信息計算的時效性。構建了完整直觀的客戶標簽體系,能有效地提升客戶細分能力,為業務營銷提供目標客戶支撐。建立了全方位的用戶行為畫像,幫助商戶更好地了解用戶特征,為營銷決策提供支持。
支持對用戶位置及軌跡進行快速精準地分析,并且保證了用戶位置信息的實時性,能更好地了解周邊的人群分布和變化。
建立完整直觀的客戶標簽體系,采用標簽化方法描述并細分客戶需求特征,構建全面豐富的客戶標簽庫,完善客戶畫像,提升客戶細分能力,可以有效的篩選目標用戶群,以支持向合適的用戶推薦合適的業務、產品或數字內容。
從移動大數據到商業大數據,跨行業建立精細的用戶行為畫像。
基于實時的用戶位置及軌跡分析,幫助商戶了解用戶特征和行為軌跡,幫助商戶實時了解周邊人群變化,精準投放營銷產品。
建立全息科學的用戶標簽體系,提升大數據處理分析能力,深化對客戶的認知,幫助商戶深度認知潛在客戶特征,為營銷決策提供支撐。
通過行為分析指標,構建用戶分析體系,幫助商戶了解群體特征,為終端營銷人員提供決策支撐。