❶ 如何培養企業管理者的數據思維
第一步:自上而下的改革;
第二步:營造數據驅動的文化;
第三步:先復制,後創新;先有形,後有神;
第四步:循序漸進的培訓模式;
第五步:分析競爭對手,向標桿企業學習。
❷ 如何選擇大數據應用程序
如何選擇大數據應用程序
選擇大數據軟體對於組織來說是一個復雜的過程,組織需要仔細評估其目標和供應商提供的解決方案。
如今可以確定的是,組織對大數據解決方案需求量很大。組織的管理者知道他們的大數據是不可忽視的最寶貴的資源之一。因此,他們正在尋找可幫助存儲、管理和分析其大數據的硬體和軟體。
根據調研機構IDC公司的調查,2017年組織在大數據和數據分析方面的支出為1508億美元,比去年增長12.4%。到2020年,這一支出可能會以每年11.9%的速度增長,2020年的收入可能高達2100億美元。
大部分收入都用於大數據應用。據IDC公司預測,到2020年,僅軟體開支就可能超過700億美元。非關系分析數據存儲(如NoSQL資料庫)的支出增長尤其迅速,每年可能增長38.6%,認知軟體平台(如人工智慧和機器學習能力的分析工具)每年可能增長23.3%。
為了充分利用大量的數據支出,供應商在各種不同的產品和服務上打上了「大數據」標簽。這種產品的擴散會使組織很難找到合適的大數據應用程序來滿足他們的需求。專家建議,企業開始選擇大數據應用程序的一個好方法是精確地確定自己所需要什麼類型的應用程序。
大數據應用的類型
企業軟體供應商提供了大量不同類型的大數據應用程序。適合企業的大數據應用將取決於其目標。
例如,如果企業只想更加詳細和深入地擴展現有的財務報告功能,那麼數據倉庫和商業智能解決方案可能已足以滿足其需求;如果企業的銷售和營銷團隊希望利用其大數據的發現增加收入和利潤的新機會,則可以考慮創建數據湖和/或投資數據挖掘解決方案;如果企業想創建一個數據驅動的文化,組織中的每個人都在使用數據來指導他們的決策,那麼企業可能需要數據湖和預測分析,內存資料庫,也可能是流分析。
這樣的事情將會變得更復雜,因為不同類型的工具之間的界限可能會有些模糊。一些商業智能工具具有數據挖掘和預測分析功能。一些預測分析工具包括流媒體功能。
最好的辦法是組織一開始就清楚地確定自己的目標,然後去尋找能夠幫助其實現這些目標的產品。
選擇大數據應用程序時的關鍵決策
無論企業選擇哪種類型的大數據應用程序,都需要做出一些關鍵決策,以幫助企業縮小選擇范圍。以下是一些最重要的考慮事項:
(1)內部部署數據中心與基於雲計算的大數據應用程序
企業需要做出的第一個重大決策是要在自己的數據中心託管大數據軟體,還是希望採用基於雲計算的解決方案。
目前,更多的組織似乎正在選擇雲計算。分析機構Forrester公司副總裁兼首席分析師BrianHopkins在2017年8月的一篇博客文章中寫道:「通過雲訂閱在大數據解決方案上的全球支出將增長快近7.5倍。此外,根據數據分析專業人員的2016和2017調查,公有雲是大數據的頭號技術優先事項。」
基於雲計算的大數據應用受到歡迎有多種原因,其中包括可擴展性和易管理性。主要的雲計算供應商也在人工智慧和機器學習研究方面處於領先地位,這使得他們可以在解決方案中添加高級功能。
但是,雲計算對於組織來說並不總是最好的選擇。對合規性或安全性要求較高的組織有時會發現他們需要將敏感數據保留在內部部署的數據中心。此外,一些組織已經在現有的本地數據解決方案上進行投資,並且他們發現繼續在本地部署數據中心運行大數據應用程序或使用混合方法會更具成本效益。
(2)私有vs開源的大數據應用程序
一些最流行的大數據工具(包括Hadoop生態系統)可以在開源許可下獲得。 Forrester公司指出,「2017年,企業將在Hadoop軟體和相關服務上投入8億美元。」
Hadoop和其他開源軟體最大的吸引力之一是降低總體擁有成本。盡管專有解決方案需要支付高昂的許可費,並且可能需要昂貴的專用硬體,但Hadoop沒有許可費,並且可以在標準的硬體上運行。
然而,企業有時發現很難獲得開源的解決方案,以滿足他們的需要。他們可能需要購買支持或咨詢服務,組織在計算總擁有成本時需要考慮這些費用。
(3)批處理vs流式傳輸大數據應用程序
最早的大數據解決方案(如Hadoop)只是處理批量數據,但企業越來越多地發現他們希望實時分析數據。這引發了對Spark、Storm、Samza等流媒體解決方案的更多興趣。
許多分析師表示,即使組織認為他們現在不需要處理流式數據,流媒體功能也可能在不久的將來成為標准操作流程。出於這個原因,許多組織正在向Lambda體系結構邁進,這是一種既能處理實時數據又能批處理數據的數據處理體系結構。
在大數據應用中尋找特性
一旦企業縮小了選項范圍,就需要評估其正在考慮的大數據應用程序。以下包括一些最重要的需要考察的因素。
與傳統技術集成 - 大多數組織已經在數據管理和分析技術方面進行現有投資。完全替代該技術可能代價高昂並且具有破壞性,因此組織通常會選擇尋找可以與現有工具一起使用的解決方案,或者可以增加現有軟體。
績效 - 2017年Talend研究發現,實時分析功能是商業領袖的首要IT優先事項之一。如果要從這些洞察中獲益,管理人員和工作人員需要能夠及時獲取見解。這意味著投資可以提供他們所需速度的技術。
可擴展性 - 大數據存儲的規模每天都會變得更大。組織需要快速執行的大數據應用程序,隨著數據存儲量以指數級增長,這些應用程序可以繼續快速執行。這種對可擴展性的需求是基於雲計算的大數據應用變得非常流行的主要原因之一。
可用性 - 組織還應該考慮他們打算購買的任何大數據應用程序的「學習曲線」。易於部署、易於配置、界面直觀和/或與組織已經使用的工具相似或集成的工具可以提供巨大的價值。
可視化 - BI-Survey.com表示,「針對商業用戶的可視化和探索性數據分析(稱為數據發現)已經演變成當今市場上最熱門的商業智能和分析主題。」在圖表中呈現數據可以使人類的大腦更容易發現趨勢和異常值,加快識別可操作見解的過程。
靈活性 – 企業如今所需要的大數據可能與其在一兩年前的需求大不相同。這就是為什麼許多企業選擇尋找能夠滿足各種不同目標的工具,而不是很好地執行單一功能的原因。
安全性 - 這些大數據存儲中包含的大部分數據都是敏感信息,這對於競爭對手、國家機構或黑客都是非常有價值的。組織需要確保他們的大數據具有足夠的保護,以防止成為頭條新聞報道的大量數據泄露事件。這意味著組織需要尋找具有內置安全功能(如加密和強身份驗證)的工具,或者尋找與現有安全解決方案集成的工具。
支持 - 即使有經驗的IT專業人員有時也會發現難以部署、維護和使用復雜的大數據應用程序。不要忘記考慮各供應商提供的支持的質量和成本。
生態系統 - 大多數組織需要多種不同的應用程序來滿足他們所有的大數據需求。這意味著要尋找一個大數據平台,與其他許多流行工具以及與其他提供商有強大合作關系的供應商進行整合。
自助服務能力 - 2017年畢馬威公司針對組織的CIO調查發現,60%的CIO持續報告指出數據分析人才短缺,而大數據和分析是最需要的技能組合。由於沒有足夠的數據科學家去解決,組織正在尋找其他商業專業人士可以獨立使用的工具。調研機構Gartner公司最近的博客文章指出,通常在一個組織中,大約32%的員工正在使用商業智能和分析。
總體擁有成本 - 大數據應用的前期成本只是其中的一小部分。組織需要確保他們考慮相關硬體成本,正在採用的許可或訂購費用、員工時間、支持成本,以及與本地部署應用程序的物理空間相關的任何費用。不要忘記要考慮到雲計算成本隨著時間的推移普遍下降的事實。
預計價值的時間 - 另一個重要的財務考慮因素是企業能夠以多快的速度啟動並運行特定的解決方案。大多數公司都希望在幾天或幾周內,而不是幾個月或幾年內從他們的大數據項目中受益。
人工智慧和機器學習 - 最後,考慮各種大數據應用供應商的創新。人工智慧和機器學習的研究正在以驚人的速度發展,並成為大數據分析的主流部分。據Forrester公司預測,「企業在2017年對於人工智慧的投資增加了三倍,因為企業需要將客戶數據轉換為個性化體驗。」如果企業選擇的供應商在這項研究沒有處於行業前沿,那麼可能會發現自己落後於競爭對手。
選擇大數據應用程序的提示
很明顯,選擇正確的大數據應用程序是一個復雜的過程,這涉及諸多因素。已成功部署大數據軟體的專家和組織提供以下建議:
理解自己的目標–企業在選擇大數據應用程序時,需要知道自己想完成什麼是至關重要的。如果不確定為什麼要投資某項技術,那麼其項目不太可能成功。
從小規模開始-如果企業可以通過小規模的大數據分析項目取得成功,那麼企業對使用該工具將會產生更多的興趣。
採取整體方法-盡管小規模項目可以幫助企業獲得技術方面的經驗和專業知識,但選擇最終可用於整個業務的應用程序非常重要。Gartner公司建議:「為了支持無處不在的數據和分析世界,IT專業人員需要創建一個新的端到端體系結構,為敏捷、規模和實驗而構建。如今,技術學科正在融合,數據和分析的方法正在變得更加整體化,涵蓋整個業務。」
協同工作–Gartner公司的這篇博客文章還指出:「建議數據和分析領導者積極主動地在他們的組織中傳播分析,以便從啟用數據驅動業務操作中獲得最大的收益。」許多組織正試圖構建數據驅動文化,這需要業務和IT領導者之間的大量合作。
病毒式傳播–前面提到的自助服務功能還可以幫助創建數據驅動的文化。Gartner公司建議:「讓分析在企業內部和外部真正發揮作用。通過培養實用的自助服務方法,並通過在交互和流程中的數據攝入點上嵌入分析功能,使更多的業務用戶能夠執行分析。」
❸ 數據驅動的思維方式包含哪五個方面
每日干貨好文分享丨請點擊+關注
歡迎關注天善智能微信公眾號,我們是專注於商業智能BI,大數據,數據分析領域的垂直社區。
對商業智能BI、數據分析挖掘、大數據、機器學習,python,R感興趣同學加微信:fridaybifly,邀請你進入頭條數據愛好者交流群,數據愛好者們都在這兒。
本文作者:天善智能聯合創始人&運營總監 呂品,微信:tianshanlvpin,原文發表於天善智能服務號,歡迎討論交流。
開篇語
看過不少講解大數據思維的文章,文章的一些觀點能夠帶給我很多的啟發,很有見地也很受用。在跟一些企業的負責人聊起大數據項目規劃和建設的時候,發現大家對大數據並不缺少自己的認識和看法,只是這些認識和看法沒有被系統性的組織起來,形成一個比較有深度的思考問題、解決問題的套路。
這篇文章結合我在和一些朋友溝通過程中看到的一些問題,將大數據思維和價值做了一些聚焦和分解。我來拋磚引玉,希望這篇文章能夠讓大家從另外的一個角度去了解和思考一下到底什麼是大數據思維和價值。
這篇文章適合企業高層、即將或者正在規劃大數據項目、思考如何對大數據進行頂層設計、大數據項目管理人員一讀。作為補充,我在此也推薦幾篇文章以豐富大家思考問題的維度(角度):
【概念篇】大數據思維十大核心原理
【分析篇】趨勢 | 大數據應用落地分析
【案例篇】深入解讀民生銀行阿拉丁大數據生態圈如何養成
【案例篇】大數據如何聚焦業務價值,美的大數據建設的啟發
本文作者:呂品 天善智能聯合創始人
本文整理自 2017年3月3日 美雲智數新品發布會數據雲分論壇呂品的演講內容
人人必談大數據
說到大數據,大家並不陌生,從各種自媒體、線上線下沙龍,包括生活中大家經常提起。早在 2010 年之前,國內的很多互聯網公司都已經在處理 「大數據」,只不過那時對大數據還沒有一個清晰的定義。2013 年起,我們注意到在國內大數據這個詞開始火了,火到什麼程度? 舉個例子:我每次回家,家裡的親人朋友都在問我是做什麼的,我說我們是搞商業智能 BI 的,基本上聽不懂。什麼把數據變為信息、信息產生決策,什麼 ETL、報表,幾乎是懵圈的。後來提了一句,我們有一個技術網站,裡面都是玩數據的,比如大數據、數據分析、數據挖掘...。「大數據啊!大數據我知道!」,我問什麼是大數據,回答很簡潔乾脆:「大數據就是數據大唄!」。
其實這種理解不能說錯,只能說不全面,但是從某種角度上來說大數據還是比較深入人心的,「大數據」這三個字起到了一個很好的名詞普及作用,至少不會像商業智能 BI 那樣很難用一句或者幾句話讓大家有個哪怕是很基礎的概念。
大數據 4V
我們經常提到的大數據四大特徵:4個V
Volume 數據容量大:數據量從 GB 到 TB 到 PB 或以上的級別。
Variety 數據類型多:企業在解決好內部數據之後,開始向外部數據擴充。同時,從以往處理結構化的數據到現在需要處理大量非結構化的數據。社交網路數據採集分析、各種日誌文本、視頻圖片等等。
Value 價值高,密度低:數據總量很大,但真正有價值的數據可能只有那麼一部分,有價值的數據所佔比例很小。就需要通過從大量不相關的、各種類型的數據中去挖掘對未來趨勢和模型預測分析有價值的數據,發現新的規律和新的價值。
Velocity 快速化:數據需要快速處理和分析。2010年前後做過一個美國醫療保險的數據遷移項目,有一個 ETL 需要處理該公司幾十年的歷史文件和歷史數據,文件數據量很大,並且邏輯非常復雜,一個流程幾十個包,一趟下來 35 個小時執行完畢。這種情形如果放在現在的互聯網比如電商平台很顯然是不允許的。比如像電商促銷、或者要打促銷價格戰,實時處理傳統的 BI 是無法完成的。對有這種實時處理實時分析要求的企業來說,數據就是金錢,時間就是生命。
我相信上面提到的大數據的四個 V、核心特徵還是比較容易理解的。如果我們不是站在技術層面去聊的話,大家對大數據或多或少都會有一些比較接近和類似的看法,並且在理解和認識上基本也不會有太大的偏差。
但是當我們談到大數據,大家真正關心的問題在哪裡呢? 從技術角度大家可能關心的是大數據的架構、大數據處理用到了什麼樣的技術。但是站在一個企業層面,特別是在著手考察或者規劃大數據項目建設的負責人、企業高層來說,更多關心的應該是下面這幾個問題:
1. 大數據到底能幫我們企業做什麼,或者說能夠帶給我們企業什麼變化。上了大數據對我們有什麼用,會有什麼樣的改變,是經營成本下降、還是幫我們把產品賣的更多?
2. 我們的企業現在能不能上大數據?如果不能上大數據,為什麼,那又需要怎麼做?
3. 我們企業也想跟隨潮流上大數據,問題是要怎麼做。需要准備什麼,關於投入、人才、還缺什麼、需要用到什麼樣的技術?
4. 我們怎麼驗證這個大數據項目是成功還是失敗,我們判斷的標準是什麼?
我相信這些問題都是大家比較關心的一些點,包括我自己。我們目前還是以 BI 分析為主,但我們也會去爬一些外部的數據,後面也在規劃大數據相關的一些項目和開發。
當然大數據這個話題是非常大的,我們很難從一個或者兩個角度把這些問題回答的非常全面。但是我覺得有一點是我們的企業高層或者決策者可以注意的:在規劃和考慮大數據的時候需要具備一定的大數據思維,或者說是面對大數據時我們所要具備的考慮問題和看問題的角度。
大數據思維方式
大數據思維方式我簡單概括為兩個方面:第一個是以數據為核心、數據驅動的思維方式。第二個是業務核心,業務場景化的思維方式。
以數據為核心、數據驅動的思維方式包含這幾個方面:
1. 盡可能完善自己的數據資源。我們手上握有什麼樣的數據資源,我們數據資源的質量如何?
企業需要關注和梳理我們有什麼樣的數據,以前是關注企業的流程,IT的流程、業務流程再造。現在大多數企業這些 IT 基礎和應用的建設都已經完成了,更加關心的應該是在我們的企業里到底握有什麼樣的數據資源,在不同的行業我們的數據主題是不一樣的。
比如電商零售行業,我們考慮更多的可能是消費數據、涉及到用戶、產品、消費記錄。因為我們可以圍繞這些數據比如做用戶畫像、精準營銷、定製化的產品、產品的市場定位分析等等。
比如製造生產行業,我們涉及更多的數據可能是產品本身、我們的生產流程、供應商等。因為我們可以圍繞這些數據比如做我們的生產質量檢查、降低生產成本、工藝流程再造等。
只有了解我們目前自身的數據資源,才能知道我們還缺少哪些數據資源。而這些缺少的數據資源從哪裡來,如何獲得,就是我們在規劃大數據項目的時候是需要解決的。如果缺乏這種意識,等在規劃和上大數據項目的時候你的大數據資源非常有限的。
2. 增加數據觸點、盡可能多的去收集數據,增加數據收集和採集渠道。大數據的建設和大數據分析它是一個迭代的過程,很多的分析場景都是在不斷的探索中找出來的,它有一定的不確定性。正是因為這種不確定性所以才需要我們盡可能收集更多的數據。
現在是移動互聯網時代,人人都是數據的生產者和製造者。比如每天的社交數據、互聯網點擊網路的數據、刷卡消費的數據、電信運營、互聯網運營數據。像我們的製造和生產行業,有自動化的感測器、生產流水線、自動設施的數據等。有些數據放在以前可能不值錢,但是現在看呢?這些數據現在或者在將來的某一天就會變得很有價值。
比如像我最開始提到的那家美國醫療保險公司,我看過他們的 COBOL 代碼注釋都有是七幾年、八幾年前的。他們積累了幾十年的數據,突然在 2010 年前後開始意識到數據的價值了,開始通過數據進行一些變現了。之前知道這些數據的價值嗎?不知道,但是嘗試到數據的甜頭,比如做自己的數據分析,咨詢機構購買一些脫敏的數據,或者給咨詢機構提供數據做市場研究用途。
所以大數據的構建不會是一天兩天的,這個過程會持續很長的時間,我們需要為將來做准備。所以如果你的公司連個最簡單的業務系統,IT 應用系統都沒有,數據連存放的地方都沒有,怎麼能夠上大數據呢?不合理。
數據越多,數據種類越豐富,我們觀察數據的角度維度就越豐富,我們利用大數據從中就能夠發掘出以前更多沒有看到的東西。
3. 數據開放和共享思維。這一點在我們國內其實說起來很容易,但是實際上很難。
去年的時候我去看了一個市公安局的大數據項目(可參看這篇文章 政府大數據面臨的問題和阻力在哪裡?),他們有兩點意識非常好:
1)非常清楚的知道自己擁有哪些數據資源。比如市公安局以及下屬分局、各個支隊各個應用系統的數據:基礎的人口管理、信訪、犯罪信息、情報。包括數據監控所涉及到的鐵路、網吧、民航購票、ETC 卡口等。
2)為了納入更多的社會化數據資源、實現全行業的數據覆蓋,他們准備接入交通、服務、科技信息化、教育、社保、民政等各個行業的數據。包括他們給下面的單位下了數據的指標,每個單位或者每個民警都有這種收集數據的指標,比如哪個單位今天上傳了什麼樣的多少數據,每個月哪個單位上傳的最多,這都是很好的數據收集的意識。
但問題在哪裡?問題在於很多機構比如銀行受國家政策限制很多數據是沒有辦法共享的、還有像教育機構,我憑什麼把數據給你,在行政上大家是並級的機構。
所以這個時候就需要考慮數據開放和共享的思維,在滿足數據安全性的基礎之上我們可以不可以考慮數據互換共享的可能。公安局有的數據一定是教育機構沒有的數據,那麼同樣的教育機構有的數據,公安機構也不一定有。如果兩者數據在某種程度上形成共享,在保證數據安全和不沖突的情況下是可以創造出更多的社會價值的。比如公安局可以提供教育機構關於各個地區犯罪率的信息,包括交通安全事故多發地等,教育機構可以針對
❹ 企業實施大數據的路徑
企業實施大數據的路徑
企業實施大數據的具體的建設路徑有兩個方面,一方面是自下而上,另一方面是自上而下。
自上而下
自上而下的路徑,首先是有序地在管理層建立數據的決策文化,在企業文化層面建設起數據的使用意識,然後建立對應的組織架構、對應的部門和團隊,確定需要招聘什麼樣的人進來、需要多少人、具體職責怎麼劃分,最後建立起對應的技術平台。
自下而上
自下而上第一是讓員工學習和掌握相關技術技能,可以通過內部培訓,也可以通過外部招聘。第二,要有規劃地設計,以後系統怎麼走、怎麼做, 要有一個長期的規劃。第三,要有明確的績效考核的指標,數據的管理、質量的管控、效益怎麼保證。第四,在思維上要保持一個開放的態度,互聯網時代大數據還在發展的初期,一般認為大數據在企業的應用還處於幼兒園階段,這個時候還有很多東西要學習,必須保持一個開放的心態,不斷地學習,才能真正把事情做好。
(一)建立企業的數據文化
文化是企業看待事物的價值觀和執行行動的衡量標准。建立數據文化就是要在整個企業層面建立一種以客觀的數據為決策依據和衡量標準的價值觀和制度體系,為企業能夠真正利用大數據產生價值提供基礎。沒有這個基礎,企業即使擁有再好的技術和資源,也無法利用好它們來為企業服務。
什麼叫企業數據文化?它包括六個方面的內容。
第一,數據文化主要體現在數據驅動決策,決策主要通過數據來說話。
第二,企業運行效率的分析。一方面,通過對數據進行深度分析,可以像望遠鏡一樣了解企業各方面的運營情況,另一方面,數據可以像顯微鏡一樣去觀察企業運營的細節,找到以優化的地方。
第三,通過數據來分析營銷規劃的得失。通常企業做促銷活動,銷售量提升了就覺得是成功了,但是促銷是有成本的,銷量提升了,是不是真的就帶來效益了呢?
第四,在以人為本的時代,企業對員工的人身安全和健康的責任越發重大了。如果能通過客觀可衡量的數據,關注員工的工作環境和舒適性,對保障良好健康的工作環境、提升員工的滿意度將起到非常重要的作用。
第五,員工績效,必須要有一個數量化的指標。
第六,價值鏈中的數據管理。在縱向供應鏈中通過數據的分享和交換,可以更好地讓供應鏈上下游的企業了解整個供應鏈上的需求、庫存和供給,從而可以優化鏈條上的庫存,主動發起供給的准備,更快地應對市場的變化。在橫向生態鏈中,通過分享和交換數據,可以在全方位生活場景中對用戶進行分析,從而打造出滿足用戶更廣泛需求的一站式服務,不僅可以挖掘出更多的商業機會,而且增強了用戶的粘性。
(二)建立企業的數據戰略
建立企業的數據戰略,需要建設三個方面的內容,如下圖
數據模型
第一個方面是建立完整的數據模型。數據模型的目的是正確地定義數據,對數據進行分類和確定數據交互之間的標准。將對企業業務管理的理解,轉化為數據的要求,從而理解到底什麼樣的數據需要管理。不同的系統產生不同的數據,各系統之間的數據和數據之間互相交互的內容是什麼。企業內部有不同的系統,ERP 系統、供應鏈系統、CRP 系統等,用戶信息放在哪,供應商信息、物聯網信息、財務信息分別放在哪,他們之間怎麼協調,怎麼溝通?這些都是需要考慮的問題。
數據服務
第二個方面是建立數據服務體系,包括選用什麼樣的技術平台、採用什麼樣的數據技術,不同的系統如何使用這些不同技術,包括傳統的資料庫、數據倉庫、商業智能、新型的 Hadoop 等。基於業務架構的設計,來設計數據應用的架構,然後通過數據交互介面來交換數據,從而避免出現數據孤島,同時建立統一的數據規劃,確保數據源的統一和一致性,為後期的數據分析提供支持。
數據管理
第三個方面是建立數據的治理體系。數據治理包括數據的管理制度和整體生命周期的管理。數據正在成為一種資產,與此相對應的,資產需要體系化的管理。數據的資產權利管理,包括確定數據的所有權、確定每個數據的所有者、誰是這個數據的管理者、誰來負責這個數據的准確性、誰來保障數據的質量,等等。數據的高質量是進行數據分析的基礎,數據如果是錯誤的,怎麼分析都不會有正確的結果。同時,數據的合規和安全的管理也是核心環節,比如誰可以操作數據、誰負責數據的安全、備份和服務等,一個嚴格的數據的合規和安全管控制度是必不可少的。
數據的生命周期管理,包括如何和何時建立數據、什麼時候可以修改、誰批准修改、數據如何消除等。國內的企業這方面做得比較欠缺,不只是數據,還包括設備、電腦等,電腦報廢了不能用了,就直接丟棄。在這方面,國外企業做得不錯,國外信息安全的企業, 通常會花錢請第三方公司來進行專業的數據銷毀的處理,甚至每台電腦花費幾百塊錢來進行環保型銷毀。比如在一些數據消除案例中,數據要用各種方 法來確保被徹底擦除,比如有些企業要求對數據進行格式化七遍,以避免可 能的數據恢復。
(三)建立企業的數據組織能力
建立數據的組織能力,包括設立合適的組織角色的定位、招聘到合適的人員、設立合適的組織結構以及設計合適的責權利,等等。
第一,數據的組織能力,建議有條件的公司可以建立首席數據官(ChiefData Officer)崗位,這個崗位主要是設計整個數據的戰略,領導數據戰略的落地,以及通過數據和業務管理層進行溝通、對話,傳遞數據的價值。
第二,數據科學家的作用非常重要,數據科學家研究的是如何用最好、最科學的演算法得出最好的結果。同樣一堆數據在那兒,十個不同的人在看,十個人看的結果都不同。那麼為什麼科學家算得准呢?因為他的知識夠深入,他了解哪個因素最重要,那麼多因素裡面他應該選哪部分來分析。數據科學家目前是整個市場上最欠缺的人才,因為同時兼具數據演算法專業知識和業務知識的人才是極其難得的。數據科學家可以分為三種類型,第一種是技術型數據科學家,他們是計算演算法方面的行家,對各種統計分析技術非常在行;第二種是應用數據科學家,他們對數據架構非常熟悉,熟悉數據在各個系統中的分布,能夠很好地把各種數據進行集成管理;第三種是業務數據科學家,這些人對行業知識和企業業務非常熟悉,同時兼具一部分對數據處理技術的了解,能很好地把業務的需要和特徵轉換成數據的處理要求,同時可以很好地將數據處理結果轉換成業務的視角和言語,來傳遞給業務管理者。
第三,對於一定規模的企業,我們通常建議,企業要建立一個集中式的數據管理運營中心。雲計算服務就是集中化管理方式,成本最低、靈活性最高、擴展性最強。
第四,整個數據組織的架構標准不是以技術、產品來交付,而是以商業價值交付為衡量標准。考量數據分析的產出能力,不是數據分析的速度有多快,也不是數據量有多大,而是數據分析的結果對業務到底有沒有幫助、是不是有指導意義。這也是所有數據分析的核心價值,也是對大數據中「大」的含義的最核心的衡量標准——「大」到產生業務價值。這個衡量標准對技術組織來說,執行起來有些困難,所以必須建立一個明確的績效評估標准和價值評估標准,讓技術人員能夠更多地從業務角度來考慮所做的工作的價值,而不陷入技術優先論的境地。
第五,提升一線人員的業務決策權和數據決策權,建立一個扁平化管理的組織。通過系統化的培訓來不斷培養員工的數據分析能力。由專業數據分析人員和演算法人員設計的數據分析解決方案或者產品,必須以簡單易用的方式提供給一線員工,同時更為重要的是,加強相關的解決方案或者數據產品的系統化培訓,讓更多的員工意識到這些解決方案或者產品的價值,並樂於在日常工作中使用。我們建議數據建模 / 數據產品研發的費用和針對一線員工的使用培訓的投入應該是對半分的。為了更好地推進培訓,企業還可以考慮成立興趣驅動的數據協會,讓更多的員工加入到該協會中,定期舉行培訓課程、研討沙龍以及聘請外部專家做相關分享以開拓視野。
建立了企業的數據組織能力後,企業使用數據的過程如下闡述。
首先搜集數據,從不同地方把數據找到,找到以後選擇演算法。其次進行業務關聯的分析,確定哪些指標、哪些維度是有意義的,這就是數據科學乾的事。業務科學家和數據科學家可以分離,也可以整合,大部分企業是一套人馬來做,展示成一個業務的可以接受、可以理解的方法,如果單純是數據展示,可能管理層、業務部門看不懂,這就需要轉換成業務管理者可以理解的語言和信息。最後,提交給管理層或者是對應的部門作商業決策。這就 完成了一個完整的價值交付。
在上述的數據處理過程中,數據團隊中有不同的崗位來執行對應的工作。在數據的採集和清理環節,主要是數據管理員,包括企業內部的數據抓取, 外部的微博、淘寶、第三方電信等的數據採集,數據很多,需要做清理,把一些沒有用的數據處理掉,留下來有效的數據,這主要是數據管理員要做的事情。接下來是數據科學家,選擇正確的演算法,同時可以根據業務的維度製作各種不同的模型,來得出一個分析的結果。再接下來,還有一個團隊是業務分析師,根據這些分析結果,將其轉換成業務人員可以理解的語言和展示方法,交給 CDO 和核心管理層、決策層做溝通,幫助他們作決策。作為整個技術平台的提供者,還有一個技術團隊做具體的平台搭建,可以自行開發基於 Hadoop 開源的大數據平台,或者購買第三方的系統做管理維護,也可以 直接使用大數據的 SaaS 服務平台來快速建立大數據技術能力。
(四)選擇技術平台
企業以往使用傳統數據進行復雜分析時,多使用數據倉庫和商務智能系統,也就是所謂的 OLAP 系統,對傳統數據比如財務數據、用戶數據進行抓取、挖掘和分析,然後通過頁面展示出來,這是非實時的分析系統。在互聯網+時代,要將第三方的社交數據和電商數據,比如微博、電商數據等放進來分析是很難的,因為傳統的架構是基於結構化的數據基礎上的,而現在更大量的數據是非結構化的數據,傳統方式很難支持。這樣我們分析數據就碰到一些困難,大數據應運而生,Hadoop 是其中最重要的一個平台。
Hadoop 是一個生態系統,它裡麵包括了一些計算的系統、數據存儲的系統、數據分析的系統,它是阿帕奇組織在 2004 年正式開展的一個項目。Hadoop 是一個非常重要的革命性的應用,因為它是免費發布,讓很多人都有機會使用,現在很多企業都是以 Hadoop 開源平台為基礎,再由內部技術人員做一些優化來使用。
傳統數據和大數據的關系是一個發展和結合的關系。傳統數據還是可以分析出對業務有價值的信息,也還是用以前倉庫的方式分析,新型數據用大數據的方式分析,兩個系統最後進行整合,形成一個後端的解決方案;現在也出現了一種完全集成式的方案,這是最近一兩年出現的新的大數據平台,可以同時兼容新的大數據和傳統的數據,這種集成式的應用將會越來越多。市場上很多公司的商業套件和 Hadoop 開源的方案有什麼區別呢?它們的主要區別是商業套件在性能上做了優化、提 升,在安全上做了增強,它加入了針對對應行業的業務理解,幫助企業預置了建模的方法和工具,但問題是價格比較貴。所以,各種方案的選擇是基於企業的實際情況,包括預算和團隊能力等因素綜合考慮的。
(五)數據的開放和共享
對於數據的來源,企業內部通常不具有大數據分析所需要的所有數據。 2014 年,我國的大數據市場規模 84 個億,預計 2015 年達到 166 個億,增長40%。相信隨著大數據交易平台的建設,增長還會更多。根據中國信息通訊研究院的研究報告,企業對大數據的認同度,認為「比較重要」的達到 97%,這說明企業對大數據的重要性是有認識的,問題是怎麼來落地。企業對待大數據往往關注的是安全性和穩定性。這說明雖然企業已經意識到大數據的重要性,但還是比較保守,對安全的顧慮影響了對數據商業價值的挖掘。隨著安全技術的發展以及對商業價值的認識的提高,企業應用大數據、獲取和交換數據將會越來越多。安全和商業價值永遠是一對需要衡量的關系,它就像速度和成本、速度和質量一樣是相輔相成、互相平衡的關系,要同時追求兩方面是有困難的,不同時期要有不同的策略。
企業對政府公開數據的需求非常強烈。市場上有很多針對政府數據的創業公司,例如一家企業叫法海風控,他是從法律層面分析企業的信用狀態,通過分析企業相關的法律文書,比如這家企業過去數年有沒有相關的法律官司、勝訴還是敗訴,也包括相關聯企業涉及到的法律行為,從這些角度提供風控的判斷,這是一個很好的應用案例,這取決於政府的數據公開程度。政府擁有海量的數據,如交通數據、社保數據等,一旦這些數據能夠公開,將會帶來大量的創業機會,也會給企業帶來更多考慮問題的維度,所以企業都希望政府能夠盡快地公開數據。
(六)找好切入點,小步快走
關於實施路徑,企業或多或少已經有一些數據、有一些系統,這個時候是推倒重來,還是有一些別的方法?數據能夠在哪些領域實現業績的大幅提高?數據能在哪些領域實現企業運營效率的提升?這些問題很重要,一開始就必須提出來。每個重要業務部門和職能部門都需要考慮這個問題,並展開相關的研討。企業高管實施大數據戰略的時候,需要高度重視這一步,但在國內很多企業往往忽略這一方面,投入大數據往往不是以提升業績為導向,而是以學術為導向,使得很多企業實施大數據戰略後,看不到數據對企業績效的提升,從而使得大數據戰略流產。
(七)放眼未來,永遠在路上
大數據是不是萬能的?是不是永遠有效的?大數據的使用有限制嗎?正確地認識這些問題,有助於企業更好地利用大數據,更客觀地看待大數據。
第一,大數據不是萬能的,大數據的使用是有限制的。大數據的使用,首先是在討論相關性的時候,而在判斷、解決一個具體問題的時候,大數據不是最好的方法。
第二,大數據即使大,也不能囊括所有的數據,大數據終究有成本的問題,准確性還不會達到百分之百。雖然它足夠可以做預測,但是不是絕對正確的東西。
第三,我們不能過於相信數據,因為有時候數據會解讀得不對,所以還要嘗試做一個驗證,如果這明顯和常識相反,你要驗證一下你的分析方法否正確。
還有一個問題是數據的安全,數據這么重要,能不能保護好數據,數據使用過程中有一些問題和潛在的風險。
最後的寄語:大數據是文化和技術的結合,最終的目的是產生業務價值。
第一,大數據技術是 IT 驅動業務變革的一個機會,不管從IT 部門本身的定位、IT 對企業產生的作用來說,還是企業能夠增強核心競爭力的角度來說,大數據都是一個非常重要的推動力。
第二,應用大數據技術的前提是要有一個數據驅動決策的企業文化,如果用大數據形成了一個報表,企業管理者作決策時根本不看,這就沒有意義了。只有當企業建立了數據驅動決策的文化,並真實地執行後,數據的價值才能夠充分實現。所以大數據使用的重要前提是企業有數據驅動決策的文化。
第三,數據本身只是一些信息,大數據的價值不在於數據本身,而在於如何通過數據做分析整理,最後產生分析和預測,傳遞業務價值,這才是使用大數據的目的和核心。
❺ 如何將數字化轉型
數字化成熟的組織不會浪費時間抵制數字化轉型,而是擁抱並適應商業環境中的關鍵轉變。從接觸與咨詢的企業來看哪些能夠駕馭復雜不確定環境下往往有以下6個特徵:
對客戶保持親密的連接,動態感知需求變化
以數據為依據而非簡單數據驅動的文化,人是核心
挑戰者心態和極強的顛覆意願
分布式決策與共創之風
不斷做實驗和團隊學習
道德決策和數字化倫理,持續發展
❻ 如何利用數據驅動的方法來降低欺詐風險
在高科技領域,數據是不可或缺的。它可以幫助你更好管理系統和團隊,但從數據有效獲取價值比拿到數字更難。你需要一種由數據驅動和抉擇的文化。通過數據可以讓管理者不僅降低正確決策的風險,也更有信心迅速行動。它也提供一種確認選擇是否可行的辦法。
建立這樣文化比口頭上簡單說說要更復雜。你衡量哪些數據看如何響應看採取什麼方法讓團隊意識到應該把數據擺在首位看
以下是實現可持續發展的數據驅動的企業文化的一些建議,可以讓團隊在自我完善,也有一些陷阱我們需要注意:
1.確定要測量什麼。我們目的是用數據讓商業更加靈活有信心。管理層需要了解公司高層的優先順序,再選擇支持這些目標的指標。如果你不分重要性衡量一切的話,你就會陷入無關緊要的細枝末節。比如對於用戶增長的核心指標有注冊數,激活率,重新激活率。
2.為實現具體商業及團隊目標的相關指標。修復的平均時間(MTTR)是一個不錯的性能指標,但它不容易讓團隊執行。確認事件發生的平均時間(MTTA)是MTTR的一個組成部分,往往更可行。跟蹤這兩個關鍵績效指標,有助於了解團隊是如何對總體指標做貢獻的。
❼ 如何做好數據驅動運營
核心了解業務,對數據敏感 數據背後的意義邏輯清楚。具體表現為:
每天不僅關心日活、新增,數據精細化運營就及其有必要,比如這個時候我們會增加一次性用戶與活躍用戶的比例、新增用戶留存率、連續N日活躍與當日活躍的佔比這些指標,通過這些指標間接佐證產品生命周期是處於增長期、活躍期、穩定期、還是衰退期,如果一次性用戶佔比比較高、說明產品粘度不夠,用戶流失率較高、那麼就要採用提升迴流的方法比如PUSH、簡訊等一系列熱點營銷活動,如果新增用戶佔比趨勢區域平緩、既有可能說明產品已經進入穩定器,這時候運營更多考慮保持活躍、如果發現新增用戶增值趨勢是呈下降、連續活躍佔比下降說明產品用戶在逐步流失,很有可能進入衰退期,這個時候管理者結合收入指標等其他財務指標判斷是否放棄原有產品投入、是否研發新的產品。