㈠ 如何做好大數據應用
去年出版的《大數據》(塗子沛著)是從數據治國的角度,深入淺出的敘述了美國政府的管理之道,細密入微的闡釋了黃仁宇先生」資本主義數目式管理「的精髓。最近人民郵電出版社又組織翻譯出版了美國Bill Franks的《駕馭大數據》一書。該書的整體思路,簡單來說,就是敘述了一個」數據收集-知識形成-智慧行動「的過程,不僅回答了」what「,也指明了」how「,提供了具體的技術、流程、方法,甚至團隊建設,文化創新。作者首先在第一章分析了大數據的興起,介紹了大數據的概念、內容,價值,並分析了大數據的來源,也探討了在汽車保險、電力、零售行業的應用場景;在第二章介紹了駕馭大數據的技術、流程、方法,第三部分則介紹了駕馭大數據的能力框架,包括了如何進行優質分析,如何成為優秀的分析師,如何打造高績效團隊,最後則提出了企業創新文化的重要意義。整本書高屋建瓴、內容恣意汪洋、酣暢淋漓,結構上百川歸海,一氣呵成,總的來說,體系完備、內容繁豐、見識獨具、實用性強,非常值得推薦,是不可多得的好書!大數據重要以及不重要的一面與大多數人的想當然的看法不同,作者認為「大數據」中的」大」和「數據」都不重要,重要的是數據能帶來的價值以及如何駕馭這些大數據,甚至與傳統的結構化數據和教科書上的認知不同,「大數據可能是凌亂而醜陋的」並且大數據也會帶來「被大數據壓得不看重負,從而停止不前」和大數據處理「成本增長速度會讓企業措手不及」的風險,所以,作者才認為駕馭大數據,做到游刃有餘、從容自若、實現「被管理的創新」最為重要。在處理數據時,作者指出「很多大數據其實並不重要」,企業要做好大數據工作,關鍵是能做到如何沙裡淘金,並與各種數據進行結合或混搭,進而發現其中的價值。這也是作者一再強調的「新數據每一次都會勝過新的工具和方法」的原因所在。網路數據與電子商務對顧客行為的挖掘早已不是什麼熱門概念,然而作者認為從更深層次的角度看,下一步客戶意圖和決策過程的分析才是具有價值的金礦,即「關於購買商品的想法以及影響他們購買決策的關鍵因素是什麼」。針對電子商務這一顧客行為的數據挖掘,作者不是泛泛而談,而是獨具慧眼的從購買路徑、偏好、行為、反饋、流失模型、響應模型、顧客分類、評估廣告效果等方面提供了非常有吸引力的建議。我認為,《駕馭大數據》的作者提出的網路數據作為大數據的「原始數據」其實也蘊含著另外一重意蘊,即只有電子商務才具備與顧客進行深入的互動,也才具有了收集這些數據的條件,從這點看,直接面向終端的企業如果不電子商務化,談論大數據不是一件很可笑的事?當然這種用戶購買路徑的行為分析,也不是新鮮的事,在昂德希爾《顧客為什麼購買:新時代的零售業聖經》一書中披露了商場僱傭大量顧問,暗中尾隨顧客,用攝影機或充滿密語的卡片,完整真實的記錄顧客從進入到離開商場的每一個動作,並進行深入的總結和分析,進而改進貨物的陳列位置、廣告的用詞和放置場所等,都與電子商務時代的客戶行為挖掘具有異曲同工之妙,當然電子商務時代,數據分析的成本更加低廉,也更加容易獲取那些非直接觀察可以收集的數據(如信用記錄)。一些有價值的應用場景大數據的價值需要藉助於一些具體的應用模式和場景才能得到集中體現,電子商務是一個案例,同時,作者也提到了車載信息「最初作為一種工具出現的,它可以幫助車主和公司獲得更好的、更有效的車輛保險」,然而它所能夠提供的時速、路段、開始和結束時間等信息,對改善城市交通擁堵具有意料之外的價值。基於GPS技術和手機應用所提供的時間和位置的數據也會提供主動的、及時的推送客戶關懷信息,有利於改善客戶關系和創造商業機會,也可以利用它進行共同目的和興趣的社交,這些都會帶來一種令人驚奇的業務創新。在視頻游戲、電信話費清單上,作者也提出了十分有價值的洞見。技術、流程、方法、組織、人、文化作者是Teradata的首席分析師,絕非是文獻學專家和徒有虛名之輩,他在書中也介紹了如何利用海量並行架構(MPP),雲計算、網格計算、MapRece等時下炙手可熱的技術從大數據中披沙瀝金,駕馭大數據。同時,作者一直在提醒我們,數據只是源,「思想才是分析之父」,「有價值和影響力的分析才是優質分析」,優質分析要符合G(Guided指導性)R(Relevant相關性)A(Explainable可行性)T(Timely及時向)原則,並且優質的分析要能提供答案、提供用戶需要的東西,要能提供新的解決方案,對實際行動有指導意義,從這個角度看,它區別於報表那種標准和固定的數據呈現模式,藉助於大數據分析,用戶能夠把握現狀、預測趨勢,這樣才能駕馭未來。作為一個大數據的行動者和實幹家,作者也結合自己的工作經驗,對於如何成為優秀的分析師,給出了他的答案,那就是學歷、數學和編程等技能「它們僅僅是起點而已」,優秀分析專家身上更重要的才能是「承諾、創造力、商業頭腦、演講能力和溝通技巧、直覺」,這種人一將難求,它需要分析師長期的工作經驗積累,從這點看,數據分析「不能只把自己當成科學家,業內最好的分析專家毫無疑問也是藝術家」。企業的大數據探索之旅,並非一片坦途,也會充滿了各種艱險,這就需要企業具有創新性的文化氛圍,容忍冒險和犯錯,並鼓勵嘗試,作者也切中肯綮的提出「關注人,而不是工具」,「打破思維定勢,形成連鎖反應,統一行動目標」的創新之路,供讀者思考和借鑒。時異而世移,我認為,在當今社會,企業直面社會的劇烈變化,在管理工作中依賴小規模的「點子」「好主意」的傳統做法已經難以應對市場的激烈競爭,企業需要從那些來自於現場、來源於客戶、來源於多個時空的全方位的立體信息中找到利潤的寶藏,才能獲得持續增長的動力,從這個意義上看,駕馭大數據是企業駕馭未來的必經之路。
㈡ 如何利用大數據平台進行市場分析
大數據平台的數據維度包含了市場分析需要的所有數據了,你只需要根據不同的數據維度進行分析就好了,決策狗大數據就在做消費品各行業的大數據分析,可以分析市場銷售趨勢、價格變動、品牌排行、產品趨勢、用戶分析等方面。
㈢ 企業如何利用大數據分析法做好品牌營銷
網路信息的分析以數據技術為基礎,在人類學習生活各個方面都起到不可或缺的作用,它促進了社會的轉型和媒介的發展。在企業品牌傳播方面,以大量的數據為基礎並且進行深度挖掘,來獲得消費者狀態、品牌傳播的有效方法和傳播效果。一般的數據分析方法已經落伍,滿足不了企業品牌傳播的更高要求。
企業要學會利用大數據建立品牌意識,對品牌的名稱、定位、形象等等一系列精準,讓客戶對你留有更深刻的印象,藉助信息傳播的便利性,將品牌概念傳輸給消費方。其次,要利用大數據抓取產品差異。開放的市場大環境下,產品的共性特別的多。但企業缺失的往往是抓取產品差異,找出產品的閃光點。同時也要了解客戶及其需求點。企業要用大數據的分析,優化推廣渠道,這樣才能更好的在客戶心中留下印象,不難發現,現在很多的行業區域性特別強,如果一個品牌在地域上越做越大,慢慢延伸,會得到很廣泛及牢固的效果。
㈣ 如何利用大數據做行業趨勢分析
從數據源、分析維度和展示結果來分析如何利用大數據做行業趨勢分析:
數據源:大數據採集電商平台線上銷售數據和消費者的文本數據;
分析維度:通過大數據整合和語義分析等,分析行業銷售趨勢、品牌佔比趨勢、產品潮流趨勢、消費者偏好趨勢等維度;
展示結果:通過在線平台展示,持續監控數據的變化。
㈤ 如何利用大數據進行市場營銷
主要是對大數據進行詳細的分析,整理,分類,找出自己的精準用戶
㈥ 如何利用大數據定位
定位理論是過去幾十年最重要的營銷理論之一.
但是,許多營銷專家做定位的時候,都是靠拍腦袋搞靈感來的。
這是非常嚴重不科學的手段
因為,任何一個人的認知都是有局限的
並且,每一個人都習慣把自己熟知的事物的影響無限的放大。
1、真實的數據與你想的不一樣
2、確定定位的核心原則
3、如何用大數據工具
一、現實世界真實的數據,往往和你想的不一樣。
舉一個例子:
大家認為老外對中國的什麼最關注呢?
每當問這個問題:
許多人條件反射就會回答政治、人權、經濟等等,
其實,這是不真實的,大部分的老外連自己國家的政治和人權都不關注,怎麼會關注你們中國的這些問題呢
記得8年前,我在使用Google關鍵詞工具查詢的時候,當我搜索了一下「chinese」這個關鍵詞的時候。
工具立刻列出了搜索量最大的前30個包含有「chinese」的組合詞。
看到數據後,我驚奇的發現,搜索量最大的「中國的XXX」這類詞中,前30個搜索量最大的詞中。
其中「chinese food」和「chinese girl」都排在20多名,剩下28個詞都以一個主題相關,那就是「玄學」。
前面搜索量最大的關鍵詞,中國占卜、中國占星術、中國婚姻占卜、中國歷法、中國算命等等相關的關鍵詞。
原來,老外最關注的是中國玄學,這才是最真實的情況!
再舉一個例子
兩年前受邀請在上海講課,當時一個傳統領域的營銷專家朋友也是講師,當天晚上吃飯的時候,他非常興奮的給我們講他的一個商業計劃。
他打算自己投入幾百萬,然後再眾籌兩千萬來親自做一款筆記本電腦,他已經非常用心的籌劃了半年,已經找好了合作的廠商。
我問他做有特色的筆記本電腦呢?
他說:17寸的筆記本電腦
他說蘋果已經停止銷售17寸筆記本了,因為他一直用17寸筆記本,我了解這個尺寸筆記本的需求,這個市場沒有一款做的非常好的,他打算來做,名字就想好了,叫做「大師本」,一定可以迅速做起來。
聽他興奮的講完,我立刻上京東和淘寶查詢了一下17寸筆記本的銷售數據,發現加起來一年的銷售量不過幾千台。
蘋果為什麼放棄?
是因為市場太小
他喜歡用17寸筆記本電腦,他就以為全世界有很多人都喜歡,這是嚴重錯誤的思維方式。
看到這個銷售數據後,當著很多人的面子我沒有直說,只是私下給他發了一個簡訊,告訴了他真實的市場數據。
很快,他就徹底放棄了這個項目。
二、確定定位的核心原則?
選擇比努力重要!
如何選擇產品的定位?
如何選擇個人的定位?
有三個原則:
1、市場需求在增長
2、市場競爭非常小
3、與自己資源匹配
三、如何用大數據定位?
市場上,那些調查公司拿出的數據有也不靠譜,因為他們只是通過幾千份問卷得來的報告。
我們其實可以免費的直接查看幾億用戶的真實數據,幫助自己做市場定位決策。
誰能夠提供這些數據呢?
1、網路
2、淘寶
3、Google
4、Amazon
通過網路指數,你可以查詢一個關鍵詞的搜索量,搜索量越大,說明市場需求越大。
然後我們看網路搜索結果,如果搜索結果排在前面三頁沒有太多專業的網站的話,說明這個領域就有非常大的機會。
淘寶也有指數,不過剛剛關閉,現在變成了淘寶生意參謀,通過以淘寶數據為支撐,還有許多第三方網站可以查詢相關數據。
你輸入一個關鍵詞,就可以查看每天多少人搜索,有多少成交量,這些人都是什麼地區的?年齡多少?都什麼星座?收入?愛好等等
這些數據都可以免費看到!
如果你想了解全球市場的數據,通過google的關鍵詞工具,你可以直接把查詢區域鎖定到某一個國家,某一種語言的具體的搜索數量。
㈦ 如何用大數據做好企業運營
大數據對企業來說有什麼用?對於這個連IT界都眾說紛紜的事情,要讓希望使用大數據產品和服務的企業主們來說,更是一頭霧水。大數據是工具,那麼它究竟對企業會有什麼作用呢?了解了大數據的作用,才能讓大數據更好的服務自身。其實,從傳統企業的運行流程來看,大數據主要能夠在了解用戶、鎖定資源、規劃生產、做好運營、開展服務等方面,幫上企業的忙。
下面,我們來看一下到底大數據到底能幫什麼忙:
1、幫企業了解用戶
大數據通過相關性分析,將客戶、用戶和產品進行有機串聯,對用戶的產品偏好,客戶的關系偏好進行個性化定位,生產出用戶驅動型的產品,提供客戶導向性的服務。
從大數據技術方面來看,用數據來指引企業的成長,將不再單單是一句口號。據網路副總裁曾良表示,從挖掘的角度來看,他們通過對每天60億的檢索請求數
據分析,可以發現檢索某一品牌的受眾行為特徵,進而反饋給企業的品牌、產品研發部門,能更准確地了解目標用戶,並推出與調性相匹配的產品。
通過運用大數據,不僅可以從數據中發掘出適應企業發展環境的社會和商業形態,用數據對用戶和客戶對待產品的態度,進行挖掘和洞察,准確發現並解讀客戶及用戶的諸多新需求和行為特徵,這必將顛覆傳統企業在用戶調研過程中,過分依賴主觀臆斷的市場分析模式。
2、幫企業鎖定資源
通過大數據技術,可以實現企業對所需資源的精準鎖定,在企業在運營過程中,所需要的每一種資源的挖掘方式、具體情況和儲量分布等,企業都可以進行搜集
分析,形成基於企業的資源分布可視圖,就如同「電子地圖」一般,將原先只是虛擬存在的各種優勢點,進行「點對點」的數據化、圖像化展現,讓企業的管理者可
以更直觀地面對自己的企業,更好地利用各種已有和潛在資源。如果沒有大數據,將很難發現曾經認為是完全無關行為間的相互關聯性,就如同外媒曾經提到的「啤
酒」與「尿片」之間的關聯營銷一樣,如果美元大數據這將是一種幾乎不可能的事情。
3、幫企業規劃生產
大數據不僅改變了數據的組合方式,而且影響到企業產品和服務的生產和提供。通過用數據來規劃生產架構和流程,不僅能夠幫助他們發掘傳統數據中無法得知的價值組合方式,而且能給對組合產生的細節問題,提供相關性的、一對一的解決方案,為企業開展生產提供保障。
過去的所謂商業智能,往往大多是「事後諸葛亮」,而大數據則讓企業可預測未來的走向,幫助企業做到「未雨綢繆」。大數據的虛擬化特徵,還將大大降低企業的經營風險,能夠在生產或服務尚未展開之前就給出相關確定性答案,讓生產和服務做到有的放矢。
在這方面,不得不提到的就是最近火爆的《紙牌屋》,它的劇集為什麼會受到全球歡迎?有很大一部分原因就跟它前期依據大數據技術和思維方式所做的准備。
據稱,《紙牌屋》的資料庫包含了3000萬用戶的收視選擇、400萬條評論、300萬次主題搜索。下一季劇情拍什麼、誰來拍、誰來演、怎麼播,都由數千萬
觀眾的客觀喜好統計決定。
4、幫企業做好運營
過去某一品牌要做市場預測,大多靠自身資源、公共關系和以往的案例來進行分析和判斷,得出的結論往往也比較模糊,很少能得到各自行業內的足夠重視。通
過大數據的相關性分析,根據不同品牌市場數據之間的交叉、重合,企業的運營方向將會變得直觀而且容易識別,在品牌推廣、區位選擇、戰略規劃方面將做到更有
把握地面對。
對於大數據對企業運營的導航左右,夢芭莎集團董事長佘曉成深有感觸,他不禁感慨「大數據讓我們能夠及時調整運營策略,現在的庫存每季售罄率從80%提升到95%,實行30天缺貨銷售,能把30天缺貨控制在每天訂單的10%左右,比以前有3倍的提升。」
5、幫企業開展服務
通過大數據計算對社交信息數據、客戶互動數據等,可以幫助企業進行品牌信息的水平化設計和碎片化擴散。經濟學家Richard H.
Thaler曾經提出一種觀點,「個人觀點的微小變化都可以演變為所有人的群體行為模式的重大變革。」在這一重大變革的背景之下,對微小的信息流,企業都
必須重視,而客戶服務為應對這種情況,也需要像空氣一樣分布在一些細枝末節之中。企業可以藉助社交媒體中公開的海量數據,通過大數據信息交叉驗證技術、分
析數據內容之間的關聯度等,進而面向社會化用戶開展精細化服務,提供更多便利、產生更大價值。
㈧ 如何更好地運用大數據服務好我們的生活
最好是你的生意的全部數據在線化了。如果沒有恐怕無法建模和分析了。之所以在線化是大數據人工智慧的第一步,也是傳統企業運用大數據的起步。
㈨ 如何更好地利用行業大數據
在分析行業趨勢,消費結構,評估業務增長力和進入新市場時,需要看行業大數據
㈩ 如何運用大數據
1.可視化分析
大數據分析的使用者有大數據分析專家,同時還有普通用戶,但是他們二者對於大數據分析最基本的要求就是可視化分析,因為可視化分析能夠直觀的呈現大數據特點,同時能夠非常容易被讀者所接受,就如同看圖說話一樣簡單明了。
2. 數據挖掘演算法
大數據分析的理論核心就是數據挖掘演算法,各種數據挖掘的演算法基於不同的數據類型和格式才能更加科學的呈現出數據本身具備的特點,也正是因為這些被全世界統
計
學家所公認的各種統計方法(可以稱之為真理)才能深入數據內部,挖掘出公認的價值。另外一個方面也是因為有這些數據挖掘的演算法才能更快速的處理大數據,如
果一個演算法得花上好幾年才能得出結論,那大數據的價值也就無從說起了。
3. 預測性分析
大數據分析最終要的應用領域之一就是預測性分析,從大數據中挖掘出特點,通過科學的建立模型,之後便可以通過模型帶入新的數據,從而預測未來的數據。
4. 語義引擎
非結構化數據的多元化給數據分析帶來新的挑戰,我們需要一套工具系統的去分析,提煉數據。語義引擎需要設計到有足夠的人工智慧以足以從數據中主動地提取信息。
5.數據質量和數據管理。 大數據分析離不開數據質量和數據管理,高質量的數據和有效的數據管理,無論是在學術研究還是在商業應用領域,都能夠保證分析結果的真實和有價值。
大數據分析的基礎就是以上五個方面,當然更加深入大數據分析的話,還有很多很多更加有特點的、更加深入的、更加專業的大數據分析方法。
大數據的技術
數據採集: ETL工具負責將分布的、異構數據源中的數據如關系數據、平面數據文件等抽取到臨時中間層後進行清洗、轉換、集成,最後載入到數據倉庫或數據集市中,成為聯機分析處理、數據挖掘的基礎。
數據存取: 關系資料庫、NOSQL、SQL等。
基礎架構: 雲存儲、分布式文件存儲等。
數
據處理: 自然語言處理(NLP,Natural Language
Processing)是研究人與計算機交互的語言問題的一門學科。處理自然語言的關鍵是要讓計算機」理解」自然語言,所以自然語言處理又叫做自然語言理
解也稱為計算語言學。一方面它是語言信息處理的一個分支,另一方面它是人工智慧的核心課題之一。
統計分析:
假設檢驗、顯著性檢驗、差異分析、相關分析、T檢驗、 方差分析 、
卡方分析、偏相關分析、距離分析、回歸分析、簡單回歸分析、多元回歸分析、逐步回歸、回歸預測與殘差分析、嶺回歸、logistic回歸分析、曲線估計、
因子分析、聚類分析、主成分分析、因子分析、快速聚類法與聚類法、判別分析、對應分析、多元對應分析(最優尺度分析)、bootstrap技術等等。
數
據挖掘: 分類
(Classification)、估計(Estimation)、預測(Prediction)、相關性分組或關聯規則(Affinity
grouping or association rules)、聚類(Clustering)、描述和可視化、Description and
Visualization)、復雜數據類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
模型預測 :預測模型、機器學習、建模模擬。
結果呈現: 雲計算、標簽雲、關系圖等。
大數據的處理
1. 大數據處理之一:採集
大
數據的採集是指利用多個資料庫來接收發自客戶端(Web、App或者感測器形式等)的
數據,並且用戶可以通過這些資料庫來進行簡單的查詢和處理工作。比如,電商會使用傳統的關系型資料庫MySQL和Oracle等來存儲每一筆事務數據,除
此之外,Redis和MongoDB這樣的NoSQL資料庫也常用於數據的採集。
在大數據的採集過程中,其主要特點和挑戰是並發數高,因為同時
有可能會有成千上萬的用戶
來進行訪問和操作,比如火車票售票網站和淘寶,它們並發的訪問量在峰值時達到上百萬,所以需要在採集端部署大量資料庫才能支撐。並且如何在這些資料庫之間
進行負載均衡和分片的確是需要深入的思考和設計。
2. 大數據處理之二:導入/預處理
雖然採集端本身會有很多資料庫,但是如果要對這些
海量數據進行有效的分析,還是應該將這
些來自前端的數據導入到一個集中的大型分布式資料庫,或者分布式存儲集群,並且可以在導入基礎上做一些簡單的清洗和預處理工作。也有一些用戶會在導入時使
用來自Twitter的Storm來對數據進行流式計算,來滿足部分業務的實時計算需求。
導入與預處理過程的特點和挑戰主要是導入的數據量大,每秒鍾的導入量經常會達到百兆,甚至千兆級別。
3. 大數據處理之三:統計/分析
統
計與分析主要利用分布式資料庫,或者分布式計算集群來對存儲於其內的海量數據進行普通
的分析和分類匯總等,以滿足大多數常見的分析需求,在這方面,一些實時性需求會用到EMC的GreenPlum、Oracle的Exadata,以及基於
MySQL的列式存儲Infobright等,而一些批處理,或者基於半結構化數據的需求可以使用Hadoop。
統計與分析這部分的主要特點和挑戰是分析涉及的數據量大,其對系統資源,特別是I/O會有極大的佔用。
4. 大數據處理之四:挖掘
與
前面統計和分析過程不同的是,數據挖掘一般沒有什麼預先設定好的主題,主要是在現有數
據上面進行基於各種演算法的計算,從而起到預測(Predict)的效果,從而實現一些高級別數據分析的需求。比較典型演算法有用於聚類的Kmeans、用於
統計學習的SVM和用於分類的NaiveBayes,主要使用的工具有Hadoop的Mahout等。該過程的特點和挑戰主要是用於挖掘的演算法很復雜,並
且計算涉及的數據量和計算量都很大,常用數據挖掘演算法都以單線程為主。
整個大數據處理的普遍流程至少應該滿足這四個方面的步驟,才能算得上是一個比較完整的大數據處理。