⑴ 大數據怎麼學
一、數據分析師有哪些要求?
1、理論要求及對數字的敏感性,包括統計知識、市場研究、模型原理等。
2、工具使用,包括挖掘工具、資料庫、常用辦公軟體(excel、PPT、word、腦圖)等。
3、業務理解能力和對商業的敏感性。對商業及產品要有深刻的理解,因為數據分析的出發點就是要解決商業的問題,只有理解了商業問題,才能轉換成數據分析的問題,從而滿足部門的要求。
4、匯報和圖表展現能力。這是臨門一腳,做得再好的分析模型,如果不能很好地展示給領導和客戶,成效就大打折扣,也會影響到數據分析師的職業晉升。
二、請把數據分析作為一種能力來培養
從廣義來說,現在大多數的工作都需要用到分析能力,特別是數據化運營理念深入的今天,像BAT這樣的公司強調全員參與數據化運營,所以,把它作為一種能力培訓,將會讓你終生受益。
三、從數據分析的四個步驟來看清數據分析師需具備的能力和知識:
數據分析的四個步驟(這有別於數據挖掘流程:商業理解、數據理解、數據准備、模型搭建、模型評估、模型部署),是從更宏觀地展示數據分析的過程:獲取數據、處理數據、分析數據、呈現數據。
(一) 獲取數據
獲取數據的前提是對商業問題的理解,把商業問題轉化成數據問題,要通過現象發現本質,確定從哪些緯度來分析問題,界定問題後,進行數據的採集。此環節,需要數據分析師具備結構化的思維和對商業問題的理解能力。
推薦書籍:《金字塔原理》、麥肯錫三部曲:《麥肯錫意識》、《麥肯錫工具》、《麥肯錫方法》
工具:思維導圖、mindmanager軟體
(二) 處理數據
一個數據分析項目,通常數據處理時間佔70%以上,使用先進的工具有利於提升效率,所以盡量學習最新最有效的處理工具,以下介紹的是最傳統的,但卻很有效率的工具:
Excel:日常在做通報、報告和抽樣分析中經常用到,其圖表功能很強大,處理10萬級別的數據很輕松。
UltraEdit:文本工具,比TXT工具好用,打開和運行速度都比較快。
ACCESS:桌面資料庫,主要是用於日常的抽樣分析(做全量統計分析,消耗資源和時間較多,通常分析師會隨機抽取部分數據進行分析),使用SQL語言,處理100萬級別的數據還是很快捷。
Orcle、SQL sever:處理千萬級別的數據需要用到這兩類資料庫。
當然,在自己能力和時間允許的情況下,學習新流行的分布式資料庫及提升自身的編程能力,對未來的職業發展也有很大幫助。
分析軟體主要推薦:
SPSS系列:老牌的統計分析軟體,SPSS Statistics(偏統計功能、市場研究)、SPSS Modeler(偏數據挖掘),不用編程,易學。
SAS:老牌經典挖掘軟體,需要編程。
R:開源軟體,新流行,對非結構化數據處理效率上更高,需編程。
隨著文本挖掘技術進一步發展,對非結構化數據的分析需求也越來越大,需要進一步關注文本挖掘工具的使用。
(三) 分析數據
分析數據,需要用到各類的模型,包括關聯規則、聚類、分類、預測模型等,其中一個最重要的思想是對比,任何的數據需要在參照系下進行對比,結論才有意義。
推薦的書籍:
1、《數據挖掘與數據化運營實戰,思路、方法、技巧與應用》,盧輝著,機械出版社。這本書是近年國內寫得最好的,務必把它當作聖經一樣來讀。
2、《誰說菜鳥不會數據分析(入門篇)》和《誰說菜鳥不會數據分析(工具篇)》,張文霖等編著。屬於入門級的書,適合初學者。
3、《統計學》第五版,賈俊平等編著,中國人民大學出版社。比較好的一本統計學的書。
4、《數據挖掘導論》完整版,[美]Pang-Ning Tan等著,范明等翻譯,人民郵電出版社。
5、《數據挖掘概念與技術》,Jiawei Han等著,范明等翻譯,機械工業出版社。這本書相對難一些。
6、《市場研究定量分析方法與應用》,簡明等編著,中國人民大學出版社。
7、《問卷統計分析實務—SPSS操作與應用》,吳明隆著,重慶大學出版社。在市場調查領域比較出名的一本書,對問卷調查數據分析講解比較詳細。
(四) 呈現數據
該部分需要把數據結果進行有效的呈現和演講匯報,需要用到金字塔原理、圖表及PPT、word的呈現,培養良好的演講能力。