數(shù)據(jù)分析方法(Data analytics )是專注從數(shù)據(jù)中提取見解的學(xué)科,包括數(shù)據(jù)分析、收集、組織和存儲(chǔ)數(shù)據(jù),以及執(zhí)行此操作的工具和技術(shù)。業(yè)務(wù)分析是數(shù)據(jù)分析方法的子集,Gartner 將業(yè)務(wù)分析定義為“用于構(gòu)建分析模型和模擬動(dòng)態(tài)以創(chuàng)建場景、了解現(xiàn)實(shí)和預(yù)測(cè)未來狀態(tài)的解決方案”。

來源:THINKSTOCK
一、什么是數(shù)據(jù)分析方法(Data analytics )?
數(shù)據(jù)分析方法是一門專注于從數(shù)據(jù)中提取見解或洞察的學(xué)科。它包括數(shù)據(jù)分析和管理的過程、工具和技術(shù),包括數(shù)據(jù)的收集、組織和存儲(chǔ)。數(shù)據(jù)分析方法的主要目的是應(yīng)用統(tǒng)計(jì)分析和技術(shù)來充分開發(fā)利用數(shù)據(jù)資源,以發(fā)現(xiàn)趨勢(shì)并解決問題。數(shù)據(jù)分析在企業(yè)中變得越來越重要,因?yàn)樗欠治龊退茉鞓I(yè)務(wù)流程以及改進(jìn)決策和業(yè)務(wù)成果的一種手段。
數(shù)據(jù)分析從一系列學(xué)科(包括計(jì)算機(jī)編程、數(shù)學(xué)和統(tǒng)計(jì)學(xué))中汲取靈感,對(duì)數(shù)據(jù)進(jìn)行分析,以描述、預(yù)測(cè)和提高性能。為了確??煽康姆治觯瑪?shù)據(jù)分析團(tuán)隊(duì)利用一系列數(shù)據(jù)管理技術(shù),包括數(shù)據(jù)挖掘、數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)建模等。
二、數(shù)據(jù)分析方法的四種類型是什么?
分析方法大致分為四種類型:描述性分析,試圖描述特定時(shí)間發(fā)生的事情;診斷分析,評(píng)估事情發(fā)生的原因;預(yù)測(cè)分析,確定未來發(fā)生某事的可能性;以及規(guī)范性分析,它提供了為實(shí)現(xiàn)預(yù)期結(jié)果而采取的建議行動(dòng)。
為了更具體地探討這些情況,描述性分析使用來自多個(gè)來源的歷史和當(dāng)前數(shù)據(jù),通過識(shí)別趨勢(shì)和模式來描述當(dāng)前狀態(tài)或指定的歷史狀態(tài)。在商業(yè)分析中,這是商業(yè)智能(BI) 的職權(quán)范圍。診斷分析使用數(shù)據(jù)(通常通過描述性分析生成)來發(fā)現(xiàn)過去表現(xiàn)的因素或原因。預(yù)測(cè)分析將統(tǒng)計(jì)建模、預(yù)測(cè)和機(jī)器學(xué)習(xí) (ML) 等技術(shù)應(yīng)用于描述性和診斷性分析的輸出,以預(yù)測(cè)未來結(jié)果。預(yù)測(cè)分析通常被認(rèn)為是一種“高級(jí)分析”,并且通常依賴于 ML 和/或深度學(xué)習(xí)。規(guī)范性分析也是一種高級(jí)分析,涉及應(yīng)用測(cè)試和其他技術(shù)來推薦將提供預(yù)期結(jié)果的特定解決方案。在業(yè)務(wù)中,預(yù)測(cè)分析使用 ML、業(yè)務(wù)規(guī)則和算法。
三、數(shù)據(jù)分析方法和技術(shù)
數(shù)據(jù)分析師使用多種方法和技術(shù)來分析數(shù)據(jù)。根據(jù)CareerFoundry的執(zhí)行編輯Emily Stevens的說法,最受歡迎的七個(gè)包括:
(一)回歸分析:一組統(tǒng)計(jì)過程,用于估計(jì)變量之間的關(guān)系,以確定一個(gè)或多個(gè)變量的變化如何影響另一個(gè)變量,例如,社交媒體的預(yù)算投入如何影響銷售。
(二)蒙特卡羅模擬:一種經(jīng)常用于風(fēng)險(xiǎn)分析的數(shù)學(xué)技術(shù),它依靠重復(fù)隨機(jī)抽樣來確定事件的各種結(jié)果的概率,避免由于輸入的不確定性程度而無法輕易預(yù)測(cè)。
(三)影響因子分析:一種統(tǒng)計(jì)方法,用于獲取大量數(shù)據(jù)集并將其簡化為更小、更易于管理的數(shù)據(jù)集,以發(fā)現(xiàn)隱藏的模式,例如,用于分析客戶忠誠度。
(四)隊(duì)列分析:一種分析形式,其中將數(shù)據(jù)集分解為具有共同特征的組或隊(duì)列進(jìn)行分析,例如,了解客戶細(xì)分。
(五)聚類分析:一種統(tǒng)計(jì)方法,其中項(xiàng)目被分類并組織成稱為聚類的組,以揭示數(shù)據(jù)中的結(jié)構(gòu);例如,保險(xiǎn)公司可能會(huì)使用聚類分析來調(diào)查某些位置與特定保險(xiǎn)索賠相關(guān)的原因。
(六)時(shí)間序列分析:一種統(tǒng)計(jì)技術(shù),通過分析設(shè)定時(shí)間段或間隔內(nèi)的數(shù)據(jù),以確定一段時(shí)間內(nèi)的趨勢(shì),例如每周銷售數(shù)字或季度銷售預(yù)測(cè)。
(七)情緒分析:一種使用自然語言處理、文本分析、計(jì)算語言學(xué)和其他工具來理解數(shù)據(jù)中表達(dá)的情緒的技術(shù),例如客戶根據(jù)客戶論壇中的響應(yīng)對(duì)品牌或產(chǎn)品的感受。前六種方法旨在分析定量數(shù)據(jù)(可以測(cè)量的數(shù)據(jù)),而情感分析則試圖通過將定性數(shù)據(jù)全部組織成主題來解釋和分類定性數(shù)據(jù)。
四、數(shù)據(jù)分析工具
數(shù)據(jù)分析師使用一系列工具來幫助他們從數(shù)據(jù)中獲取見解。一些最受歡迎的包括:
(一)Apache Spark:一個(gè)開源的數(shù)據(jù)科學(xué)平臺(tái),用于處理大數(shù)據(jù)并創(chuàng)建集群計(jì)算引擎
(二)Domo分析: 用于收集和轉(zhuǎn)換數(shù)據(jù)的 BI SaaS 平臺(tái)
(三)Excel:Microsoft用于數(shù)學(xué)分析和表格報(bào)告的電子表格軟件
(四)Klipfolio:基于云的Web 應(yīng)用程序,用于自助式 BI 和報(bào)告
(五)Looker:Google的數(shù)據(jù)分析和 BI 平臺(tái)
(六)Power BI:Microsoft的數(shù)據(jù)可視化和分析工具,用于創(chuàng)建和分發(fā)報(bào)表和儀表板
(七)Python:一種深受數(shù)據(jù)科學(xué)家歡迎的開源編程語言,用于提取、匯總和可視化數(shù)據(jù)
(八)Qlik:一套用于探索數(shù)據(jù)和創(chuàng)建數(shù)據(jù)可視化的工具
(九)QuickSight:Amazon的一項(xiàng)分析服務(wù),旨在與云數(shù)據(jù)源集成
(十)R:用于統(tǒng)計(jì)分析和圖形建模的開源數(shù)據(jù)分析工具(An open-source data analytics tool for statistical analysis and graphical modeling)
(十五)RapidMiner:包含可視化工作流設(shè)計(jì)器的數(shù)據(jù)科學(xué)平臺(tái)
(十六)SAP Analytics Cloud: 基于云的分析和規(guī)劃解決方案
(十七)SAS公司:用于商業(yè)智能和數(shù)據(jù)挖掘的分析平臺(tái)
(十八)Sisense:流行的自助式BI 平臺(tái)
(十九)Tableau:Salesforce的數(shù)據(jù)分析軟件,用于創(chuàng)建數(shù)據(jù)儀表板和可視化
(二十)Talend塔倫德:數(shù)據(jù)工程師、數(shù)據(jù)架構(gòu)師、分析師和開發(fā)人員使用的ETL 工具
(二十一)Zoho分析:自助式 BI 和數(shù)據(jù)分析平臺(tái)
五、數(shù)據(jù)分析方法與數(shù)據(jù)科學(xué)(Data analytics vs. data science)
數(shù)據(jù)分析方法是數(shù)據(jù)科學(xué)的一個(gè)組成部分,用于了解組織的數(shù)據(jù)是什么樣子的。通常,數(shù)據(jù)分析方法的輸出是報(bào)告和可視化。數(shù)據(jù)科學(xué)利用數(shù)據(jù)分析方法的輸出來研究和解決問題。
數(shù)據(jù)分析方法和數(shù)據(jù)科學(xué)之間的區(qū)別通常在于時(shí)間尺度。數(shù)據(jù)分析方法描述了現(xiàn)實(shí)的當(dāng)前或歷史狀態(tài),而數(shù)據(jù)科學(xué)則使用該數(shù)據(jù)來預(yù)測(cè)和/或理解未來。
六、數(shù)據(jù)分析方法與數(shù)據(jù)分析技術(shù)(Data analytics vs. data analysis)
雖然數(shù)據(jù)分析方法和數(shù)據(jù)分析技術(shù)這兩個(gè)術(shù)語經(jīng)?;Q使用(福建CIO網(wǎng)注:道與術(shù)的關(guān)系),但數(shù)據(jù)分析技術(shù)是數(shù)據(jù)分析方法論的一個(gè)子集,涉及檢查、清理、轉(zhuǎn)換和建模數(shù)據(jù)以得出結(jié)論。數(shù)據(jù)分析方法包括用于執(zhí)行數(shù)據(jù)分析的工具、技術(shù)與方法。
七、數(shù)據(jù)分析方法與業(yè)務(wù)分析
業(yè)務(wù)分析是數(shù)據(jù)分析方法的另一個(gè)子集。它使用數(shù)據(jù)分析技術(shù),包括數(shù)據(jù)挖掘、統(tǒng)計(jì)分析和預(yù)測(cè)建模,來推動(dòng)更好的業(yè)務(wù)決策。Gartner 將業(yè)務(wù)分析定義為“用于構(gòu)建分析模型和模擬動(dòng)態(tài)以創(chuàng)建場景、了解現(xiàn)實(shí)和預(yù)測(cè)未來狀態(tài)的解決方案”。
八、數(shù)據(jù)分析方法的示例
各行各業(yè)的組織都利用數(shù)據(jù)分析來改善運(yùn)營、增加收入并促進(jìn)數(shù)字化轉(zhuǎn)型。這里有三個(gè)例子:
(一)費(fèi)森尤斯醫(yī)療通過預(yù)測(cè)分析預(yù)測(cè)并發(fā)癥:費(fèi)森尤斯醫(yī)療公司專門提供腎透析服務(wù),率先使用近乎實(shí)時(shí)的物聯(lián)網(wǎng)數(shù)據(jù)和臨床數(shù)據(jù)來預(yù)測(cè)腎透析患者何時(shí)可能遭受可能危及生命的并發(fā)癥,稱為透析中低血壓(IDH)。
(二)UPS通過預(yù)測(cè)分析提供彈性和靈活性:跨國運(yùn)輸公司 UPS 創(chuàng)建了統(tǒng)一企業(yè)分析工具 (HEAT),以幫助其捕獲和分析客戶數(shù)據(jù)、運(yùn)營數(shù)據(jù)和計(jì)劃數(shù)據(jù),以跟蹤每個(gè)包裹在其網(wǎng)絡(luò)中移動(dòng)時(shí)的實(shí)時(shí)狀態(tài)。該工具幫助它跟蹤每天交付的大約 2100 萬個(gè)包裹。
(三)預(yù)測(cè)分析幫助Owens Corning 開發(fā)渦輪葉片:制造商歐文斯·康寧(Owens Corning)在其卓越分析中心的幫助下,使用預(yù)測(cè)分析來簡化測(cè)試用于制造風(fēng)力渦輪機(jī)葉片玻璃織物的粘合劑的過程。預(yù)測(cè)分析幫助該公司將任何給定新材料的測(cè)試時(shí)間從 10 天縮短到大約 2 小時(shí)。
九、數(shù)據(jù)分析崗位的工資
根據(jù)PayScale 的數(shù)據(jù),數(shù)據(jù)分析師的平均年薪為 66,310 美元,據(jù)報(bào)道的工資范圍為 48,000 美元至 91,000 美元。類似職位的薪資數(shù)據(jù)包括:
職稱? ? ? ? ? ? ? ? ? 薪資范圍? ? ? ? ? ? ? ? 平均工資
分析經(jīng)理 澳元 $74,000 - $136,000? ? 104,540美元
業(yè)務(wù)分析師 $50,000 至 $88,000? ? ? ? ?66,898美元
IT業(yè)務(wù)分析師 澳元 $54,000 - $104,000 73,893美元
數(shù)據(jù)分析師 澳元 $48,000 - $91,000? ? ?66,310美元
市場研究分析師 澳元 $44,000 至 $80,000 59,103美元
運(yùn)籌學(xué)分析師 澳元 $51,000 - $120,000 82,833美元
定量分析師 澳元 $65,000 - $142,000? ? ?92,089美元
高級(jí)業(yè)務(wù)分析師 澳元 $67,000 - $121,000 89,595美元
統(tǒng)計(jì)員 澳元 $59,000 - $126,000? ? ? ? ?86,349美元
PayScale還確定了數(shù)據(jù)分析師的薪水高于全國平均水平的城市。其中包括舊金山(30.8%)、紐約(10.7%)和華盛頓(10%)。