《數(shù)據(jù)分析與決策》課件_第1頁
《數(shù)據(jù)分析與決策》課件_第2頁
《數(shù)據(jù)分析與決策》課件_第3頁
《數(shù)據(jù)分析與決策》課件_第4頁
《數(shù)據(jù)分析與決策》課件_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)分析與決策課程簡介:數(shù)據(jù)驅(qū)動決策的重要性為什么選擇數(shù)據(jù)驅(qū)動決策?數(shù)據(jù)驅(qū)動決策能夠減少主觀臆斷,基于客觀數(shù)據(jù)進行分析,從而提高決策的準確性和效率。在快速變化的市場環(huán)境中,依靠直覺和經(jīng)驗已經(jīng)遠遠不夠,只有通過數(shù)據(jù)分析才能洞察市場趨勢,把握機遇。數(shù)據(jù)驅(qū)動決策的優(yōu)勢課程目標:掌握數(shù)據(jù)分析方法,提升決策能力1掌握數(shù)據(jù)分析的核心方法本課程將系統(tǒng)講解數(shù)據(jù)分析的各個環(huán)節(jié),包括數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)分析和數(shù)據(jù)可視化。通過案例分析和實踐操作,讓您能夠熟練運用各種數(shù)據(jù)分析工具和技術。2提升數(shù)據(jù)驅(qū)動的決策能力本課程將幫助您培養(yǎng)數(shù)據(jù)驅(qū)動的思維模式,讓您能夠從數(shù)據(jù)中發(fā)現(xiàn)問題、分析問題、解決問題。通過學習決策模型和方法,您將能夠做出更加明智和有效的決策。培養(yǎng)批判性思維和創(chuàng)新能力課程大綱:內(nèi)容概要1數(shù)據(jù)分析基礎介紹數(shù)據(jù)分析的基本概念、流程和方法,包括數(shù)據(jù)的類型、來源、收集和清洗。通過實際案例,讓您了解數(shù)據(jù)分析的重要性和應用場景。2描述性統(tǒng)計與探索性數(shù)據(jù)分析講解描述性統(tǒng)計的基本概念和計算方法,包括集中趨勢、離散程度和分布形狀。介紹探索性數(shù)據(jù)分析(EDA)的基本方法,包括可視化、數(shù)據(jù)透視表和案例分析。3假設檢驗與相關分析講解假設檢驗的基本概念和方法,包括t檢驗、卡方檢驗和方差分析。介紹相關分析的基本概念和方法,包括Pearson相關和Spearman相關。4回歸分析與時間序列分析講解回歸分析的基本概念和方法,包括線性回歸、多元線性回歸和邏輯回歸。介紹時間序列分析的基本概念和方法,包括平穩(wěn)性檢驗和ARIMA模型。5數(shù)據(jù)挖掘與商業(yè)智能講解數(shù)據(jù)挖掘的基本概念和方法,包括分類算法、聚類算法和關聯(lián)規(guī)則。介紹商業(yè)智能(BI)的概念和應用,包括Tableau和PowerBI。6決策支持系統(tǒng)與風險管理講解決策支持系統(tǒng)(DSS)的概念和架構(gòu),包括案例分析。介紹風險評估與管理的基本概念和方法,包括風險評估方法和風險管理策略。為什么要學習數(shù)據(jù)分析?提升職業(yè)競爭力在當今社會,數(shù)據(jù)分析技能已經(jīng)成為各行各業(yè)都需要的核心能力。掌握數(shù)據(jù)分析技能,能夠讓您在求職和晉升中更具競爭力。提高決策質(zhì)量數(shù)據(jù)分析能夠幫助您基于客觀數(shù)據(jù)進行決策,減少主觀臆斷,提高決策的準確性和效率。這對于企業(yè)和個人都至關重要。發(fā)現(xiàn)潛在機遇通過數(shù)據(jù)分析,您可以發(fā)現(xiàn)隱藏在數(shù)據(jù)中的潛在機遇,從而為企業(yè)帶來新的增長點,為個人帶來新的發(fā)展機會。數(shù)據(jù)分析的應用場景零售行業(yè)通過分析銷售數(shù)據(jù)、客戶行為數(shù)據(jù)等,優(yōu)化商品陳列、促銷策略,提高銷售額和客戶滿意度。醫(yī)療行業(yè)通過分析患者數(shù)據(jù)、疾病數(shù)據(jù)等,提高診斷準確率、治療效果,降低醫(yī)療成本。制造業(yè)通過分析生產(chǎn)數(shù)據(jù)、設備數(shù)據(jù)等,優(yōu)化生產(chǎn)流程、提高生產(chǎn)效率,降低生產(chǎn)成本。金融行業(yè)通過分析交易數(shù)據(jù)、信用數(shù)據(jù)等,識別欺詐行為、評估信用風險,提高風控能力。數(shù)據(jù)分析的流程數(shù)據(jù)收集從各種來源收集原始數(shù)據(jù),包括內(nèi)部數(shù)據(jù)庫、外部數(shù)據(jù)源和第三方數(shù)據(jù)供應商。數(shù)據(jù)清洗處理缺失值、異常值和重復值,將原始數(shù)據(jù)轉(zhuǎn)換為干凈、規(guī)范的數(shù)據(jù)。數(shù)據(jù)分析運用各種數(shù)據(jù)分析方法,如描述性統(tǒng)計、假設檢驗、回歸分析等,從數(shù)據(jù)中提取有價值的信息。數(shù)據(jù)可視化將數(shù)據(jù)分析結(jié)果以圖表、圖形等形式呈現(xiàn)出來,方便理解和溝通。決策支持基于數(shù)據(jù)分析結(jié)果,為決策者提供決策支持,幫助他們做出明智的決策。數(shù)據(jù)的類型與來源數(shù)據(jù)類型數(shù)值型數(shù)據(jù):可以進行數(shù)值計算的數(shù)據(jù),如年齡、收入等。類別型數(shù)據(jù):表示類別或?qū)傩缘臄?shù)據(jù),如性別、學歷等。文本型數(shù)據(jù):以文本形式存在的數(shù)據(jù),如評論、日志等。數(shù)據(jù)來源內(nèi)部數(shù)據(jù):企業(yè)內(nèi)部產(chǎn)生的數(shù)據(jù),如銷售數(shù)據(jù)、客戶數(shù)據(jù)等。外部數(shù)據(jù):企業(yè)外部獲取的數(shù)據(jù),如市場調(diào)研數(shù)據(jù)、行業(yè)報告等。公開數(shù)據(jù):政府、機構(gòu)等公開的數(shù)據(jù),如統(tǒng)計數(shù)據(jù)、地理數(shù)據(jù)等。數(shù)據(jù)的收集方法問卷調(diào)查1訪談2實驗3觀察4數(shù)據(jù)收集是數(shù)據(jù)分析的第一步,選擇合適的收集方法至關重要。問卷調(diào)查適用于大規(guī)模數(shù)據(jù)收集,訪談適用于深入了解用戶需求,實驗適用于驗證假設,觀察適用于研究用戶行為。在實際應用中,可以根據(jù)具體情況選擇多種收集方法。數(shù)據(jù)清洗:處理缺失值1刪除缺失值直接刪除包含缺失值的行或列,適用于缺失值較少的情況。2填充缺失值用均值、中位數(shù)、眾數(shù)等統(tǒng)計量填充缺失值,適用于數(shù)值型數(shù)據(jù)。3插值法填充用插值法根據(jù)已有數(shù)據(jù)推算缺失值,適用于時間序列數(shù)據(jù)。4模型預測填充用機器學習模型預測缺失值,適用于復雜的數(shù)據(jù)關系。數(shù)據(jù)清洗:處理異常值識別異常值箱線圖:通過上下四分位數(shù)和IQR識別異常值。散點圖:直觀展示數(shù)據(jù)分布,識別遠離大部分數(shù)據(jù)的點。統(tǒng)計方法:如3σ原則,超出均值±3倍標準差的為異常值。處理異常值刪除異常值:直接刪除異常值,適用于異常值較少的情況。替換異常值:用均值、中位數(shù)等替換異常值,適用于數(shù)值型數(shù)據(jù)。分箱處理:將數(shù)據(jù)分到不同的箱子中,降低異常值的影響。數(shù)據(jù)清洗:數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)類型轉(zhuǎn)換將數(shù)據(jù)轉(zhuǎn)換為合適的類型,如將字符串轉(zhuǎn)換為數(shù)值、將日期轉(zhuǎn)換為時間戳等。數(shù)據(jù)標準化將數(shù)據(jù)縮放到相同的范圍,如將數(shù)據(jù)縮放到0-1之間,適用于機器學習算法。數(shù)據(jù)離散化將連續(xù)型數(shù)據(jù)轉(zhuǎn)換為離散型數(shù)據(jù),如將年齡劃分為不同的年齡段。數(shù)據(jù)清洗案例:實際操作以客戶數(shù)據(jù)為例,包括客戶ID、姓名、年齡、性別、收入、注冊時間等。數(shù)據(jù)中存在缺失值、異常值和數(shù)據(jù)類型錯誤等問題。首先,處理缺失值,用平均年齡填充缺失的年齡,用眾數(shù)填充缺失的性別。然后,識別異常值,刪除收入超過100萬的客戶。最后,轉(zhuǎn)換數(shù)據(jù)類型,將注冊時間轉(zhuǎn)換為日期格式。importpandasaspd#讀取數(shù)據(jù)df=pd.read_csv('customer_data.csv')#填充缺失值df['age'].fillna(df['age'].mean(),inplace=True)df['gender'].fillna(df['gender'].mode()[0],inplace=True)#刪除異常值df=df[df['income']<=1000000]#轉(zhuǎn)換數(shù)據(jù)類型df['register_time']=pd.to_datetime(df['register_time'])描述性統(tǒng)計:集中趨勢均值(Mean)所有數(shù)據(jù)的總和除以數(shù)據(jù)的個數(shù),反映數(shù)據(jù)的平均水平。中位數(shù)(Median)將數(shù)據(jù)按大小排序后,位于中間位置的數(shù),不受異常值影響。眾數(shù)(Mode)數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù),適用于類別型數(shù)據(jù)。描述性統(tǒng)計:離散程度方差(Variance)衡量數(shù)據(jù)離散程度的指標,反映數(shù)據(jù)偏離均值的程度。標準差(StandardDeviation)方差的平方根,更容易理解和比較。四分位距(IQR)上四分位數(shù)與下四分位數(shù)的差,反映中間50%數(shù)據(jù)的離散程度。描述性統(tǒng)計:分布形狀偏度(Skewness)衡量數(shù)據(jù)分布對稱性的指標,偏度為正表示右偏,偏度為負表示左偏。峰度(Kurtosis)衡量數(shù)據(jù)分布尖峭程度的指標,峰度大于3表示尖峰,峰度小于3表示扁平。探索性數(shù)據(jù)分析(EDA)數(shù)據(jù)可視化通過圖表、圖形等形式展示數(shù)據(jù),幫助發(fā)現(xiàn)數(shù)據(jù)中的模式、趨勢和異常值。數(shù)據(jù)透視表對數(shù)據(jù)進行匯總和分析,幫助從不同的角度了解數(shù)據(jù)。統(tǒng)計分析運用描述性統(tǒng)計和推斷統(tǒng)計方法,對數(shù)據(jù)進行深入分析。EDA:可視化方法直方圖展示數(shù)值型數(shù)據(jù)的分布情況。散點圖展示兩個變量之間的關系。箱線圖展示數(shù)據(jù)的分布、中位數(shù)和異常值。EDA:數(shù)據(jù)透視表數(shù)據(jù)透視表是一種強大的數(shù)據(jù)匯總和分析工具,可以快速地對數(shù)據(jù)進行分組、篩選、排序和計算。通過數(shù)據(jù)透視表,可以從不同的維度了解數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)中的模式和趨勢。例如,可以按地區(qū)、產(chǎn)品類別和時間段對銷售數(shù)據(jù)進行匯總,分析不同地區(qū)的銷售情況,不同產(chǎn)品的銷售趨勢,以及不同時間段的銷售變化。importpandasaspd#讀取數(shù)據(jù)df=pd.read_csv('sales_data.csv')#創(chuàng)建數(shù)據(jù)透視表pivot_table=pd.pivot_table(df,values='sales',index='region',columns='product_category',aggfunc='sum')#打印數(shù)據(jù)透視表print(pivot_table)EDA:案例分析以電商平臺的用戶行為數(shù)據(jù)為例,包括用戶ID、瀏覽時間、點擊商品、購買商品等。首先,通過數(shù)據(jù)可視化,了解用戶的活躍時間段、熱門商品等。然后,通過數(shù)據(jù)透視表,分析不同用戶的購買偏好、購買金額等。最后,通過統(tǒng)計分析,計算用戶的平均購買金額、復購率等,從而了解用戶的行為特征,為精準營銷提供依據(jù)。假設檢驗:基本概念原假設(NullHypothesis)對總體參數(shù)的某種假設,通常表示為“沒有差異”、“沒有影響”等。備擇假設(AlternativeHypothesis)與原假設相反的假設,通常表示為“存在差異”、“存在影響”等。顯著性水平(SignificanceLevel)犯第一類錯誤的概率,通常用α表示,常見的取值為0.05或0.01。p值(p-value)在原假設成立的條件下,出現(xiàn)觀測結(jié)果或更極端結(jié)果的概率。假設檢驗:t檢驗單樣本t檢驗檢驗單個樣本的均值是否與給定的值存在顯著差異。獨立樣本t檢驗檢驗兩個獨立樣本的均值是否存在顯著差異。配對樣本t檢驗檢驗兩個配對樣本的均值是否存在顯著差異。假設檢驗:卡方檢驗卡方擬合優(yōu)度檢驗檢驗樣本數(shù)據(jù)的分布是否與理論分布相符??ǚ姜毩⑿詸z驗檢驗兩個類別型變量之間是否存在關聯(lián)。假設檢驗:方差分析單因素方差分析檢驗一個因素的不同水平對因變量的影響是否存在顯著差異。雙因素方差分析檢驗兩個因素的不同水平對因變量的影響是否存在顯著差異,以及兩個因素之間是否存在交互作用。相關分析:Pearson相關Pearson相關系數(shù)用于衡量兩個數(shù)值型變量之間的線性關系,取值范圍為-1到1。當相關系數(shù)為1時,表示完全正相關;當相關系數(shù)為-1時,表示完全負相關;當相關系數(shù)為0時,表示沒有線性關系。Pearson相關系數(shù)只能衡量線性關系,不能衡量非線性關系。例如,可以計算身高和體重之間的Pearson相關系數(shù),了解身高和體重之間的關系。importpandasaspd#讀取數(shù)據(jù)df=pd.read_csv('data.csv')#計算Pearson相關系數(shù)correlation=df['height'].corr(df['weight'],method='pearson')#打印相關系數(shù)print(correlation)相關分析:Spearman相關1Spearman等級相關Spearman等級相關系數(shù)用于衡量兩個變量之間的單調(diào)關系,即使變量之間的關系不是線性的,也可以使用Spearman等級相關系數(shù)。2應用場景Spearman等級相關系數(shù)適用于非正態(tài)分布的數(shù)據(jù),或者變量之間的關系不是線性的情況。例如,可以計算電影評分和票房之間的Spearman等級相關系數(shù)。3計算方法首先將變量按大小排序,然后計算等級之間的Pearson相關系數(shù)?;貧w分析:線性回歸線性回歸模型線性回歸模型用于描述因變量與自變量之間的線性關系,可以用來預測因變量的值。最小二乘法最小二乘法是一種常用的線性回歸模型求解方法,通過最小化殘差平方和來確定回歸系數(shù)。模型評估指標常用的模型評估指標包括R平方、均方誤差、均方根誤差等,用于評估模型的擬合效果?;貧w分析:多元線性回歸多元線性回歸模型多元線性回歸模型用于描述因變量與多個自變量之間的線性關系,可以用來預測因變量的值。變量選擇在構(gòu)建多元線性回歸模型時,需要選擇合適的自變量,常用的變量選擇方法包括逐步回歸、向前選擇和向后選擇。多重共線性多重共線性是指自變量之間存在高度相關性,會導致回歸系數(shù)估計不穩(wěn)定,需要進行處理?;貧w分析:邏輯回歸邏輯回歸模型邏輯回歸模型用于解決二分類問題,預測事件發(fā)生的概率。OddsRatioOddsRatio是邏輯回歸模型中常用的指標,用于衡量事件發(fā)生的可能性。回歸分析:模型評估R平方衡量模型解釋因變量變異的程度,取值范圍為0到1,值越大表示模型擬合效果越好。均方誤差(MSE)衡量模型預測值與真實值之間的平均差異,值越小表示模型預測精度越高。均方根誤差(RMSE)均方誤差的平方根,更容易理解和比較。ROC曲線用于評估二分類模型的性能,曲線越靠近左上角表示模型性能越好。時間序列分析:基本概念時間序列按時間順序排列的一系列數(shù)據(jù)點,例如股票價格、銷售額等。趨勢(Trend)時間序列在長期內(nèi)的總體變化方向。季節(jié)性(Seasonality)時間序列在一年內(nèi)的周期性變化。周期性(Cyclical)時間序列在較長時間內(nèi)的波動。時間序列分析:平穩(wěn)性檢驗平穩(wěn)性時間序列的統(tǒng)計特性不隨時間變化,是進行時間序列分析的前提。ADF檢驗ADF檢驗是一種常用的平穩(wěn)性檢驗方法,用于檢驗時間序列是否存在單位根。差分法差分法是一種常用的時間序列平穩(wěn)化方法,通過計算時間序列的差分來消除趨勢和季節(jié)性。時間序列分析:ARIMA模型AR(自回歸)使用自身過去的值來預測未來的值。MA(移動平均)使用過去預測誤差的移動平均來預測未來的值。I(積分)對時間序列進行差分,使其平穩(wěn)。數(shù)據(jù)挖掘:基本概念定義從大量數(shù)據(jù)中發(fā)現(xiàn)有用的模式和知識的過程。目標發(fā)現(xiàn)數(shù)據(jù)中的模式、趨勢和關聯(lián),為決策提供支持。常用技術分類、聚類、關聯(lián)規(guī)則等。數(shù)據(jù)挖掘:分類算法決策樹通過構(gòu)建樹狀模型來進行分類,易于理解和解釋。支持向量機(SVM)通過尋找最優(yōu)超平面來進行分類,具有良好的泛化能力。樸素貝葉斯基于貝葉斯定理進行分類,簡單高效。數(shù)據(jù)挖掘:聚類算法K-means將數(shù)據(jù)劃分為K個簇,每個簇的數(shù)據(jù)點具有相似的特征。層次聚類通過構(gòu)建層次結(jié)構(gòu)來進行聚類,可以得到不同層次的聚類結(jié)果。DBSCAN基于密度進行聚類,可以發(fā)現(xiàn)任意形狀的簇。數(shù)據(jù)挖掘:關聯(lián)規(guī)則Apriori算法一種經(jīng)典的關聯(lián)規(guī)則挖掘算法,用于發(fā)現(xiàn)頻繁項集和關聯(lián)規(guī)則。支持度衡量項集在數(shù)據(jù)集中出現(xiàn)的頻率。置信度衡量關聯(lián)規(guī)則的可靠性。提升度衡量關聯(lián)規(guī)則的實際效果。決策樹:算法原理基本思想通過遞歸地將數(shù)據(jù)集劃分為不同的子集,構(gòu)建樹狀模型來進行分類或回歸。節(jié)點決策樹中的每個節(jié)點表示一個特征或?qū)傩?。分支決策樹中的每個分支表示一個決策規(guī)則。葉子節(jié)點決策樹中的葉子節(jié)點表示一個類別或預測值。決策樹:構(gòu)建過程特征選擇選擇合適的特征作為劃分數(shù)據(jù)集的依據(jù),常用的特征選擇方法包括信息增益、信息增益比和基尼指數(shù)。樹的生成遞歸地將數(shù)據(jù)集劃分為不同的子集,直到滿足停止條件為止。剪枝對決策樹進行簡化,防止過擬合。決策樹:模型評估準確率衡量模型預測正確的樣本比例。召回率衡量模型正確識別出的正樣本比例。F1值準確率和召回率的調(diào)和平均數(shù),綜合評價模型的性能。決策樹:應用案例信用風險評估使用決策樹模型評估客戶的信用風險,決定是否給予貸款。疾病診斷使用決策樹模型輔助醫(yī)生進行疾病診斷,提高診斷準確率??蛻艏毞质褂脹Q策樹模型將客戶劃分為不同的群體,進行個性化營銷。神經(jīng)網(wǎng)絡:基本原理神經(jīng)元神經(jīng)網(wǎng)絡的基本單元,模擬生物神經(jīng)元的功能。激活函數(shù)對神經(jīng)元的輸出進行非線性變換,增強模型的表達能力。權重連接神經(jīng)元之間的強度,用于調(diào)整神經(jīng)元之間的影響。偏置調(diào)整神經(jīng)元的輸出,使其更符合實際情況。神經(jīng)網(wǎng)絡:模型構(gòu)建選擇網(wǎng)絡結(jié)構(gòu)根據(jù)實際問題選擇合適的網(wǎng)絡結(jié)構(gòu),如前饋神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡等。初始化權重對神經(jīng)網(wǎng)絡的權重進行初始化,常用的初始化方法包括隨機初始化和Xavier初始化。定義損失函數(shù)定義損失函數(shù),用于衡量模型的預測結(jié)果與真實結(jié)果之間的差異。神經(jīng)網(wǎng)絡:訓練方法反向傳播根據(jù)損失函數(shù)計算梯度,并將梯度反向傳播到神經(jīng)網(wǎng)絡的每一層,更新權重。優(yōu)化器選擇合適的優(yōu)化器,如梯度下降、Adam等,用于更新權重。學習率調(diào)整學習率,控制權重更新的幅度。神經(jīng)網(wǎng)絡:應用案例圖像識別使用卷積神經(jīng)網(wǎng)絡進行圖像識別,如人臉識別、物體識別等。自然語言處理使用循環(huán)神經(jīng)網(wǎng)絡進行自然語言處理,如文本分類、機器翻譯等。推薦系統(tǒng)使用神經(jīng)網(wǎng)絡構(gòu)建推薦系統(tǒng),為用戶推薦感興趣的商品或內(nèi)容。大數(shù)據(jù)分析:概念與特點Volume(大量)數(shù)據(jù)量巨大,傳統(tǒng)的數(shù)據(jù)庫和分析工具難以處理。Velocity(高速)數(shù)據(jù)產(chǎn)生和處理速度快,需要實時或近實時分析。Variety(多樣)數(shù)據(jù)類型多樣,包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。Veracity(真實)數(shù)據(jù)質(zhì)量參差不齊,需要進行清洗和驗證。Value(價值)數(shù)據(jù)中蘊含著巨大的價值,需要通過分析才能發(fā)現(xiàn)。大數(shù)據(jù)分析:常用工具Hadoop分布式存儲和計算框架,用于處理大規(guī)模數(shù)據(jù)。Spark快速的內(nèi)存計算引擎,用于進行大數(shù)據(jù)分析和機器學習。Hive基于Hadoop的數(shù)據(jù)倉庫工具,用于進行數(shù)據(jù)查詢和分析。Pig高級數(shù)據(jù)流語言,用于進行數(shù)據(jù)轉(zhuǎn)換和分析。大數(shù)據(jù)分析:HadoopHDFSHadoop分布式文件系統(tǒng),用于存儲大規(guī)模數(shù)據(jù)。MapReduceHadoop分布式計算框架,用于處理大規(guī)模數(shù)據(jù)。YARNHadoop資源管理器,用于管理集群資源。大數(shù)據(jù)分析:SparkRDD彈性分布式數(shù)據(jù)集,是Spark的基本數(shù)據(jù)抽象。SparkSQL用于進行結(jié)構(gòu)化數(shù)據(jù)處理的組件。SparkStreaming用于進行實時數(shù)據(jù)處理的組件。MLlibSpark機器學習庫,提供常用的機器學習算法。商業(yè)智能(BI):概念與應用定義利用數(shù)據(jù)倉庫、在線分析處理、數(shù)據(jù)挖掘等技術,將企業(yè)的海量業(yè)務數(shù)據(jù)轉(zhuǎn)化為知識,輔助決策。應用銷售分析、客戶分析、財務分析、供應鏈分析等。目標提高決策效率和質(zhì)量,優(yōu)化業(yè)務流程,提升企業(yè)競爭力。BI工具:Tableau特點強大的數(shù)據(jù)可視化能力。易于使用,無需編程。支持多種數(shù)據(jù)源。功能數(shù)據(jù)連接與準備。數(shù)據(jù)可視化分析。儀表盤創(chuàng)建與分享。BI工具:PowerBI特點與MicrosoftOffice集成。強大的數(shù)據(jù)建模能力。支持云端部署。功能數(shù)據(jù)連接與轉(zhuǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論