商業(yè)數(shù)據(jù)分析理念與方法 課件 第6、7章 課件 - 商業(yè)運(yùn)營(yíng)與規(guī)劃、商業(yè)預(yù)測(cè)_第1頁(yè)
商業(yè)數(shù)據(jù)分析理念與方法 課件 第6、7章 課件 - 商業(yè)運(yùn)營(yíng)與規(guī)劃、商業(yè)預(yù)測(cè)_第2頁(yè)
商業(yè)數(shù)據(jù)分析理念與方法 課件 第6、7章 課件 - 商業(yè)運(yùn)營(yíng)與規(guī)劃、商業(yè)預(yù)測(cè)_第3頁(yè)
商業(yè)數(shù)據(jù)分析理念與方法 課件 第6、7章 課件 - 商業(yè)運(yùn)營(yíng)與規(guī)劃、商業(yè)預(yù)測(cè)_第4頁(yè)
商業(yè)數(shù)據(jù)分析理念與方法 課件 第6、7章 課件 - 商業(yè)運(yùn)營(yíng)與規(guī)劃、商業(yè)預(yù)測(cè)_第5頁(yè)
已閱讀5頁(yè),還剩147頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章

商業(yè)運(yùn)營(yíng)與規(guī)劃學(xué)習(xí)目標(biāo)1.掌握線性規(guī)劃問(wèn)題、運(yùn)輸問(wèn)題、整數(shù)規(guī)劃的數(shù)學(xué)模型及模型特征。2.能利用線性規(guī)劃、整數(shù)規(guī)劃解決實(shí)際問(wèn)題。3.能熟練運(yùn)用軟件求解線性規(guī)劃、運(yùn)輸問(wèn)題、整數(shù)規(guī)劃。4.掌握用不同軟件求解整數(shù)問(wèn)題的技巧。目錄CONTENTS01線性規(guī)劃問(wèn)題02整數(shù)規(guī)劃問(wèn)題03運(yùn)輸問(wèn)題04本章習(xí)題線性規(guī)劃問(wèn)題01一、問(wèn)題提出

線性規(guī)劃是運(yùn)籌學(xué)的一個(gè)重要分支,是幫助決策者做出決策的有效方法之一。在經(jīng)濟(jì)管理活動(dòng)中,針對(duì)有限的資源通常需要尋求最佳的利用或分配方式。任何資源,如勞動(dòng)力、原材料、設(shè)備或資金等都是有限的,所以必須進(jìn)行合理的配置,尋求最佳的分配方式。所謂最佳的分配方式,必須有一個(gè)標(biāo)準(zhǔn)或目標(biāo),在單一目標(biāo)問(wèn)題中,就是使利潤(rùn)最高或成本最低,由此可以把有限資源的合理配置歸納為兩類(lèi)問(wèn)題:一類(lèi)是如何合理地使用有限資源,使得效益最大化;另一類(lèi)是在經(jīng)濟(jì)管理的任務(wù)確定的條件下,如何合理地組織、安排活動(dòng),使所消耗的資源數(shù)最少,這是最常見(jiàn)的兩類(lèi)規(guī)劃問(wèn)題。與規(guī)劃問(wèn)題有關(guān)的數(shù)學(xué)模型主要由以下兩部分內(nèi)容組成:一部分是約束條件,反映有限資源對(duì)經(jīng)濟(jì)管理活動(dòng)的種種約束,或者必須完成的任務(wù);另一部分是目標(biāo)函數(shù),反映決策者在有限資源條件下希望實(shí)現(xiàn)的目標(biāo)。一、問(wèn)題提出

例6-1-1XY公司計(jì)劃生產(chǎn)Ⅰ、Ⅱ兩種產(chǎn)品。已知各生產(chǎn)一種產(chǎn)品時(shí)分別占用的設(shè)備臺(tái)時(shí)、工時(shí)和資源總量,各售出一種產(chǎn)品時(shí)的收益情況,如下表所示。問(wèn)該公司應(yīng)如何組織生產(chǎn),以使獲取的總收益最大。這是一個(gè)合理使用有限資源產(chǎn)生最大收益的問(wèn)題。資源信息表III資源總量/元設(shè)備臺(tái)時(shí)/(小時(shí)/件)23300工時(shí)/(小時(shí)/件)21.5150收益/(元/件)100120

一、問(wèn)題提出

例6-1-2某加工廠要制作100套鋼架,每套要用長(zhǎng)為2.9m、2.1m和1.5m的圓鋼各一根。已知原料長(zhǎng)為7.4m,問(wèn)應(yīng)如何下料可使所用材料最省。這是一個(gè)典型的在生產(chǎn)任務(wù)確定的條件下,合理組織生產(chǎn)(下料),以使所消耗資源數(shù)量最少的問(wèn)題。日期所需營(yíng)業(yè)員人數(shù)星期日28星期一15星期二24星期三25星期四19星期五31星期六28表6.1.2工作需求表二、線性規(guī)劃問(wèn)題的數(shù)學(xué)模型

數(shù)學(xué)模型的約束條件中的第一個(gè)式子表示產(chǎn)品Ⅰ、產(chǎn)品Ⅱ的制造數(shù)量受設(shè)備的限制,第二個(gè)式子表示產(chǎn)品Ⅰ、產(chǎn)品Ⅱ的制造數(shù)量受人工能力的限制,第三個(gè)式子稱(chēng)為變量的非負(fù)約束,表示產(chǎn)品Ⅰ、產(chǎn)品Ⅱ的制造數(shù)量不可能取負(fù)值。二、線性規(guī)劃問(wèn)題的數(shù)學(xué)模型

例6-1-2可以這樣理解:在長(zhǎng)度一定的原材料上截三種不同長(zhǎng)度的圓鋼,有多種下料方案,基本原則是按各種下料方案下料以后剩下的余料要足夠少,即剩下的余料已不能再截下任何一種規(guī)格的圓鋼,即余料的長(zhǎng)度必須小于1.5m。按照這樣的原則,可以歸納出8種不同的下料方案,按余料長(zhǎng)度逐步遞增排序,如下表所示。下料方案表下料方案12345678圓鋼/m2.9120101002.1002211301.531203104余料/m00.10.20.30.80.91.11.4至此,此問(wèn)題則變?yōu)槿绾位旌鲜褂帽碇羞@8種不同的下料方案來(lái)制造100套鋼架,并且使剩余余料的總長(zhǎng)度最短。二、線性規(guī)劃問(wèn)題的數(shù)學(xué)模型

二、線性規(guī)劃問(wèn)題的數(shù)學(xué)模型

二、線性規(guī)劃問(wèn)題的數(shù)學(xué)模型

此數(shù)學(xué)模型可簡(jiǎn)寫(xiě)為

二、線性規(guī)劃問(wèn)題的數(shù)學(xué)模型

如果用向量表示,該數(shù)學(xué)模型則可寫(xiě)為式中,;該數(shù)學(xué)模型用矩陣和向量來(lái)表示可寫(xiě)為式中,A被稱(chēng)為約束方程組(約束條件)的系數(shù)矩陣。

三、線性規(guī)劃問(wèn)題數(shù)學(xué)模型的標(biāo)準(zhǔn)形式

;

因?yàn)槟繕?biāo)函數(shù)和約束條件在內(nèi)容和形式上存在差異,所以線性規(guī)劃問(wèn)題數(shù)學(xué)模型的表達(dá)方式可以有很多種。為了便于討論和制定統(tǒng)一的求解方法,因此統(tǒng)一規(guī)定線性規(guī)劃問(wèn)題數(shù)學(xué)模型的標(biāo)準(zhǔn)形式如下:如果用矩陣和向量來(lái)表示可以寫(xiě)為在標(biāo)準(zhǔn)形式的數(shù)學(xué)模型中,必須符合以下四個(gè)條件:目標(biāo)函數(shù)為極大化型。約束條件全為等式。約束條件右端常數(shù)項(xiàng)??_??全為非負(fù)值。決策變量??_??的取值全為非負(fù)值。四、標(biāo)準(zhǔn)型線性規(guī)劃解的概念

;

max?z=CX四、標(biāo)準(zhǔn)型線性規(guī)劃解的概念

;;

五、線性規(guī)劃問(wèn)題的圖解法

圖解法是一種只能求解兩個(gè)決策變量的線性規(guī)劃問(wèn)題的方法,不能解決多個(gè)決策變量的問(wèn)題。但它有助于直觀了解線性規(guī)劃問(wèn)題,并有助于后面章節(jié)介紹的單純形法的理解。(一)圖解法的基本步驟例6-1-7利用圖解法求解下列線性規(guī)問(wèn)題;

五、線性規(guī)劃問(wèn)題的圖解法

圖6-1-2可行域圖6-1-1五、線性規(guī)劃問(wèn)題的圖解法

圖6-1-3目標(biāo)函數(shù)

圖6-1-4圖解法求解

五、線性規(guī)劃問(wèn)題的圖解法

(二)圖解法的幾種可能結(jié)果在使用圖解法求解線性規(guī)劃問(wèn)題的過(guò)程中,除了存在上述唯一最優(yōu)解的情況,還可能存在其他情況,如存在多個(gè)最優(yōu)解,存在無(wú)界解或無(wú)可行解,下面分別進(jìn)行討論與總結(jié)。(1)可行域?yàn)榉忾]的有界區(qū)域。①存在唯一的最優(yōu)解,如圖6-1-5所示。②存在無(wú)窮多的最優(yōu)解,如圖6-1-6所示。

圖6-1-5存在唯一的最優(yōu)解(1)

圖6-1-6存在無(wú)窮多的最優(yōu)解(1)五、線性規(guī)劃問(wèn)題的圖解法

(2)可行域?yàn)榉欠忾]的無(wú)界區(qū)域。①存在唯一的最優(yōu)解,如圖6-1-7所示。②存在無(wú)窮多的最優(yōu)解,如圖6-1-8所示。③存在無(wú)界解,如圖6-1-9所示。(3)可行域?yàn)榭占???尚杏驗(yàn)榭占?,即約束條件不存在公共部分,這種情況下是無(wú)可行解的,如圖6-1-10所示。圖6-1-7存在唯一的最優(yōu)解(2)

圖6-1-8存在無(wú)窮多的最優(yōu)解(2)

圖6-1-9存在無(wú)界解

圖6-1-10無(wú)可行解

五、線性規(guī)劃問(wèn)題的圖解法

(三)圖解法基本結(jié)論對(duì)于只有兩個(gè)決策變量的線性規(guī)劃問(wèn)題,可以利用圖解法求解,從幾何的角度得出以下幾個(gè)結(jié)論。(1)線性規(guī)劃問(wèn)題的可行域?yàn)橐粋€(gè)有界或無(wú)界的凸多邊形,其頂點(diǎn)個(gè)數(shù)是有限個(gè),且對(duì)應(yīng)該問(wèn)題的基可行解。(2)若線性規(guī)劃問(wèn)題有唯一的最優(yōu)解,那么最優(yōu)解一定可在可行域的某個(gè)頂點(diǎn)(基可行解)上找到。(3)求解線性規(guī)劃問(wèn)題時(shí),解的可能情況有唯一最優(yōu)解、無(wú)窮多最優(yōu)解、無(wú)界解、無(wú)可行解等。;

六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析

(一)對(duì)偶問(wèn)題的提出對(duì)偶理論是線性規(guī)劃問(wèn)題中最重要和有意義的概念。它的基本思想是每個(gè)線性規(guī)劃問(wèn)題都有一個(gè)對(duì)偶問(wèn)題,求出一個(gè)問(wèn)題的解時(shí),也同時(shí)給出了對(duì)偶問(wèn)題的解。通過(guò)實(shí)際例子可以看出對(duì)偶問(wèn)題的意義。在例6-1-1中,XY公司利用現(xiàn)有的資源生產(chǎn)兩種產(chǎn)品時(shí),其線性規(guī)劃問(wèn)題為;

六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析

現(xiàn)在從另一角度提出問(wèn)題。假如某個(gè)公司想購(gòu)買(mǎi)XY公司的資源,它至少應(yīng)付出多大代價(jià),才能使XY公司愿意放棄其目前的生產(chǎn)活動(dòng),出售自己的資源?很顯然,如果要使XY公司出讓自己的資源,其基本條件應(yīng)當(dāng)是出讓代價(jià)不低于自己用相同數(shù)量的資源組織生產(chǎn)活動(dòng)時(shí)所能夠獲取的贏利。如果單位設(shè)備臺(tái)時(shí)和工時(shí)的出讓代價(jià)分別用y1和y2來(lái)代表,因?yàn)閄Y公司生產(chǎn)一件產(chǎn)品Ⅰ需要用到2單位的設(shè)備臺(tái)時(shí)和2單位的工時(shí),可以贏利100元;生產(chǎn)一件產(chǎn)品Ⅱ需要用3單位的設(shè)備臺(tái)時(shí)和1.5單位的工時(shí),可以贏利120元,所以y1、y2的取值應(yīng)該要滿(mǎn)足這家公司希望用最小代價(jià)把XY公司的全部資源收買(mǎi)過(guò)來(lái),故有顯然,yi

≥0(i=1,2),再綜合上式有

對(duì)于上述的兩個(gè)線性規(guī)劃問(wèn)題,通常稱(chēng)前者為原問(wèn)題,稱(chēng)后者為前者的對(duì)偶問(wèn)題。六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析

(二)對(duì)稱(chēng)形式下對(duì)偶問(wèn)題的一般形式定義6.1.1滿(mǎn)足下列條件的線性規(guī)劃問(wèn)題稱(chēng)為具有對(duì)稱(chēng)形式:其變量均具有非負(fù)約束;其約束條件為當(dāng)目標(biāo)函數(shù)求極大值時(shí)均取“≤”號(hào),當(dāng)目標(biāo)函數(shù)求極小值時(shí)均取“≥”號(hào)[20]。對(duì)稱(chēng)形式下,線性規(guī)劃原問(wèn)題的一般形式為;

六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析

;

六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析將上述對(duì)稱(chēng)形式下線性規(guī)劃問(wèn)題的原問(wèn)題與對(duì)偶問(wèn)題進(jìn)行比較,如下表所示。原問(wèn)題與對(duì)偶問(wèn)題的對(duì)比;

原問(wèn)題對(duì)偶問(wèn)題A約束系數(shù)矩陣其約束系數(shù)矩陣的轉(zhuǎn)置b約束條件的右端常數(shù)項(xiàng)向量目標(biāo)函數(shù)中的價(jià)格系數(shù)向量C目標(biāo)函數(shù)中的價(jià)格系數(shù)向量約束條件的右端常數(shù)項(xiàng)向量目標(biāo)函數(shù)約束條件六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析

六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析將上述對(duì)稱(chēng)形式下線性規(guī)劃問(wèn)題的原問(wèn)題與對(duì)偶問(wèn)題進(jìn)行比較,如下表所示。

原問(wèn)題與對(duì)偶問(wèn)題的對(duì)比;

原問(wèn)題對(duì)偶問(wèn)題A約束系數(shù)矩陣其約束系數(shù)矩陣的轉(zhuǎn)置b約束條件的右端常數(shù)項(xiàng)向量目標(biāo)函數(shù)中的價(jià)格系數(shù)向c量C目標(biāo)函數(shù)中的價(jià)格系數(shù)向量約束條件的右端常數(shù)項(xiàng)向量目標(biāo)函數(shù)約束條件六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析

;

六、線性規(guī)劃的對(duì)偶問(wèn)題與靈敏度分析

七、線性規(guī)劃軟件求解(一)用Excel求解線性規(guī)劃模型例6-1-10用Excel求解線性規(guī)劃模型:;

七、線性規(guī)劃軟件求解先將線性規(guī)劃模型數(shù)據(jù)輸入Excel表格中點(diǎn)擊“數(shù)據(jù)”→“規(guī)劃求解”按鈕,彈出上圖所示的“規(guī)劃求解參數(shù)”對(duì)話(huà)框,依次添加規(guī)劃求解參數(shù)。點(diǎn)擊“求解”按鈕,根據(jù)計(jì)算提示可知,得到了一個(gè)最優(yōu)解,滿(mǎn)足所有的約束條件及目標(biāo)函數(shù)值的最大化要求,在“規(guī)劃求解結(jié)果”對(duì)話(huà)框中選中“保存規(guī)劃求解結(jié)果”單選按鈕,然后點(diǎn)擊“確定”按鈕,可以得到求解的結(jié)果;

模型數(shù)據(jù)輸入求解結(jié)果(Excel)求解步驟七、線性規(guī)劃軟件求解(二)用LINGO軟件求解線性規(guī)劃問(wèn)題LINGO(LinearInteractiveandGeneralOptimizer)即“交互式的線性和通用優(yōu)化求解器”,可用于求解線性規(guī)劃和非線性規(guī)劃的大規(guī)模優(yōu)化問(wèn)題,其建模和輸入方便,執(zhí)行速度快。例6-1-11有如下線性規(guī)劃問(wèn)題,請(qǐng)用Lingo軟件求解。;

七、線性規(guī)劃軟件求解對(duì)于決策變量少、約束條件不多的線性規(guī)劃模型,只需按照LINGO程序書(shū)寫(xiě)規(guī)則,將線性規(guī)劃模型直接輸入。;

點(diǎn)擊“Run”按鈕

輸入線性規(guī)劃模型

求解結(jié)果(LINGO)七、線性規(guī)劃軟件求解(三)用管理運(yùn)籌學(xué)軟件求解線性規(guī)劃問(wèn)題例6-1-12某工廠在計(jì)劃期內(nèi)要安排Ⅰ、Ⅱ兩種產(chǎn)品的生產(chǎn),已知生產(chǎn)單位產(chǎn)品所需的設(shè)備臺(tái)時(shí)及A、B兩種原材料的消耗、資源限制,如下表所示。產(chǎn)品信息表

問(wèn)題:工廠應(yīng)分別生產(chǎn)多少單位Ⅰ、Ⅱ產(chǎn)品才能使工廠獲利最大?;

III資源限制設(shè)備臺(tái)時(shí)/小時(shí)11300原料A/kg21400原料B/kg01250單位產(chǎn)品獲利/元50100

七、線性規(guī)劃軟件求解

軟件求解過(guò)程如下1234七、線性規(guī)劃軟件求解;

整數(shù)規(guī)劃問(wèn)題02一、整數(shù)規(guī)劃的一般形式

整數(shù)規(guī)劃的一般形式如下:例6-2-1某公司擬用集裝箱托運(yùn)甲、乙兩種貨物,貨物信息(每箱的體積、質(zhì)量、利潤(rùn)及托運(yùn)限制)如下表所示。兩種貨物各托運(yùn)多少箱,可使所獲利潤(rùn)最大?貨物信息一、整數(shù)規(guī)劃的一般形式

二、含0-1變量的整數(shù)規(guī)劃0-1變量作為邏輯變量(LogicalVariable),常用于表示系統(tǒng)是否處于某一特定狀態(tài)或者決策時(shí)是否采取某個(gè)方案,因此提供選擇的功能,即整數(shù)規(guī)劃建模上的靈活性在很大程度上是由于使用了0-1變量(又稱(chēng)為二進(jìn)制變量)。例6-2-2背包問(wèn)題:一個(gè)登山隊(duì)員需要攜帶的物品有食品、氧氣、冰鎬、繩索、帳篷、照相器材、通信器材等,物品的質(zhì)量和重要性系數(shù)如下表所示。設(shè)登山隊(duì)員可攜帶的最大質(zhì)量為25kg,試選擇該隊(duì)員應(yīng)攜帶的物品。表6.2.2物品質(zhì)量和重要性函數(shù)

三、混合整數(shù)規(guī)劃

例6-2-4高壓容器公司制造小、中、大三種尺寸的容器,所需資源為金屬板、勞動(dòng)力和機(jī)器設(shè)備,制造一個(gè)容器所需的各種資源的數(shù)量如下表所示。不考慮固定費(fèi)用,每種容器售出一只所得的利潤(rùn)分別為4萬(wàn)元、5萬(wàn)元、6萬(wàn)元,可使用的金屬板有500噸,勞動(dòng)力有300人/月,機(jī)器設(shè)備有100臺(tái)/月,此外不管每種容器制造的數(shù)量是多少,都要支付一筆固定的費(fèi)用:小號(hào)容器是100萬(wàn)元,中號(hào)容器為150萬(wàn)元,大號(hào)容器為200萬(wàn)元。請(qǐng)制定一個(gè)生產(chǎn)計(jì)劃,使獲得的利潤(rùn)最大。

制造一個(gè)容器所需的各種資源的數(shù)量資源小號(hào)容器中號(hào)容器大號(hào)容器金屬板/噸248勞動(dòng)力/(人/月)234機(jī)器設(shè)備/(臺(tái)/月)123三、混合整數(shù)規(guī)劃

三、混合整數(shù)規(guī)劃

四、整數(shù)規(guī)劃模型求解方法

五、指派問(wèn)題及其解法

(一)指派問(wèn)題的數(shù)學(xué)模型例6-2-6有5個(gè)工人,要指派他們分別完成5項(xiàng)工作,各人完成各項(xiàng)工作所需時(shí)間如下表所示。指派哪個(gè)人去完成哪項(xiàng)工作,才能使得消耗的總時(shí)間最短?各人完成各項(xiàng)工作所需的時(shí)間工作工人ABCDE甲56841乙73579丙18656丁63785戊97268五、指派問(wèn)題及其解法

為了解決這個(gè)問(wèn)題,首先引入0-1變量xij,令用z表示5個(gè)工人分別完成5項(xiàng)工作所消耗的總時(shí)間,該問(wèn)題的目標(biāo)函數(shù)為約束條件為五、指派問(wèn)題及其解法

五、指派問(wèn)題及其解法

六、整數(shù)規(guī)劃軟件求解

(一)Excel求解用Excel對(duì)整數(shù)規(guī)劃問(wèn)題進(jìn)行建模就是在對(duì)線性規(guī)劃問(wèn)題進(jìn)行建模的基礎(chǔ)上,如果要求所有決策變量取整數(shù),則在約束條件中進(jìn)行變量設(shè)置。對(duì)于例6-2-1,用Excel對(duì)其建模。對(duì)例6-2-1建模其中,約束條件格F2的命令為“=sumproduct(B2:B3,E2:E3)”;約束條件格F3的命令為“=sumproduct(C2:C3,E2:E3)”;目標(biāo)函數(shù)格F5的命令為“=sumproduct(D2:D3,E2:E3)”。

規(guī)劃求解選項(xiàng)設(shè)置點(diǎn)擊“規(guī)劃求解選項(xiàng)”對(duì)話(huà)框中的“確定”按鈕,再點(diǎn)擊“規(guī)劃求解參數(shù)”對(duì)話(huà)框中的“求解按鈕”,得到最優(yōu)解。例6-2-1的求解結(jié)果(Excel)六、整數(shù)規(guī)劃軟件求解

(二)LINGO軟件求解對(duì)例6-2-1進(jìn)行求解。LINGO程序如下:MODEL:MAX=600*x1+400*x2;2*x1+4*x2<=13;200*x1+100*x2<=700;@gin(x1);!變量x1為整數(shù);@gin(x2);!變量x2為整數(shù);End例6-2-1的求解結(jié)果(LINGO)

運(yùn)輸問(wèn)題03一、運(yùn)輸問(wèn)題的數(shù)學(xué)模型

一、運(yùn)輸問(wèn)題的數(shù)學(xué)模型

銷(xiāo)售地B1B2…Bn生產(chǎn)地A1c11c12…c1nA2c21c22…c2n

Amcm1cm2…cmn單位運(yùn)價(jià)表銷(xiāo)售地B1B2…Bn生產(chǎn)地A1…A2…

Am…平衡表

一、運(yùn)輸問(wèn)題的數(shù)學(xué)模型

一、運(yùn)輸問(wèn)題的數(shù)學(xué)模型

二、運(yùn)輸問(wèn)題的基本性質(zhì)

三、運(yùn)輸問(wèn)題軟件求解

(一)運(yùn)輸問(wèn)題Excel求解1.產(chǎn)銷(xiāo)平衡運(yùn)輸問(wèn)題Excel求解例6-3-1某公司有3個(gè)生產(chǎn)同類(lèi)產(chǎn)品的加工廠(生產(chǎn)地),生產(chǎn)的產(chǎn)品由4個(gè)銷(xiāo)售點(diǎn)(銷(xiāo)售地)出售,各生產(chǎn)地的產(chǎn)量、各銷(xiāo)售地的銷(xiāo)量(假定單位均為噸)及將產(chǎn)品由各生產(chǎn)地運(yùn)往各銷(xiāo)售地的單位運(yùn)價(jià)(元/噸)如表所示,應(yīng)如何調(diào)運(yùn)才能使總費(fèi)用最小?

產(chǎn)量、銷(xiāo)量單位運(yùn)價(jià)表(1)

銷(xiāo)售地產(chǎn)量/噸B1B2B3B4生產(chǎn)地A14124118A2210395A38511611銷(xiāo)量/噸4767

三、運(yùn)輸問(wèn)題軟件求解

用Excel對(duì)運(yùn)輸問(wèn)題建模類(lèi)似于用Excel對(duì)線性規(guī)劃問(wèn)題建模。其中,約束條件格F12、F13、F14的命令分別為“=sum(B12:E12)”“=sum(B13:E13)”“=sum(B14:E14)”;約束條件格B15、C15、D15、E15的命令分別為“=sum(B12:B14)”“=sum(C12:C14)”“=sum(D12:D14)”“=sum(E12:E14)”;目標(biāo)函數(shù)格C17的命令為“=sumproduct(B5:E7,B12:E14)”。給定可變單元格與約束條件后,點(diǎn)擊“選項(xiàng)”按鈕進(jìn)行規(guī)劃求解選項(xiàng)設(shè)置。對(duì)例6-3-1建模規(guī)劃求解選項(xiàng)設(shè)置(1)三、運(yùn)輸問(wèn)題軟件求解

2.產(chǎn)銷(xiāo)不平衡運(yùn)輸問(wèn)題Excel求解利用Excel求解產(chǎn)銷(xiāo)不平衡的運(yùn)輸問(wèn)題時(shí)

,我們可以不用將其轉(zhuǎn)變?yōu)楫a(chǎn)銷(xiāo)平衡運(yùn)輸問(wèn)題而直接進(jìn)行求解。例6-3-1的求解結(jié)果(Excel)三、運(yùn)輸問(wèn)題軟件求解

(二)運(yùn)輸問(wèn)題管理運(yùn)籌學(xué)軟件求解例6-3-3某公司從三個(gè)生產(chǎn)地A1、A2、A3將產(chǎn)品運(yùn)往四個(gè)銷(xiāo)售地B1、B2、B3、B4,各生產(chǎn)地的產(chǎn)量、各銷(xiāo)售地的銷(xiāo)量和將產(chǎn)品由各生產(chǎn)地運(yùn)往各銷(xiāo)售地的單位運(yùn)價(jià)(萬(wàn)元/噸)所示,問(wèn):應(yīng)如何調(diào)運(yùn)使總運(yùn)輸費(fèi)用最小?產(chǎn)量、銷(xiāo)量、單位運(yùn)價(jià)表設(shè)xij為從生產(chǎn)地Ai運(yùn)往銷(xiāo)售地Bj的運(yùn)輸量,得到運(yùn)輸量表所示。運(yùn)輸量表

銷(xiāo)售地產(chǎn)量/噸B1B2B3B4生產(chǎn)地A1675314A2842727A35910619銷(xiāo)量/噸22131213

銷(xiāo)售地產(chǎn)量/噸B1B2B3B4生產(chǎn)地A114A227A319三、運(yùn)輸問(wèn)題軟件求解

整理可得三、運(yùn)輸問(wèn)題軟件求解

將上述問(wèn)題用單位運(yùn)價(jià)表表示產(chǎn)量、銷(xiāo)量、單位運(yùn)價(jià)表(4)運(yùn)行管理運(yùn)籌學(xué)軟件,選擇“運(yùn)輸問(wèn)題”模塊,點(diǎn)擊“新建”按鈕,設(shè)置目標(biāo)函數(shù),輸入產(chǎn)地個(gè)數(shù)、銷(xiāo)地個(gè)數(shù),點(diǎn)擊“確定”按鈕后,工作區(qū)中會(huì)出現(xiàn)單位運(yùn)價(jià)表。按照各個(gè)生產(chǎn)地到銷(xiāo)售地的運(yùn)價(jià)情況完善單位運(yùn)價(jià)表。點(diǎn)擊“解決”按鈕,輸出求解結(jié)果。求解結(jié)果顯示:此運(yùn)輸問(wèn)題的成本為232萬(wàn)元,最佳運(yùn)輸方案為:從生產(chǎn)地A1向銷(xiāo)售地B1和B4分別運(yùn)輸1噸和13噸的產(chǎn)品;從生產(chǎn)地A2分別向銷(xiāo)售地B1、B2、B3運(yùn)輸2噸、13噸、和12噸產(chǎn)品;從生產(chǎn)地A3向銷(xiāo)售地B1運(yùn)輸19噸產(chǎn)品,只有這樣,才能夠使總運(yùn)輸費(fèi)用最低,且能保障各個(gè)銷(xiāo)售地的產(chǎn)品需求。

銷(xiāo)售地產(chǎn)量/噸B1B2B3B4生產(chǎn)地A1675314A2842727A35910619銷(xiāo)量/噸22131213

三、運(yùn)輸問(wèn)題軟件求解

求解結(jié)果顯示:此運(yùn)輸問(wèn)題的成本為232萬(wàn)元,最佳運(yùn)輸方案為:從生產(chǎn)地A1向銷(xiāo)售地B1和B4分別運(yùn)輸1噸和13噸的產(chǎn)品;從生產(chǎn)地A2分別向銷(xiāo)售地B1、B2、B3運(yùn)輸2噸、13噸、和12噸產(chǎn)品;從生產(chǎn)地A3向銷(xiāo)售地B1運(yùn)輸19噸產(chǎn)品,只有這樣,才能夠使總運(yùn)輸費(fèi)用最低,且能保障各個(gè)銷(xiāo)售地的產(chǎn)品需求。本章習(xí)題04一、單選題

一、單選題

4.對(duì)于總產(chǎn)量大于總銷(xiāo)量的運(yùn)輸問(wèn)題,在增加一個(gè)虛設(shè)的銷(xiāo)售地后轉(zhuǎn)化為產(chǎn)銷(xiāo)平衡問(wèn)題,此時(shí)各生產(chǎn)地到虛設(shè)的銷(xiāo)售地的單位運(yùn)價(jià)應(yīng)設(shè)為(

)。A.M(足夠大的數(shù)) B.0 C.現(xiàn)有單位運(yùn)價(jià)的最大值 D.以上都不對(duì)5.有甲、乙、丙三個(gè)城市,每年分別需要煤320萬(wàn)噸、250萬(wàn)噸、350萬(wàn)噸,由A、B兩個(gè)煤礦供應(yīng)。已知煤礦年產(chǎn)量:A為400萬(wàn)噸,B為450萬(wàn)噸,從兩煤礦至各城市的單位運(yùn)價(jià)表如下表所示。由于需求量大于產(chǎn)量,經(jīng)協(xié)商平衡,甲城市的供應(yīng)量可減少0~30萬(wàn)噸,乙城市的需求量必須全部被滿(mǎn)足,丙城市的供應(yīng)量不少于270萬(wàn)噸。問(wèn):若將甲城市的需求量拆分成甲和甲',則B運(yùn)往甲'的單位運(yùn)價(jià)為(

)。

從兩煤礦至各城市的單位運(yùn)價(jià)表A.M(足夠大的數(shù)) B.21 C.0 D.以上都不是

甲乙丙A151822B212516謝謝第七章商業(yè)預(yù)測(cè)目錄CONTENTS01潛在客戶(hù)識(shí)別預(yù)測(cè)02商業(yè)時(shí)間序列預(yù)測(cè)問(wèn)題潛在客戶(hù)識(shí)別預(yù)測(cè)011.了解潛在客戶(hù)識(shí)別的定義。2.掌握潛在客戶(hù)識(shí)別的方法。3.掌握潛在客戶(hù)識(shí)別的模型,重點(diǎn)掌握潛在客戶(hù)識(shí)別預(yù)測(cè)模型。4.了解時(shí)間序列預(yù)測(cè)模型的基本理論。5.了解時(shí)間序列預(yù)測(cè)模型的分析流程。6.掌握時(shí)間序列預(yù)測(cè)模型在R中的實(shí)現(xiàn)及其交叉精度檢驗(yàn)。學(xué)習(xí)目標(biāo)

現(xiàn)代企業(yè)要想增加其利潤(rùn),不僅要對(duì)現(xiàn)有的有價(jià)值客戶(hù)進(jìn)行維護(hù),還要對(duì)那些具有潛在價(jià)值的客戶(hù),即潛在客戶(hù)進(jìn)行不斷的挖掘。(一)潛在客戶(hù)與客戶(hù)價(jià)值

經(jīng)濟(jì)全球化和信息技術(shù)的快速發(fā)展使企業(yè)的生存環(huán)境發(fā)生了很大改變。企業(yè)為了能夠在激烈的競(jìng)爭(zhēng)環(huán)境中求得生存和發(fā)展,把自己的經(jīng)營(yíng)理念從以提高產(chǎn)品或服務(wù)質(zhì)量為核心轉(zhuǎn)向了以客戶(hù)為核心。因此,將客戶(hù)關(guān)系管理思想運(yùn)用到企業(yè)的經(jīng)營(yíng)管理中,是企業(yè)生存環(huán)境的必然要求。然而,許多企業(yè)在努力研究如何不讓現(xiàn)有客戶(hù)流失的情況下,忽略了對(duì)潛在客戶(hù)的挖掘,如果企業(yè)能夠提前預(yù)測(cè)一些潛在客戶(hù),并對(duì)其進(jìn)行相應(yīng)的營(yíng)銷(xiāo)工作,就可能在很大程度上增加企業(yè)的利潤(rùn),為企業(yè)創(chuàng)造更多的價(jià)值。所以,潛在客戶(hù)識(shí)別具有非常重要的現(xiàn)實(shí)意義。潛在客戶(hù)其實(shí)就是這些客戶(hù):他們雖然現(xiàn)在還不是企業(yè)的有價(jià)值客戶(hù),但將來(lái)有可能成為企業(yè)的有價(jià)值客戶(hù),從而給企業(yè)帶來(lái)巨大的利潤(rùn)。所謂的客戶(hù)價(jià)值,就是指客戶(hù)能為企業(yè)帶來(lái)的價(jià)值,其大小等于企業(yè)過(guò)去、現(xiàn)在、未來(lái)從客戶(hù)身上獲得的收益與吸引、發(fā)展、維護(hù)客戶(hù)所需的成本之差。一、潛在客戶(hù)識(shí)別理論(二)客戶(hù)價(jià)值的分類(lèi)

客戶(hù)價(jià)值包括客戶(hù)的當(dāng)前價(jià)值和潛在價(jià)值。與客戶(hù)的當(dāng)前價(jià)值相比,客戶(hù)的潛在價(jià)值關(guān)系到企業(yè)的長(zhǎng)遠(yuǎn)利益,對(duì)企業(yè)的將來(lái)更加重要,也是客戶(hù)價(jià)值不可缺少的重要方面。正是由于這個(gè)原因,對(duì)客戶(hù)潛在價(jià)值的研究越來(lái)越受到企業(yè)的重視。(三)潛在客戶(hù)識(shí)別方法

由于數(shù)據(jù)挖掘技術(shù)迎合了企業(yè)在營(yíng)銷(xiāo)和服務(wù)業(yè)務(wù)中涉及的客戶(hù)數(shù)據(jù)的量大、細(xì)節(jié)化、分布廣泛等特點(diǎn),因此它在海量數(shù)據(jù)處理、潛在客戶(hù)識(shí)別等方面發(fā)揮了重要作用?,F(xiàn)有的潛在客戶(hù)識(shí)別方法可以歸納為以下幾種,數(shù)據(jù)挖掘技術(shù)能夠有效地支持這些方法的應(yīng)用。1.基于客戶(hù)統(tǒng)計(jì)學(xué)特征的潛在客戶(hù)識(shí)別方法2.基于客戶(hù)交易行為的潛在客戶(hù)識(shí)別方法(四)數(shù)據(jù)挖掘理論

數(shù)據(jù)挖掘理論和方法是潛在客戶(hù)識(shí)別的核心方法。企業(yè)可以根據(jù)客戶(hù)信息、歷史行為記錄等資料對(duì)客戶(hù)進(jìn)行分析,并利用數(shù)據(jù)挖掘技術(shù)建立相應(yīng)的預(yù)測(cè)模型。此后,企業(yè)可以根據(jù)模型結(jié)果把握潛在客戶(hù)的特征,并進(jìn)行相應(yīng)的營(yíng)銷(xiāo)活動(dòng)。在數(shù)據(jù)爆炸的網(wǎng)絡(luò)時(shí)代,企業(yè)希望能夠?qū)?shù)據(jù)進(jìn)行更高層次的分析,以便更好地利用這些數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,并顯示出強(qiáng)大的生命力。1.?dāng)?shù)據(jù)挖掘的基本概念

從1989年至今,數(shù)據(jù)挖掘的定義隨著人們研究的不斷深入而不斷完善,目前獲得認(rèn)可的定義是由Fayyad等人提出的:數(shù)據(jù)挖掘是從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的模式的高級(jí)處理過(guò)程,它從數(shù)據(jù)集中識(shí)別出用模式來(lái)表示的知識(shí)。數(shù)據(jù)挖掘的過(guò)程是一個(gè)多步驟的處理過(guò)程,多個(gè)步驟之間相互影響、反復(fù)調(diào)整,形成一種螺旋式上升的態(tài)勢(shì)。2.?dāng)?shù)據(jù)挖掘的常用技術(shù)

數(shù)據(jù)挖掘技術(shù)大致可分為描述式數(shù)據(jù)挖掘技術(shù)和預(yù)測(cè)式數(shù)據(jù)挖掘技術(shù),具體來(lái)講,數(shù)據(jù)挖掘技術(shù)可分為以下五類(lèi)。(1)人工神經(jīng)網(wǎng)絡(luò)。

人工神經(jīng)網(wǎng)絡(luò)是由大量的簡(jiǎn)單神經(jīng)元通過(guò)極其豐富和完善的連接而構(gòu)成的自適應(yīng)非線性動(dòng)態(tài)系統(tǒng),其具有分布存儲(chǔ)、聯(lián)想記憶、大規(guī)模并行處理、自組織、自學(xué)習(xí)、自適應(yīng)等功能。目前,人工神經(jīng)網(wǎng)絡(luò)主要應(yīng)用于分類(lèi)、優(yōu)化、模式識(shí)別、預(yù)測(cè)和控制等領(lǐng)域。(2)決策樹(shù)。

決策樹(shù)根據(jù)不同的特征,以樹(shù)狀結(jié)構(gòu)表示分類(lèi)或決策集合,產(chǎn)生規(guī)則和發(fā)展規(guī)律。利用信息論中的互信息(信息增益)尋找數(shù)據(jù)庫(kù)中具有最大信息量的字段,建立決策樹(shù)的一個(gè)節(jié)點(diǎn),再根據(jù)字段的不同取值建立決策樹(shù)的分支,在每個(gè)分支子集中,重復(fù)建立決策樹(shù)的下層節(jié)點(diǎn)和分支,即可建立決策樹(shù)。(3)遺傳算法。

遺傳算法基于進(jìn)化論中的基因重組、基因突變和自然選擇等概念,利用復(fù)制(自然選擇)、交叉(基因重組)和變異(基因突變)3個(gè)基本算子進(jìn)行求解。遺傳算法的最大優(yōu)點(diǎn)是問(wèn)題的最優(yōu)解與初始條件無(wú)關(guān),而且搜索最優(yōu)解的能力極強(qiáng)。目前,遺傳算法已發(fā)展成一種自組織、自適應(yīng)的綜合技術(shù),而且其應(yīng)用領(lǐng)域很廣,如工程技術(shù)、計(jì)算機(jī)科學(xué)等。(4)粗糙集算法。

粗糙集算法的特點(diǎn)是不需要預(yù)先給定某些特征或?qū)傩缘臄?shù)量描述,如統(tǒng)計(jì)學(xué)中的概率分布、模糊集理論中的隸屬函數(shù)等,其直接從給定的問(wèn)題出發(fā),通過(guò)不可分辨關(guān)系和不可分辨類(lèi)確定問(wèn)題的近似域,從而找出該問(wèn)題的內(nèi)在規(guī)律。它的理論核心是基于“知識(shí)源于對(duì)對(duì)象的分類(lèi)”這一思想的,其通過(guò)分類(lèi)找出屬性間的關(guān)聯(lián)規(guī)則。(5)關(guān)聯(lián)規(guī)則。

關(guān)聯(lián)規(guī)則主要針對(duì)事物型數(shù)據(jù)庫(kù),是與大多數(shù)人想象的數(shù)據(jù)挖掘過(guò)程最相似的一種數(shù)據(jù)挖掘形式。根據(jù)關(guān)聯(lián)規(guī)則中所處理的值的類(lèi)型,關(guān)聯(lián)規(guī)則可以分成布爾關(guān)聯(lián)規(guī)則和量化關(guān)聯(lián)規(guī)則兩種;根據(jù)關(guān)聯(lián)規(guī)則集所涉及的不同抽象層次,關(guān)聯(lián)規(guī)則可以分成多層關(guān)聯(lián)規(guī)則和單層關(guān)聯(lián)規(guī)則。特別是對(duì)于銷(xiāo)售數(shù)據(jù),如果利用關(guān)聯(lián)規(guī)則對(duì)歷史交易數(shù)據(jù)進(jìn)行分析,可為預(yù)測(cè)客戶(hù)未來(lái)的購(gòu)買(mǎi)行為提供極有價(jià)值的信息。

下面重點(diǎn)講解關(guān)于決策樹(shù)的內(nèi)容。決策樹(shù)是一種建立分類(lèi)模型的技術(shù)。由于模型結(jié)構(gòu)和生成規(guī)則具有簡(jiǎn)潔性,因此決策樹(shù)一直以來(lái)很受歡迎。(1)決策樹(shù)的定義。

決策樹(shù)是一種基于貪心算法的分類(lèi)方法,采用自頂向下遞歸的思想進(jìn)行構(gòu)造。其中一個(gè)內(nèi)部節(jié)點(diǎn)代表一個(gè)屬性上的測(cè)試,一個(gè)分支代表一個(gè)測(cè)試輸出,而一個(gè)葉節(jié)點(diǎn)代表一個(gè)類(lèi)或類(lèi)分布。以使用條件屬性I和條件屬性J來(lái)預(yù)測(cè)決策屬性的取值是否為真為例,典型的決策樹(shù)如圖所示。(2)決策樹(shù)的基本算法。①I(mǎi)D3算法:由J.RossQuinlan于1975年提出的一種基于信息熵的決策樹(shù)算法,他把信息論引入決策樹(shù)算法中,把信息熵作為選擇測(cè)試屬性的標(biāo)準(zhǔn),對(duì)訓(xùn)練集進(jìn)行分類(lèi),并構(gòu)造決策樹(shù)來(lái)預(yù)測(cè)如何利用測(cè)試屬性對(duì)整個(gè)實(shí)例空間進(jìn)行劃分。ID3算法的建樹(shù)時(shí)間和任務(wù)的困難程度呈線性遞增關(guān)系,計(jì)算量相對(duì)小,但存在的問(wèn)題是信息增益的計(jì)算依賴(lài)于屬性取值較多的特征,而屬性取值較多的屬性不一定最優(yōu);ID3算法是非遞增學(xué)習(xí)算法,抗噪性差,訓(xùn)練例子中的正例和反例較難控制。②C5.0算法:由ID3算法改進(jìn)兩次而成的,先由ID3算法改進(jìn)成C4.5算法,它在ID3算法的基礎(chǔ)上增加了連續(xù)屬性的離散化,再在C4.5算法的基礎(chǔ)上改進(jìn)成C5.0算法,其根據(jù)提供最大信息增益的字段分割樣本數(shù)據(jù),并通過(guò)對(duì)決策樹(shù)各子葉進(jìn)行裁剪或合并來(lái)提高分類(lèi)精度,最后確定各子葉的最佳閾值。C5.0算法通常無(wú)須花費(fèi)大量的訓(xùn)練時(shí)間即可構(gòu)造決策樹(shù),且容易對(duì)構(gòu)造的決策樹(shù)進(jìn)行解釋。C5.0算法中還增加了強(qiáng)大的Boosting算法以提高分類(lèi)精度,Boosting算法依次構(gòu)造一系列決策樹(shù),構(gòu)造的決策樹(shù)重點(diǎn)考慮以前被錯(cuò)分和漏分的數(shù)據(jù),最后生成更準(zhǔn)確的決策樹(shù)。③CART算法:是ClassificationAndRegressionTree的英文縮寫(xiě),CART算法可以處理高度傾斜或多態(tài)的數(shù)值型數(shù)據(jù),也可以處理順序或無(wú)序的類(lèi)屬性數(shù)據(jù)。CART算法選擇具有最小基尼系數(shù)Gini的屬性作為測(cè)試屬性,Gini越小,樣本的“純凈度”越高,劃分效果越好。與C5.0算法類(lèi)似,CART算法也是先建樹(shù)后剪枝,但在具體實(shí)現(xiàn)上有所不同。④CHAID算法:J.A.Hartigan在1975年首次提出了CHAID算法,該算法是一種基于卡方檢驗(yàn)的決策樹(shù)算法,它可以處理離散型特征,適用于分類(lèi)問(wèn)題。CHAID算法和CART算法最大的不同之處在于CHAID算法只能處理分類(lèi)變量。⑤SLIQ算法:是一種快速可伸縮的適合處理較大規(guī)模數(shù)據(jù)的決策樹(shù)分類(lèi)算法。它能夠同時(shí)處理連續(xù)變量和分類(lèi)變量,在決策樹(shù)生成過(guò)程中采用“預(yù)先排序”和“寬度優(yōu)先”的策略,對(duì)于每個(gè)變量,首先掃描相應(yīng)的屬性排序表,同時(shí)計(jì)算每個(gè)變量值在當(dāng)前樹(shù)的所有葉節(jié)點(diǎn)中的熵值,計(jì)算完成后,為當(dāng)前決策樹(shù)中的每個(gè)葉節(jié)點(diǎn)選擇一個(gè)屬性進(jìn)行分支,然后再次掃描屬性排序表,對(duì)類(lèi)表中的節(jié)點(diǎn)名稱(chēng)進(jìn)行更新。⑥SPRINT算法:進(jìn)一步改進(jìn)了決策樹(shù)算法實(shí)現(xiàn)時(shí)的數(shù)據(jù)結(jié)構(gòu),去掉了SLIQ算法需要存儲(chǔ)在內(nèi)存中的類(lèi)別列表,將它的類(lèi)別列表合并到每個(gè)屬性列表中。此算法是一種可擴(kuò)展、可并行的歸納決策樹(shù)算法,它完全不受內(nèi)存限制,運(yùn)行速度快,且允許多個(gè)處理器協(xié)同創(chuàng)建一個(gè)決策樹(shù)模型。⑦PUBLIC算法:基于SPRINT方法,剪枝基于MDL原則,但MDL原則不能直接應(yīng)用。因?yàn)樯L(zhǎng)不完全的決策樹(shù)提供的信息不安全,所以對(duì)于仍要擴(kuò)展的葉節(jié)點(diǎn),估算的編碼代價(jià)偏高,這會(huì)導(dǎo)致過(guò)度剪枝,從而降低預(yù)測(cè)精確度。PUBLIC算法采用低估策略來(lái)矯正過(guò)高的編碼代價(jià),即對(duì)于將要擴(kuò)展的葉節(jié)點(diǎn),計(jì)算編碼代價(jià)的較低閾值;而對(duì)于另兩類(lèi)葉節(jié)點(diǎn)(剪枝形成的、不能被擴(kuò)展的),估算方法不變。

本節(jié)主要講解保險(xiǎn)業(yè)在潛在客戶(hù)識(shí)別方面的研究,保險(xiǎn)公司的目標(biāo)客戶(hù)是指保險(xiǎn)產(chǎn)品的提供對(duì)象,包含潛在客戶(hù)和現(xiàn)有客戶(hù)兩部分。(1)潛在客戶(hù)分析。

在保險(xiǎn)業(yè)這個(gè)特定領(lǐng)域中,保險(xiǎn)產(chǎn)品的可能購(gòu)買(mǎi)者就是潛在客戶(hù),包括以前沒(méi)聽(tīng)過(guò)或沒(méi)購(gòu)買(mǎi)過(guò)保險(xiǎn)產(chǎn)品的人、以前不需要購(gòu)買(mǎi)保險(xiǎn)產(chǎn)品的人等。在對(duì)潛在客戶(hù)進(jìn)行分析時(shí),由于數(shù)據(jù)量受限,要想利用數(shù)據(jù)挖掘技術(shù),可以采用兩種解決方案。

第一種解決方案:對(duì)于這些潛在客戶(hù),保險(xiǎn)公司對(duì)他們的了解較少,掌握的客戶(hù)信息數(shù)據(jù)有限,因此難以利用數(shù)據(jù)挖掘技術(shù)對(duì)其進(jìn)行建模分析。針對(duì)此種情況,保險(xiǎn)公司應(yīng)采取某些必要措施來(lái)獲取地址、年齡、收入、職業(yè)、教育程度和購(gòu)買(mǎi)行為等方面的客戶(hù)信息數(shù)據(jù)。在掌握相關(guān)數(shù)據(jù)后,保險(xiǎn)公司可以根據(jù)實(shí)際情況進(jìn)行一定規(guī)模的實(shí)驗(yàn),進(jìn)而通過(guò)實(shí)驗(yàn)觀察這些潛在客戶(hù)對(duì)保險(xiǎn)產(chǎn)品的態(tài)度,然后根據(jù)反饋信息建立數(shù)據(jù)挖掘預(yù)測(cè)模型,尋找本公司保險(xiǎn)產(chǎn)品的優(yōu)勢(shì),實(shí)現(xiàn)成功銷(xiāo)售。

第二種解決方案:從節(jié)約時(shí)間和成本的角度考慮,首先保險(xiǎn)公司可以通過(guò)對(duì)現(xiàn)有客戶(hù)基本信息數(shù)據(jù)的挖掘,找到已購(gòu)買(mǎi)某類(lèi)保險(xiǎn)產(chǎn)品的客戶(hù)具備的基本特征;然后以發(fā)現(xiàn)的基本特征為依據(jù),找出那些具有同樣特征的人群,這些人群就是保險(xiǎn)公司的潛在客戶(hù);最后將潛在客戶(hù)轉(zhuǎn)化為實(shí)際客戶(hù)。(2)現(xiàn)有客戶(hù)分析。

對(duì)現(xiàn)有客戶(hù)的分析其實(shí)就是對(duì)有價(jià)值客戶(hù)的分析,有價(jià)值客戶(hù)就是指能給保險(xiǎn)公司帶來(lái)利潤(rùn)增長(zhǎng)的客戶(hù)。保險(xiǎn)公司要想知道某些客戶(hù)是否能帶來(lái)盈利,就必須對(duì)客戶(hù)進(jìn)行盈利率分析。通過(guò)盈利率分析,就可以找到保險(xiǎn)公司的有價(jià)值客戶(hù)。這些有價(jià)值客戶(hù)包括三類(lèi):第一類(lèi)是目前給保險(xiǎn)公司帶來(lái)最大利潤(rùn)的客戶(hù),也稱(chēng)之為高價(jià)值客戶(hù),即保險(xiǎn)公司對(duì)其投入較少成本就可以獲得高收益的客戶(hù),保險(xiǎn)公司可以針對(duì)高價(jià)值客戶(hù)進(jìn)行更深層、更細(xì)致的客戶(hù)關(guān)系管理;第二類(lèi)是現(xiàn)在給保險(xiǎn)公司帶來(lái)豐厚利潤(rùn),且未來(lái)可能成為最大利潤(rùn)貢獻(xiàn)者的客戶(hù);第三類(lèi)是現(xiàn)在能為保險(xiǎn)公司做出利潤(rùn)貢獻(xiàn),但正在逐漸失去價(jià)值的客戶(hù)。二、案例分析(一)案例介紹

近年來(lái),中國(guó)保險(xiǎn)業(yè)在迅速發(fā)展的同時(shí),也面臨著更加嚴(yán)峻的考驗(yàn)。據(jù)《中國(guó)保險(xiǎn)年鑒(2022年)》統(tǒng)計(jì),經(jīng)過(guò)12年的不斷發(fā)展,保險(xiǎn)業(yè)市場(chǎng)競(jìng)爭(zhēng)激烈。截至2021年年底,全國(guó)已有保險(xiǎn)集團(tuán)公司10家,保險(xiǎn)公司139家,保險(xiǎn)資產(chǎn)管理公司11家;全國(guó)共有省級(jí)(一級(jí))分公司1619家,中支和中支以下?tīng)I(yíng)業(yè)性機(jī)構(gòu)68968家。保險(xiǎn)從業(yè)人員高達(dá)353.83萬(wàn)人,其中營(yíng)銷(xiāo)員有279.6萬(wàn)人。對(duì)保險(xiǎn)公司的資本結(jié)構(gòu)進(jìn)行分析后發(fā)現(xiàn):中資保險(xiǎn)公司共有79家,其中產(chǎn)險(xiǎn)公司、壽險(xiǎn)公司、再保險(xiǎn)公司分別為39家、37家、3家;外資保險(xiǎn)公司共有51家,其中產(chǎn)險(xiǎn)公司、壽險(xiǎn)公司、再保險(xiǎn)公司分別為21家、25家、5家??焖僭龆嗟谋kU(xiǎn)市場(chǎng)主體使中國(guó)保險(xiǎn)業(yè)不得不面臨國(guó)內(nèi)、國(guó)際兩方面的競(jìng)爭(zhēng)。保險(xiǎn)公司對(duì)客戶(hù)資源的爭(zhēng)奪已到白熱化階段,對(duì)新市場(chǎng)空間的開(kāi)發(fā)變得越發(fā)困難。

本案例從定量角度出發(fā),通過(guò)歷史數(shù)據(jù)對(duì)車(chē)輛保險(xiǎn)產(chǎn)品的潛在客戶(hù)展開(kāi)研究,建立基于決策樹(shù)算法的車(chē)輛保險(xiǎn)產(chǎn)品的潛在客戶(hù)識(shí)別模型,根據(jù)保險(xiǎn)公司提供的有關(guān)數(shù)據(jù)進(jìn)行特征選取,建立相應(yīng)的決策樹(shù)模型,進(jìn)而分析出車(chē)輛保險(xiǎn)產(chǎn)品的潛在客戶(hù)畫(huà)像,以提高保險(xiǎn)公司營(yíng)銷(xiāo)推薦的成功率和經(jīng)營(yíng)效率,為保險(xiǎn)公司提供潛在客戶(hù)識(shí)別模型的設(shè)計(jì)思路,進(jìn)一步豐富車(chē)輛保險(xiǎn)產(chǎn)品的相關(guān)研究。(二)實(shí)證分析1.?dāng)?shù)據(jù)來(lái)源

本案例所使用的數(shù)據(jù)來(lái)源于Kaggle網(wǎng)站。為了預(yù)測(cè)保險(xiǎn)公司客戶(hù)是否會(huì)對(duì)該公司的車(chē)輛保險(xiǎn)產(chǎn)品感興趣,數(shù)據(jù)集包含人口統(tǒng)計(jì)信息(性別、年齡、區(qū)域代碼)、車(chē)輛(車(chē)齡、車(chē)輛是否損壞)、保單(年度保險(xiǎn)費(fèi)、保單銷(xiāo)售渠道)等11個(gè)相關(guān)信息?,F(xiàn)將這11個(gè)相關(guān)信息定義為自變量,利用這些自變量去預(yù)測(cè)客戶(hù)是否對(duì)該公司的車(chē)輛保險(xiǎn)產(chǎn)品感興趣,因變量是Response字段,表示是否感興趣,對(duì)車(chē)輛保險(xiǎn)產(chǎn)品感興趣的客戶(hù)用1作為標(biāo)簽,對(duì)車(chē)輛保險(xiǎn)產(chǎn)品不感興趣的客戶(hù)用0作為標(biāo)簽,因此這個(gè)模型屬于有監(jiān)督的二分類(lèi)模型,單個(gè)變量的含義如表7.1.1所示。

該數(shù)據(jù)集共有381109個(gè)車(chē)輛保險(xiǎn)產(chǎn)品購(gòu)買(mǎi)者(客戶(hù))的相關(guān)信息,其中12.26%的客戶(hù)對(duì)該公司的車(chē)輛保險(xiǎn)產(chǎn)品感興趣,87.74%的客戶(hù)對(duì)該公司的車(chē)輛保險(xiǎn)產(chǎn)品不感興趣,對(duì)車(chē)輛保險(xiǎn)產(chǎn)品感興趣的客戶(hù)與對(duì)車(chē)輛保險(xiǎn)產(chǎn)品不感興趣的客戶(hù)的比例約為1∶7,客戶(hù)興趣狀態(tài)餅圖如圖7-1-3所示。由上述分析可知,對(duì)車(chē)輛保險(xiǎn)產(chǎn)品感興趣的客戶(hù)群體數(shù)量較少,屬于少數(shù)類(lèi)樣本,也稱(chēng)為正樣本;對(duì)車(chē)輛保險(xiǎn)產(chǎn)品不感興趣的客戶(hù)群體數(shù)量較多,屬于多數(shù)類(lèi)樣本,也稱(chēng)為負(fù)樣本。它們之間存在明顯的不平衡現(xiàn)象。2.?dāng)?shù)據(jù)預(yù)處理

數(shù)據(jù)的質(zhì)量決定了模型的預(yù)測(cè)與泛化能力,所以在數(shù)據(jù)建模之前有一個(gè)非常關(guān)鍵的步驟,就是數(shù)據(jù)預(yù)處理。為了使數(shù)據(jù)達(dá)到適應(yīng)模型、匹配模型的要求,一般會(huì)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理來(lái)解決數(shù)據(jù)類(lèi)型不同、數(shù)據(jù)有缺失等問(wèn)題。通過(guò)查看數(shù)據(jù)集的信息,我們可以大致了解數(shù)值列、字符列、不同變量的取值范圍。通過(guò)對(duì)數(shù)據(jù)格式、結(jié)構(gòu)等進(jìn)行轉(zhuǎn)換,將數(shù)據(jù)轉(zhuǎn)換為適合處理的形式進(jìn)行建模來(lái)發(fā)現(xiàn)其中隱藏的潛在信息規(guī)則。變量類(lèi)型與描述性統(tǒng)計(jì)如表7.1.2所示。

由表7.1.2可知,在數(shù)據(jù)集的12個(gè)變量中,有10個(gè)整數(shù)型變量,2個(gè)字符型變量。從取值范圍可以看出不同變量之間的差別相對(duì)較大,存在量綱不一致的問(wèn)題。另外,經(jīng)過(guò)缺失值檢驗(yàn)發(fā)現(xiàn),數(shù)據(jù)集中的12個(gè)變量都不存在缺失值。對(duì)數(shù)據(jù)的主要處理如下。(1)字符型變量處理。

對(duì)數(shù)據(jù)集中的2個(gè)字符型變量進(jìn)行如下處理:對(duì)于Gender(性別)這個(gè)變量,本案例將Male(男性)設(shè)置為0,將Female(女性)設(shè)置為1;對(duì)于Vehicle_Age(車(chē)齡)這個(gè)變量,將車(chē)齡>2years(大于2年)設(shè)置為2,將車(chē)齡1~2years(1~2年)設(shè)置為1,將車(chē)齡<1year(小于1年)設(shè)置為0。(2)無(wú)效值處理。

無(wú)效值處理就是對(duì)無(wú)意義的特征變量或可能破壞模型穩(wěn)定性的數(shù)據(jù)進(jìn)行刪除處理。在保險(xiǎn)公司的數(shù)據(jù)集中,ID這個(gè)變量為客戶(hù)序號(hào),沒(méi)有實(shí)際意義,且可能影響模型穩(wěn)定性,因此將這個(gè)變量刪除。(3)數(shù)據(jù)標(biāo)準(zhǔn)化處理。

數(shù)據(jù)標(biāo)準(zhǔn)化處理是非常有必要的,不同特征變量往往具有不同的量綱,而且各變量值的取值范圍也有很大差異,雖然決策樹(shù)模型對(duì)數(shù)據(jù)的量綱非常不敏感,但是有些模型對(duì)此比較敏感,如KNN、支持向量機(jī)等要求數(shù)據(jù)具有一致的量綱。為了統(tǒng)一,本案例選用max-min標(biāo)準(zhǔn)化來(lái)消除量綱的影響,提高模型準(zhǔn)確性。(4)樣本的均衡化處理。

不平衡數(shù)據(jù)是指數(shù)據(jù)集樣本中標(biāo)簽的比例明顯不平衡,不同類(lèi)別樣本的樣本量差異非常大,通常來(lái)說(shuō)標(biāo)簽的比例大于1∶3就可以稱(chēng)為不平衡數(shù)據(jù)。本案例的數(shù)據(jù)集中對(duì)車(chē)輛保險(xiǎn)產(chǎn)品感興趣的客戶(hù)與對(duì)車(chē)輛保險(xiǎn)產(chǎn)品不感興趣的客戶(hù)的比例約為1∶7,所以此數(shù)據(jù)為不平衡數(shù)據(jù)。樣本分布不平衡,即正、負(fù)樣本的數(shù)量差別較大,主要出現(xiàn)在與分類(lèi)相關(guān)的建模問(wèn)題上。樣本分布不平衡將導(dǎo)致樣本量少的樣本中包含的特征過(guò)少,從樣本量少的樣本中提取特征規(guī)律難度較大,也會(huì)導(dǎo)致過(guò)擬合等問(wèn)題,且得到的結(jié)果準(zhǔn)確性和穩(wěn)定性較差。

目前,解決樣本分布不平衡問(wèn)題的方法主要有兩種:一種是從算法角度出發(fā)的方法;另一種是從數(shù)據(jù)角度出發(fā)的方法。前者對(duì)傳統(tǒng)的分類(lèi)算法進(jìn)行改進(jìn),分類(lèi)算法大多是依據(jù)平衡數(shù)據(jù)集進(jìn)行設(shè)計(jì)的,因而從算法角度對(duì)其進(jìn)行優(yōu)化的難度較大;后者采用重采樣技術(shù)改進(jìn)不平衡數(shù)據(jù)集類(lèi)別的比例,從而使數(shù)據(jù)集中正、負(fù)樣本平衡,相對(duì)比較簡(jiǎn)單。本案例使用過(guò)采樣法中的隨機(jī)過(guò)采樣法來(lái)平衡訓(xùn)練集,將正、負(fù)樣本的比例調(diào)整為1∶1,經(jīng)過(guò)測(cè)試,采用經(jīng)隨機(jī)過(guò)采樣法處理的數(shù)據(jù)訓(xùn)練出來(lái)的模型比采用未經(jīng)處理的數(shù)據(jù)訓(xùn)練出來(lái)的模型在AUC(曲線下面積)等指標(biāo)上有所提升。3.模型評(píng)價(jià)指標(biāo)

進(jìn)行上述一系列處理之后,建立模型之前,先介紹本案例所用的模型評(píng)價(jià)指標(biāo),以判斷模型的優(yōu)劣。(1)準(zhǔn)確率。準(zhǔn)確率反映了模型結(jié)果相對(duì)于實(shí)際結(jié)果的準(zhǔn)確程度。(2)查準(zhǔn)率、召回率。在實(shí)際情況中,模型的準(zhǔn)確率只能對(duì)模型進(jìn)行大概的評(píng)價(jià),因此定義查準(zhǔn)率(Precision)表示模型預(yù)測(cè)為正樣本且其真正為正的比例,召回率(Recall)表示所有正樣本中被模型預(yù)測(cè)成功的比例。(3)ROC曲線與AUC。

ROC曲線關(guān)注兩個(gè)指標(biāo):一是真正類(lèi)率(TPR=TP/(TP+FN));二是假正類(lèi)率(FPR=FP/(FP+TN))。直觀上,TPR代表能將正類(lèi)正確分類(lèi)的可能性,F(xiàn)PR代表將負(fù)類(lèi)錯(cuò)誤地分為正類(lèi)的可能性。在ROC曲線上,每個(gè)點(diǎn)的橫坐標(biāo)為FPR,縱坐標(biāo)為T(mén)PR,這也顯示了分類(lèi)器在TP與FP之間的取舍,而將(FPR,TPR)連接起來(lái)就形成了ROC曲線。

AUC為ROC曲線的起點(diǎn)、終點(diǎn)與垂直坐標(biāo)軸所圍成的面積,一般來(lái)說(shuō),AUC的值越大越好,根據(jù)經(jīng)驗(yàn),AUC的值介于0.5與1.0之間,AUC的值越大代表模型的分類(lèi)效果越好。4.建模前的準(zhǔn)備

在訓(xùn)練模型和預(yù)測(cè)之前,為了更好地評(píng)價(jià)和比較不同模型之間的分類(lèi)預(yù)測(cè)效果,應(yīng)該盡可能保證使用的訓(xùn)練集和測(cè)試集樣本成分相似,先將381109個(gè)樣本進(jìn)行樣本均衡化和數(shù)據(jù)標(biāo)準(zhǔn)化,再劃分?jǐn)?shù)據(jù)集的訓(xùn)練集和測(cè)試集,最后利用R語(yǔ)言隨機(jī)抽取數(shù)據(jù)集中70%的樣本為訓(xùn)練集,其余的30%為測(cè)試集,如表7.1.3所示。由表7.1.3可知,訓(xùn)練集和測(cè)試集的切分基本均勻,訓(xùn)練集用于構(gòu)建模型,測(cè)試集用于評(píng)估模型。為了更好地構(gòu)建模型,對(duì)訓(xùn)練集進(jìn)行均衡化處理。5.構(gòu)建模型(1)ID3模型的構(gòu)建。利用R語(yǔ)言在RStudio平臺(tái)上建立ID3模型,使用rpart()函數(shù)建立ID3模型,對(duì)測(cè)試集進(jìn)行預(yù)測(cè),ID3模型測(cè)試集的混淆矩陣如表7.1.4所示。ID3模型的AUC值約為0.783,準(zhǔn)確率約為0.783,召回率約為0.977,說(shuō)明ID3模型可以較好地區(qū)分正、負(fù)樣本,整體分類(lèi)預(yù)測(cè)結(jié)果較好。ID3模型的ROC曲線如圖7-1-4所示。(2)CART模型的構(gòu)建。利用R語(yǔ)言在RStudio平臺(tái)上建立CART模型,對(duì)測(cè)試集進(jìn)行預(yù)測(cè)。CART模型測(cè)試集的混淆矩陣如表7.1.5所示。CART模型的AUC值約為0.783,準(zhǔn)確率約為0.783,召回率約為0.977,整體來(lái)說(shuō),CART模型的分類(lèi)預(yù)測(cè)結(jié)果也較好,可以較好地區(qū)分正、負(fù)樣本。CART模型的ROC曲線如圖7-1-5所示。(3)C5.0模型的構(gòu)建。先利用R語(yǔ)言在RStudio平臺(tái)上使用C5.0算法進(jìn)行C5.0模型構(gòu)建,再計(jì)算C5.0模型的AUC、召回率、準(zhǔn)確率等,評(píng)價(jià)C5.0模型在該問(wèn)題中的分類(lèi)預(yù)測(cè)效果。C5.0模型測(cè)試集的混淆矩陣如表7.1.6所示。C5.0模型的AUC值約為0.852,準(zhǔn)確率約為0.852,召回率約為0.982,該模型對(duì)正、負(fù)樣本有很好的區(qū)分能力,整體分類(lèi)預(yù)測(cè)結(jié)果非常優(yōu)秀。C5.0模型的ROC曲線如圖7-1-6所示。(4)模型結(jié)果對(duì)比分析。

將ID3模型、CART模型、C5.0模型三個(gè)模型的相關(guān)評(píng)價(jià)指標(biāo)匯總,如表7.1.7所示。由表7.1.7可知,三個(gè)模型的AUC值均大于或等于0.783,處于良好水平,而三個(gè)模型的準(zhǔn)確率和召回率也非常優(yōu)秀,準(zhǔn)確率均大于或等于0.783,召回率均大于或等于0.977,說(shuō)明分類(lèi)預(yù)測(cè)結(jié)果可以覆蓋絕大多數(shù)車(chē)輛保險(xiǎn)產(chǎn)品的潛在客戶(hù)。但是綜合來(lái)看,C5.0模型的AUC值、準(zhǔn)確率和召回率都高于其他兩個(gè)模型,說(shuō)明C5.0模型最合適,各項(xiàng)評(píng)價(jià)指標(biāo)均最佳,在車(chē)輛保險(xiǎn)產(chǎn)品潛在客戶(hù)識(shí)別問(wèn)題上有很好的可行性,因此最終選取C5.0模型對(duì)車(chē)輛保險(xiǎn)產(chǎn)品潛在客戶(hù)進(jìn)行預(yù)測(cè)識(shí)別。(5)特征重要性分析。

從表7.1.7中可以發(fā)現(xiàn),C5.0模型對(duì)車(chē)輛保險(xiǎn)產(chǎn)品潛在客戶(hù)的預(yù)測(cè)識(shí)別效果最好,同時(shí)C5.0模型可以在模型構(gòu)建中展現(xiàn)特征的重要性。一般來(lái)說(shuō),特征重要性不僅可以衡量特征在模型構(gòu)建中的作用,還反映了特征對(duì)潛在客戶(hù)預(yù)測(cè)的影響。由C5.0模型的特征重要性排序可知,不同變量對(duì)模型預(yù)測(cè)結(jié)果的重要性是不同的,因此可以進(jìn)一步分析得出哪些變量對(duì)車(chē)輛保險(xiǎn)潛在客戶(hù)識(shí)別比較重要,從而提醒保險(xiǎn)公司重點(diǎn)關(guān)注客戶(hù)的這些特征,制定合理的營(yíng)銷(xiāo)策略。本案例使用的C5.0模型的特征重要性排序依據(jù)是使用不同特征進(jìn)行分割帶來(lái)的總信息增益,如圖7-1-7所示。從圖7-1-7中可以看出,車(chē)輛是否損(Vehicle_Damage)、以前是否購(gòu)買(mǎi)過(guò)車(chē)輛保險(xiǎn)產(chǎn)品(Previously_Insured)、保單銷(xiāo)售渠道(Policy_Sales_Channel)是排名前三的變量,年齡(Age)、區(qū)域代碼(Region_Code)、車(chē)齡(Vehicle_Age)也是對(duì)識(shí)別潛在客戶(hù)影響較大的因素,保險(xiǎn)公司應(yīng)該重點(diǎn)關(guān)注這些因素,從而制定更加精準(zhǔn)的營(yíng)銷(xiāo)方案,挖掘出更多潛在客戶(hù),進(jìn)而將其轉(zhuǎn)變?yōu)檎嬲目蛻?hù),創(chuàng)造收益,提高競(jìng)爭(zhēng)能力。6.總結(jié)

本案例通過(guò)對(duì)某保險(xiǎn)公司車(chē)輛保險(xiǎn)客戶(hù)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,介紹了數(shù)據(jù)集的基本特征并對(duì)數(shù)據(jù)集進(jìn)行了樣本均衡化和數(shù)據(jù)標(biāo)準(zhǔn)化,保證了決策樹(shù)模型的準(zhǔn)確性和健壯性;同時(shí)為了保證決策樹(shù)模型的分類(lèi)預(yù)測(cè)效果,構(gòu)建了三種不同的決策樹(shù)模型,通過(guò)各種評(píng)價(jià)指標(biāo)比較三種決策樹(shù)模型的分類(lèi)預(yù)測(cè)性能,最后得出C5.0模型是表現(xiàn)最佳的模型,并且在此基礎(chǔ)上對(duì)C5.0模型的特征重要性進(jìn)行了排序分析。商業(yè)時(shí)間序列預(yù)測(cè)問(wèn)題02常用的時(shí)間序列預(yù)測(cè)模型如表7.2.1所示。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論除以上模型外,常用于時(shí)間序列預(yù)測(cè)的還有平滑預(yù)測(cè)法。平滑預(yù)測(cè)法常用于時(shí)間序列的趨勢(shì)分析和預(yù)測(cè),通過(guò)修勻技術(shù)削弱短期隨機(jī)波動(dòng)對(duì)時(shí)間序列的影響,使得時(shí)間序列更加平滑,具體分為移動(dòng)平滑法和指數(shù)平滑法。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論(一)時(shí)間序列預(yù)處理一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論1.時(shí)間序列定義時(shí)間序列就是一組按照時(shí)間順序排列的數(shù)據(jù),記錄了一個(gè)隨機(jī)事件在不同時(shí)刻的表現(xiàn)。換句話(huà)說(shuō),按照時(shí)間順序記錄的某隨機(jī)事件的發(fā)展過(guò)程構(gòu)成一個(gè)時(shí)間序列。其中,時(shí)間序列的n個(gè)有序觀察值稱(chēng)為序列長(zhǎng)度為n的觀察值序列,對(duì)時(shí)間序列進(jìn)行觀察、研究,尋找隨機(jī)事件變化發(fā)展的規(guī)律,預(yù)測(cè)其未來(lái)走勢(shì)即為時(shí)間序列分析。時(shí)間序列是商業(yè)分析中很常見(jiàn)的一種數(shù)據(jù)形式,如把某店鋪2019年至2021年每個(gè)月的銷(xiāo)量記錄下來(lái)就構(gòu)成了一個(gè)長(zhǎng)度為36期的時(shí)間序列。進(jìn)行時(shí)間序列研究的目的是揭示隨機(jī)時(shí)序的性質(zhì),即通過(guò)分析它的觀察值序列的性質(zhì)來(lái)推斷隨機(jī)時(shí)序的性質(zhì)。2.時(shí)間序列平穩(wěn)性時(shí)間序列分析是統(tǒng)計(jì)學(xué)中的一個(gè)重要分支,它涉及到對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行建模和預(yù)測(cè)。在進(jìn)行時(shí)間序列建模之前,通常需要對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn)和純隨機(jī)性檢驗(yàn),這是因?yàn)楹芏鄷r(shí)間序列模型都是建立在數(shù)據(jù)具有平穩(wěn)性的基礎(chǔ)之上的。平穩(wěn)性的定義:平穩(wěn)性是指時(shí)間序列的統(tǒng)計(jì)特性不隨時(shí)間變化而變化。具體來(lái)說(shuō),平穩(wěn)性分為兩種類(lèi)型:嚴(yán)平穩(wěn)(StrongStationarity):時(shí)間序列的所有階矩(均值、方差、偏度、峰度等)都不隨時(shí)間變化,且任意時(shí)間點(diǎn)的聯(lián)合概率分布與任何其他時(shí)間點(diǎn)的聯(lián)合概率分布相同。寬平穩(wěn)(WeakStationarity):通常指的是二階平穩(wěn),即時(shí)間序列的均值和方差不隨時(shí)間變化,且自協(xié)方差只依賴(lài)于時(shí)間間隔,不依賴(lài)于時(shí)間的起點(diǎn)。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論

平穩(wěn)時(shí)間序列的性質(zhì):均值為常數(shù):整個(gè)序列的均值是恒定的。自協(xié)方差和自相關(guān)系數(shù)只依賴(lài)于時(shí)間的平移長(zhǎng)度:與時(shí)間序列的起始點(diǎn)無(wú)關(guān)。方差也為常數(shù):整個(gè)序列的方差是恒定的。平穩(wěn)性檢驗(yàn)的目的:簡(jiǎn)化模型參數(shù)估計(jì):由于平穩(wěn)時(shí)間序列的均值和方差恒定,可以使用整個(gè)樣本數(shù)據(jù)來(lái)估計(jì)這些參數(shù),簡(jiǎn)化了參數(shù)估計(jì)過(guò)程。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論平穩(wěn)性檢驗(yàn)的方法:圖檢法:通過(guò)繪制時(shí)間序列圖和自相關(guān)圖來(lái)直觀判斷序列是否平穩(wěn)。時(shí)間序列圖:觀察數(shù)據(jù)是否圍繞一個(gè)常數(shù)值上下波動(dòng),波動(dòng)是否有界。自相關(guān)圖:觀察自相關(guān)系數(shù)隨滯后階數(shù)的增減情況。統(tǒng)計(jì)檢驗(yàn)法:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量來(lái)判斷序列的平穩(wěn)性,常用的方法包括單位根檢驗(yàn)(如ADF檢驗(yàn))等。自協(xié)方差和自相關(guān)系數(shù):自協(xié)方差:衡量時(shí)間序列在不同時(shí)間點(diǎn)的值的協(xié)方差,對(duì)于平穩(wěn)時(shí)間序列,自協(xié)方差只與時(shí)間間隔有關(guān)。自相關(guān)系數(shù):自協(xié)方差與同時(shí)點(diǎn)的方差的比值,衡量時(shí)間序列在不同時(shí)間點(diǎn)的相關(guān)程度。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論協(xié)方差可以通俗地理解為兩個(gè)變量在變化過(guò)程中是同方向變化還是反方向變化,同向或反向程度如何。而相關(guān)系數(shù)研究的是變量之間線性相關(guān)程度如何,相關(guān)系系的計(jì)算公式如下:

式中,COV(X,Y)為兩個(gè)變量間的協(xié)方差;

、

分別為兩個(gè)變量的標(biāo)準(zhǔn)差。將協(xié)方差和相關(guān)系數(shù)應(yīng)用到時(shí)間序列中,即為自協(xié)方差和自相關(guān)系數(shù)。自協(xié)方差表示不同時(shí)刻兩個(gè)觀察值之間的變化關(guān)系,計(jì)算公式為

式中,

為時(shí)間序列在t時(shí)刻的均值;

為時(shí)間序列在s時(shí)刻的均值。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論自相關(guān)系數(shù)衡量的是不同時(shí)刻兩個(gè)觀察值之間的相關(guān)程度,計(jì)算公式為

式中,

為時(shí)間序列t、s時(shí)刻的自協(xié)方差;

分別為時(shí)間序列t、s時(shí)刻的方差。根據(jù)平穩(wěn)時(shí)間序列自協(xié)方差和自相關(guān)系數(shù)只依賴(lài)于時(shí)間的平移長(zhǎng)度,而與時(shí)間的起止點(diǎn)無(wú)關(guān)這一性質(zhì),定義平穩(wěn)時(shí)間序列的自協(xié)方差函數(shù)

相應(yīng)的延遲k階的自相關(guān)系數(shù)等于除以序列標(biāo)準(zhǔn)差,即平穩(wěn)時(shí)間序列具有短期相關(guān)的特點(diǎn)是指隨著延遲階數(shù)k趨于n-1,自相關(guān)系數(shù)在短期內(nèi)快速衰減到0附近小幅度振蕩,這也是利用自相關(guān)圖進(jìn)行平穩(wěn)性檢驗(yàn)的依據(jù)。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論時(shí)間序列分析中,除了平穩(wěn)性檢驗(yàn)外,純隨機(jī)性檢驗(yàn)也是非常重要的一步。純隨機(jī)性檢驗(yàn)主要用于判斷一個(gè)平穩(wěn)時(shí)間序列是否為純隨機(jī)序列,即白噪聲序列。白噪聲序列是一種理想化的隨機(jī)序列,其中各個(gè)時(shí)刻的值之間相互獨(dú)立,沒(méi)有相關(guān)性。純隨機(jī)序列(白噪聲序列)的特點(diǎn):對(duì)于任意觀察時(shí)刻??,期望為常數(shù)。對(duì)于任意不同的觀察時(shí)刻??和??,當(dāng)??=??時(shí),協(xié)方差(方差)為常數(shù)。當(dāng)??≠??時(shí),協(xié)方差為零,即自相關(guān)系數(shù)為零。純隨機(jī)性檢驗(yàn)的必要性:純隨機(jī)序列沒(méi)有可預(yù)測(cè)的模式或趨勢(shì),因此無(wú)法從中提取有用信息進(jìn)行進(jìn)一步分析。對(duì)于純隨機(jī)序列,過(guò)去的行為對(duì)將來(lái)的發(fā)展沒(méi)有影響,因此不需要進(jìn)行復(fù)雜的時(shí)間序列分析。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論自相關(guān)圖分析:觀察自相關(guān)系數(shù)是否在0附近小幅度振蕩,但由于樣本長(zhǎng)度限制,可能難以準(zhǔn)確判斷。統(tǒng)計(jì)學(xué)假設(shè)檢驗(yàn):原假設(shè)(H0):時(shí)間序列是純隨機(jī)序列,除0階外的所有延遲階數(shù)的自相關(guān)系數(shù)全為0。備擇假設(shè)(H1):時(shí)間序列不是純隨機(jī)序列,至少有一個(gè)延遲階數(shù)的自相關(guān)系數(shù)不為0。統(tǒng)計(jì)量構(gòu)建:常用的統(tǒng)計(jì)量包括Q統(tǒng)計(jì)量和Ljung-Box(LB)統(tǒng)計(jì)量。Q統(tǒng)計(jì)量適用于大樣本情況。LB統(tǒng)計(jì)量是對(duì)Q統(tǒng)計(jì)量的修正,適用于小樣本情況。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論檢驗(yàn)步驟:計(jì)算統(tǒng)計(jì)量的值。確定臨界值和顯著性水平(α)。比較統(tǒng)計(jì)量的值和臨界值,或P值與顯著性水平,做出決策。決策:如果P值小于顯著性水平α,則拒絕原假設(shè),認(rèn)為時(shí)間序列不是純隨機(jī)序列。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論單位根檢驗(yàn)是構(gòu)造統(tǒng)計(jì)量進(jìn)行時(shí)間序列平穩(wěn)性檢驗(yàn)最常用的方法。若時(shí)間序列是平穩(wěn)的,那么該時(shí)間序列的所有特征根都應(yīng)該在單位圓內(nèi)?;谶@個(gè)性質(zhì)構(gòu)造的時(shí)間序列平穩(wěn)性檢驗(yàn)方法叫作單位根檢驗(yàn)。隨著學(xué)科的發(fā)展,后續(xù)又產(chǎn)生了很多種單位根檢驗(yàn),如DF檢驗(yàn)、ADF檢驗(yàn)、PP檢驗(yàn)、kpss檢驗(yàn)等單位根檢驗(yàn)的步驟:確定自回歸模型:假定時(shí)間序列由自回歸模型描述,模型階數(shù)??可以根據(jù)序列特性確定。構(gòu)建特征方程:從自回歸模型得到特征方程,解出特征根。檢驗(yàn)特征根位置:如果所有非零特征根都在單位圓內(nèi),則序列是平穩(wěn)的。(二)時(shí)間序列平穩(wěn)性的單位根檢驗(yàn)

一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論DF檢驗(yàn):最早的單位根檢驗(yàn)方法,基于一階自回歸模型

。原假設(shè)H0:時(shí)間序列具有單位根,是非平穩(wěn)的

。備擇假設(shè)H1:時(shí)間序列沒(méi)有單位根,是平穩(wěn)的

。檢驗(yàn)形式的分類(lèi):第一種類(lèi)型:無(wú)常數(shù)項(xiàng)、無(wú)趨勢(shì)項(xiàng)。第二種類(lèi)型:有常數(shù)項(xiàng)、無(wú)趨勢(shì)項(xiàng)。第三種類(lèi)型:有常數(shù)項(xiàng)、有趨勢(shì)項(xiàng)。一、時(shí)間序列預(yù)測(cè)模型的基礎(chǔ)理論ADF檢驗(yàn):增廣的DF檢驗(yàn),允許時(shí)間序列的確定性部分由過(guò)去??期的歷史數(shù)據(jù)描述。適用于時(shí)間序列的確定性部分不僅僅受到上一期歷史數(shù)據(jù)的影響。檢驗(yàn)決策:如果統(tǒng)計(jì)量小于臨界值或P值小于顯著性水平,則拒絕原假設(shè),認(rèn)為序列是平穩(wěn)的。如果統(tǒng)計(jì)量大于臨界值或P值大于顯著性水平,則接受原假設(shè),認(rèn)為序列是非平穩(wěn)的。趨勢(shì)平穩(wěn)時(shí)間序列:如果檢驗(yàn)結(jié)果顯示時(shí)間序列是趨勢(shì)平穩(wěn)的,這意味著序列具有趨勢(shì)項(xiàng),但去除趨勢(shì)項(xiàng)后序列是平穩(wěn)的。平穩(wěn)時(shí)間序列分析常用的模型有三個(gè):自回歸模型(AR模型)、移動(dòng)平均模型(MA模型)、ARMA模型。1.AR模型p階AR模型具有以下結(jié)構(gòu):式中,限制條件

要求隨機(jī)擾動(dòng)項(xiàng)

為零均值白噪聲序列。用延遲算子可將中心化AR模型寫(xiě)為AR模型常見(jiàn)的統(tǒng)計(jì)量有常數(shù)均值和方差、自相關(guān)系數(shù)、偏自相關(guān)系數(shù)。二、時(shí)間序列分析方法介紹(一)平穩(wěn)時(shí)間序列分析方法

2.MA模型q階MA模型具有以下結(jié)構(gòu):

和AR模型一樣,限制條件

仍然要求隨機(jī)擾動(dòng)項(xiàng)為零均值白噪聲序列。用延遲算子可將中心化MA模型寫(xiě)為

MA模型常見(jiàn)的統(tǒng)計(jì)量有常數(shù)均值和方差、自相關(guān)系數(shù)、偏自相關(guān)系數(shù),其中自相關(guān)系數(shù)截尾,偏自相關(guān)系數(shù)拖尾。二、時(shí)間序列分析方法介紹(一)平穩(wěn)時(shí)間序列分析方法

3.ARMA模型

用延遲算子可將中心化ARMA模型寫(xiě)為

ARMA模型的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都表現(xiàn)為拖尾。二、時(shí)間序列分析方法介紹(一)平穩(wěn)時(shí)間序列分析方法

平穩(wěn)時(shí)間序列建模步驟:(1)時(shí)間序列預(yù)處理。(2)模型識(shí)別定階。(3)參數(shù)估計(jì)。(4)模型檢驗(yàn)。(5)模型優(yōu)化。(6)模型預(yù)測(cè)。二、時(shí)間序列分析方法介紹(一)平穩(wěn)時(shí)間序列分析方法

非平穩(wěn)時(shí)間序列在自然界和社會(huì)科學(xué)中非常普遍,因此對(duì)它們的分析尤為重要。非平穩(wěn)時(shí)間序列的分析方法主要分為確定性分析方法和隨機(jī)分析方法兩大類(lèi):確定性分析方法原理簡(jiǎn)單,操作方便,易于解釋?zhuān)侵惶崛〈_定性信息,對(duì)隨機(jī)信息浪費(fèi)嚴(yán)重,且對(duì)各因素之間確切的作用關(guān)系沒(méi)有明確有效的判斷方法;隨機(jī)分析方法深入時(shí)間序列內(nèi)部去尋找觀察值之間的相關(guān)關(guān)系,借助自相關(guān)系數(shù)、偏自相關(guān)系數(shù)等統(tǒng)計(jì)量的特征進(jìn)行時(shí)間序列相關(guān)信息的提取,彌補(bǔ)了確定性分析方法的不足,為人們提供更加豐富、更加精確的時(shí)序分析工具。隨機(jī)分析方法包括ARIMA模型、殘差自回歸模型、條件異方差(GARCH)模型等,確定性分析方法主要有季節(jié)調(diào)節(jié)模型、平滑法和隨機(jī)方法結(jié)合的季節(jié)ARIMA模型等。二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

1.非平穩(wěn)時(shí)間序列的隨機(jī)分析(1)差分運(yùn)算。在時(shí)間序列分析中,為了將非平穩(wěn)時(shí)間序列轉(zhuǎn)換為平穩(wěn)時(shí)間序列以便于建模,通常采用差分技術(shù),包括一次差分去除線性趨勢(shì)和高次差分處理曲線趨勢(shì),隨后通過(guò)平穩(wěn)性檢驗(yàn)確認(rèn)轉(zhuǎn)換效果。一旦序列平穩(wěn),便可應(yīng)用ARMA模型進(jìn)行深入分析和預(yù)測(cè),確保模型的準(zhǔn)確性和可靠性。差分實(shí)質(zhì):自回歸,是一種非常簡(jiǎn)便有效的確定性信息提取方法。差分類(lèi)型:包括階數(shù)差分和步數(shù)差分。一階差分:d階差分:k步差分:(2)ARIMA模型。ARIMA模型,即自回歸積分滑動(dòng)平均模型,是時(shí)間序列分析中用于處理非平穩(wěn)數(shù)據(jù)并轉(zhuǎn)換為平穩(wěn)序列的核心方法。這種模型通過(guò)差分d次將原始序列轉(zhuǎn)換為平穩(wěn)形式,然后應(yīng)用自回歸部分p和移動(dòng)平均部分q進(jìn)行建模。當(dāng)q=0時(shí),簡(jiǎn)化為AR模型;當(dāng)p=0時(shí),簡(jiǎn)化為MA模型。ARIMA模型的關(guān)鍵在于假設(shè)隨機(jī)波動(dòng)為具有0均值和常數(shù)方差的純隨機(jī)序列,確保模型能夠準(zhǔn)確捕捉并預(yù)測(cè)時(shí)間序列的統(tǒng)計(jì)特性。二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

ARIMA模型的建模步驟:第一步,進(jìn)行時(shí)間序列預(yù)處理,檢驗(yàn)其是否為平穩(wěn)時(shí)間序列,若是,則進(jìn)入第三步,若為非平穩(wěn)時(shí)間序列,則進(jìn)行第二步;第二步,差分處理,將非平穩(wěn)時(shí)間序列轉(zhuǎn)換為平穩(wěn)時(shí)間序列,繼續(xù)檢驗(yàn)平穩(wěn)時(shí)間序列的純隨機(jī)性,若為純隨機(jī)序列,則停止分析,若為非純隨機(jī)序列,則繼續(xù)分析;第三步,模型識(shí)別定階,繪制自相關(guān)圖和偏自相關(guān)圖,判斷模型及階數(shù);第四步,參數(shù)估計(jì);第五步,殘差序列純隨機(jī)性檢驗(yàn),若不通過(guò),則返回第三步;第六步,模型優(yōu)化;第七步,時(shí)間序列預(yù)測(cè)。二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

(1)因素分解方法。因素分解方法是時(shí)間序列分析中的一種技術(shù),它將時(shí)間序列的波動(dòng)分解為長(zhǎng)期趨勢(shì)(Tt)、循環(huán)波動(dòng)(Ct)、季節(jié)性效應(yīng)(St)和隨機(jī)波動(dòng)(It)四個(gè)組成部分。這種方法在經(jīng)濟(jì)、商業(yè)和社會(huì)領(lǐng)域有廣泛應(yīng)用,但存在挑戰(zhàn),特別是在區(qū)分長(zhǎng)期趨勢(shì)和循環(huán)波動(dòng)方面,因?yàn)槿绻^察時(shí)期不夠長(zhǎng),它們的影響可能難以準(zhǔn)確分離??档吕疽蛑芷诘妊h(huán)波動(dòng)的周期可能非常長(zhǎng)且不固定,導(dǎo)致在較短的觀察期內(nèi)難以捕捉其完整影響。因素分解方法的目的是:1.排除其他因素的干擾,單獨(dú)測(cè)量某個(gè)確定性因素的影響。2.根據(jù)時(shí)間序列的確定性特征選擇合適的方法進(jìn)行綜合預(yù)測(cè),例如LOESS季節(jié)分解模型和指數(shù)平滑預(yù)測(cè)模型。二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

因素分解模型根據(jù)各因素之間的關(guān)系有不同的形式,包括加法模型和乘法模型。如果各時(shí)間序列之間是相互獨(dú)立的,表現(xiàn)在時(shí)序圖中季節(jié)性效應(yīng)和長(zhǎng)期趨勢(shì)相互獨(dú)立,季節(jié)效應(yīng)的周期振幅不隨長(zhǎng)期趨勢(shì)發(fā)生變化,維持相對(duì)穩(wěn)定,用加法模型: 若時(shí)間序列各因素之間互相影響,也就是說(shuō)季節(jié)性效應(yīng)的周期振幅隨著長(zhǎng)期趨勢(shì)的遞增發(fā)生變化,則用乘法模型:

二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

(2)利用LOESS方法的季節(jié)分解模型(STL)。LOESS方法的思想在估計(jì)的每個(gè)點(diǎn)處利用低階多項(xiàng)式進(jìn)行加權(quán)最小二乘擬合,離擬合目標(biāo)點(diǎn)越近的點(diǎn)給予的權(quán)重越大。利用

LOESS

方法進(jìn)行時(shí)間序列的季節(jié)分解(SeasonaldecompositionofTimeseriesbyLOESS,簡(jiǎn)稱(chēng)STL)是Cleveland等于1990年提出的分解時(shí)間序列的常用方法,是一種局部加權(quán)多項(xiàng)式回歸分解的方法。模型可寫(xiě)成式中,Yt為數(shù)據(jù);Tt為長(zhǎng)期趨勢(shì);St為季節(jié)性效應(yīng);Rt為隨機(jī)波動(dòng)。該模型對(duì)于離群點(diǎn)STL季節(jié)分解也是穩(wěn)健的,少數(shù)的離群觀測(cè)值不會(huì)影響長(zhǎng)期趨勢(shì)和季節(jié)性效應(yīng)的估計(jì)。STL季節(jié)分解由外循環(huán)及嵌套在外循環(huán)之中的內(nèi)循環(huán)組成,每進(jìn)行一次內(nèi)循環(huán)都更新長(zhǎng)期趨勢(shì)和季節(jié)性效應(yīng)一次。在內(nèi)循環(huán)中,記

為第k步的迭代結(jié)果,第k+1步進(jìn)行如下操作。步驟一:去掉趨勢(shì)成分

。步驟二:用LOESS對(duì)去掉趨勢(shì)成分后的序列進(jìn)行d=1,q取季節(jié)周期的平滑,記作

。步驟三:平滑后

的先做兩次周期長(zhǎng)度的移動(dòng)平均和3期移動(dòng)平均,接著進(jìn)行d=1,某個(gè)q的LOESS平滑,記作

。步驟四:去掉平滑后的循環(huán)子序列的趨勢(shì)成分得到季節(jié)成分

。步驟五:去掉季節(jié)成分

。步驟六:去掉季節(jié)成分的趨勢(shì)做LOESS平滑,剩余部分

。二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

(3)指數(shù)平滑。在實(shí)際生活中,對(duì)大多數(shù)隨機(jī)事件而言,一般都是近期的結(jié)果對(duì)現(xiàn)在的影響會(huì)大些,遠(yuǎn)期的結(jié)果對(duì)現(xiàn)在的影響會(huì)小些。為了更好地反映這種影響作用,考慮到時(shí)間間隔對(duì)事件發(fā)展的影響,各期權(quán)重隨時(shí)間間隔的增大而呈指數(shù)衰減,這就是指數(shù)平滑法的基本思想。指數(shù)平滑包括簡(jiǎn)單指數(shù)平滑、Holt-Winters兩參數(shù)指數(shù)平滑、Holt-Winters三參數(shù)指數(shù)平滑。具體應(yīng)用場(chǎng)景如表7.2.3所示。二、時(shí)間序列分析方法介紹(二)非平穩(wěn)時(shí)間序列分析方法

(3)指數(shù)平滑。季節(jié)加法ARIMA模型通過(guò)趨勢(shì)差分和季節(jié)差分將時(shí)間序列轉(zhuǎn)化為平穩(wěn)序列,適用于季節(jié)效應(yīng)、長(zhǎng)期趨勢(shì)效應(yīng)和隨機(jī)波動(dòng)之間存在簡(jiǎn)單線性關(guān)系的情況。季節(jié)乘法ARIMA模型適用于復(fù)雜交互影響的時(shí)間序列,其原理基于使用低階ARIMA模型提取長(zhǎng)期趨勢(shì)效應(yīng),并通過(guò)周期步長(zhǎng)的差分操作提取具有季節(jié)相關(guān)性的季節(jié)效應(yīng),最終構(gòu)建為ARIMA(p,d,q)和ARIMA(P,D,Q)S的乘積模型,即ARIMA(p,d,q)×(P,D,Q)S。季節(jié)加法ARIMA模型的數(shù)學(xué)形式:季節(jié)乘法ARIMA模型的數(shù)學(xué)形式:二、時(shí)間序列分析方法介紹(三)時(shí)間序列的交叉驗(yàn)證時(shí)間序列有以下兩種交叉驗(yàn)證方法[27]。①隨機(jī)選取N個(gè)訓(xùn)練集和N個(gè)測(cè)試集,類(lèi)似于截面數(shù)據(jù)的N折交叉驗(yàn)證,訓(xùn)練集和測(cè)試集都是固定的原始序列的完整窗口,而且所有折的訓(xùn)練集和測(cè)試集的滯后間隔固定。②固定長(zhǎng)度或者改變長(zhǎng)度的訓(xùn)練集每次向前移動(dòng)一個(gè)時(shí)間或者一段固定時(shí)間,如季節(jié)周期,后面是固定長(zhǎng)度的測(cè)試集。交叉驗(yàn)證的目的主要有以下三點(diǎn)。①對(duì)不同時(shí)間段比較不同的精度度量。②對(duì)不同的方法比較不同的精度度量。③對(duì)不同的預(yù)測(cè)前景比較不同的精度度量。二、時(shí)間序列分析方法介紹交叉驗(yàn)證中度量精度的誤差如下:①平均絕對(duì)誤差為②均方誤差為③均方根誤差為④平均絕對(duì)百分比誤差為⑤平均絕對(duì)標(biāo)準(zhǔn)化誤差為針對(duì)非季節(jié)性時(shí)間序列:針對(duì)季節(jié)性時(shí)間序列:(三)時(shí)間序列的交叉驗(yàn)證二、時(shí)間序列分析方法介紹(四)時(shí)間序列預(yù)測(cè)R語(yǔ)言算法函數(shù)用R語(yǔ)言實(shí)現(xiàn)時(shí)間序列分析的主要模型是ARIMA模型、STL季節(jié)分解、指數(shù)平滑模型,在使用這些模型時(shí)需要進(jìn)行數(shù)據(jù)預(yù)處理、差分等操作,主要包括繪制時(shí)序圖、ACF圖、PACF圖、平穩(wěn)性檢驗(yàn)、純隨機(jī)性檢驗(yàn)、各類(lèi)差分、參數(shù)估計(jì)、模型檢驗(yàn)、AIC優(yōu)化、BIC優(yōu)化、模型預(yù)測(cè)、交叉驗(yàn)證等過(guò)程,常用函數(shù)如表7.2.4所示。三、案例分析(一)案例背景糖尿病是全球性日益嚴(yán)重的公共衛(wèi)生問(wèn)題,2019年全球成人患者已達(dá)4.63億,預(yù)計(jì)到2030年和2045年將分別增至5.78億和7.002億。中國(guó)以1.164億患者位居世界第一,預(yù)計(jì)2030年將增至1.41億。隨著患者人數(shù)增長(zhǎng)、醫(yī)療保險(xiǎn)制度推廣和新藥推出,中國(guó)抗糖尿病藥物市場(chǎng)自2017年的512億元增長(zhǎng)至2022年的978億元,并預(yù)計(jì)2028年將達(dá)到1739億元,公立醫(yī)院數(shù)據(jù)顯示2015至2019年間銷(xiāo)售總金額復(fù)合增長(zhǎng)率為9.55%,預(yù)計(jì)市場(chǎng)增速將保持在10%以上,突顯了抗糖尿病藥物市場(chǎng)的廣闊前景和持續(xù)增長(zhǎng)潛力?,F(xiàn)有某醫(yī)藥企業(yè)1992年1月至2008年12月的抗糖尿病藥物銷(xiāo)售歷史數(shù)據(jù),分析目標(biāo)包括:研究每月抗糖尿病藥物銷(xiāo)售的長(zhǎng)期趨勢(shì)及季節(jié)性影響。選擇合適的模型預(yù)測(cè)未來(lái)每月的銷(xiāo)售情況。三、案例分析(二)問(wèn)題分析采用時(shí)間序列分析法研究每月抗糖尿病藥物銷(xiāo)售序列的建模分析過(guò)程主要包括以下步驟:①數(shù)據(jù)預(yù)處理:缺失值、異常值處理,形成建模數(shù)據(jù),繪制時(shí)序圖探索序列特點(diǎn)。②因素分解:使用因素分解方法來(lái)識(shí)別并分離出時(shí)間序列中的趨勢(shì)和季節(jié)效應(yīng),特別是分析不同季節(jié)對(duì)銷(xiāo)售的影響。③模型選擇與評(píng)估:應(yīng)用STL季節(jié)分解、指數(shù)平滑和季節(jié)ARIMA模型對(duì)銷(xiāo)售序列進(jìn)行建模,并通過(guò)交叉驗(yàn)證來(lái)評(píng)估各模型的預(yù)測(cè)性能。④預(yù)測(cè)與指導(dǎo):利用選定的模型預(yù)測(cè)未來(lái)每月的銷(xiāo)售情況,為藥物銷(xiāo)售策略和庫(kù)存管理提供數(shù)據(jù)支持和建議。三、案例分析(三)數(shù)據(jù)探索分析每月抗糖尿病藥物銷(xiāo)售序列的數(shù)據(jù)格式整潔,經(jīng)檢查沒(méi)有缺失值、異常值,故不必作數(shù)據(jù)清洗處理,直接可以進(jìn)行建模分析。首先對(duì)每月抗糖尿病藥物銷(xiāo)售序列進(jìn)行時(shí)間序列格式轉(zhuǎn)換,設(shè)置時(shí)間起止為1992年1月至2008年12月,時(shí)間頻率為月度,緊接著對(duì)每月抗糖尿病藥物銷(xiāo)售序列繪制時(shí)序圖,如圖7-2-6所示。三、案例分析(三)數(shù)據(jù)探索分析觀察圖7-2-6,可以看到每月抗糖尿病藥物銷(xiāo)售序列有著明顯上升的趨勢(shì),并且每一年都有從低谷到高峰再到低谷的周期循環(huán),周期長(zhǎng)度為12個(gè)月。顯然每月抗糖尿病藥物銷(xiāo)售序列非平穩(wěn),并且同時(shí)受到趨勢(shì)效應(yīng)、季節(jié)效應(yīng)和隨機(jī)擾動(dòng)的影響,在構(gòu)建模型的時(shí)候需要考慮到上述因素的影響。三、案例分析(四)模型建模為預(yù)測(cè)抗糖尿病藥物銷(xiāo)售,分析流程包括:序列因素分解以識(shí)別趨勢(shì)和季節(jié)效應(yīng),使用1992至2007年數(shù)據(jù)訓(xùn)練季節(jié)ARIMA、STL分解和指數(shù)平滑模型,預(yù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論