誰是最好的客戶使用spss從營銷數據中獲得_第1頁
誰是最好的客戶使用spss從營銷數據中獲得_第2頁
誰是最好的客戶使用spss從營銷數據中獲得_第3頁
誰是最好的客戶使用spss從營銷數據中獲得_第4頁
誰是最好的客戶使用spss從營銷數據中獲得_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、30/30誰是最好的客戶?使用SPSS從營銷數據庫中獲得更多信息備注:這是一篇思路特不清晰的市場挖掘方面的文章,要緊側重于從統(tǒng)計的角度來看待數據挖掘,而不是側重于從機器學習的角度。特不適合具有統(tǒng)計背景的人員迅速切入數據挖掘領域。美中不足的是沒有給出具體的數據如此我們不能按圖索驥地將文章中介紹的方法操作一遍。網上也流傳一篇由SPSS北京辦事處翻譯的pdf版,但我覺得依舊原來的英文版講得詳細點。歡迎前來交流營銷和數據挖掘 HYPERLINK MSN:mktexchage MSN:mktexchage。摘要本文使用SPSS 的頻數分析、描述性分析、缺失值分析、方差分析、卡方檢驗、交叉表、均值比較、相

2、關分析、線性回歸、決策樹等統(tǒng)計方法及餅狀圖、條形圖、箱圖、散點圖、樹形圖等圖表對一個客戶數據案例進行分析,以發(fā)覺不同客戶群體的特征,為市場推廣活動提供依據。關鍵詞市場,細分,客戶,統(tǒng)計,分析,比較誰是最好的客戶?任何行業(yè)專業(yè)人士市場人員,銷售經理,產品開發(fā)者和服務專家都樂意回答那個問題。 在當今激烈的市場中,開發(fā),吸引和保留客戶越來越困難同時也越來越昂貴。由于這些壓力,更多的組織使用營銷數據庫最大化他們現有的客戶價值。轉換客戶數據為知識和信息的行為是一個有力的手段和企業(yè)生存的一項必需的技能。 理解客戶的固有特征能夠給你有價值的發(fā)覺。了解最有價值或至少有利潤的客戶,他們的購買方式,購買行為和人口

3、統(tǒng)計特征是制訂營銷打算的關鍵。較好地理解客戶是什么能夠關心你開發(fā)忠誠的,有持續(xù)回報的客戶,制訂提升銷售和交叉銷售及營銷定位打算。集思廣益的決策也是廣告,促銷,直接郵寄活動和其他營銷成功的基礎。 有許多方式能夠確定最佳客戶的特征,也有許多方法可用來度量這些特征。本文講明使用SPSS實現客戶分析的一種方法。 案例營銷數據庫中包含2000個客戶和下列數據: 首次成為公司客戶的日期 購買歷史不同促銷方案的響應率家庭收入地區(qū)性不和其它人口統(tǒng)計數據 本文中我們從數據庫中析取可控信息,使用各種數據分析技術,從初級的到高級的,目標是依據過去的銷售額用人口統(tǒng)計數據來識不不同的細分客戶群。即使最一般的過程產生的結

4、果對如何樣理解客戶也能夠產生深刻的含意。不要低估這些方法。用靈活和有力的分析工具結合你的業(yè)務背景是從數據中獲得有價值信息的最好方法。 首先探究:典型客戶是什么樣的? 我們通過從數據庫中探究不同的變量來回答如此的問題: 客戶住在哪里?在三個銷售區(qū)域中客戶的分布如何? 客戶的平均收入是多少? 成為公司客戶的時刻有多長? 對不同的促銷方案,客戶平均響應是多少?有多少人響應第一促銷方案? 客戶花費是多少? SPSS 提供了能夠迅速回答以上問題的幾種分析方法,頻數和描述性分析過程能夠提供對客戶數據的初步印象。從圖1 餅狀圖中能夠看出,東部地區(qū)所占比例最大(34%),西部地區(qū)最小(19%),而有16.9%

5、的數據未列出所屬地區(qū)。圖 1 和表 1。SPSS自動形成的圖表顯示最多的客戶(34%)生活在東部地區(qū)。頻數和描述過程特不適合對數據進行原始整理,可能在分析中許多方法都要用這種方法實現。 分析客戶住居在哪里關心我們確定銷售版圖。頻數過程提供分類變量計數和百分比表,同時可用條圖,直方圖和餅圖表示數據。SPSS 自動地呈現這些表和圖的結果。 從分析中我們能夠認識到什么證明是重要的。餅圖和表1顯示最大的客戶群(34%)生活在東部地區(qū),最小的客戶群(19%)生活在西部地區(qū)。同時有16.9%的客戶在數據庫中沒有列出居住區(qū)域。 SPSS 用專門的處理表示缺失數據。明白何時什么緣故信息缺失專門有必要。例如,你

6、可能想區(qū)不是因為它們沒有涉及而缺失依舊因為它們難以獲得而缺失。表1中,“百分數” 包括缺失數據,“有效百分數” 從計算中排出了缺失數據, 能夠從表上迅速并行比較缺失數據如何樣阻礙結果的。 要得到家庭收入的信息,我們需要幾個差不多的統(tǒng)計量作為最初描述統(tǒng)計量。如平均值,最小和最大值,或連續(xù)變量,如以美元為單位的收入和以年數為單位的年齡。描述過程為我們提供了一系列匯總統(tǒng)計量。從表2能夠看到在2000個客戶中家庭收入的平均值大約是 $61,000, 大部分收入范圍在 $50,000和 $72,000之間。表2. 描述過程顯示平均家庭收入大約是$61,000.要回答“成為公司客戶的時刻有多長?” 的問題

7、,我們必須處理一個字段然后計算每個時刻周期的客戶數。因為數據庫包含第一次成為公司客戶的日期,首先計算一個新變量:作為客戶的時長。使用SPSS中提供的眾多的時刻函數,能夠輕而易舉地用年數轉換成日期計算客戶的時長。計算那個新變量后,用時長的頻數表來表示客戶存在時刻。 表 3. 頻數表顯示51%的客戶存在超過7年。從表 3 看出大約有29%的客戶存在10年以上,差不多有過半數的客戶在7年以上。接下來,我們要問“誰消費最多?”,最好的客戶理所因此是最有利潤的客戶,或為組織花費最多的客戶。 為了得到準確的客戶生命周期價值,結合前期購買和客戶行為建立預測模型預測以后購買。 本例中,我們開始用總訂單金額代替

8、每個客戶。首先,建立一個新變量,對數據庫中每個訂單金額(訂單1的金額,訂單2的金額等等)求和。因為總訂單金額是連續(xù)變量,直方圖是顯示結果的最有效的方法。 圖 2. 從直方圖能夠看出大部分客戶消費低于$500,少數幾個客戶消費量比較大。 直方圖的直條代表一個數據范圍。在圖2中大部分客戶消費低于$500,少數幾個客戶消費量比較大。 每個客戶平均消費量是$1,360 ,專門少有客戶消費量超過$7,000。當目前為止,我們明白典型的客戶是: 生活在東部家庭平均收入為$61,000有七年購物歷史 在公司產品和服務上消費 $1,360 客戶對不同的促銷有如何樣的響應? 進行促銷分析是理解客戶的另一個重要步

9、驟。評估營銷打算和促銷關心分辨能夠做什么能夠不做什么。它準確地告訴我們何時及什么緣故某個打算成功,因此你能夠拷貝你的成功經驗和學習失敗的經驗。 要回答“每種促銷有多少人響應?”和“不同的促銷平均響應是多少?”的問題,能夠對每種促銷響應運行頻數分析過程和對四種促銷的訂單運行描述分析過程。 表 4. 大約有45%,或890人對第一促銷方案有響應。 在表4中,有890人,或大約45%的客戶響應第一促銷方案。對其它促銷進行類似的分析,第二促銷方案的響應率是39%,第三促銷方案的響應率是37.4%,第四促銷方案的響應率是17.4%。 那個地點出現一個新問題:在第四促銷方案中唯一的特征是它較成功的獲得客戶

10、響應的緣故嗎?換句話講,這種結果有意義嗎?購買歷史(表5)信息顯示第三促銷方案的平均值是$294, 低于其它促銷方案。這種差不是否有統(tǒng)計意義還需進一步分析來確定。 表 5. 購買歷史分析顯示第三促銷方案的平均值是$294, 低于其它促銷方案。 進一步分析:我們的客戶如何樣不同?如何樣相似? 既然對客戶和各種促銷的成功有一個差不多的理解,通過觀看兩個或多個變量趕忙支持這種有力的分析。SPSS 關心發(fā)覺用不的方式難于發(fā)覺的潛在關系。例如,差不多明白客戶在各區(qū)域分布和有多少客戶響應第一促銷方案。接下來要觀看各區(qū)域響應第一促銷方案的客戶有多少。通過研究回答這些問題: 每個地區(qū)客戶生命周期平均是多少?

11、各區(qū)域人們如何樣響應第一促銷方案? SPSS專門容易實現比較不同的分組數據。Crosstabs過程,Means過程, 分段條圖和箱圖都能夠清晰地表示這些結果;當結果有統(tǒng)計意義時,可用卡方統(tǒng)計量,方差分析和CHAID識不。當你明白什么是有統(tǒng)計意義時,這就專門重要了,因為你沒有白費你的努力。 下一步探究的問題是“每個區(qū)域客戶平均生命周期是多少?”。一個強有力的統(tǒng)計圖,箱圖將均值和數據分布顯示在一起。 圖3箱圖中專門容易看出西部地區(qū)客戶平均生命周期大于其它地區(qū)。 圖 3. 箱圖將均值和數據分布顯示在一起。專門容易看出西部地區(qū)客戶平均生命周期大于其它地區(qū)。 均值比較提供聯合分布的匯總統(tǒng)計。表6(包含與

12、箱圖相同的信息,但用表的形式)顯示總平均時長是 7.49 年,西部地區(qū)比東部和中部地區(qū)平均占有期長。那個發(fā)覺有意義嗎?統(tǒng)計顯著性告訴你假如差不是隨機的,或它們概率值專門大,需進一步分析推斷。假如差不是隨機的,意味著結果同原假設一樣。即變量沒有顯著性阻礙或對結果沒有發(fā)生阻礙。 假如差不有統(tǒng)計意義,意味著備擇假設成立,表明有非隨機因素的潛在阻礙。當統(tǒng)計意義存在時,進一步探究特不必要。 表6. 均值比較報告顯示總平均生命周期是 7.49 年,西部地區(qū)比東部和中部地區(qū)占有時刻要長。 圖7的ANOVA表顯示區(qū)域與時刻周期有統(tǒng)計意義的差不。因為顯著性水平是0.000, 或小于0.05,能夠得出均值間差不專

13、門可能統(tǒng)計意義的結論:區(qū)域和生命周期的差不專門可能不是隨機因素引起的而與其它因素有關??赡艿木壒适牵菏紫仍谖鞑繀^(qū)域開展促銷,但在不同的區(qū)域有更多的產品需求,或某種產品功能在一個區(qū)域成功地促銷。了解你的業(yè)務,關鍵數據,支持你的直覺也是專門重要的。 表7. ANOVA表顯示各區(qū)域有統(tǒng)計意義差不,表明要做進一步的分析。 接著對促銷響應進行分析。SPSS使用分段條圖將四種促銷信息組合在一起,并將其可視化。圖4提供按區(qū)域響應方式匯總表。可見中部地區(qū)同其它兩個地區(qū)相比訂單較少,特不是同西部相比。通過觀看區(qū)域頻數分布可不能得出那個推測,它只告訴我們西部地區(qū)包含最少的人口。 圖 4. SPSS 分段條圖提供快

14、速清晰的方式表達各區(qū)域響應方式。 要查明假如這是顯著的,我們要進一步按區(qū)域探究各種促銷結果。要回答“有多少人在各區(qū)域響應第一促銷方案”的問題,我們在第一促銷方案和區(qū)域因素上執(zhí)行交叉表過程。表8顯示響應第一個促銷方案的人有41.3%來自東部地區(qū)(列百分比)。而響應第一個促銷方案的人只有26.5%來自西部地區(qū),超過半數(50.5%)的西部居民(行百分比)響應了促銷。要理解假如區(qū)域確定對第一促銷方案可能的響應,比較的是區(qū)域百分比(行百分比)并發(fā)覺東部地區(qū)的居民45%響應了那個促銷,中部地區(qū)的居民40%響應那個促銷。依照那個信息,對第一促銷方案,得出西部是一個促銷較好銷售區(qū)域的結論。但是,當百分數看起

15、來不同時,在西部地區(qū)啟動拷貝第一促銷方案就沒有充分的理由。首先,我們必須確定這些百分數是否有統(tǒng)計意義。那個地點,假如統(tǒng)計意義存在,卡方統(tǒng)計量能夠表示。 表 8. 響應第一個促銷方案的人只有26.5%來自西部地區(qū),超過半數的西部居民響應了促銷。 表 9 包含區(qū)域和第一促銷方案的卡方信息。按慣例皮爾松卡方統(tǒng)計量應該小于0.05才有統(tǒng)計顯著性意義(在95%的置信水平上)。在那個例子中卡方值是0.007, 所有它有顯著性意義。能夠有令人信服的理由確信第一促銷方案在西部地區(qū)比較成功,例如廣告語言直接滿足客戶聽覺上的需要,或媒體類型匹配客戶視覺需要,吸引客戶的眼球。通過識不哪一種活動在西部地區(qū)比較成功,能

16、夠得到今后在該地區(qū)促銷的知識。也能夠選擇探究以區(qū)域為基礎的任何關系。 表 9. Chi-square 值是0.007 表示各地區(qū)在第一促銷方案上有顯著性的差異。 哪一位客戶消費最多? 觀看購買歷史的另一種方法是評估總消費量而不是只看在單一訂單上消費多少。也許總消費量同區(qū)域之間的關系能夠揭示一些信息。 單因素方差分析給你一個有關平均值有顯著性差異的詳細信息。 首先單因素方差分析提供一個描述性統(tǒng)計表。表10顯示各地區(qū)四種促銷方案的總消費量平均差不特不大。在中部地區(qū)平均消費量是$1,206, 東部地區(qū)是$1,391, 而西部地區(qū)超過$1,600.報告的最后部分顯示東部和西部間消費水平的平均差異沒有顯

17、著的統(tǒng)計意義。另一方面,西部和中部間的差異有統(tǒng)計意義。能使用這些信息進一步識不這些地區(qū)的差不如何及什么緣故,制訂營銷定位打算。例如,不同的營銷和銷售混合,不同的促銷,或綁定一些產品和服務或許在中部地區(qū)會更好。西部地區(qū)營銷打算在西部重復應該更加成功。 表10. 單因素方差分析顯示東部和西部消費水平的差不沒有統(tǒng)計意義差不;西部和中部地區(qū)的差不有統(tǒng)計意義。 預測總消費量 預測模型是關心定位潛在客戶和優(yōu)化營銷資源一種有力的武器。它能關心回答如“按照收入家庭消費占他們的收入多少?”的問題。 在許多統(tǒng)計研究中,目標是用方程建立一種關系,用一個已知變量預測另一個變量。SPSS 提供幾個過程建立相關關系定義預

18、測模型,從散點圖到相關關系,線性和邏輯回歸分析再到CHAID分析。SPSS的指南按部就班地指導,你不必成為統(tǒng)計學家就能夠完成這些過程。 圖 5. 散點圖顯示兩個變量相關關系。 表11. 相關系數是60.8%,顯示在家庭收入和總消費量上有專門強的相關關系圖 5 顯示這兩個變量的相關關系。散點圖顯示兩個連續(xù)變量的聯合分布。相關系數是60.8%,表11顯示在家庭收入和總消費量上有專門強的相關關系?;貧w分析進一步確定模型的相關關系,如表12和圖6所示。這種關系意思是隨著家庭收入的增加,購買我們產品的總消費量也增加。 我們能夠使用那個模型發(fā)覺更好的預測銷售和改進營銷努力。 表12 和圖 6. 線性回歸講

19、明家庭收入和總消費量的關系。收入越多,消費越多。 范例的打算包括:對較高收入的家庭提供較多的產品和服務,或制訂客戶保留打算關心維持較高收入家庭成為長期的客戶,匹配營銷資源給潛在收入的細分市場。到現在為止,差不多看到客戶所在地區(qū)和他們的消費量間的相關關系。同時也看到收入與總消費量有正相關性。 細分有利潤的客戶群并進行成功的營銷。 營銷數據庫常常使用一種叫做CHAID的技術(卡方自動交互檢驗)。CHAID告訴我們幾個變量什么特征結合專門可能導致什么結果,而不是只告訴我們兩個變量間的關系是否有意義。(例如,對促銷的響應)。我們輸入區(qū)域,產品類不,離散化的收入變量到CHAID模型中,去查找哪一種特征結

20、合最可能對第一促銷方案產生響應。CHAID自動建立結果樹圖,如圖7所示。 圖7. CHAID 呈現哪一個特征結合最可能對第一促銷方案產生結果的模型。 圖 8 顯示根節(jié)點的細節(jié),哪些變量對第一促銷方案有最顯著的阻礙。收入被發(fā)覺是最高的預測因子(它對應著前面回歸方程發(fā)覺)。在這種情況下,CHAID超出回歸方程的范圍對其進行進一步的交互探究。 圖8. CHAID樹圖的根節(jié)點顯示收入作為最高響應的預測因子。在圖 9中, 下面的樹枝顯示假如收入水平在第三類($57,750 到 $65,000)同時產品類不在第一類則有73%的響應率。CHAID 在數據庫內顯示唯一的細分。因此你能夠支持特征的組合從營銷打算中獲得最好的結果。我們發(fā)覺家庭收入在$57,750到$65,000的客戶(購買第一類產品的客戶)專門可能確實是購買第一促銷方案的客戶。用其它變量作CHAID 分析可能導致其它的研究結果;例如,一般而言,我們發(fā)覺中部地區(qū)對我們的各種促銷響應不行,另外一個收入組的婦女對我們的響應良好,因此對另外的客戶群采納直接郵寄方法也許有效果。 圖 9. CHAID 用收入水平的第三類($57,750 到$65,000)和產品分類的第一類劃分唯一的細分市場。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論