【基于SPSS Modeler聚類分析的移動應(yīng)用商店中影響用戶滿意度的因素實證研究9800字(論文)】_第1頁
【基于SPSS Modeler聚類分析的移動應(yīng)用商店中影響用戶滿意度的因素實證研究9800字(論文)】_第2頁
【基于SPSS Modeler聚類分析的移動應(yīng)用商店中影響用戶滿意度的因素實證研究9800字(論文)】_第3頁
【基于SPSS Modeler聚類分析的移動應(yīng)用商店中影響用戶滿意度的因素實證研究9800字(論文)】_第4頁
【基于SPSS Modeler聚類分析的移動應(yīng)用商店中影響用戶滿意度的因素實證研究9800字(論文)】_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于SPSSModeler聚類分析的移動應(yīng)用商店中影響用戶滿意度的因素實證研究摘要移動應(yīng)用商店是用戶選擇下載應(yīng)用的主要平臺,對軟件開發(fā)者和應(yīng)用商店平臺方來說,用戶下載量和滿意度都是非常重要的,因此影響用戶下載量和滿意度的因素是一個非常值得研究的問題。本文在參考大量國內(nèi)外相關(guān)文獻的基礎(chǔ)上,首先通過Python對數(shù)據(jù)進行處理,再通過聚類分析、決策樹分析、神經(jīng)網(wǎng)絡(luò)分析等方法在SPSSModeler中進行數(shù)據(jù)挖掘[1],然后在Tableau中進行數(shù)據(jù)可視化[2]分析,最終找到了影響用戶下載量因素:評論數(shù)、評分、大小、價格和收費類型,以及影響用戶滿意度的因素:內(nèi)容評級(年齡等級)、下載量、評論數(shù)、大小、價格和收費類型,并針對這些因素向軟件開發(fā)者和應(yīng)用商店平臺方分別提出了一些建議。關(guān)鍵詞移動應(yīng)用商店;下載量;滿意度;數(shù)據(jù)挖掘;數(shù)據(jù)可視化目錄1引言(或緒論)……………………11.1課題背景簡介…………………11.2研究進展………………………11.3研究目的和意義………………22理論基礎(chǔ)…………32.1聚類分析………………………32.2決策樹分析……………………32.3神經(jīng)網(wǎng)絡(luò)………………………43GooglePlayStore數(shù)據(jù)清洗………………53.1App…………53.2Category………………………53.3Rating…………53.4Reviews………………………53.5Size……………53.6Installs…………63.7Type……………63.8Price…………63.9ContentRating………………63.10Genres…………74影響用戶下載因素分析………84.1詳細數(shù)據(jù)處理…………………84.2數(shù)據(jù)建模分析…………………84.3數(shù)據(jù)可視化分析……………125影響用戶滿意度因素分析……………………195.1數(shù)據(jù)建模分析…………………195.2數(shù)據(jù)可視化分析……………216分析建議……………………276.1對軟件開發(fā)者…………………276.2對應(yīng)用商店平臺方……………27結(jié)論…………………29參考文獻……………31第第頁1引言(或緒論)1.1課題背景簡介隨著信息科學(xué)技術(shù)的飛速發(fā)展,移動互聯(lián)網(wǎng)終端設(shè)備的數(shù)量不斷增加。移動應(yīng)用商店作為移動互聯(lián)網(wǎng)終端軟件中重要的一部分,伴隨著移動終端設(shè)備基數(shù)不斷增長,其發(fā)展越來越受到關(guān)注。隨著蘋果公司AppStore在移動應(yīng)用商店領(lǐng)域取得的商業(yè)成功,自2009年開始,移動應(yīng)用商店的概念得到迅速發(fā)展,也被評為2010年十大科創(chuàng)新趨勢之一。移動應(yīng)用商店是用戶使用移動終端設(shè)備其他App的起點和入口,其開發(fā)的根本目的是為用戶提供高效率、高質(zhì)量的利用服務(wù),滿足用戶利用需求。所以只有基于用戶行為對移動應(yīng)用商店進行研究,才能夠深入用戶需求,滿足用戶預(yù)期,從而推動移動應(yīng)用商店服務(wù)的不斷完善。因此,本課題以GooglePlayStore的數(shù)據(jù)為研究對象,通過機器學(xué)習(xí)[3]中的聚類分析[4]、決策樹分析以及數(shù)據(jù)可視化等大數(shù)據(jù)分析[5][6]的方法,對用戶行為進行研究,找出影響用戶下載量[7]和滿意度[8][9]的因素,針對如何提高用戶的下載量和滿意度等問題提出建議,從而促進GooglePlay應(yīng)用商店的發(fā)展。1.2研究進展近年來,國內(nèi)外對移動應(yīng)用商店下載數(shù)據(jù)的分析已經(jīng)有不少研究,研究內(nèi)容有商業(yè)模式、運營模式、發(fā)展趨勢、交互設(shè)計、用戶體驗、用戶行為、用戶安全等。主要分為兩個大致方向,一個是移動應(yīng)用商店運營與發(fā)展方向,一個是移動應(yīng)用商店用戶行為研究。(1)移動應(yīng)用商店運營與發(fā)展方向隨著信息科學(xué)和新技術(shù)的發(fā)展,對于移動平臺的終端app——移動應(yīng)用商店而言,其運營機制及發(fā)展方向也在不斷更替,對此國內(nèi)外多位學(xué)者進行了系統(tǒng)研究。曾亞從移動應(yīng)用商店的實踐角度出發(fā),解析了行業(yè)主流應(yīng)用商店的商業(yè)模式、開發(fā)者管理、運營模式等,對國內(nèi)三大運營商各自主導(dǎo)的移動應(yīng)用商店進行了相應(yīng)研究[10]。Liu等通過分析GooglePlay平臺中由711個排名的移動應(yīng)用組成的大型面板數(shù)據(jù)集,得出免費增值策略與付費app的銷售增長呈正相關(guān)[11]。ErshovD等構(gòu)建出基于GooglePlay移動應(yīng)用商店的需求和供給模型,認為減少用戶邊際搜索成本可有效促進平臺收益[12]。KristoferKimbler通過分析AppStore的成功模式,針對運營商提出發(fā)展策略[13]。周琳深度分析了蘋果AppStore的商業(yè)發(fā)展模式,并針對國內(nèi)移動應(yīng)用商店提出平臺創(chuàng)新、培育開發(fā)商、完善支付渠道、建立品牌優(yōu)勢等發(fā)展建議[14]。針對移動應(yīng)用商店運營與發(fā)展方向的研究為移動應(yīng)用商店市場的后續(xù)研究提供了基本條件,也為理論研究和實踐研究的進一步深入奠定了良好基石。(2)移動應(yīng)用商店用戶行為研究通過對用戶行為數(shù)據(jù)進行分析,能夠更清晰地了解用戶行為習(xí)慣,發(fā)現(xiàn)移動應(yīng)用商店在經(jīng)營模式、推廣渠道等方面存在的不足,從而幫助移動應(yīng)用商店更加精確高效地滿足用戶需求,提升其市場占有率。相關(guān)研究中,蔡可利用了經(jīng)典的TAM模型建立了手機應(yīng)用商店用戶采納模型,并引入了情景感知理論,得出影響用戶在手機商店下載應(yīng)用的影響因素[15]。袁霞提出基于TAM與TPB整合模型的移動應(yīng)用商店用戶下載模型,采用結(jié)構(gòu)方程進行實證分析,提出針對移動應(yīng)用商店平臺和移動應(yīng)用開發(fā)者的優(yōu)化策略[16]。王睿構(gòu)建出UTAUT擴展模型,據(jù)此探究影響用戶對智能移動終端應(yīng)用商店內(nèi)的App購買意愿的因素[17]。TangJ等使用偏最小二乘法對蘋果AppStore中用戶付費下載行為的影響因素進行研究,提出用戶所處的社交環(huán)境在其付費下載意愿中具有重要作用[18]。戚少君提出手機應(yīng)用商店的用戶接受行為研究模型,并予以驗證[19]。UsmanShehzaib等分析從GooglePlayStore中提取的評論和應(yīng)用信息,建立模型,來評估移動應(yīng)用程序的可接受性和流行程度[20]。上述研究通過建立相應(yīng)的用戶行為模型對用戶行為展開了研究,有助于拓展移動應(yīng)用商店用戶行為研究的思路和廣度。1.3研究目的和意義本課題的研究目的主要有兩點:第一點是從用戶的角度出發(fā),構(gòu)建用戶行為模型,找到影響用戶下載和滿意度的因素,并提出相應(yīng)優(yōu)化對策,由此提高Google應(yīng)用商店在行業(yè)競爭中的優(yōu)勢;第二點是為了培養(yǎng)自己文件檢索和論文編寫的能力,讓自己對數(shù)據(jù)分析與數(shù)據(jù)可視化領(lǐng)域有著更清晰的理解,以便更好地融入今后的學(xué)習(xí)工作中。本課題的研究意義在于充分了解用戶行為特征,幫助軟件開發(fā)者和Google應(yīng)用商店的技術(shù)人員或管理人員提供新的開發(fā)和優(yōu)化思路,從而提高Google應(yīng)用商店的用戶認可度和滿意度,提升其服務(wù)水平和質(zhì)量,增加其在行業(yè)競爭中的優(yōu)勢,同時也為移動應(yīng)用商店的發(fā)展提供借鑒。2理論基礎(chǔ)2.1聚類分析聚類分析就是將個體或?qū)ο蠓诸?,使得同一類中的對象之間的相似性比其他類的對象的相似性更強。目前最典型的聚類分析算法有K-means算法、K-medoids算法、CLARANS算法、BIRCH算法等,但使用更廣泛的還是K-means算法。2.1.1K-means算法K-means是一個反復(fù)迭代的過程,算法主要可以分為四個步驟:1、從樣本集合中隨機抽取k個樣本點作為初始簇的中心;2、將每個樣本點劃分到距離它最近的中心點所代表的簇中;3、用各個簇中所有樣本點的中心點代表簇的中心點;4、重復(fù)2和3,直到簇的中心點不變或達到設(shè)定的迭代次數(shù)或達到設(shè)定的容錯范圍。常用的距離度量標(biāo)準是歐幾里得距離的平方:

d(x,y)其中x和y表示不同的兩個樣本,n表示樣本的維度?;跉W幾里得距離,K-means算法需要優(yōu)化的問題就是,使簇內(nèi)誤差平方和(SSE)最小,也叫簇慣性。SSE=其中μ(j)表示j簇的中心2.2決策樹分析決策樹是一種基本的分類與回歸方法,首先對數(shù)據(jù)進行處理,利用歸納算法生成可讀的規(guī)則和決策樹,然后使用決策對新數(shù)據(jù)進行分析。目前最常用的決策樹算法有C&RT,CHAID、QUEST和C5.0等2.2.1C&RT(分類回歸樹)C&RT生成可用于預(yù)測或分類未來觀測值的決策樹,該方法通過在每個步驟最大限度降低不純潔度,使用遞歸分區(qū)來將訓(xùn)練記錄分割為組。如果節(jié)點中100%的觀測值都屬于目標(biāo)字段的一個特定類別,則樹中的該節(jié)點將被認定為“純潔”。目標(biāo)和輸入字段可以是數(shù)字范圍或分類(名義、有序或標(biāo)志);所有分割均為二元分割。2.2.2QUESTQUEST可提供用于構(gòu)建決策樹的二元分類法,此方法的設(shè)計目的是減少大型C&R樹分析所需的處理時間,同時也減少在分類樹方法中發(fā)現(xiàn)的趨勢以便支持允許有多個分割的輸入。輸入字段可以是數(shù)字范圍(連續(xù)),但目標(biāo)字段必須是分類。所有分割都是二元的。2.2.3CHAIDCHAID使用卡方統(tǒng)計量來生成決策樹,以確定最佳的分割。CHAID與C&R樹和QUEST節(jié)點不同,它可以生成非二元樹,這意味著有些分割將有多于兩個的分支。目標(biāo)和輸入字段可以是數(shù)字范圍(連續(xù))或分類。2.2.4C5.0算法C5.0算法構(gòu)建決策樹或規(guī)則集。該模型的工作原理是根據(jù)在每個級別提供最大信息收獲的字段分割樣本。目標(biāo)字段必須為分類字段。允許進行多次多于兩個子組的分割。2.3神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是一種試圖模擬生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能的數(shù)學(xué)模型或計算模型,由一個輸入層、若干個中間隱含層和一個輸出層組成。此模型通過模擬大量類似于神經(jīng)元的抽象形式的互連簡單處理單元而運行。神經(jīng)網(wǎng)絡(luò)是功能強大的一般函數(shù)估計器,只需要最少的統(tǒng)計或數(shù)學(xué)知識就可以對其進行訓(xùn)練或應(yīng)用。

3GooglePlayStore數(shù)據(jù)清洗GooglePlayStore的數(shù)據(jù)主要包含以下字段:App(名稱)、Category(類別)、Rating(評分)、Reviews(評論數(shù))、Size(大?。nstalls(下載量)、Type(收費類別)、Price(價格)、ContentRating(內(nèi)容等級(年齡等級))、Genres(多種類別)、LastUpdated(最后更新時間)、CurrentVer(版本號)、AndroidVer(適用安卓版本),如下表3-1所示。表3-1GooglePlayStore下載數(shù)據(jù)名稱照片編輯和糖果相機和網(wǎng)格和剪貼簿涂色本繪畫-鉛筆畫和顏色畫類別藝術(shù)與設(shè)計藝術(shù)與設(shè)計藝術(shù)與設(shè)計評分4.13.94.5評論數(shù)159967215644大小19M14M25M下載量10,000+500,000+50,000,000+收費類別免費免費免費價格000內(nèi)容等級(年齡等級)每個人每個人青少年多種類別藝術(shù)與設(shè)計藝術(shù)與設(shè)計;裝扮游戲藝術(shù)與設(shè)計最后更新時間2018/1/72018/1/152018/6/8版本號1.0.02.0.0隨設(shè)備而變化適用安卓版本4.0.3及以上4.0.3及以上4.2及以上我通過Python對該文件中所有的10841條數(shù)據(jù)進行了處理,首先導(dǎo)入數(shù)據(jù)并刪除了本次分析無需用到的字段,如LastUpdated、CurrentVer、AndroidVer,然后對保留的字段分別進行處理。3.1App因為APP的名稱是不可以重復(fù)的,所以這里需要刪除APP名稱重復(fù)的值:data.drop_duplicates('App',inplace=True)3.2Category首先查詢該項的所有值:print(data.Category.unique()),發(fā)現(xiàn)有一項錯誤的值1.9,所以需要刪除它:data=data[data.Category!='1.9']3.3Rating通過data.Rating.isna().sum()發(fā)現(xiàn)Rating項缺失的值有點多,有1474條,若刪除會缺失很多數(shù)據(jù),所以這里選擇忽略NA值,不做處理。3.4Reviews將該項所有值轉(zhuǎn)換為數(shù)值型data.Reviews=pd.to_numeric(data.Reviews)3.5Size該項有以M和以k為單位的值,需統(tǒng)一轉(zhuǎn)換為以k為單位的數(shù)值型:deff(x):ifx[-1]=='M':res=float(x[:-1])*1024elifx[-1]=='k':res=float(x[:-1])else:res=np.nanreturnresdata.Size=data.Size.apply(f)3.6Installs該項數(shù)據(jù)格式為“10,000+”的形式,所以在這里需要刪除逗號和加號,將該項所有數(shù)據(jù)轉(zhuǎn)換為數(shù)值型:definst(x):ifx[-1]=='+':res=float(x[:-1].replace(',',''))else:res=float(x)returnresdata.Installs=data.Installs.apply(inst)3.7Type首先查詢該項的所有值:data.Type.value_counts(dropna=False),發(fā)現(xiàn)除了有Free和Paid這兩類數(shù)據(jù)之外,還有一項空缺值NaN,所以在這里需要刪除它:data.Type.dropna(inplace=True)3.8Price該項數(shù)據(jù)中除了為0的數(shù)據(jù),其他數(shù)據(jù)都是“$+數(shù)值”的格式,如$4.99,所以需要將數(shù)字前的$符號刪除,將該項所有數(shù)據(jù)轉(zhuǎn)換為數(shù)值型:defprc(x):ifx[0]=='$':res=float(x[1:])else:res=float(x)returnresdata.Price=data.Price.apply(prc)3.9ContentRating通過data['ContentRating'].value_counts()發(fā)現(xiàn)該項沒有需要修改的值,不做處理。3.10Genres通過data.Genres.value_counts()發(fā)現(xiàn)多類別的App數(shù)量較少,且有一個類別做分析已經(jīng)足夠,所以需刪除第二個類別:data['Genres']=data.Genres.Apply(lambdax:x.split(";")[0])至此,對于數(shù)據(jù)的預(yù)處理已經(jīng)基本完成,處理完成后還剩余9659條數(shù)據(jù)。當(dāng)然,后面進行分析時可能還需要對數(shù)據(jù)進行更詳細的處理。

4影響用戶下載因素分析4.1詳細數(shù)據(jù)處理因為有些字段數(shù)值差距較大且數(shù)值較多,所以在SPSSModeler軟件中通過導(dǎo)出節(jié)點對Rating、Reviews、Size和Price這四個字段進行了分段處理,然后將它們合并后與其他所有字段一起導(dǎo)出為新的Excel表格,如圖4-1所示。圖4-1SPSS詳細數(shù)據(jù)處理4.1.1Rating(評分)評分共分為4段,評分1表示Rating<3.5,評分2表示3.5≤Rating<4,評分3表示4≤Rating<4.5,評分4表示Rating≥4.5。4.1.2Reviews(評論數(shù))評論數(shù)共分為5段,評論數(shù)1表示Reviews<1000,評論數(shù)2表示1000≤Reviews<10000,評論數(shù)3表示10000≤Reviews<100000,評論數(shù)4表示100000≤Reviews<1000000,評論數(shù)5表示Reviews≥1000000。4.1.3Size(大?。┐笮」卜譃?段,大小1表示Size≤10000,大小2表示10000<Size≤30000,大小3表示30000<Size≤60000,大小4表示Size>60000。4.1.4Price(價格)價格共分為3段,價格1表示Price=0,價格2表示0<Price<10,價格3表示Price≥10。4.2數(shù)據(jù)建模分析通過SPSSModeler中的各類節(jié)點,對數(shù)據(jù)進行處理分析。4.2.1聚類分析以Installs為目標(biāo),首先通過自動聚類節(jié)點,分析有哪些可用的聚類方法,通過結(jié)果發(fā)現(xiàn)Kohonen方法和兩步法構(gòu)造出的聚類質(zhì)量較差,而通過K-means算法構(gòu)造出的聚類效果較好,所以最終通過K-means節(jié)點進行聚類分析,過程和結(jié)果如圖4-2所示。圖4-2SPSS聚類分析過程由圖4-3和圖4-4可以看出此次聚類共分為5類,聚類1所占比值最大,而聚類5占比最小。聚類1和聚類3的Rating、Reviews、Size、Price和Installs都相對較低;聚類2的Rating、Reviews都較高,Size和Installs都在中等水平;而聚類4與聚類2相反,Rating、Reviews在中等水平,Size和Installs較高;聚類5是唯一一個Price較高的聚類,所以它的Installs就會偏低。由此可見,這些字段對下載量還是有一定影響的。圖4-3SPSS聚類分析各聚類大小圖4-4SPSS聚類分析各聚類比較而接下來圖4-5的預(yù)測變量重要性也可證明,無論評分、評論數(shù)、價格、大小這幾個字段是否進行了分段處理,大都很重要。圖4-5SPSS聚類分析預(yù)測變量重要性4.2.2決策樹分析由于Quest和C5.0方法的目標(biāo)字段只能是分類類型,而目標(biāo)Installs是連續(xù)類型,所以這里通過C&RT節(jié)點和CHAID節(jié)點進行決策樹分析,過程和結(jié)果如圖4-6所示。圖4-6SPSS決策樹分析流程由圖4-7和圖4-8預(yù)測變量重要性可看到評論數(shù)是最重要的。圖4-7SPSSC&RT分析預(yù)測變量重要性圖4-8SPSSCHAID分析預(yù)測變量重要性4.2.3神經(jīng)網(wǎng)絡(luò)以Installs為目標(biāo),通過類神經(jīng)網(wǎng)絡(luò)節(jié)點進行分析,過程和結(jié)果如圖4-9所示。圖4-9SPSS神經(jīng)網(wǎng)絡(luò)分析流程由圖4-10預(yù)測變量重要性可以看出Reviews(評論數(shù))最重要。圖4-10SPSS神經(jīng)網(wǎng)絡(luò)分析預(yù)測變量重要性4.3數(shù)據(jù)可視化分析由上面的建模分析可知,對下載量影響較大的字段為Reviews、Rating、Size、Price和Type,因此接下來在Tableau中針對這些字段進行可視化分析。4.3.1Reviews可視分析由于Reviews數(shù)值差距較大,所以在此選擇前中后三個數(shù)值段進行分析,如圖4-11到圖4-13所示,可以看到當(dāng)Reviews值越大Installs的值也越大,說明用戶可能選擇評論數(shù)更多的APP進行下載,當(dāng)然也表示下載量越多的APP,也會有更多的用戶對其評價。這也反映了一種從眾心理,用戶會覺得有越多人進行評論說明該APP更可信。圖4-11TableauReviews分析前段圖4-12TableauReviews分析中段圖4-13TableauReviews分析后段下圖4-14對評論數(shù)_分段的分析也可證明上述說法的正確性。圖4-14Tableau評論數(shù)_分段分析4.3.2Rating可視分析由下圖4-15和圖4-16可以看到,Rating值較低的Installs也較低,Rating值中等的Installs也處于中等水平,Rating值較高的Installs值中等偏高。說明用戶更傾向于下載評分較高的APP。圖4-15TableauRating分析圖4-16Tableau評分_分段分析4.3.3Size可視分析由于Size數(shù)值差距較大,所以在此選擇前中后三個數(shù)值段進行分析,如圖4-17到圖4-19所示,并結(jié)合圖4-20大小_分段的分析,可以看到當(dāng)Size值越大時Installs的值也越大,且Size中等的APP數(shù)量較多,而Size較小和較大的APP數(shù)量都相對較少,說明用戶大都下載Size適中或較大的APP。圖4-17TableauSize分析前段圖4-18TableauSize分析中段圖4-19TableauSize分析后段圖4-20Tableau大小_分段分析4.3.4Price可視分析由于Price數(shù)值差距較大,所以在此選擇前后兩個數(shù)值段進行分析,如圖4-21和圖4-22所示,并結(jié)合圖4-23價格_分段的分析,可以看到Price越小Installs越大,說明用戶大都下載價格為0或收費價格較小的APP,對于那些收費較高的APP,下載的數(shù)量就較少了。圖4-21TableauPrice分析前段圖4-22TableauPrice分析后段圖4-23Tableau價格_分段分析4.3.5Type可視分析Type即收費類型,分為Free和Paid兩種,由下圖4-24可知Free類型的APP下載量較多,即用戶更喜歡下載免費的APP。圖4-24TableauType分析總的來說,用戶更傾向于下載評分較高、評論數(shù)較多、大小適中或較大以及免費或收費價格較低的APP。

5影響用戶滿意度因素分析Rating表示所有參與評分的用戶對該APP的評分平均數(shù),是表示用戶對該APP滿意程度最有效的字段,所以在此以Rating為目標(biāo)進行用戶滿意度分析。5.1數(shù)據(jù)建模分析通過SPSSModeler中的各類節(jié)點,對數(shù)據(jù)進行處理分析。5.1.1聚類分析以Rating為目標(biāo),首先通過自動聚類節(jié)點,分析有哪些可用的聚類方法,通過結(jié)果發(fā)現(xiàn)兩步法構(gòu)造出的聚類質(zhì)量較差,而通過Kohonen和K-means算法構(gòu)造出的聚類效果較好,所以最終通過Kohonen節(jié)點和K-means節(jié)點進行聚類分析,過程和結(jié)果如圖5-1所示。圖5-1SPSS聚類分析滿意度過程首先對于Kohonen方法,由下圖5-2預(yù)測變量重要性可以看到ContentRating、Type和Size是最重要的,對結(jié)果影響最大。圖5-2SPSSKohonen方法預(yù)測變量重要性然后對于K-Means算法,由下圖5-3預(yù)測變量重要性可以看到ContentRating和Type是最重要的,對結(jié)果影響最大,Price和Size也較重要。圖5-3SPSSK-Means算法預(yù)測變量重要性5.1.2決策樹分析由于Quest和C5.0方法的目標(biāo)字段只能是分類類型,而目標(biāo)Installs是連續(xù)類型,所以這里通過C&RT節(jié)點和CHAID節(jié)點進行決策樹分析,過程和結(jié)果如圖5-4所示。圖5-4SPSS決策樹分析滿意度流程由下圖5-5的C&RT方法預(yù)測變量重要性可以看到Installs最重要,Reviews也較重要,而其他字段的重要性較差。圖5-5SPSSC&RT分析滿意度預(yù)測變量重要性由下圖5-6的CHAID方法預(yù)測變量重要性可以看到Reviews最重要,Installs、Type、ContentRating的重要性依次遞減。圖5-6SPSSCHAID分析滿意度預(yù)測變量重要性5.2數(shù)據(jù)可視化分析由上面的建模分析可知,對下載量影響較大的字段為ContentRating、Installs、Reviews、Size、Price和Type,因此接下來在Tableau中針對這些字段進行可視化分析。5.2.1ContentRating可視分析由下圖5-7可以看到除了Everyone即每個用戶都可下載的APP基本上各種評分都有,其他有特定年齡段使用的APP大都評分中等或較高,說明針對特定年齡開發(fā)的APP還是很符合該年齡段的要求的。圖5-7TableauContentRating滿意度分析5.2.2Installs可視分析由下圖5-8可以看到Installs較少的Rating也較低,反之Installs較多的Rating也較高,說明下載量越高的APP大都是用戶越滿意的。圖5-8TableauInstalls滿意度分析5.2.3Reviews可視分析由于Reviews數(shù)值差距較大,所以在此選擇前后兩個數(shù)值段進行分析,如圖5-9和圖5-10所示,可以看到Reviews值越小Rating值越低,反之Reviews值越大Rating值也越高,說明用戶評分越高即越滿意就更可能對APP進行評論,反之用戶對此APP不滿意就可能不會花費時間去評論。圖5-9TableauReviews滿意度分析前段圖5-10TableauReviews滿意度分析后段5.2.4Size可視分析由于Size數(shù)值差距較大,所以在此選擇前中后三個數(shù)值段進行分析,如圖5-11到圖5-13所示,可以看到Size值較小和較大時Rating值都較高,但Size值中等時有一部分APP的Rating值較低,說明用戶不太滿意。圖5-11TableauSize滿意度分析前段圖5-12TableauSize滿意度分析中段圖5-13TableauSize滿意度分析后段5.2.5Price可視分析由于Price數(shù)值差距較大,所以在此選擇前后兩個數(shù)值段進行分析,如圖5-14和圖5-15所示,可以看到Price越低時有一部分APP的Rating越低,反之Price越高時Rating中等偏高,說明收費低的APP大都滿意度較高但也有一部分滿意度較低,而收費高的APP滿意度大都中等偏高。圖5-14TableauPrice滿意度分析前段圖5-15TableauPrice滿意度分析后段5.2.6Type可視分析由圖5-16可以看到大多數(shù)APP的Rating值都較高,Rating值較低的APP大都為Free類型,即Free類型的APP相較于Paid類型的APP滿意度更低。圖5-16TableauType滿意度分析6分析建議6.1對軟件開發(fā)者6.1.1針對不同年齡段開發(fā)相應(yīng)APP通過本研究可以看出,針對特定年齡段開發(fā)的APP比所有用戶都可下載的APP滿意度更高,因此軟件開發(fā)者可以根據(jù)不同年齡段的特征開發(fā)特定的APP,這樣會使不同年齡段的人更容易找到適合自己的APP,提高APP的下載量和用戶滿意度。6.1.2優(yōu)化APP大小即相應(yīng)的介紹通過本研究可以看出,Size較小的APP大都下載量較少但滿意度較高,Size較大的APP下載量和滿意度大都較高,Size值中等的APP大都下載量較高但滿意度較少,所以軟件開發(fā)者可以優(yōu)化APP的大小,使得APP的大小與功能相匹配,盡量不要出現(xiàn)功能少但APP太大的情況。此外APP介紹是用戶了解APP最直接的方式,介紹文案的描寫應(yīng)該包含APP所有重要的信息,還要注重語言的簡略性和生動性。6.1.3合理收取APP費用通過本研究可以看出,免費或收費價格較低的APP下載量較高,且大部分滿意度也較高,但有一部分滿意度較低,收費較高的APP下載量較低但大都滿意度中等偏高,所以軟件開發(fā)者合理收取APP的費用,開發(fā)出更好的產(chǎn)品,使用戶感到價有所值,這樣才會提高APP下載量和用戶滿意度。6.2對應(yīng)用商店平臺方6.2.1針對不同的年齡推薦相應(yīng)APP若開發(fā)者針對不同的年齡段開發(fā)了相應(yīng)的APP,那么應(yīng)用商店平臺則需要分析自己核心用戶群體的年齡分布情況,并對其喜歡下載的APP進行分析,得到用戶的一些喜好特征,然后針對用戶年齡段及喜好進行推薦,減少用戶的時間浪費,提高用戶下載效率及滿意度。6.2.2詳細介紹APP信息用戶了解APP最主要的方式就是通過APP的詳細介紹信息,針對軟件開發(fā)者提供的信息,應(yīng)用商店平臺可以對此進行合理的布局及描述,不僅要傳遞出應(yīng)有的價值和用處,還要注意語言的簡潔性和生動性,盡量第一眼就打動用戶,提高下載量。6.2.3提高用戶評論的欲望通過本研究可以看出,Reviews值越多時,APP下載量和用戶滿意度都會更高,評論數(shù)越多說明該APP的活躍用戶越多,用戶就會更傾向于下載這種APP,所以應(yīng)用商店平臺應(yīng)該想辦法提高用戶評論的欲望。當(dāng)然,最直接的方法就是提高APP的質(zhì)量,讓用戶真的滿意,從而提高用戶評論數(shù);其次,應(yīng)用商店平臺可以通過活動獎勵方式促進用戶評論,如評論領(lǐng)積分兌換獎品活動等。結(jié)論目前各個應(yīng)用商店都在積極進行優(yōu)化,基于用戶行為對應(yīng)用商店進行研究,才能夠深入用戶需求,滿足用戶預(yù)期,從而推動移動應(yīng)用商店服務(wù)的不斷完善。本文從用戶行為出發(fā),通過數(shù)據(jù)處理與數(shù)據(jù)挖掘,確定了影響APP下載量的5個主要因素:評論數(shù)、評分、大小、價格和收費類型,以及影響用戶滿意度的6個主要因素:內(nèi)容評級(年齡等級)、下載量、評論數(shù)、大小、價格和收費類型,并通過可視化逐一驗證。發(fā)現(xiàn)當(dāng)評論數(shù)的值越大時用戶下載量和滿意度也就越高,說明用戶更喜歡下載評論數(shù)較多的APP且越滿意某APP就越可能對其進行評價;當(dāng)APP大小值越大用戶下載量就越高,但用戶滿意度在APP大小較大或較小時都較高,反而中等大小的一部分APP用戶滿意度較低,說明中等大小的APP有很大的改進空間;當(dāng)收費類型為免費或價格值較低時,用戶下載量較高但滿意度較低,說明即使用戶更愿意下載免費或價格低的APP,但還是收費較高的APP更能讓用戶滿意;當(dāng)下載量越高的評分也越高,說明下載量越多的APP大都是用戶越滿意的,并且用戶也更喜歡下載評分更高的APP;當(dāng)內(nèi)容評級(年齡等級)有年齡限制時比任何人都能下載的APP滿意度更高,說明針對特定年齡段進行APP開發(fā)還是很有必要的。最終從軟件開發(fā)者角度和應(yīng)用商店平臺角度針對上述影響因素分別提出了相應(yīng)的建議。目前國內(nèi)外對于應(yīng)用商店的研究還算較多,但針對應(yīng)用商店可視化的研究非常少,對此還是有很多值得進一步探討和研究的問題。用戶在使用應(yīng)用商店的過程中還產(chǎn)生了大量的數(shù)據(jù),例如本次研究中舍棄的APP最后更新時間、適用手機版本等數(shù)據(jù)。后續(xù)的研究還可以分析這些行為數(shù)據(jù),發(fā)現(xiàn)更多的用戶行為特征。

參考文獻[

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論