版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
直播營銷數(shù)據(jù)分析Livestreamingmarketingdataanalysis聚沉淀太平鳥女裝圍繞用戶生命周期,前后臺(tái)密切協(xié)作:短期內(nèi),以口播形式為賬號(hào)增粉,撬動(dòng)短效杠桿;在長期,不斷完善客服響應(yīng)速度和備貨情況,提高用戶復(fù)購率促轉(zhuǎn)化內(nèi)容是良好運(yùn)營的核心,太平鳥女裝持續(xù)打磨、優(yōu)化內(nèi)容:升級(jí)布置直播間裝修和商品櫥窗;通過不同體型的主播搭配講解同一套衣服,全面展示商品賣點(diǎn)匯流量太平鳥女裝憑借每天超過18個(gè)小時(shí)的持續(xù)自播投入,逐步沉淀高購買意向的用戶人群;通過分析這一批初期客群畫像,太平鳥女裝得以準(zhǔn)確定位付費(fèi)流量的投放人群案例引入“太平鳥女裝以優(yōu)質(zhì)內(nèi)容為核心,領(lǐng)跑自播賽道,打造穩(wěn)定日銷”從2020年下半年起,太平鳥女裝進(jìn)駐抖音電商,正式設(shè)立專門團(tuán)隊(duì)運(yùn)營抖音小店針對(duì)用戶互動(dòng)高、決策快的特點(diǎn),太平鳥女裝以每天長時(shí)間自播為切入點(diǎn),沉淀精準(zhǔn)粉絲,同時(shí)著力提升直播內(nèi)容太平鳥女裝依靠直播營銷活動(dòng),在數(shù)據(jù)層面,關(guān)注流量、轉(zhuǎn)化、沉淀數(shù)據(jù)的變化,根據(jù)數(shù)據(jù)表現(xiàn),不斷優(yōu)化直播間策略,最終獲得品牌總銷售額的快速成長:日均GMV從10萬提升至約300萬思考隨著用戶購物習(xí)慣的變化和社交媒體的興起,直播營銷活動(dòng)已成為電商領(lǐng)域的一大熱門趨勢(shì),接下來讓我們一起深入探討直播營銷活動(dòng)在電商行業(yè)中的價(jià)值和意義。思考一下:1.你認(rèn)為現(xiàn)在的品牌做直播電商,需要關(guān)注哪些數(shù)據(jù)指標(biāo)?2.直播相較于傳統(tǒng)商務(wù)方式有哪些獨(dú)特的優(yōu)勢(shì)和重要性?嚴(yán)謹(jǐn)勤儉求實(shí)開拓01直播營銷活動(dòng)概述02直播營銷活動(dòng)商品推廣案例03直播營銷活動(dòng)商品推廣分析及預(yù)測04實(shí)訓(xùn)Part1直播營銷活動(dòng)概述嚴(yán)謹(jǐn)勤儉求實(shí)開拓即時(shí)事件常用媒介直達(dá)受眾由于直播完全與事件的發(fā)生、發(fā)展進(jìn)程同步,因此可以第一時(shí)間反映現(xiàn)場狀態(tài)收聽或觀看直播通常無須專門購買昂貴的設(shè)備,使用手機(jī)、平板、筆記本電腦等常用設(shè)備即可了解事件的最新進(jìn)展與錄播節(jié)目相比,直播節(jié)目不會(huì)做過多的剪輯與后期加工,所有現(xiàn)場情況直接傳達(dá)給觀眾直播營銷活動(dòng)要素直播營銷活動(dòng)是指企業(yè)通過直播平臺(tái),利用視頻直播的形式進(jìn)行產(chǎn)品或服務(wù)的推廣和銷售的一種營銷方式01直播行業(yè)整體發(fā)展歷程網(wǎng)絡(luò)速度和硬件水平是影響互聯(lián)網(wǎng)直播發(fā)展的主要因素:受這兩個(gè)因素制約,互聯(lián)網(wǎng)直播行業(yè)的發(fā)展歷史分為四大階段,包括圖文直播、秀場直播、游戲直播、移動(dòng)直播等01直播行業(yè)發(fā)展歷程網(wǎng)絡(luò)速度和硬件水平是影響互聯(lián)網(wǎng)直播發(fā)展的主要因素:受這兩個(gè)因素制約,互聯(lián)網(wǎng)直播行業(yè)的發(fā)展歷史分為四大階段,包括圖文直播、秀場直播、游戲直播、移動(dòng)直播等直播類型????內(nèi)容形式????帶寬要求????依賴硬件????代表平臺(tái)/場景??圖文直播文字+靜態(tài)圖片低(≤100Kbps)基礎(chǔ)拍攝設(shè)備微博、新聞網(wǎng)站秀場直播才藝視頻+實(shí)時(shí)互動(dòng)中(2-5Mbps)高清攝像頭、PC映客、花椒游戲直播游戲畫面+解說高(≥10Mbps)高性能PC/顯卡斗魚、虎牙移動(dòng)直播手機(jī)高清視頻+社交極高(5G)智能手機(jī)、云服務(wù)器抖音、央視新聞移動(dòng)端01Part2直播營銷活動(dòng)商品推廣案例嚴(yán)謹(jǐn)勤儉求實(shí)開拓商品數(shù)據(jù)概況5630名用戶基本信息消費(fèi)信息消費(fèi)偏好02數(shù)據(jù)集變量變量名稱變量描述CustomerID用戶唯一IDChurn用戶是否流失(0:否;1:是)Tenure用戶使用平臺(tái)的期限(月)PreferredLoginDevice用戶首選登錄設(shè)備CityTier用戶所在城市級(jí)別WarehouseToHome倉庫與用戶收貨地址之間的距離AgeGroup用戶年齡(1:10-19;2:20-29;3:30-39;4:40-49;5:50-59;6:60-69)MaritalStatus用戶的婚姻狀況Gender用戶性別HourSpendOnApp用戶使用App的小時(shí)數(shù)PreferedOrderCat用戶最近一個(gè)月的訂單偏好類別SatisfactionScore用戶對(duì)服務(wù)的滿意度NumberOfStreamerFollowed用戶所關(guān)注的流媒體數(shù)量Complain用戶最近一個(gè)月是否提出投訴(0:否;1:是)OrderAmountHikeFromlastYear用戶訂單較去年增加的百分比CouponUsed用戶最近一個(gè)月使用的優(yōu)惠券總數(shù)OrderCount用戶最近一個(gè)月已下訂單的總數(shù)DaySinceLastOrder用戶距上次下單天數(shù)DiscountAmount用戶最近一個(gè)月平均每筆訂單節(jié)省的價(jià)錢商品數(shù)據(jù)指標(biāo)02數(shù)據(jù)預(yù)處理importpandasaspd#讀取數(shù)據(jù)excel_file=pd.ExcelFile('直播電商數(shù)據(jù)集.xlsx')#數(shù)據(jù)預(yù)覽df=excel_file.parse(sheet_name)print(f'sheet表名為{sheet_name}的基本信息:')()對(duì)數(shù)據(jù)進(jìn)行清洗,分析數(shù)據(jù)集中的變量是否存在缺失值,并對(duì)缺失值進(jìn)行處理#變量非空值數(shù)量變量類型1CustomerID5630int642Churn5630int643Tenure5366float644PreferredLoginDevice5630object5CityTier5630int646WarehouseToHome5379float647MaritalStatus5630object8AgeGroup5630int649Gender5630object10HourSpendOnApp5375float6411OrderCount5372float6412OrderAmountHikeFromlastYear5365float6413DaySinceLastOrder5323float6414PreferedOrderCat5630object15NumberOfStreamerFollowed5630int6416SatisfactionScore5630int6417Complain5630int6418CouponUsed5374float6419DiscountAmount5630float64Tenure、WarehouseToHome、HourSpendOnApp、OrderCount、OrderAmountHikeFromlastYear、DaySinceLastOrder、CouponUsed這7個(gè)變量均存在缺失值數(shù)據(jù)情況表商品數(shù)據(jù)指標(biāo)02數(shù)據(jù)預(yù)處理數(shù)據(jù)缺失值填充方式常用的缺失值處理方式包括直接刪除、均值填充、中位數(shù)填充、眾數(shù)填充等。以Tenure這個(gè)字段為例,觀察到該變量有明顯的離群值,因此使用中位數(shù)進(jìn)行填充。其他字段的缺失值填充方式與此類似#填充Tenure列的缺失值df['Tenure'].fillna(df['Tenure'].median(),inplace=True)#填充WarehouseToHome列的缺失值df['WarehouseToHome'].fillna(df['WarehouseToHome'].median(),inplace=True)#填充HourSpendOnApp列的缺失值df['HourSpendOnApp'].fillna(df['HourSpendOnApp'].mean(),inplace=True)#填充OrderCount列的缺失值df['OrderCount'].fillna(0,inplace=True)#填充OrderAmountHikeFromlastYear列的缺失值df['OrderAmountHikeFromlastYear'].fillna(df['OrderAmountHikeFromlastYear'].median(),inplace=True)#填充CouponUsed列的缺失值df['CouponUsed'].fillna(df['CouponUsed'].median(),inplace=True)#填充DaySinceLastOrder列的缺失值df['DaySinceLastOrder'].fillna(df['DaySinceLastOrder'].median(),inplace=True)商品數(shù)據(jù)指標(biāo)02用戶屬性特征分析——常用登錄設(shè)備分析首先獲取已經(jīng)流失和未流失的用戶,然后按照登陸設(shè)備的類別進(jìn)行分組,計(jì)算流失和非流失用戶的數(shù)量,并繪制餅圖#分析用戶登錄設(shè)備(餅圖)#分析流失用戶的首選登錄設(shè)備df_churn1=df.loc[df['Churn']==1]#獲取流失的用戶#按照登錄設(shè)備分組后計(jì)算數(shù)據(jù)個(gè)數(shù)df_churn1_PreferredLoginDevice=\df_churn1.groupby(['PreferredLoginDevice'])['CustomerID'].count().reset_index().rename(columns={'CustomerID':'count'})label_churn1_PreferredLoginDevice=df_churn1_PreferredLoginDevice['PreferredLoginDevice']#提取標(biāo)簽plt.rcParams['font.sans-serif']=['SimHei']#用來正常顯示標(biāo)簽plt.rcParams['axes.unicode_minus']=False#用來正常顯示負(fù)號(hào)plt.pie(df_churn1_PreferredLoginDevice['count'],#傳入標(biāo)簽labels=label_churn1_PreferredLoginDevice.values,#格式化輸出百分比autopct='%.2f%%',pctdistance=1.2,labeldistance=1.05)plt.show()#分析未流失用戶的首選登錄設(shè)備(餅圖)df_churn0=df.loc[df['Churn']==0]#獲取未流失的用戶#按照登錄設(shè)備分組后計(jì)算數(shù)據(jù)個(gè)數(shù)df_churn0_PreferredLoginDevice=\df_churn0.groupby(['PreferredLoginDevice'])['CustomerID'].count().reset_index().rename(columns={'CustomerID':'count'})label_churn0_PreferredLoginDevice=df_churn0_PreferredLoginDevice['PreferredLoginDevice']#提取標(biāo)簽plt.rcParams['font.sans-serif']=['SimHei']#用來正常顯示標(biāo)簽plt.rcParams['axes.unicode_minus']=False#用來正常顯示負(fù)號(hào)plt.pie(df_churn0_PreferredLoginDevice['count'],#傳入標(biāo)簽labels=label_churn1_PreferredLoginDevice.values,#格式化輸出百分比autopct='%.2f%%',pctdistance=1.24,labeldistance=1.05,)plt.show()商品數(shù)據(jù)指標(biāo)02用戶屬性特征分析——常用登錄設(shè)備分析使用移動(dòng)手機(jī)的用戶比例最高,不論是在流失用戶群體中,還是在未流失用戶群體中說明移動(dòng)手機(jī)的用戶穩(wěn)定性最好,而Pad
的用戶穩(wěn)定性最差商品數(shù)據(jù)指標(biāo)02用戶屬性特征分析——常用登錄設(shè)備分析接下來使用堆積柱狀圖分析用戶在選擇不同首選登錄設(shè)備時(shí)用戶的流失情況,從而判斷哪種首選登錄設(shè)備流失比例最高。首先獲取在不同設(shè)備登錄的用戶,然后按照是否發(fā)生流失進(jìn)行分組,計(jì)算流失和非流失用戶的占比,并繪制堆積柱狀圖#分析用戶在首選登錄設(shè)備不同情況下的流失情況(堆積柱狀圖)df_MobilePhone=df.loc[df['PreferredLoginDevice']=='MobilePhone']#獲取首選移動(dòng)手機(jī)的用戶df_Phone=df.loc[df['PreferredLoginDevice']=='Phone']#獲取首選電話的用戶df_Pad=df.loc[df['PreferredLoginDevice']=='Pad']#獲取首選平板計(jì)算機(jī)的用戶y1=[list(df_MobilePhone['Churn']).count(1),list(df_Phone['Churn']).count(1),list(df_Pad['Churn']).count(1)]#流失y2=[list(df_MobilePhone['Churn']).count(0),list(df_Phone['Churn']).count(0),list(df_Pad['Churn']).count(0)]#未流失data=[y1,y2]#為方便后續(xù)引用,將數(shù)據(jù)放入datalabel_churn0_PreferredLoginDevice=['MobilePhone','Phone','Pad']#提取標(biāo)簽(注意x軸順序)x=range(len(label_churn0_PreferredLoginDevice))#獲取的labels依次給到x軸bottom_y=np.zeros(len(label_churn0_PreferredLoginDevice))#將bottom_y元素都初始化為0data=np.array(data)#將data放入數(shù)組中sums=np.sum(data,axis=0)#求數(shù)組data的和,為計(jì)算百分比做準(zhǔn)備j=0colors=['#66c2a5','#8da0cb']figure,ax=plt.subplots()#創(chuàng)建子圖,采用默認(rèn)設(shè)置foriindata:#通過函數(shù)繪制圖像y=i/sums#獲取各個(gè)y值的百分比plt.bar(x,y,width=0.5,color=np.array(colors)[j],bottom=bottom_y,edgecolor='gray')bottom_y=y+bottom_y#實(shí)現(xiàn)百分比柱子的堆積plt.xticks(x,label_churn0_PreferredLoginDevice)#設(shè)置x軸的坐標(biāo)標(biāo)簽legend_labels=['流失用戶比例','未流失用戶比例']#設(shè)置圖像圖例color=['#66c2a5','#8da0cb',]#設(shè)定與柱子相同的顏色
#將顏色和圖例標(biāo)簽對(duì)應(yīng)patches=[mpatches.Patch(color=color[h],label=”{:s}”.format(legend_labels[h]))forhinrange(len(legend_labels))]ax=plt.gca()#繪制子圖box=ax.get_position()plt.gca().yaxis.set_major_formatter(PercentFormatter(1))#縱軸設(shè)置為百分比#生成legend,顯示標(biāo)簽;用bbox_to_anchor=(1,1)設(shè)置圖例的位置ax.legend(handles=patches,ncol=1,bbox_to_anchor=(1,1))figure.subplots_adjust(right=0.7)j+=1#color=np.array(colors)[j],通過數(shù)組設(shè)定柱子的顏色Y_churn0=[list(df_MobilePhone['Churn']).count(0)/len(df_MobilePhone),list(df_Phone['Churn']).count(0)/len(df_Phone),list(df_Pad['Churn']).count(0)/len(df_Pad)]#不同首選登錄設(shè)備未流失用戶占比Y_churn1=[list(df_MobilePhone['Churn']).count(1)/len(df_MobilePhone),list(df_Phone['Churn']).count(1)/len(df_Phone),list(df_Pad['Churn']).count(1)/len(df_Pad)]#不同首選登錄設(shè)備流失用戶占比fora,binzip(x,Y_churn0):#柱子上的數(shù)字顯示plt.text(a,b,'%.2f%%'%(b*100),ha='center',va='bottom');fora,binzip(x,Y_churn1):#柱子上的數(shù)字顯示plt.text(a,b,'%.2f%%'%(b*100),ha='center',va='bottom');labels=ax.get_xticklabels()+ax.get_yticklabels()ax.set_ylabel('流失用戶與未流失用戶占比',fontsize=13)ax.set_xlabel('用戶首選登錄設(shè)備',fontsize=13)plt.show()商品數(shù)據(jù)指標(biāo)02用戶屬性特征分析——常用登錄設(shè)備分析使用移動(dòng)電話的流失用戶占比12.5%使用平板電腦的流失用戶占比19.8%使用電話的流失用戶占比22.4%根據(jù)分析結(jié)果,建議產(chǎn)品團(tuán)隊(duì)測試電話和平板電腦的用戶端是否存在使用問題02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶屬性特征分析——性別分析通過餅圖對(duì)用戶性別進(jìn)行分析,分析流失用戶和未流失用戶的性別占比,對(duì)不同性別用戶采取不同的商務(wù)活動(dòng)策略從圖9-15和圖9-16可以看出,總體來說女性用戶比例最高,說明直播活動(dòng)的主要受眾群體為女性,在進(jìn)行商務(wù)活動(dòng)時(shí)更應(yīng)該關(guān)注女性群體的偏好,同時(shí)制定其他策略吸引更多的男性用戶。02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶屬性特征分析——性別分析使用堆積柱狀圖分析不同性別用戶的流失情況02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶屬性特征分析——性別分析如圖所示,女性用戶是平臺(tái)的主要用戶,女性的流失用戶占比為17.7%,男性的流失用戶占比為15.5%,基本持平。建議運(yùn)營團(tuán)隊(duì)根據(jù)男性與女性喜歡的直播風(fēng)格,進(jìn)行直播內(nèi)容定向推送,嘗試降低其流失率。02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶屬性特征分析——年齡分析利用餅圖對(duì)用戶年齡段進(jìn)行分析,分析流失用戶和未流失用戶的年齡占比,從而采取相應(yīng)的改進(jìn)措施根據(jù)圖9-10和9-11結(jié)果可知,年齡處于40-49歲和30-39歲的用戶占比最多,分別占比41.35%和39.30%,所以既要制定合適的策略挽留該組用戶,又要維系未流失的用戶,其次年齡處于20-29歲和50-59歲的用戶群體也十分重要,應(yīng)該制定適當(dāng)?shù)纳虅?wù)活動(dòng)吸用戶。02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶屬性特征分析——年齡分析使用堆積柱狀圖分析每個(gè)年齡段用戶的流失情況02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶屬性特征分析——年齡分析如圖所示,年齡為60-69歲的分組流失用戶占比最高,為34.6%;其次是年齡分組為50-59歲,流失用戶占比為22.5%。建議運(yùn)營團(tuán)隊(duì)增加年齡分組為50-59歲和60-69歲這部分群體喜歡的直播內(nèi)容和商品進(jìn)駐,提高其留存率。02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶行為特征分析——計(jì)算流失率計(jì)算結(jié)果約為16.84%。數(shù)據(jù)集中標(biāo)簽為“1”的用戶為已經(jīng)流失的用戶,根據(jù)流失率計(jì)算公式(流失的用戶數(shù)量除以總用戶數(shù)量,即標(biāo)簽為“1”的用戶數(shù)量/總用戶數(shù)量),計(jì)算流失率02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶行為特征分析——最近一個(gè)月訂單偏好類型分析使用餅圖分析用戶的訂單偏好類別。首先獲取流失用戶和非流失用戶的數(shù)據(jù),然后獲取每一個(gè)類別用戶的訂單偏好,繪制不同的餅圖。02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)用戶行為特征分析——最近一個(gè)月訂單偏好類型分析從圖9-13和圖9-14可以看出用戶更加喜歡筆記本電腦和移動(dòng)手機(jī)類型的產(chǎn)品,所以在直播營銷活動(dòng)中,可以重點(diǎn)推出這兩種類型的產(chǎn)品,并連帶銷售其他類型產(chǎn)品,提高整體銷售額。02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)使用堆積柱狀圖分析每一個(gè)偏好下流失用戶和非流失用戶的占比用戶行為特征分析——最近一個(gè)月訂單偏好類型分析02直播營銷活動(dòng)商品數(shù)據(jù)指標(biāo)如圖所示,上月主要訂單為移動(dòng)手機(jī)和食品的流失用戶占比較多,均超過了25%,其次是上月訂單為時(shí)尚單品的用戶??赡艿脑?yàn)橐苿?dòng)手機(jī)和食品的商品使用周期較長,用戶購買該類商品后,很長一段時(shí)間不再有相同的購買意愿,從而造成用戶流失。用戶行為特征分析——最近一個(gè)月訂單偏好類型分析Part3直播營銷活動(dòng)商品推廣分析及預(yù)測嚴(yán)謹(jǐn)勤儉求實(shí)開拓JUNE12th03直播營銷活動(dòng)商品推廣分析及預(yù)測——邏輯回歸模型目標(biāo):預(yù)測哪些用戶更可能在未來流失方法:邏輯回歸模型03直播營銷活動(dòng)商品推廣分析及預(yù)測——邏輯回歸模型機(jī)器學(xué)習(xí)按任務(wù)類型分類Classification:分類任務(wù):預(yù)測離散變量(決策樹、隨機(jī)森林、SVM、邏輯回歸等)Regression:回歸任務(wù):預(yù)測連續(xù)變量(線性回歸、隨機(jī)森林回歸、SVR等)Clustering:聚類任務(wù):無監(jiān)督分組,標(biāo)簽未知(Kmeans、AgglomerativeClustering等)DimensionalityReduction:降維任務(wù):壓縮特征維度(PCA、TruncatedSVD、t-SNE等)Preprocessing:預(yù)處理ModelSelection:模型選擇按學(xué)習(xí)過程分類邏輯回歸?監(jiān)督學(xué)習(xí)無監(jiān)督學(xué)習(xí)強(qiáng)化學(xué)習(xí)邏輯回歸不是“算一個(gè)數(shù)”,而是判斷一件事是不是會(huì)發(fā)生,它輸出的不是一個(gè)具體的數(shù)值,而是一個(gè)“概率”,邏輯回歸時(shí)一種做判斷的數(shù)學(xué)工具。缺點(diǎn):①容易受到異常值影響,對(duì)異常值較為敏感;②對(duì)特征相關(guān)性較強(qiáng)的數(shù)據(jù)表現(xiàn)不佳,模型性能可能會(huì)下降。優(yōu)點(diǎn):①易于理解和解釋:可以提供特征對(duì)分類結(jié)果的影響程度;②計(jì)算代價(jià)低:訓(xùn)練和預(yù)測速度相對(duì)較快;③小型數(shù)據(jù)集效果好1.首先模型將“下單間隔”“折扣力度”“用戶投訴”等變量作為輸入特征。2.接下來為每個(gè)變量分配一個(gè)權(quán)重,表示其對(duì)用戶是否流失的影響方向與程度。3.這些變量的加權(quán)求和形成一個(gè)得分,用于衡量用戶的“流失傾向”4.該得分通過邏輯函數(shù)轉(zhuǎn)換為0到1的概率,表示用戶流失的可能性。5.通常以0.5為閾值,若概率大于該值則預(yù)測為“即將流失”,反之則不流失。6.通過歷史數(shù)據(jù)訓(xùn)練,模型不斷調(diào)整權(quán)重,從而學(xué)習(xí)各變量與流失行為之間的真實(shí)關(guān)系。7.得出最終學(xué)習(xí)結(jié)果03直播營銷活動(dòng)商品推廣分析及預(yù)測——邏輯回歸模型變量名含義可能的解釋HourSpendonApp用戶使用App的小時(shí)數(shù)使用時(shí)間越久可能更忠誠Complain用戶最近一個(gè)月是否提出投訴(0:否;1:是)有投訴可能更易流失DiscountAmount用戶最近一個(gè)月平均每筆訂單節(jié)省的價(jià)錢節(jié)省越多可能越愿意留下DaySinceLastOrder用戶距離上次下單的天數(shù)距上次下單時(shí)間越久,越可能流失1.數(shù)據(jù)準(zhǔn)備2.拆分訓(xùn)練集和預(yù)測集3.模型訓(xùn)練與預(yù)測4.結(jié)果評(píng)估與模型表現(xiàn)03直播營銷活動(dòng)商品推廣分析及預(yù)測03直播營銷活動(dòng)商品推廣分析及預(yù)測——邏輯回歸模型實(shí)際\預(yù)測(1126)預(yù)測“不流失”(0)預(yù)測“流失”(1)實(shí)際不流失(0)TrueNegative:932FalsePositive:182實(shí)際流失(1)FalseNegative:2TruePositive:10邏輯回歸模型-混淆矩陣
結(jié)果解讀?
準(zhǔn)確率:模型整體判斷正確的比例精確率:被預(yù)測為“會(huì)流失”的人中,有多少是真的會(huì)流失F1分?jǐn)?shù):模型整體判斷正確的比例召回率:所有真正會(huì)流失的人中,模型識(shí)別出了多少BinaryF1-score:只關(guān)注某類別(二分類任務(wù))MicroF1-score:整體樣本級(jí)別(類別不均衡時(shí)常用)=AccuracyMacroF1-score:分別計(jì)算每類F1再平均(多分類且類別均衡時(shí))WeightedF1-score:分別計(jì)算每類F1再加權(quán)平均(類別不均衡時(shí))
模型回歸系數(shù)03直播營銷活動(dòng)商品推廣分析及預(yù)測-基于Deepseek的客戶流失預(yù)測步驟一,在DeepSeek中上傳數(shù)據(jù)集,然后完成以下內(nèi)容。(1)讀取用戶流失數(shù)據(jù)集,包括用戶是否流失的目標(biāo)字段和多個(gè)特征。(2)對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,得到與用戶流失相關(guān)的特征。DeepSeek指令如下:請(qǐng)給出數(shù)據(jù)預(yù)處理的Python代碼,完成這些工作:讀取用戶流失數(shù)據(jù)集,包括用戶是否流失的目標(biāo)字段和多個(gè)特征。同時(shí)對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,得到與用戶流失相關(guān)的特征。數(shù)據(jù)預(yù)處理參考結(jié)果如圖。03直播營銷活動(dòng)商品推廣分析及預(yù)測-基于Deepseek的客戶流失預(yù)測步驟二,在上述數(shù)據(jù)集基礎(chǔ)上,實(shí)現(xiàn)對(duì)數(shù)據(jù)的分割和預(yù)測。(1)將數(shù)據(jù)集進(jìn)行分割,得到訓(xùn)練集與測試集。(2)使用邏輯回歸模型進(jìn)行預(yù)測,給出對(duì)應(yīng)的代碼和預(yù)期結(jié)果。DeepSeek指令如下。將數(shù)據(jù)集進(jìn)行分割,得到訓(xùn)練集與測試集。同時(shí)使用邏輯回歸模型進(jìn)行預(yù)測,給出對(duì)應(yīng)的代碼和預(yù)期結(jié)果。參考結(jié)果如圖通過預(yù)測結(jié)果可以發(fā)現(xiàn),準(zhǔn)確率(accur
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 甘肅省武威市涼州區(qū)柏樹片2025年九年級(jí)物理中考一模練習(xí)試卷(含答案)
- 專職和志愿消防隊(duì)的組織管理制度
- 《事業(yè)單位人事管理?xiàng)l例》試題及答案
- 2026年水利防臺(tái)風(fēng)水庫調(diào)度應(yīng)急處置預(yù)案
- 公眾聚集場所投入使用營業(yè)前消防安全管理制度
- 2026年廣告?zhèn)髅絼?chuàng)意創(chuàng)新報(bào)告
- 2026年化工生產(chǎn)安全與環(huán)境保護(hù)基本要求試題
- 2025年江西農(nóng)商銀行員工招聘備考題庫及一套完整答案詳解
- 2026山東威海市復(fù)退軍人康寧醫(yī)院招聘4人備考題庫完整答案詳解
- 2026江蘇南京大學(xué)XZ2026-008化學(xué)學(xué)院科研人員招聘備考題庫及參考答案詳解
- 石籠網(wǎng)廠施工技術(shù)交底
- 新建粉煤灰填埋場施工方案
- 2025至2030全球及中國經(jīng)顱刺激器行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢(shì)及投資規(guī)劃深度研究報(bào)告
- 互聯(lián)網(wǎng)運(yùn)維服務(wù)保障承諾函8篇范文
- 中遠(yuǎn)海運(yùn)集團(tuán)筆試題庫2025
- 電力三種人安全培訓(xùn)課件
- 船舶生產(chǎn)許可管理辦法
- 戒毒所生產(chǎn)安全知識(shí)培訓(xùn)課件
- 江蘇省淮安市2024-2025學(xué)年七年級(jí)下學(xué)期期末歷史試題(含答案)
- 醫(yī)療質(zhì)量安全核心制度落實(shí)情況監(jiān)測指標(biāo)
- 電鍍公司車間承包協(xié)議書
評(píng)論
0/150
提交評(píng)論