版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第8章
企業(yè)戰(zhàn)略分析XX老師本章內(nèi)容8.1戰(zhàn)略分析方法簡介8.2基于NPL的機(jī)會與威脅分析8.3基于NLP的企業(yè)優(yōu)劣勢分析8.4基于Kmeans聚類的戰(zhàn)略群組分析機(jī)器學(xué)習(xí)平臺網(wǎng)址
01戰(zhàn)略分析方法簡介8.1.1SWOT分析8.1.2戰(zhàn)略群組分析8.1.3傳統(tǒng)戰(zhàn)略分析與智能戰(zhàn)略分析的比較8.1戰(zhàn)略分析方法簡介
企業(yè)戰(zhàn)略分析指的是對企業(yè)所處的內(nèi)外部環(huán)境進(jìn)行系統(tǒng)深入的了解,以識別環(huán)境中的機(jī)會和威脅、評估企業(yè)的優(yōu)勢和劣勢,從而為制定有效的戰(zhàn)略決策提供依據(jù)。企業(yè)戰(zhàn)略分析通常包括外部環(huán)境分析和內(nèi)部環(huán)境分析。8.1戰(zhàn)略分析方法簡介常見的戰(zhàn)略分析工具和方法8.1.1SWOT分析SWOT分析是對企業(yè)的內(nèi)外部條件進(jìn)行綜合概括,S指企業(yè)內(nèi)部的優(yōu)勢(Strength),W指企業(yè)內(nèi)部的劣勢(Weakness),O指企業(yè)外部環(huán)境中的發(fā)展機(jī)會(Opportunity),T指企業(yè)面臨的外部威脅(Threat)。優(yōu)劣勢分析主要著眼于企業(yè)相比于競爭對手的實(shí)力,機(jī)會和威脅分析則著眼于外部環(huán)境變化及其對企業(yè)的潛在影響。SWOT分析概念8.1.1SWOT分析典型的SWOT分析框架優(yōu)勢(S)劣勢(W)S有力的戰(zhàn)略w
缺乏明確戰(zhàn)略導(dǎo)向S
有利的金融環(huán)境w
陳舊的設(shè)備S
有利的品牌形象和美譽(yù)w
高于對手的財(cái)務(wù)杠桿(資產(chǎn)負(fù)債率)S
被廣泛認(rèn)可的市場領(lǐng)導(dǎo)地位w
高于對手的成本費(fèi)用S專利技術(shù)w
缺少關(guān)鍵技能和資格能力S成本優(yōu)勢w
侵蝕利潤的各項(xiàng)支出S強(qiáng)勢廣告w
不利的內(nèi)在運(yùn)作環(huán)境S產(chǎn)品創(chuàng)新技能w
落后的研發(fā)能力S優(yōu)質(zhì)客戶服務(wù)w
過分狹窄的產(chǎn)品組合S優(yōu)秀產(chǎn)品質(zhì)量w
缺乏市場規(guī)劃能力S
戰(zhàn)略聯(lián)盟與并購
機(jī)會(O)威脅(T)O服務(wù)獨(dú)特的客戶群體T強(qiáng)勢競爭者的進(jìn)入O新地理區(qū)域的擴(kuò)張T替代品引起的銷售下降O產(chǎn)品組合的擴(kuò)張T市場增長減緩O核心技能向產(chǎn)品組合轉(zhuǎn)化T交換率和貿(mào)易政策的不利轉(zhuǎn)變O垂直整合的戰(zhàn)略形式T由新規(guī)則引起的成本增加O分享競爭對手的市場資源T商業(yè)周期的影響O競爭對手的支持T客戶和供應(yīng)商的杠桿作用加強(qiáng)O戰(zhàn)略聯(lián)盟與并購帶來的超額市場覆蓋T消費(fèi)者的購買需求下降O新技術(shù)開發(fā)T人口與環(huán)境的變化O品牌形象拓展8.1.1SWOT分析外部因素機(jī)會威脅內(nèi)部因素優(yōu)勢SOST劣勢WOWT增長型戰(zhàn)略(SO):在該戰(zhàn)略下,企業(yè)應(yīng)當(dāng)充分利用內(nèi)部優(yōu)勢來把握外部機(jī)會。如開發(fā)市場、增加產(chǎn)量等。多種經(jīng)營戰(zhàn)略(ST):在該戰(zhàn)略下,企業(yè)應(yīng)當(dāng)利用自身優(yōu)勢來回避或減少外部威脅的沖擊。扭轉(zhuǎn)型戰(zhàn)略(WO):該戰(zhàn)略旨在借助外部機(jī)遇來彌補(bǔ)企業(yè)內(nèi)部的劣勢,如充分利用環(huán)境變化帶來的機(jī)會設(shè)法消除劣勢。防御型戰(zhàn)略(WT):該戰(zhàn)略是一種彌補(bǔ)內(nèi)部劣勢并規(guī)避外部威脅的防御性策略,通過業(yè)務(wù)調(diào)整來設(shè)法避開威脅和消除劣勢。通常,企業(yè)需要先采用WO,ST或WT戰(zhàn)略,以逐步達(dá)到能夠采用SO戰(zhàn)略的程度。SWOT分析結(jié)果將形成一個2×2的矩陣,矩陣的不同區(qū)域被賦予了不同的戰(zhàn)略意義。SWOT矩陣將企業(yè)可選擇的戰(zhàn)略分成了四種類型。SWOT分析結(jié)構(gòu)與戰(zhàn)略8.1.2戰(zhàn)略群組分析戰(zhàn)略群組定義戰(zhàn)略群組是在同一行業(yè)中經(jīng)營并且在某方面采用相同或相似戰(zhàn)略的企業(yè)集合,通常只有少數(shù)幾個戰(zhàn)略群組,各組采用特征不同的戰(zhàn)略;而同一個戰(zhàn)略群組內(nèi)的企業(yè)卻在許多方面存在相似之處。戰(zhàn)略群組競爭
戰(zhàn)略群組內(nèi)企業(yè)競爭激烈,行業(yè)五力強(qiáng)度各異;進(jìn)入壁壘阻止新企業(yè)進(jìn)入,不同戰(zhàn)略群組間的戰(zhàn)略越接近,企業(yè)相互成為競爭者的可能性越大。戰(zhàn)略群組劃分方法根據(jù)2至3項(xiàng)代表性特征把行業(yè)內(nèi)的企業(yè)進(jìn)行分類,如產(chǎn)品的差異化程度、細(xì)分市場的數(shù)目、所使用的分銷渠道等,選擇兩項(xiàng)繪制二維坐標(biāo)圖,根據(jù)企業(yè)在兩個特征上的表現(xiàn)確定其在坐標(biāo)圖中的位置,位置接近的企業(yè)屬于同一戰(zhàn)略群組。戰(zhàn)略群組分析圖選取兩項(xiàng)特征,如地區(qū)覆蓋與營銷力度,繪制戰(zhàn)略群組分析圖,每個戰(zhàn)略群組用圓表示,半徑與銷售收入份額成正比,直觀展示競爭地位。選取變量的條件在選取劃分戰(zhàn)略群組的依據(jù)時,變量應(yīng)體現(xiàn)各企業(yè)的競爭目的,避免共性特征,且兩個變量不能具有強(qiáng)相關(guān)性,以確保分析的準(zhǔn)確性和有效性。戰(zhàn)略群組分析價(jià)值戰(zhàn)略群組分析有助于企業(yè)確定戰(zhàn)略行動方向;思考外部環(huán)境變化的影響;發(fā)現(xiàn)競爭者,把握市場定位,發(fā)現(xiàn)潛在的合作伙伴或?qū)ふ腋偁巸?yōu)勢;了解移動障礙,避免其他群組的進(jìn)攻8.1.2戰(zhàn)略群組分析
例如,選取“地區(qū)覆蓋”與“營銷力度”兩項(xiàng)特征,可以得到如下戰(zhàn)略群組分析圖:戰(zhàn)略群組分析圖根據(jù)研究目的,從多個角度繪制戰(zhàn)略群組分析圖,以全面地反映企業(yè)的競爭地位。在選取劃分戰(zhàn)略群組的依據(jù)時,位于橫縱坐標(biāo)的兩個變量應(yīng)能夠體現(xiàn)各企業(yè)的競爭目的,避免選擇行業(yè)內(nèi)企業(yè)所共有的特征,且兩個變量不能具有強(qiáng)相關(guān)性。8.1.3傳統(tǒng)戰(zhàn)略分析與智能戰(zhàn)略分析的比較
在復(fù)雜多變的商業(yè)環(huán)境下,傳統(tǒng)戰(zhàn)略分析方法局限性漸顯。數(shù)智化時代的智能戰(zhàn)略分析,憑借大數(shù)據(jù)和智能化技術(shù),解決了傳統(tǒng)戰(zhàn)略管理的滯后性和信息遺漏問題,以全面、動態(tài)、科學(xué)的優(yōu)勢,更契合企業(yè)發(fā)展需求,助力企業(yè)在激烈競爭中把握先機(jī),實(shí)現(xiàn)可持續(xù)發(fā)展。對比維度傳統(tǒng)戰(zhàn)略分析智能戰(zhàn)略分析信息收集依賴歷史資料、市場調(diào)研報(bào)告,信息采集成本高,易遺漏重要信息。利用大數(shù)據(jù)技術(shù),高效搜尋和處理海量信息,來源廣泛且全面。分析方法基于相對靜態(tài)環(huán)境,人工分析耗時耗力構(gòu)建數(shù)據(jù)模型,自動分析和排列影響因素,形成矩陣。預(yù)測能力決策滯后,難以應(yīng)對快速變化的環(huán)境實(shí)時監(jiān)控內(nèi)外部環(huán)境,及時識別風(fēng)險(xiǎn)和機(jī)遇分析效果決策信息集不完整,增加企業(yè)風(fēng)險(xiǎn)隱患。確保戰(zhàn)略分析的全面性、動態(tài)性和科學(xué)性,助力企業(yè)發(fā)展02基于NPL的機(jī)會與威脅分析8.2.1實(shí)訓(xùn)任務(wù)要求與特點(diǎn)8.2.2情感分析的方法8.2.3基于詞典法的情感分析8.2.4基于調(diào)包法的情感分析8.2.5基于機(jī)器學(xué)習(xí)法的情感分析8.2.6企業(yè)機(jī)會和威脅分析8.2.1實(shí)訓(xùn)任務(wù)要求與特點(diǎn)家電行業(yè)文本分析企業(yè)外部環(huán)境相關(guān)的信息并非都是結(jié)構(gòu)化的信息,相反,許多此類信息蘊(yùn)含在政府的政策文件、監(jiān)管機(jī)構(gòu)的規(guī)章制度、分析師報(bào)告等文本中。因此,需要使用自然語言處理(NLP)技術(shù)對這些文本進(jìn)行內(nèi)容和情感分析。家電政策語料庫構(gòu)建利用爬蟲技術(shù),搜集了可能影響家電企業(yè)所處的宏觀環(huán)境、產(chǎn)業(yè)環(huán)境和競爭格局的政府政策、行業(yè)報(bào)告、監(jiān)管要求、行業(yè)規(guī)范等公開文件。提取上述文件中與家電行業(yè)相關(guān)的語句,刪除無關(guān)語句。語料庫情感分析生成OT表基于家電行業(yè)外部環(huán)境語料庫,采用詞典法、調(diào)包法、機(jī)器學(xué)習(xí)法對外部環(huán)境相關(guān)語句進(jìn)行文本情感分析,積極暗示機(jī)會,消極暗示威脅;如“消費(fèi)市場”一詞中性,但“蓬勃”與“疲軟”分別代表機(jī)遇與風(fēng)險(xiǎn)。8.2.2情感分析的方法情感分析方法及原理目前,主流的文本情感分析方法可分為基于情感詞典的情感分析法、基于調(diào)包的情感分析法以及基于機(jī)器學(xué)習(xí)的情感分析法。詞典法調(diào)包法機(jī)器學(xué)習(xí)法8.2.2情感分析的方法需情感詞、否定詞、程度副詞詞典情感詞詞典包含許多個表達(dá)積極或消極情緒的情感詞,以及每個詞對應(yīng)的情感分?jǐn)?shù)。否定詞詞典包含許多個否定詞,在遇到這些否定詞時,句子取相反意思,而雙重否定則表示肯定。程度副詞詞典包含許多個用來調(diào)整情感詞的情感分?jǐn)?shù)權(quán)重(即情緒強(qiáng)度)的程度副詞,以及每個詞本身的程度副詞分?jǐn)?shù)(即調(diào)整力度)。詞典法的基本流程如下:(1)遍歷每個句子的分詞結(jié)果;(2)初始化情感分?jǐn)?shù)權(quán)重,取值為1;(3)對于當(dāng)前句子的每個單詞:如果該單詞是情感詞,根據(jù)權(quán)重和情感詞得分,更新情感分?jǐn)?shù)。獲取下一個情感詞的位置索引,更新位置索引。判斷當(dāng)前情感詞與下一個情感詞之間是否存在否定詞或程度副詞,根據(jù)否定詞調(diào)整情感分?jǐn)?shù)的正負(fù)符號,根據(jù)程度副詞調(diào)整情感分?jǐn)?shù)的取值大小,更新情感分?jǐn)?shù)權(quán)重。(4)將每個句子的加權(quán)情感分?jǐn)?shù)作為情感分析結(jié)果。詞典法的特點(diǎn)在于綜合考慮了情感詞、否定詞和程度副詞,以及其詞匯屬性、位置、相互作用等因素,實(shí)現(xiàn)對文本數(shù)據(jù)的情感分析。詞典法8.2.2情感分析的方法調(diào)包法可以更快地實(shí)現(xiàn)文本情感分析。Python、R、Matlab等高級編程語言能夠?yàn)槲覀兲峁V泛的生態(tài)系統(tǒng)和豐富的第三方包,而直接調(diào)用開源環(huán)境中其他人預(yù)先編寫好的庫或模塊,相當(dāng)于“站在巨人的肩膀上”——只需自行編寫少量代碼,即可擴(kuò)展程序的功能并實(shí)現(xiàn)特定的任務(wù)。以情感分析任務(wù)為例,現(xiàn)階段Python有許多自然語言處理(NLP)包,可以輕松實(shí)現(xiàn)文本情感分析,如SnowNLP、NLTK和TextBlob等,這些NLP包已經(jīng)內(nèi)嵌了分詞、詞性標(biāo)注、與詞典對比等操作。調(diào)包法8.2.2情感分析的方法機(jī)器學(xué)習(xí)法可以更加自主地實(shí)現(xiàn)文本情感分析。傳統(tǒng)方法如決策樹,能有效捕獲關(guān)鍵特征。集成學(xué)習(xí)算法如XGBoost通過優(yōu)化梯度提升框架,提升模型準(zhǔn)確性和效率。深度學(xué)習(xí)模型如DNN、LSTM能夠自動學(xué)習(xí)文本的抽象特征,處理非線性關(guān)系,效果更理想。機(jī)器學(xué)習(xí)法需要先對一個帶情感標(biāo)簽的樣本進(jìn)行學(xué)習(xí),才能建立模型對樣本外數(shù)據(jù)的情感分類進(jìn)行預(yù)測。帶標(biāo)簽樣本又稱為樣本內(nèi)數(shù)據(jù),即由人工判斷每條文本觀測記錄的情感傾向,打上積極、消極、中性等情感標(biāo)簽,其將被劃分為訓(xùn)練集和測試集兩個部分,分別用來訓(xùn)練機(jī)器學(xué)習(xí)模型和評估模型的預(yù)測效果。機(jī)器學(xué)習(xí)法8.2.2情感分析的方法方法優(yōu)勢劣勢詞典法簡單直觀,不需要大量標(biāo)注數(shù)據(jù),適用于快速情感分析。受限于情感詞典的質(zhì)量和覆蓋范圍,對于新詞、復(fù)雜語境以及歧義性較高的文本可能表現(xiàn)不佳。調(diào)包法開發(fā)者提前訓(xùn)練并封裝好NLP模型,使用者可以直接使用,操作方便模型的可調(diào)試空間有限,通常無法自由調(diào)整模型參數(shù);開發(fā)者訓(xùn)練好的模型可能不適配數(shù)據(jù)集特征。機(jī)器學(xué)習(xí)法能夠根據(jù)特定領(lǐng)域或特定任務(wù)的數(shù)據(jù)進(jìn)行自定義訓(xùn)練,具有較好的靈活性和可解釋性。依賴于數(shù)據(jù)標(biāo)注,需要大量的訓(xùn)練樣本和特征工程,消耗大量的訓(xùn)練時間和計(jì)算資源,編程難度與學(xué)習(xí)成本較高。情感分析方法比較8.2.3基于詞典法的情感分析詞典法流程基于詞典法的技術(shù)流程圖步驟一:數(shù)據(jù)導(dǎo)入與清洗01導(dǎo)入名為“家電行業(yè)政策.xlsx”的文本數(shù)據(jù)集,該數(shù)據(jù)共有50行觀測記錄,5列特征;其中的“內(nèi)容”列是我們進(jìn)行情感分析的對象。數(shù)據(jù)導(dǎo)入02本次任務(wù)所涉及的變量均為字符型變量,因此,在數(shù)據(jù)清洗階段主要檢查各變量是否存在缺失值和重復(fù)值,而無須進(jìn)行異常值檢測。將缺失比例較高的特征變量刪除,并檢查是否存在完全相同的觀測記錄,若有則只保留其中一條。缺失值和重復(fù)值處理8.2.3基于詞典法的情感分析8.2.3基于詞典法的情感分析文本分詞和詞性標(biāo)注分詞按照特定需求把文本切分成一個字符串序列,其中的元素被稱為詞語。分詞中涉及到幾個基本問題:分詞規(guī)范、歧義切分、未登錄詞的識別。詞性標(biāo)注僅保留對機(jī)器學(xué)習(xí)或人工智能識別有益的詞匯。刪除停用詞刪除對文本分析意義不大的詞匯,如介詞、助詞、連詞、代詞等,其出現(xiàn)頻率很高卻不攜帶太多語義信息。文本分詞結(jié)果步驟二:文本分詞與詞性標(biāo)注保留詞性的結(jié)果8.2.3基于詞典法的情感分析計(jì)算文本情感分?jǐn)?shù)讀者在選擇相應(yīng)的中文情感詞典和否定詞典之后,便可自動計(jì)算文本的情感分?jǐn)?shù)。情感分?jǐn)?shù)的取值范圍是0-1,取值越趨近于1,說明文本的分詞結(jié)果中正向情感詞越多,文本情感越積極;取值越趨近于0,說明文本情感越消極;取值在0.5左右,則說明文本沒有明顯的情感傾向。圖8-5展示了詞典法下的情感分析結(jié)果。步驟二:計(jì)算文本情感分?jǐn)?shù)詞典法情感分析結(jié)果8.2.4基于調(diào)包法的情感分析基于調(diào)包法的技術(shù)流程圖“包”的概念與調(diào)包法流程調(diào)包法中的“包”指的是專注于中文文本情感分析的一系列程序集合,“包”里面內(nèi)嵌了文本分詞、詞性標(biāo)注、去除停用詞等處理,并能夠基于大規(guī)模的情感詞典和概率算法,根據(jù)情感詞的出現(xiàn)頻率、情感詞前后的詞語以及語法規(guī)則等對文本的整體情感進(jìn)行分析,計(jì)算并輸出文本的情感分?jǐn)?shù)。如SnowNLP包就是一個簡單易用的情感分析包,能夠較好地識別中文文本的情感傾向。調(diào)包法計(jì)算的情感分?jǐn)?shù)的取值范圍同樣在0-1之間。取值越趨近于1,文本情感越積極;反之則情感越消極。在調(diào)包法下,分析人員無須再進(jìn)行分詞等文本預(yù)處理操作,直接調(diào)用程序包即可。8.2.5基于機(jī)器學(xué)習(xí)法的情感分析基于機(jī)器學(xué)習(xí)法的技術(shù)流程圖機(jī)器學(xué)習(xí)法技術(shù)流程機(jī)器學(xué)習(xí)法需要先對一個帶情感標(biāo)簽的樣本進(jìn)行學(xué)習(xí),才能建立模型對樣本外數(shù)據(jù)的情感分類進(jìn)行預(yù)測。所謂的“帶標(biāo)簽”的樣本,即由人工判斷每條文本觀測記錄的情感傾向,打上積極、消極、中性等情感標(biāo)簽。帶標(biāo)簽樣本又稱為樣本內(nèi)數(shù)據(jù),將被劃分為訓(xùn)練集和測試集兩個部分,分別用來訓(xùn)練機(jī)器學(xué)習(xí)模型和評估模型的預(yù)測效果。在建模完成后,就可以用該模型對樣本外數(shù)據(jù)進(jìn)行情感分析了。導(dǎo)入一份名為“家電行業(yè)政策_(dá)帶標(biāo)注.xlsx”的數(shù)據(jù)集。新數(shù)據(jù)集共有50條文本觀測記錄,其中40條帶有情感分?jǐn)?shù)(變量名為“OT分?jǐn)?shù)”),剩余10條不帶標(biāo)簽。數(shù)據(jù)導(dǎo)入8.2.5基于機(jī)器學(xué)習(xí)法的情感分析步驟一:數(shù)據(jù)導(dǎo)入與清洗缺失值和重復(fù)值處理同8.2.3主要檢查各變量是否存在缺失值和重復(fù)值,而無須進(jìn)行異常值檢測。將缺失比例較高的特征變量刪除,并檢查是否存在完全相同的觀測記錄,若有則只保留其中一條。先對文本的內(nèi)容進(jìn)行分詞、詞性標(biāo)注、刪除停用詞等預(yù)處理。將分詞結(jié)果中的每個詞匯都轉(zhuǎn)變成一個向量,最終形成許多內(nèi)容向量,第N個詞匯對應(yīng)“內(nèi)容向量N”?!皟?nèi)容向量N”的取值代表了第N個詞匯在該條觀測記錄中出現(xiàn)的位置;若“內(nèi)容向量N”取值為0,則說明第N個詞匯未曾出現(xiàn)在這條觀測記錄中。8.2.5基于機(jī)器學(xué)習(xí)法的情感分析步驟二:文本向量化文本向量化結(jié)果首先剔除數(shù)據(jù)集中的樣本外數(shù)據(jù)(不帶標(biāo)簽的觀測記錄),再將樣本內(nèi)數(shù)據(jù)進(jìn)行拆分。將帶標(biāo)簽觀測記錄中的80%劃分為訓(xùn)練集,其余20%作為測試集。劃分訓(xùn)練集和測試集步驟三:決策樹建模過程與效果評估8.2.5基于機(jī)器學(xué)習(xí)法的情感分析模型訓(xùn)練將劃分得到的訓(xùn)練集用于模型訓(xùn)練,預(yù)測目標(biāo)是“OT分?jǐn)?shù)”,所使用的特征變量即之前生成的全部文本向量。設(shè)置決策樹模型的各種參數(shù)取值。模型評估我們用構(gòu)建的決策樹模型來預(yù)測測試集樣本的情感分?jǐn)?shù),并與其真實(shí)的情感分?jǐn)?shù)進(jìn)行對比,從而評價(jià)該模型的預(yù)測效果。由于此數(shù)據(jù)的樣本規(guī)模較小,樣本量少于特征量,應(yīng)使用R2而非調(diào)整R2進(jìn)行模型評價(jià)。目前模型未經(jīng)過系統(tǒng)性調(diào)參,故而R2僅為0.7199,模型性能一般,仍具有改進(jìn)空間。模型評估結(jié)果導(dǎo)入樣本外數(shù)據(jù),重復(fù)前述的數(shù)據(jù)清洗、分詞、標(biāo)注詞性、文本向量化等預(yù)處理過程?;?qū)颖緝?nèi)、外的數(shù)據(jù)同時進(jìn)行數(shù)據(jù)清洗、分詞、詞性標(biāo)注、文本向量化等預(yù)處理操作,再單獨(dú)保留經(jīng)過預(yù)處理的樣本外數(shù)據(jù),以便在模型應(yīng)用階段使用。進(jìn)行樣本外預(yù)測,將已經(jīng)構(gòu)建的決策樹模型用于不帶標(biāo)簽的樣本,以全部文本向量作為預(yù)測因子,便可得到所有樣本外觀測記錄的情感分?jǐn)?shù)(OT分?jǐn)?shù))。步驟四:決策樹模型應(yīng)用8.2.5基于機(jī)器學(xué)習(xí)法的情感分析通過對樣本內(nèi)數(shù)據(jù)的學(xué)習(xí),分析人員得到了情感分?jǐn)?shù)的預(yù)測模型,可以用該模型對樣本外數(shù)據(jù)進(jìn)行預(yù)測。8.2.2情感分析的方法機(jī)器學(xué)習(xí)法情感分析調(diào)包法情感分析使用專注于中文文本情感分析的程序包,如SnowNLP,直接調(diào)用程序包進(jìn)行情感分析。調(diào)包法計(jì)算的情感分?jǐn)?shù)取值范圍為0-1,越趨近于1表示情感越積極,越趨近于0表示情感越消極。詞典法情感分析選擇合適的中文情感詞典,如Hownet詞典、清華大學(xué)李軍詞典等,結(jié)合否定詞典進(jìn)行情感分析。詞典法計(jì)算的情感分?jǐn)?shù)取值范圍也是0-1,取值越趨近于1表示情感越積極,反之亦然。對少量文本語句打標(biāo)簽,將帶標(biāo)簽的觀測記錄作為樣本內(nèi)數(shù)據(jù),分為訓(xùn)練集和驗(yàn)證集。通過模型訓(xùn)練、驗(yàn)證和應(yīng)用,對樣本外數(shù)據(jù)進(jìn)行情感分類。機(jī)器學(xué)習(xí)模型的性能可以通過均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)、決定系數(shù)(R2)等指標(biāo)進(jìn)行衡量。情感分析方法對比8.2.6企業(yè)機(jī)會和威脅分析設(shè)置劃分閾值生成OT清單統(tǒng)計(jì)分析結(jié)合企業(yè)的風(fēng)險(xiǎn)偏好和風(fēng)險(xiǎn)容忍度,設(shè)置機(jī)會和威脅的劃分閾值將符合機(jī)會/威脅定義的觀測記錄篩選出來并列表通過統(tǒng)計(jì)機(jī)會和威脅因素各自的數(shù)量或占比,得到外部環(huán)境整體的有利或不利程度企業(yè)機(jī)會和威脅分析步驟得到與某家電企業(yè)相關(guān)的所有外部環(huán)境文本的情感分?jǐn)?shù)后,在此基礎(chǔ)上,計(jì)算外部環(huán)境整體蘊(yùn)含的機(jī)會或威脅大小程度8.2.6企業(yè)機(jī)會和威脅分析機(jī)會/威脅因素清單03基于NLP的企業(yè)優(yōu)劣勢分析8.3.1實(shí)訓(xùn)任務(wù)要求與特點(diǎn)8.3.2文本主題分析8.3.3基于LDA的文本主題分析8.3.4企業(yè)優(yōu)勢和劣勢分析8.3.1實(shí)訓(xùn)任務(wù)要求與特點(diǎn)消費(fèi)者往往會在電商平臺的評論區(qū)分享自己的商品使用體驗(yàn),對商品的外觀設(shè)計(jì)、質(zhì)量、價(jià)格、創(chuàng)新性等進(jìn)行評價(jià)。這些消費(fèi)者評論能夠很大程度地反映出品牌的優(yōu)勢和劣勢。因此,需要從電商平臺上爬取海爾冰箱的公開客戶評價(jià),其中包括評分星級、評論內(nèi)容、時間、產(chǎn)品型號等信息,形成產(chǎn)品評論文檔??蛻粼u價(jià)評分星級是客戶對商品的定量評價(jià),通常在1-5分之間,屬于數(shù)值型信息。評論內(nèi)容是客戶對商品的定性評價(jià),表現(xiàn)為文字形式,是我們進(jìn)行文本分析的對象。我們要基于評分星級對產(chǎn)品評論文本進(jìn)行情感分類。建模對評論內(nèi)容的主題做提取和分類,使一個主題代表企業(yè)的一項(xiàng)能力。基于正面(負(fù)面)評論樣本所得到的主題即為美的冰箱的優(yōu)勢(劣勢)。生成SW表以列表形式對優(yōu)劣勢進(jìn)行直觀呈現(xiàn)。消費(fèi)者評論信息步驟一從文檔的主題分布中隨機(jī)選擇一個主題步驟二從被選擇的主題的詞分布中隨機(jī)選擇一個詞作為該位置的詞文本主題分析(ThematicAnalysis)指對文本內(nèi)容與含義進(jìn)行有效概括與詮釋。LDA(LatentDirichletAllocation)模型是最為常用的文本主題分析模型,在LDA模型中,每個文檔可以被表示為對各個主題的概率分布,而每個主題又可以被表示為對各個詞的概率分布。8.3.2文本主題分析文檔中每個詞生成過程通過重復(fù)這一過程,可以生成整個文檔的詞序列。而LDA模型的目標(biāo)就是通過觀察到的文本數(shù)據(jù),推斷出最有可能的主題分布和詞分布,從而揭示文檔集合中的潛在主題結(jié)構(gòu)。8.3.3基于LDA的文本主題分析文本主題分析的技術(shù)流程圖文本主題分析的技術(shù)流程文本數(shù)據(jù)清洗數(shù)據(jù)導(dǎo)入:導(dǎo)入名為“冰箱產(chǎn)品評論.xlsx”的數(shù)據(jù)集,其中有9167行觀測記錄和5列特征,最關(guān)鍵的三個變量是“評論級別”、“評論內(nèi)容”和“品牌”。數(shù)據(jù)篩選:我們主要分析海爾冰箱的優(yōu)劣勢,因此,需要剔除其他品牌的觀測記錄。缺失值處理:主要檢查各變量是否存在缺失值和重復(fù)值,無需進(jìn)行異常值檢測和處理。將缺失比例較高的特征變量刪除,并將變量缺失率達(dá)到10%以上的觀測記錄刪除。8.3.3基于LDA的文本主題分析步驟一:文本數(shù)據(jù)清洗8.3.3基于LDA的文本主題分析分詞結(jié)果步驟二:文本分詞和詞性標(biāo)注分詞:將文本拆分成一個個有意義的詞語刪除停用詞:將研究對象的代稱或者同義詞等非常用的停用詞排除在外。詞性標(biāo)注:主題分析時僅保留詞性標(biāo)注為名詞的詞匯,比如外觀、容量、包裝、設(shè)計(jì)等,其余詞性的詞匯均予以刪除。(1)正面評論篩選。根據(jù)“評論級別”的取值大小來區(qū)分正面評論與負(fù)面評論,先篩選出“評論級別”大于等于4的正面評論。(2)詞頻關(guān)鍵詞建模。將所有備選主題詞按照其在文本中出現(xiàn)的頻率(即詞頻)由高到低來排序,排序最靠前的就是關(guān)鍵詞。(3)LDA主題建模。若設(shè)定主題數(shù)為2、每個主題下的關(guān)鍵詞數(shù)為4,則代表評論內(nèi)容的所有詞匯整體上描述了2個主題,每個主題又涵蓋了4個細(xì)分主題。優(yōu)勢分析劣勢分析步驟三:優(yōu)劣勢分析8.3.3基于LDA的文本主題分析(1)負(fù)面評論篩選。先篩選出“評論級別”小于等于2的負(fù)面評論,保留下來觀測記錄中的各個名詞就是代表產(chǎn)品劣勢的備選主題詞。(2)詞頻關(guān)鍵詞建模?;趥溥x主題詞在負(fù)面評論中出現(xiàn)的頻率高低來判斷關(guān)鍵詞。(3)LDA主題建模。使用LDA主題模型對負(fù)面評論進(jìn)行主題建模,設(shè)定主題數(shù)為2個,每個主題下的關(guān)鍵詞數(shù)為4個。SW分析結(jié)果列表結(jié)合內(nèi)部優(yōu)劣勢分析與外部機(jī)遇風(fēng)險(xiǎn),對比競爭對手優(yōu)劣勢,制定適合本公司發(fā)展的戰(zhàn)略,提升市場競爭力。競爭對手優(yōu)劣勢對比通過對商品評論內(nèi)容進(jìn)行主題建模,分析人員能夠得到研究對象的內(nèi)部優(yōu)勢和劣勢,并使用“生成SW表”選項(xiàng)將結(jié)果進(jìn)行列表展示。冰箱優(yōu)劣勢分析8.3.4企業(yè)優(yōu)勢和劣勢分析SW分析結(jié)果列表(優(yōu)勢/劣勢清單)04基于Kmeans聚類的戰(zhàn)略群組分析8.4.1實(shí)訓(xùn)任務(wù)要求與特點(diǎn)8.4.2聚類分析8.4.3價(jià)格-銷量聚類分析8.4.1實(shí)訓(xùn)任務(wù)要求與特點(diǎn)對市場上的冰箱產(chǎn)品按照價(jià)格-銷量兩個維度進(jìn)行聚類,以便對冰箱產(chǎn)業(yè)進(jìn)行戰(zhàn)略群組分析。目前,在國內(nèi)市場上銷售的冰箱品牌多達(dá)30個左右,有的品牌在價(jià)格定位和銷售策略上存在巨大差異,但也有一些品牌擁有相近的商品單價(jià),并且取得了相似的銷量(如表所示)。很顯然,在我國冰箱產(chǎn)業(yè)中存在多個戰(zhàn)略群組?;趦r(jià)格和銷量對冰箱產(chǎn)業(yè)進(jìn)行戰(zhàn)略群組分析能夠幫助冰箱企業(yè)或潛在進(jìn)入者進(jìn)行戰(zhàn)略決策。本任務(wù)所使用的數(shù)據(jù)源自電商平臺,使用真實(shí)有效的消費(fèi)者評論數(shù)作為銷量的代理變量。常見的聚類算法有K均值聚類(Kmeans),基于密度的聚類算法(DBSCAN),層次聚類算法(AGNES、Birch等),親和傳播聚類算法(AffinityPropagation)和均值漂移聚類算法(MeanShift)等。以K均值聚類為例,其實(shí)現(xiàn)過程和原理如下:1)隨機(jī)選擇K個數(shù)據(jù)點(diǎn)作為初始質(zhì)心;2)將每個數(shù)據(jù)點(diǎn)分配到與之最近的質(zhì)心所在的簇中;3)重新計(jì)算每個簇的質(zhì)心;4)重復(fù)前述步驟2)和3),直到簇內(nèi)的誤差平方和最小化。聚類算法基本原理適用場景Kmeans?基于數(shù)據(jù)點(diǎn)之間的距離將數(shù)據(jù)劃分為K個簇,適用于凸形簇結(jié)構(gòu)市場細(xì)分、客戶群體分析、產(chǎn)品推薦等DBSCANe基于數(shù)據(jù)點(diǎn)的密度尋找高密度區(qū)域形成簇,適用于任意形狀的簇結(jié)構(gòu)異常檢測、噪聲過濾、地理信息數(shù)據(jù)聚類等AGNESe自下而上合并相似簇形成層次化結(jié)構(gòu),適用于不同尺度的簇結(jié)構(gòu)生物學(xué)分類、醫(yī)療影像分析等Birche利用樹狀結(jié)構(gòu)逐步合并數(shù)據(jù)點(diǎn)形成簇,適用于大規(guī)模數(shù)據(jù)集的聚類分析大規(guī)模數(shù)據(jù)的聚類分析、客戶行為分析等AffinityPropag
ation?根據(jù)數(shù)據(jù)點(diǎn)之間的相似性選擇代表點(diǎn)形成簇,適應(yīng)于數(shù)據(jù)非球形分布圖像分割、社交網(wǎng)絡(luò)分析、異常檢測等MeanShifte通過調(diào)整數(shù)據(jù)點(diǎn)密度中心找到局部密度最大值形成簇,適用于密度估計(jì)空間聚類、圖像分割、自動駕駛領(lǐng)域等不同聚類算法的比較8.4.2聚類分析聚類分析(Cluster)是一種無監(jiān)督學(xué)習(xí)方法,指的是將相似的對象歸入同一個類別,也即同一個“簇”;“簇”就是聚類之后形成的具有相似特征和行為模式的群體。8.4.3價(jià)格-銷量聚類分析聚類分析的技術(shù)流程圖聚類分析技術(shù)流
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年軟件編程進(jìn)階Java編程技巧高頻考點(diǎn)解析
- 2026年?duì)I養(yǎng)師營養(yǎng)學(xué)基礎(chǔ)知識題集
- 2026年材料科學(xué)試題集材料制備材料性能與加工題目
- 2026年互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)筆試題目及答案
- 乙型肝炎病毒變異與護(hù)理應(yīng)對
- 2026年閩北職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試備考題庫含詳細(xì)答案解析
- 2026年青海交通職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)筆試模擬試題含詳細(xì)答案解析
- 2026年廣西體育高等專科學(xué)校單招綜合素質(zhì)考試備考題庫含詳細(xì)答案解析
- 2026年河南檢察職業(yè)學(xué)院單招綜合素質(zhì)考試備考試題含詳細(xì)答案解析
- 外貿(mào)業(yè)務(wù)新人培訓(xùn)
- 七大浪費(fèi)考試試卷及答案
- GB/T 10810.1-2025眼鏡鏡片第1部分:單焦和多焦
- 新版GCP培訓(xùn)課件
- 客戶開發(fā)流程圖
- 音樂節(jié)活動場地租賃合同
- 風(fēng)險(xiǎn)管理顧問協(xié)議
- 一年級下冊字帖筆順
- 2024屆高考語文復(fù)習(xí):散文訓(xùn)練王劍冰散文(含解析)
- SWITCH暗黑破壞神3超級金手指修改 版本號:2.7.7.92380
- 二尖瓣狹窄講課課件
- 腸造瘺術(shù)后護(hù)理查房
評論
0/150
提交評論