聚類規(guī)則在金融行業(yè)的應(yīng)用分析_第1頁
聚類規(guī)則在金融行業(yè)的應(yīng)用分析_第2頁
聚類規(guī)則在金融行業(yè)的應(yīng)用分析_第3頁
聚類規(guī)則在金融行業(yè)的應(yīng)用分析_第4頁
聚類規(guī)則在金融行業(yè)的應(yīng)用分析_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

聚類規(guī)則在金融行業(yè)的應(yīng)用分析聚類規(guī)則在金融行業(yè)的應(yīng)用分析聚類規(guī)則在金融行業(yè)的應(yīng)用分析資料僅供參考文件編號:2022年4月聚類規(guī)則在金融行業(yè)的應(yīng)用分析版本號:A修改號:1頁次:1.0審核:批準(zhǔn):發(fā)布日期:聚類規(guī)則在金融行業(yè)的應(yīng)用分析摘要:俗話說“物以類聚,人以群分”。對事物進(jìn)行分類,是人們認(rèn)識事物的出發(fā)點(diǎn),也是人們認(rèn)識世界的一種重要方法。在自然科學(xué)和社會科學(xué)中,存在著大量的聚類問題。通俗地說,類是指相似對象的集合。聚類分析是數(shù)據(jù)挖掘中的一種重要方法。既可以作為獨(dú)立的方法透視數(shù)據(jù)分布,也可以作為其他分析方法的預(yù)處理步驟。然而,聚類與分類的不同在于,聚類所要求劃分的類是未知的。基于聚類規(guī)則的特點(diǎn),它被廣泛應(yīng)用在銀行、零售和保險(xiǎn)領(lǐng)域等其他各個(gè)領(lǐng)域,例如,應(yīng)用于股票市場的研究、營銷策略中的客戶細(xì)分等。關(guān)鍵詞:數(shù)據(jù)挖掘;聚類規(guī)則;金融;股票市場;板塊前言:俗話說“物以類聚,人以群分”。對事物進(jìn)行分類,是人們認(rèn)識事物的出發(fā)點(diǎn),也是人們認(rèn)識世界的一種重要方法。在自然科學(xué)和社會科學(xué)中,存在著大量的聚類問題。通俗地說,類是指相似對象的集合。聚類分析是數(shù)據(jù)挖掘中的一種重要方法。聚類與分類的不同在于,聚類所要求劃分的類是未知的?;诰垲愐?guī)則的特點(diǎn),它被廣泛應(yīng)用在銀行、零售和保險(xiǎn)領(lǐng)域等其他各個(gè)領(lǐng)域,例如,應(yīng)用于股票市場的研究、營銷策略中的客戶細(xì)分等。正文:聚類規(guī)則在金融行業(yè)的應(yīng)用分析近年來,計(jì)算機(jī)應(yīng)用范圍日益擴(kuò)大,數(shù)據(jù)庫技術(shù)和挖掘技術(shù)的不斷發(fā)展,因此利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力大幅度提高,人類所擁有的數(shù)據(jù)急劇增長,各種大型數(shù)據(jù)庫被廣泛應(yīng)用于各行各業(yè),而且這一勢頭將繼續(xù)發(fā)展下去。一般來說,數(shù)據(jù)挖掘是指從數(shù)據(jù)庫或數(shù)據(jù)倉庫中發(fā)現(xiàn)隱藏的、預(yù)先未知的、有趣的信息的過程,該過程可以看作是知識發(fā)現(xiàn)過程中的一個(gè)核心步驟。而聚類規(guī)則挖掘是數(shù)據(jù)挖掘中最活躍的研究方法之一。本文就數(shù)據(jù)挖掘中的聚類規(guī)則及其在金融行業(yè)的具體應(yīng)用進(jìn)行詳盡的分析與說明。一、聚類聚類是把對象或樣本的集合分組成為多個(gè)簇的過程,使同一個(gè)組中的對象具有較高的相似度,而不同類的對象差別較大。相異度是根據(jù)描述對象的屬性值進(jìn)行計(jì)算的,距離通常采用相異度度量方式。在許多應(yīng)用場合,可以把一個(gè)簇中的對象作為一個(gè)整體對待。聚類源于很多領(lǐng)域,包括數(shù)學(xué),計(jì)算機(jī)科學(xué),統(tǒng)計(jì)學(xué),生物學(xué)和經(jīng)濟(jì)學(xué)。在不同的應(yīng)用領(lǐng)域,很多聚類技術(shù)都得到了發(fā)展,這些技術(shù)方法被用作描述數(shù)據(jù),衡量不同數(shù)據(jù)源間的相似性,以及把數(shù)據(jù)源分類到不同的簇中。二、聚類規(guī)則的概念聚類規(guī)則就是通過對樣本或指標(biāo)進(jìn)行量化分類,討論的對象是大量的樣品,要求能按各自的特性進(jìn)行合理的分類。其目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。聚類規(guī)則是一種重要的人類行為。早在孩提時(shí)代,一個(gè)人就通過不斷地改進(jìn)下意識中的聚類模式來學(xué)會如何區(qū)分貓和狗,或者動物和植物。三、聚類規(guī)則的分析聚類規(guī)則是一個(gè)富有挑戰(zhàn)性的研究領(lǐng)域,它的潛在應(yīng)用提出了各自特殊的要求。數(shù)據(jù)挖掘?qū)垲惖牡湫鸵笕缦拢嚎缮炜s性、處理不同類型屬性的能力、發(fā)現(xiàn)任意形狀的聚類、用于決定輸入?yún)?shù)的領(lǐng)域知識最小化、處理噪聲數(shù)據(jù)的能力、對于輸入記錄的順序不敏感、高維性、基于約束的聚類、可解釋性和可用性。建立模型:設(shè)有n個(gè)樣品,p個(gè)指標(biāo),每個(gè)樣品都有這p個(gè)指標(biāo)的觀察值,設(shè)第i個(gè)樣品的第j個(gè)指標(biāo)的觀察值為xij,把n個(gè)樣品看成p維空間中的n個(gè)點(diǎn),則兩個(gè)樣品間親疏程度可用p維空間中兩點(diǎn)的距離來度量。令dij表示樣品xi與xj的距離。定義距離公式——明考斯基距離,即:dij(q)=[∑|xik-xjk|q]1/q當(dāng)q=1時(shí),明考斯基距離變?yōu)槁D距離:dij(1)=∑|xik-xjk|當(dāng)q=2時(shí),明考斯基距離變?yōu)闅W幾里得距離:dij(2)=[∑|xik-xjk|2]1/2聚類分析的職能是建立一種分類方法,它是將一批樣品或變量,按照他們在性質(zhì)上的親疏程度進(jìn)行分類叫。凡是具有數(shù)值特征的變量和樣品都可以采用系統(tǒng)聚類方法,選擇不同的距離和聚類方法可以獲得滿意的數(shù)值分類效果。聚類分析法是把個(gè)體逐個(gè)地合并成一些子集,直至整個(gè)總體都在一個(gè)集合之內(nèi)為止。其分類步驟如下:(1)聚類前先對數(shù)據(jù)進(jìn)行變換處理。(2)聚類分析處理的開始是各樣品自成一類(n個(gè)樣品一共有n類),計(jì)算各樣品之間的距離,并將距離最近的兩個(gè)樣品并成一類。(3)選擇并計(jì)算類與類之間的距離,并將距離最近的兩類合并,如果類的個(gè)數(shù)大于1,則繼續(xù)并類,直至所有樣品歸為一類為止。(4)最后繪制系統(tǒng)聚類譜系圖,按不同的分類標(biāo)準(zhǔn)或不同的分類原則,得出不同的分類結(jié)果。四、聚類規(guī)則在股票中的應(yīng)用分析隨著我國市場經(jīng)濟(jì)建設(shè)的高速發(fā)展,人們的金融意識和投資意識日益增強(qiáng),而作為市場經(jīng)濟(jì)的組成部分—股票市場,正逐步走向成熟與規(guī)范,越來越多的投資者把眼光投向了股票,歷史已經(jīng)證明股票是一種不僅在過去已提供了投資者可觀的長期利益,并且在將來也將提供良好機(jī)遇的投資媒體。然而,股價(jià)漲跌無常,股市變幻莫測,投資者要想在股市投資中贏取豐厚的投資回報(bào),成為一個(gè)成功的投資者,就得認(rèn)真研究上市公司的歷史、業(yè)績和發(fā)展前景,詳細(xì)分析上市公司的財(cái)務(wù)狀況,樹立以基本分析為主,技術(shù)分析為輔的投資理念,找出真正具有投資價(jià)值的股票,進(jìn)行長期投資。板塊是指具有共同特征的股票群。股市中的板塊可以從行業(yè)和產(chǎn)業(yè)、地域、時(shí)間、特殊題材等多種角度來劃分,而在每一板塊中又有幾十種甚至上百種股票。面對眾多股票及每個(gè)公司的眾多財(cái)務(wù)數(shù)據(jù),可以使用多元統(tǒng)計(jì)分析中的系統(tǒng)聚類分析方法,客觀、全面、準(zhǔn)確地分析并選出各板塊及板塊內(nèi)的績優(yōu)龍頭股和潛力股。下面就以一個(gè)具體的案例進(jìn)行簡單解釋分析。選取40家石油化工板塊的上市公司、根據(jù)2004年度證券中期報(bào)告中的信息及數(shù)據(jù),選擇每股收益、每股凈資產(chǎn)、凈資產(chǎn)收益率、每股資本公積金4項(xiàng)財(cái)務(wù)指標(biāo),對這些公司股票進(jìn)行了聚類分析,試圖將它們進(jìn)行分類,為股票的分析和選擇提供決策依據(jù)。數(shù)據(jù)如表1所示,資料來源上市公司中期報(bào)告。每股收益/元每股凈資產(chǎn)/元凈資產(chǎn)收益率%每股資本公積/元16009852600885360079246007645600727660074076007228600636960061810600409116003671260035213600339146003311560032816600319176003091860030119600299206002812160014122600091230009852400097925000953260008612700083028000822290008183000076331000755320007373300072834000698350006863600067737000637380006353900061840000598表12004年度40家上市公司4項(xiàng)財(cái)務(wù)指標(biāo)根據(jù)以上數(shù)據(jù)可以進(jìn)行如下聚類分析:首先將每個(gè)樣本當(dāng)作一類,然后根據(jù)樣本之間的相似程度并類,并計(jì)算新類與其它類之間的距離,再選擇相近者并類,每合并一次減少一類,繼續(xù)這一過程,直到所有樣本都并成一類為止。圖1聚類譜系圖聚類譜系圖直觀地顯示了這一聚類的過程,從圖1上可以清楚的看出各種股票的歸屬。根據(jù)選擇距離的不同可以根據(jù)圖形對股票進(jìn)行新的分類,另外根據(jù)聚類譜系圖可以清晰地看出每一種股票的原始分類及其聚類過程,可以了解各種股票的親疏關(guān)系程度。同樣,可以利用spss統(tǒng)計(jì)分析軟件中的聚類功能,選用歐氏距離來度量類與類之間的相似程度,聚類方法采用類平均法。通過計(jì)算機(jī)的計(jì)算,聚類分析結(jié)果如下(假設(shè)將樣品分成4類):第一類:{000635,000618,600792,600309};第二類:{600636,000677,600740};第三類:{1600352,000763,600367,600301};第四類:{1600281,000686,600319,600985,000698,000755,000737,000985,000818,600141,000598,600885,600764,600722,600328,600618,000861,600409,000728,600331,600299,000830,000822,600339,000637,000953,600727,600091,000979}。由以上聚類結(jié)果可以知道:第一、二、三類公司在經(jīng)營規(guī)模、經(jīng)營實(shí)力、技術(shù)水平等方面具有一定優(yōu)勢,競爭能力強(qiáng),經(jīng)營業(yè)績優(yōu)良,綜合財(cái)務(wù)狀況良好,屬石油化工板塊的績優(yōu)龍頭股,具有發(fā)展?jié)摿烷L期投資價(jià)值,是石油化工板塊中投資者的首選投資對象。其中第一類的000635,000618,600792,600309凈資產(chǎn)收益率在15%以上具有較強(qiáng)的資本積累能力和較高的成長性,但其負(fù)債較高。第二類的600636,000677,600740每股收益較高,具有較強(qiáng)的獲利能力。第三類的600352,000763,600367,600301綜合能力較強(qiáng),財(cái)務(wù)指標(biāo)較好。然而第四類公司業(yè)績一般,投資者應(yīng)謹(jǐn)慎介人,可多加觀望?;谏鲜鼍垲愐?guī)則在股票中的應(yīng)用,可以看出,將多項(xiàng)財(cái)務(wù)指標(biāo)樣本經(jīng)過一系列的聚類分析,通過改變樣本間的距離,最終將同樣屬性和指標(biāo)的數(shù)據(jù)聚集到一起,得出相應(yīng)數(shù)據(jù)組的數(shù)據(jù)特性,為投資者提供更好的投資方向和范圍,可以大幅降低投資風(fēng)險(xiǎn)。結(jié)論:聚類是把對象或樣本的集合分組成為多個(gè)簇的過程,使同一個(gè)組中的對象具有較高的相似度,而不同類的對象差別較大。聚類分析是數(shù)據(jù)挖掘中的一種重要方法,是一種無監(jiān)督學(xué)習(xí)。它既可以作為獨(dú)立的方法透視數(shù)據(jù)分布,也可以作為其他分析方法的預(yù)處理步驟。也是一個(gè)富有挑戰(zhàn)性的研究領(lǐng)域,它的潛在應(yīng)用提出了各自特殊的要求。因?yàn)榍皟纱握撐囊彩墙鹑谛袠I(yè),我寫的又分別是銀行和保險(xiǎn),所以這次想找一個(gè)不一樣的領(lǐng)域進(jìn)行研究??紤]到現(xiàn)在股票市場熱度很強(qiáng),父母以及周圍同學(xué)都有涉及這一方面,所以這次我選擇了股票市場中利用聚類規(guī)則分析股票風(fēng)險(xiǎn)的案例,用以說明聚類在金融行業(yè)的應(yīng)用、選取那些數(shù)據(jù)、經(jīng)過怎樣的分析、得到怎樣的結(jié)果、為投資者進(jìn)行投資提供了哪些方向。聚類分析能綜合多項(xiàng)財(cái)務(wù)指標(biāo)來反映上市公司的盈利能力和發(fā)展水平,為分類和評

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論