Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價(jià)格指數(shù)_第1頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價(jià)格指數(shù)_第2頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價(jià)格指數(shù)_第3頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價(jià)格指數(shù)_第4頁
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件 6-4.股票交易數(shù)據(jù)與股票價(jià)格指數(shù)_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第6章

金融數(shù)據(jù)基礎(chǔ)股票交易數(shù)據(jù)基本知識(shí)股票交易數(shù)據(jù)生產(chǎn)場景高頻數(shù)據(jù)(10檔行情)股票交易日頻數(shù)據(jù)和股票價(jià)格指數(shù)股票交易數(shù)據(jù)基本知識(shí)第6章

股票交易數(shù)據(jù)最主要是兩個(gè)方面:一個(gè)是價(jià),包括成交價(jià)、委托價(jià);一個(gè)是量,包括成交量、委托量;一般地,以日為單位的交易數(shù)據(jù)(統(tǒng)計(jì)當(dāng)天的交易情況,比如開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)是多少,總成交量又是多少等),主要是成交價(jià)和成交量數(shù)據(jù),沒有委托價(jià)和量數(shù)據(jù)。以秒、分鐘為單位的交易數(shù)據(jù)(稱為高頻數(shù)據(jù)),則更為詳細(xì),不僅包括成交價(jià)、成交量數(shù)據(jù),還包括委托量、委托價(jià)數(shù)據(jù)。股票交易數(shù)據(jù)基本知識(shí)第6章

我們以一個(gè)買賣白菜的市場為例,形象的解釋這些術(shù)語。為了公平起見,我們對(duì)日常的白菜市場制定一些規(guī)則。首先,有賣白菜的,我們稱為供應(yīng)方,或者是賣方;同樣的,也有買白菜的,我們稱為需求方,或者是買方其次,這個(gè)菜市場有一個(gè)開放時(shí)間,比如9:15-15:00,其中11:30-13:00休息。為了使買賣雙方都有一個(gè)公平的價(jià)格,它應(yīng)該由市場決定。9:15-9:25這10分鐘內(nèi),在場的買方都報(bào)出自己需要購買的數(shù)量和單價(jià),賣方也報(bào)出自己能供應(yīng)的數(shù)量及單價(jià)。10分鐘結(jié)束后,不允許再報(bào)了,我們要找到這樣一個(gè)價(jià)格,使得成交量最大化,就是第一筆成交價(jià)格,稱為開盤價(jià),這個(gè)過程稱為集合競價(jià)。開盤價(jià)是買賣雙方最早的集體博弈的結(jié)果,比較有意義,為了讓雙方都有一個(gè)短暫的消化時(shí)間,9:25-9:30這5分鐘內(nèi)不交易。9:30開始繼續(xù)交易,交易價(jià)格的產(chǎn)生不再是通過集合競價(jià),而是進(jìn)入連續(xù)競價(jià)階段。股票交易數(shù)據(jù)基本知識(shí)第6章

連續(xù)競價(jià)交易,即買賣雙方都可以隨時(shí)報(bào)出自己的數(shù)量和單價(jià),但又是如何促成交易的呢?這里有一個(gè)原則,即價(jià)格越優(yōu)的報(bào)單就越排在前面,如果價(jià)格都一樣,則先報(bào)的排在前面,即價(jià)格優(yōu)先、時(shí)間優(yōu)先原則。何為優(yōu)的報(bào)價(jià),對(duì)于買方,越高的報(bào)價(jià)就越優(yōu);對(duì)于賣方,越低的報(bào)價(jià)越優(yōu);這樣,只要符合買賣雙方的交易條件,就會(huì)連續(xù)成交,一直持續(xù)到結(jié)束。最后一筆交易的價(jià)格,即為收盤價(jià)。統(tǒng)計(jì)當(dāng)天所有的交易,價(jià)格最高的即為最高價(jià)、最低的即為最低價(jià)。當(dāng)然,交易也會(huì)產(chǎn)生交易量和交易金額等數(shù)據(jù)。最后,一天交易結(jié)束之后統(tǒng)計(jì)的數(shù)據(jù)稱為日頻數(shù)據(jù),一天只有一條記錄,主要指標(biāo)數(shù)據(jù)是當(dāng)天的開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、總成交量、總成交金額。如果以秒或分鐘為頻率統(tǒng)計(jì)的數(shù)據(jù),稱為高頻數(shù)據(jù),他們主要是統(tǒng)計(jì)截止當(dāng)前時(shí)間和相鄰兩個(gè)時(shí)間點(diǎn)產(chǎn)生的數(shù)據(jù)。高頻數(shù)據(jù)除了成交價(jià)格、成交量和金額之外,還有一些未成交的買賣雙方委托價(jià)格和委托量數(shù)據(jù)。如果把白菜比喻成股票等證券,白菜市場看成是證券交易所,買方和賣方看成投資者,產(chǎn)生的數(shù)據(jù)就是股票交易數(shù)據(jù)。股票交易數(shù)據(jù)生產(chǎn)場景第6章

我們可以想象這樣一個(gè)場景,一個(gè)投資者在券商的行情軟件提交委托訂單,而券商的行情軟件是與交易所交易系統(tǒng)聯(lián)網(wǎng)的,從而投資者的委托訂單被送達(dá)交易系統(tǒng),進(jìn)行撮合成交。目前市場上有數(shù)量眾多的投資者、券商和相關(guān)交易所,他們共同構(gòu)成了中國的證券期貨場內(nèi)交易市場這里有兩個(gè)微觀數(shù)據(jù):一個(gè)是投資者的委托訂單數(shù)據(jù),稱為逐筆委托數(shù)據(jù);一個(gè)是交易所系統(tǒng)的成交數(shù)據(jù),稱為逐筆成交數(shù)據(jù)。這兩個(gè)數(shù)據(jù)是時(shí)間序列數(shù)據(jù),時(shí)間精確到毫秒,詳細(xì)完整地記錄了每一位投資者每一筆委托訂單信息及交易系統(tǒng)每一筆交易的成交信息。高頻數(shù)據(jù)則是由這兩個(gè)微觀數(shù)據(jù)加工而成股票交易數(shù)據(jù)生產(chǎn)場景第6章

高頻數(shù)據(jù)分為兩種:一種是超高頻數(shù)據(jù),比如以上的逐筆委托數(shù)據(jù)和逐筆成交數(shù)據(jù),這是一類比較特殊的高頻數(shù)據(jù);一種是通常意義上的高頻數(shù)據(jù),屬于等間隔取樣(或者等間隔的整數(shù)倍取樣,主要是因?yàn)槿拥臅r(shí)候,沒有對(duì)應(yīng)的委托數(shù)據(jù)或成交數(shù)據(jù),則順延至下一次取樣,直到取樣成功為止)。這里的取樣,是指截止當(dāng)前時(shí)間,統(tǒng)計(jì)匯總逐筆委托數(shù)據(jù)和逐筆成交數(shù)據(jù)而形成的行情數(shù)據(jù)(或稱快照數(shù)據(jù))。匯總統(tǒng)計(jì)過程是由交易所完成的,我們只需接收交易所發(fā)送的行情數(shù)據(jù)即可。根據(jù)統(tǒng)計(jì)匯總的頻率高低和內(nèi)容的詳細(xì)程度不同,交易所分為基本行情(5檔)和深度行情(10檔和超高頻數(shù)據(jù))兩個(gè)品種。10檔高頻數(shù)據(jù)第6章

靜態(tài)字段:證券代碼、交易日期、昨收盤價(jià)時(shí)間字段:數(shù)據(jù)生成時(shí)間成交字段:(開、高、低、最新)價(jià)、截止當(dāng)前總成交筆數(shù)、分筆期間成交筆數(shù)、

截止當(dāng)前總成交量、分筆期間成交量、截止當(dāng)前總成交額、分筆期間成交額委托字段:賣委托總量、賣委托加權(quán)平均價(jià)、委賣10至委賣01價(jià)、申賣量10至申賣量01、

買委托總量、買委托加權(quán)平均價(jià)、委買01至委買10、委買量01至委買量10.說明:數(shù)據(jù)生成時(shí)間,其實(shí)就是統(tǒng)計(jì)截止時(shí)間,假設(shè)數(shù)據(jù)生成時(shí)間是0941.230,這個(gè)時(shí)間通常是某筆交易發(fā)生的時(shí)間,則統(tǒng)計(jì)[0925.000,0941.230]該時(shí)間段內(nèi)逐筆成交數(shù)據(jù)表的成交數(shù)據(jù),形成本條記錄的成交字段數(shù)據(jù),同時(shí)再統(tǒng)計(jì)[0915,0941.230]該時(shí)間段內(nèi)有效的逐筆委托數(shù)據(jù)(不包括撤單的記錄),形成本條記錄的委托字段數(shù)據(jù)。換言之,成交字段數(shù)據(jù),就是截止0941.230該時(shí)間點(diǎn),已經(jīng)成交的事實(shí),而委托字段數(shù)據(jù)則是可供選擇的有望在下一刻成交的總量和可能獲得的價(jià)格,為推斷未來成交情況提供基礎(chǔ)數(shù)據(jù)。10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

以093013100這個(gè)數(shù)據(jù)生產(chǎn)時(shí)間的記錄為例,它表示的是平安銀行(代碼:000001)在20130301交易日(TRDDATE)內(nèi),截止093013100當(dāng)前時(shí)間(DATATIME)的最高成交價(jià)(HIGHPX)為22.930最低成交價(jià)(LOWPX)為22.820最近一次交易的價(jià)格(最新價(jià),LASTPX)為22.880,累計(jì)發(fā)生的總成交量(TOTALVOLUME)為1889900分筆期間的成交量(與上一條記錄之間的時(shí)間間隔發(fā)生的交易量,CQ)為10400可供購買的總量(即賣方的總供應(yīng)量,TOTALOFFERQTY)為6470952其中賣方提供的最低價(jià)格(S01)為22.900賣方提供的最低價(jià)位上的供應(yīng)量(SV01)為372617……日頻數(shù)據(jù)第6章

日頻交易數(shù)據(jù),主要是統(tǒng)計(jì)當(dāng)天交易情況的數(shù)據(jù),上一節(jié)也提到,高頻交易10檔行情數(shù)據(jù)表最后一條記錄數(shù)據(jù)就是日頻交易數(shù)據(jù)的來源,字段包括股票代碼、交易日期、收盤價(jià)、成交量、成交金額、開盤價(jià)、最高價(jià)、最低價(jià)等。StkcdTrddtClsprcDnshrtrdDnvaltrdOpnprcHiprcLoprcAdjprcwdAdjprcnd3000152017-05-1532.883314184107995576.532.432.8832.35244.9883236.32463000152017-05-1633.8474677915804871132.833.8832.5251.8433242.93713000152017-05-1733.31373243012511258333.5733.933.26248.1923239.41523000152017-05-1822.235758990128095499.322.0622.4921.89249.7941239.66663000152017-05-1922.46449048145514093.822.2722.9522.02251.7044241.49943000152017-05-2222.574798200107396565.522.4622.8522253.6146243.3322……………………………………………………由于分紅送股轉(zhuǎn)增股等行為,正常的收盤價(jià)是不具可比性的,基于投資者權(quán)益不變的原則(假設(shè)投資者在除權(quán)之前購買了股票或者是一位長期投資者,公司的送股、轉(zhuǎn)增股和分紅等權(quán)益均享有,即個(gè)人的資產(chǎn)權(quán)益不發(fā)生變化),需要對(duì)這個(gè)收盤價(jià)做出調(diào)整,于是衍生出了常見的兩個(gè)指標(biāo):考慮現(xiàn)金紅利再投資的收盤價(jià)可比價(jià)和不考慮現(xiàn)金紅利再投資的收盤價(jià)可比價(jià)股票價(jià)格指數(shù)第6章

股票價(jià)格指數(shù),反映多只股票或股票投資組合整體趨勢的指標(biāo),比如:反映上海證券交易所A股整體趨勢的上證A股指數(shù);反映深圳證券交易所A股主板、中小板和創(chuàng)業(yè)板各板塊整體趨勢的深證主板指數(shù)、中小板指數(shù)和創(chuàng)業(yè)板指數(shù);反映中國大陸A股市場整體趨勢的滬深300指數(shù)(從上海、深圳兩個(gè)證券交易所選取具有代表性的300只股票作為樣本進(jìn)行計(jì)算)。事實(shí)上,股票價(jià)格指數(shù)屬于衍生性指標(biāo),其基礎(chǔ)數(shù)據(jù)是個(gè)股交易數(shù)據(jù),其計(jì)算公式為:股票價(jià)格指數(shù)=指數(shù)所包含的股票總市值/指數(shù)所包含的股票基準(zhǔn)日總市值。這里的總市值一般為調(diào)整性總市值,即根據(jù)不同的規(guī)則約束和調(diào)整機(jī)制,選擇個(gè)股范圍,并對(duì)參與計(jì)算的個(gè)股賦予不同的權(quán)重。股票價(jià)格指數(shù)第6章

為了方便理解,我們基于深圳創(chuàng)業(yè)板的所有股票2017年個(gè)股交易數(shù)據(jù),自建一個(gè)指數(shù)。StkcdTrddtClsprcDnshrtrdDnvaltrdOpnprcHiprcLoprc3000012017-01-0317.428140604898570217.3617.5217.343000012017-01-0417.7548001088465166217.4117.8917.333000012017-01-0517.6533944986008666217.7517.8617.613000012017-01-0617.4130020605243240417.6417.6617.383000012017-01-0917.4424145834205844017.3717.5417.313000012017-01-1017.3520724093604314717.3917.4717.323000012017-01-1117.6877575881.37E+0817.3518.1617.123000012017-01-1218.05107386841.93E+0817.6918.1417.453000012017-01-1317.4158797771.05E+0817.9618.117.4…………………………………………字段依次表示股票代碼、交易日期、收盤價(jià)、交易量、交易金額、開盤價(jià)、最高價(jià)和最低價(jià)。股票價(jià)格指數(shù)第6章

以2017年第一個(gè)交易日(2017-01-03)為基準(zhǔn)日,基點(diǎn)設(shè)為1000點(diǎn),其計(jì)算公式為:每日總市值/基準(zhǔn)日總市值*1000,進(jìn)一步地,我們還將其指數(shù)趨勢圖繪制出來importpandasaspdimportmatplotlib.pyplotaspltimportnumpyasnpplt.rcParams['font.sans-serif']='SimHei'df=pd.read_excel('創(chuàng)業(yè)板2017年個(gè)股交易數(shù)據(jù).xlsx')df1=df.groupby(['Trddt'])['Dnvaltrd'].sum()#分組統(tǒng)計(jì)每日總市值index=df1.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論