版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
隨機(jī)過程筆記2015-05-10許鐵混沌巡洋第一部分:為什么要研究隨機(jī)過程?人類認(rèn)識世界的歷史,就是一認(rèn)識和描繪各種運(yùn)動的歷史,從宏觀的天體運(yùn)動到分子的運(yùn)動,到人心理的運(yùn)動-我們通稱為變化,就是一個東西隨時間的改變。人們最成功的描繪運(yùn)動的模型是牛頓的天體運(yùn)動,確定性是牛頓體系最大的特征。給定位置和速度,運(yùn)動軌跡即確定。但是20實際后的科學(xué)卻失去了牛頓美麗的確定性光環(huán)。因為當(dāng)人們試圖描繪一些真實世界,充滿復(fù)雜而未知因素的運(yùn)動時候,人們發(fā)現(xiàn)不確定的因素(通常稱之為噪音)對事物的變化至關(guān)重要,而牛頓的方法幾乎難以應(yīng)用。而我們所能夠給出的最好的對事物變化的東西,是一套叫概率論的東西。而與之相應(yīng)的產(chǎn)生的一個全新的研究運(yùn)動的方法-隨機(jī)過程,對不確定性下的運(yùn)動進(jìn)行精細(xì)的數(shù)學(xué)描述。我們周邊充滿了各種各樣的數(shù)據(jù),所謂大數(shù)據(jù)時代,這些數(shù)據(jù)最基本的特點(diǎn)就是含有巨量的噪音,而隨機(jī)過程就是從這些噪音里提取信息的武器。*其實我們生活中也處處充滿"噪音"。比如說我們每天發(fā)郵件,經(jīng)常有一些人時回時不回。那些不回的人到底是忘了還是真的不想回,我們卻不知道。一個書呆子統(tǒng)計學(xué)家會告訴你,你無法從一次的行為評判他,而要看他一貫的表現(xiàn)。第一個隨機(jī)過程方法的偉大勝利是愛因斯坦的布朗運(yùn)動。一些小花粉在水里,受到水分子不停碰撞,而呈現(xiàn)隨機(jī)的運(yùn)動(花粉顆粒由于很小比較容易受到水分子熱擾動的影響)。研究這些花粉的微小運(yùn)動似乎有點(diǎn)天然呆,我們卻從中找到了分子世界重要的信息。而花粉那無序與多變的軌道,也為我們提供了隨機(jī)運(yùn)動的范式(隨機(jī)游走X計算機(jī)生成的十個粒子的布朗運(yùn)動軌跡如果給隨機(jī)過程打個比方,它就像是一個充滿交叉小徑的花園。你站在現(xiàn)在的點(diǎn)上,看未來的變化,未來有千萬種變化的方式,每一種可能又不斷分叉變化出其它可能。第二部分:描述隨機(jī)過程的武器隨機(jī)過程怎么研究?幾樣神器是不可缺少的。.概率空間:面對不可確定的未來,無非有兩件事需要關(guān)心,一個是有哪些可以實現(xiàn)的可能,一個是每種可能的大小,前者定義一個事件空間(態(tài)空間),后者定義一個數(shù)-概率。關(guān)鍵這些信息從哪里來呢?我們?nèi)绾沃酪l(fā)生什么?又如何知道多多大可能發(fā)生?-歷史。概率論的思維基點(diǎn)其實是:日光之下并無新事。我們對未來的預(yù)測來源于對過于的經(jīng)驗積累,而溝通過去經(jīng)驗與未來預(yù)測的工具就是概率。所謂一件事發(fā)生可能性大小,就是一件事在歷史中發(fā)生的頻率。當(dāng)然很多情況下概率也可以通過已知理論用演繹法推得,但是最根本的,還是由經(jīng)驗確定的概率。概率,我們中學(xué)數(shù)學(xué)都學(xué)過它是一個事件出現(xiàn)的頻率,但它的含義其實很深很深。因為一個事件出現(xiàn)的頻率來自于歷史,而概率卻用于對未來的預(yù)測,因此,概率包含的一個基本假設(shè)就是未來和過去的一致性-你要用概率,你所研究的對象要有可重復(fù)性。這其實假設(shè)了概率所研究的事件具有的某種穩(wěn)定性,一旦這些一個過程是一個隨時間劇烈變化的過程,概率幾乎就不能應(yīng)用。所以這里只能說概率是一種近似,他對于研究那些比較簡單的物理過程,如投擲硬幣,才完全有效。所以,所謂概率空間,只能是一種近似,他是人類現(xiàn)有知識的總和,我們用它描述已知的未知,但是卻從來無法描述未知的未知-被我們稱作黑天鵝的事件,因為真正的未來,永遠(yuǎn)無法只有已知的可能性(感興趣的請參看本人舊文-高斯與天鵝X在大多數(shù)時候,我們還是日光之下并無新事,因此,概論的威力依然不可小覷。有關(guān)概率空間的思維,可以立刻滅掉一些看似燒腦實際腦殘的題目:假設(shè)你在進(jìn)行一個游戲節(jié)目?,F(xiàn)給三扇門供你選擇:一扇門后面是一輛轎車,另兩扇門后面什么都沒有。你的目的當(dāng)然是要想得到比較值錢的轎車,但你卻并不能看到門后面的真實情況。主持人先讓你作第一次選擇。在你選擇了一扇門后,知道其余兩扇門后面是什么的主持人,打開了另一扇門給你看,而且,當(dāng)然,那里什么都沒有。現(xiàn)在主持人告訴你,你還有一次選擇的機(jī)會。那么,請你考慮一下,你是堅持第一次的選擇不變,還是改變第一次的選擇,更有可能得到轎車?回答這個問題的關(guān)鍵即事件空間,在主持人打開門之前,事件空間即車的位置有三種可能,你有1/3的可能拿到車。當(dāng)主持人選擇打開門的時候,它實際上幫你做了一個選擇,那就是告你某個車庫沒有車,這時候事件空間發(fā)生了變化,因為你的已知變了。如果說以前的事件空間是或者你選擇的車庫有車(1/3),或者另外兩個車庫中的某一個有車(各1/3)?,F(xiàn)在的情況呢?被打開的車庫有車的概率變?yōu)?,因此你選擇的車庫沒車的情況下車的位置已經(jīng)變成確定的了,概率為2/3e而原來你車庫有車的選項卻不受到這一事件的影響(依然1/3概率),所以你當(dāng)然要選擇換車庫。這個例子第一個說明的道理是概率是主觀的,來自于你頭腦中的信息?;剡^頭看,主持人的舉動增加了你對兩個車庫的信息,而車是不變的,所以你要根據(jù)新的信息調(diào)整概率空間。*此實例是好的思維方法的力量的典范,如果你沒有這個事件空間的角度,恐怕要做無數(shù)的試驗了。 條件概率:現(xiàn)實生活中的一般都以條件概率的形式出現(xiàn),即給定一定的已知條件,信息我們會得到什么樣的概率。對這一大類問題可以引出整個貝葉斯分析理論,將在后續(xù)篇章中介紹。.隨機(jī)變量:你投擲篩子,得到6個結(jié)果,每種結(jié)果有1/6的可能。你把態(tài)空間的種種可能性都用數(shù)字表達(dá)出來,用一套用輕度裝逼的數(shù)學(xué)語言描述,就是隨機(jī)變量。這個東西包含所有輸出的可能性以及相應(yīng)的概率,這些可能性(態(tài)空間)和概率的對應(yīng)關(guān)系我們稱之為分布函數(shù)。如果態(tài)空間是連續(xù)的,我們就得到連續(xù)的分布函數(shù)形式。圖:一個二維高斯分布分布函數(shù):隨機(jī)變量已經(jīng)包含了兩個隨機(jī)過程研究的核心武器:態(tài)空間和分布函數(shù)。分布函數(shù)是提取隨機(jī)過程內(nèi)有用信息的第一手段。分布函數(shù)-是在大量數(shù)據(jù)中提取信息的入口。隨機(jī)變量的實現(xiàn):隨機(jī)變量可以看做一個實驗,你在實驗之前,結(jié)果是不確定的,你所有的是一團(tuán)可能性。當(dāng)你做完實驗,卻得到一個唯一的結(jié)果,只是預(yù)先不可知。期望:對一個隨機(jī)變量,已知其分布函數(shù),可以定義一個期望。這個東西由每個結(jié)果的取值和它的可能性共同決定,表達(dá)未來結(jié)果的加權(quán)平均值。實際中我們可以用實驗的方法確定這個數(shù)字,就是所謂蒙特卡洛方法,不停的投篩子然后做個統(tǒng)計,你所得到的結(jié)果的平均就是期望。(平均值和期望的區(qū)別就是第一個來自已有的數(shù)據(jù)的平均,第二是對根據(jù)已有的平均對未來的預(yù)測。)關(guān)于期望包含著一種投資世界里的基本思維方式,就是對收益的幅值和風(fēng)險(概率)一起考慮。經(jīng)常有一些時候一些出現(xiàn)機(jī)會極少而收益特別大的可能性決定了期望,如果你的心臟足夠強(qiáng)大,就應(yīng)該充分考慮這些高風(fēng)險高收益的可能。相關(guān)性:對于兩個隨機(jī)變量,你可以定義一個相關(guān)性covariance,描述一個隨機(jī)變量隨另一個而變化的趨勢。這個函數(shù)特別有用,它是現(xiàn)實生活中我們說兩個事物相關(guān)性的精確表達(dá)。理解這個算式特別簡單,這個量就是x和y波動乘積的期望,當(dāng)兩個變量是此消彼長,則為負(fù),共生共榮則為正,若兩個過程不相關(guān),則為0.方差:上述關(guān)系當(dāng)x=y我們得到方差,方差就是自己和自己的關(guān)聯(lián)函數(shù),當(dāng)隨機(jī)變量比較接近正態(tài)分布時候它可以描繪波動性的大小。對于N個隨機(jī)變量,任意兩個隨機(jī)變量可得到一個covariance,而這樣一組covariance構(gòu)成大名鼎鼎的covariancematrix.測量分布函數(shù)的武器-蒙特卡洛方法:搞定一個分布函數(shù),笨辦法也是最有用的方法就是蒙特卡洛方法。一般篩子情況下,篩子有6各面,每個面出現(xiàn)的概率有1/6,但是萬一篩子被做過手腳呢?所以最好的方法還是所謂蒙特卡洛抽樣,不停的玩,知道你認(rèn)為你可以穩(wěn)定得到每次可能性出現(xiàn)的頻率。所謂笨辦法確是最常用的,尤其是隨著高速計算機(jī)的普及。一些重大的工程,涉及太多復(fù)雜不好確定因素時候,我們就讓計算機(jī)模擬,設(shè)計一系列的蒙特卡洛抽樣來求得一些結(jié)果。*此名來自MonteCarlo摩納哥的賭場,其實賭場里也可以產(chǎn)生一些最厲害的數(shù)學(xué)思想。抽樣:在計算機(jī)里研究牽扯隨機(jī)變量的過程最基本的方法就是抽樣,抽樣就是已知分布函數(shù)取得一個隨機(jī)的結(jié)果的過程。我們要在計算機(jī)里模擬一個隨機(jī)過程都是通過抽樣來實現(xiàn)的。抽樣的成功與否決定這些計算機(jī)模擬(simulation)能在多少程度逼近真實。計算機(jī)的抽樣都是基于最簡單的隨機(jī)數(shù)生成器產(chǎn)生的,產(chǎn)生概率均等的均與分布(Uniformdistribution'但是這些"隨機(jī)數(shù)"實際是早已設(shè)定好的,因此更準(zhǔn)備的被稱作"偽隨機(jī)數(shù)"。而對于更加復(fù)雜的分布函數(shù)的抽樣,則有如層出不窮的算法解決它,比如大名鼎鼎的MarkovChainMonteCarlo(MCMC)方法,將在之后的章節(jié)介紹。第三部分:什么是隨機(jī)過程確定性過程研究一個量隨時間確定的變化,而隨機(jī)過程描述的是一個量隨時間可能的變化,在這個過程里,每一個時刻變化的方向都是不確定的,或者說隨機(jī)過程就是由一系列隨機(jī)變量組成,每一個時刻系統(tǒng)的狀態(tài)都由一個隨機(jī)變量表述,而整個過程則構(gòu)成態(tài)空間的一個軌跡(隨機(jī)過程的實現(xiàn)X一個隨機(jī)過程最終實現(xiàn),會得到一組隨時間變化的數(shù)值(態(tài)空間里的軌跡),實踐中我們都是從數(shù)據(jù)結(jié)果中推測一個隨機(jī)過程的性質(zhì)的。剛說過概率是建立在可重復(fù)性上,是一個理想模型,而建立在此上的隨機(jī)過程就更是一個理想化的模型,它暗含的是歷史可無限重復(fù),然后你把他們收集在一起看一看。我在一開頭的說的充滿分叉小徑的花園是一種比喻,但說的也是你需要站在平時時空(每一個時空包含一種歷史的可能性)的角度來看一個隨機(jī)過程的全貌。我們立刻發(fā)現(xiàn)這是一個超級復(fù)雜的問題,因為一個隨機(jī)過程具有無限多可能性。試想象一個最簡單的隨機(jī)過程,這個過程由N步組成,每一步都有兩個選擇(0,1),那么可能的路徑就有2的N次方個,這個隨機(jī)過程就要由2人N-1個概率來描述價既率只和為一減掉一個維度),用數(shù)學(xué)物理的語言就是極高維度的問題。*離散的時間序列是清晰表述隨機(jī)過程的入門方式,雖然更一般的表述是時間是連續(xù)的因此,能否研究一個隨機(jī)過程的關(guān)鍵就是減少問題的維度-這也是物理的核心思想。一下講一下達(dá)到這個目的發(fā)明的神器:馬爾科夫過程(MarkovProcesses)馬爾科夫過程,是隨機(jī)過程中的精華部分,其地位猶如牛頓定律在力學(xué)的地位。對于最一般的隨機(jī)過程,是無限復(fù)雜的,幸好,在我們?nèi)粘I钪?,很多隨機(jī)過程符合或近似更簡單的模型。其中目前一種最有效的框架成為馬爾科夫過程.所謂馬爾科夫過程,即隨機(jī)過程的每一步的結(jié)果最多只與上一步有關(guān),而與其它無關(guān)。好比你不停撒篩子,你每一次的結(jié)果不會影響未來的成績。馬爾可夫鏈(Markovchain):makov過程用數(shù)學(xué)語言表述就是馬爾科夫鏈,就像一臺熊熊駛過的火車,前一個車廂(上一步)拉著后一個(下一步),向前運(yùn)行。如果一個過程是markov過程,這個過程就得到了神簡化,你只需要知道第n步是如何與第n-1步相關(guān)的,一般由一組條件概率表述,就可以求得整個過程。一個巨大的隨機(jī)過程,其內(nèi)核僅僅是這樣一組條件概率,而知道了這組條件概率,就可以衍生整個過程。圖:一個典型的markov過程,每一個的結(jié)果只與上一步相關(guān),我們只需要一組條件概率(箭頭)來描述,每個條件概率告你如果態(tài)空間中的某一個事件發(fā)生,那么從這一點(diǎn)出發(fā),下一個事件發(fā)生的概率。我們不妨多想一下,如果第n步和第n-1步的關(guān)系不是隨機(jī)的,而是確定的,那我們得到了什么?我們聯(lián)想到牛頓力學(xué),牛頓力學(xué)也是此刻的狀態(tài)決定下一刻的變化,其本質(zhì)也是鏈?zhǔn)椒▌t,通過此刻與此刻最鄰近的未來的關(guān)系,衍生出整個宇宙的過去和未來,其靈魂同樣是降維?;蛘哒fmarkov就是隨機(jī)過程里的牛頓法則。Markov是不是真的是一個歷史無關(guān)的過程?N。!雖然第N+1步只與第N步有關(guān),但是第N步又包含第N-1步,所以通過鏈?zhǔn)椒▌t,歷史的信息還是可以傳遞到現(xiàn)在的。經(jīng)典表述:馬爾科夫鏈的核心條件概率表達(dá)式就是這臺火車鏈接不同車廂的鏈條。如果這個條件概率關(guān)系不隨時間變化,我們就得到經(jīng)典的穩(wěn)態(tài)馬爾科夫鏈。它有一個良好的性質(zhì),就是當(dāng)這個過程啟動一段時間就會進(jìn)入統(tǒng)計穩(wěn)態(tài),穩(wěn)態(tài)的分布函數(shù)與歷史路徑無關(guān)。一個簡單的例子:關(guān)于生育偏好是否影響男女比例的問題。我們知道過去的人喜歡生男孩,往往生女孩子就不停生,直到生到一個男生為止,因此就造成很多一大堆姐姐只有一個弟弟的家庭。我接觸過的一些特別聰明的人都會認(rèn)為這樣的行為會影響男女比例。大部分人覺得會造成女孩比例多,少數(shù)人認(rèn)為會增
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年農(nóng)業(yè)高技能人才培育策略
- 2026年呼叫中心服務(wù)質(zhì)量提升課程
- 2026河南南陽市市直機(jī)關(guān)遴選公務(wù)員37人備考題庫帶答案詳解
- 隱形技術(shù)的定義
- 職業(yè)噪聲工人心血管疾病一級預(yù)防實踐
- 職業(yè)健康監(jiān)護(hù)策略研究
- 職業(yè)健康大數(shù)據(jù)在職業(yè)病鑒定中的應(yīng)用
- 職業(yè)健康中的人機(jī)適應(yīng)性研究
- 齊齊哈爾2025年黑龍江齊齊哈爾龍江縣選調(diào)中小學(xué)校醫(yī)筆試歷年參考題庫附帶答案詳解
- 韶關(guān)廣東韶關(guān)高新區(qū)工會聯(lián)合會招聘社會化工會工作者筆試歷年參考題庫附帶答案詳解
- 泄漏管理培訓(xùn)課件
- 電子商務(wù)平臺項目運(yùn)營合作協(xié)議書范本
- 動設(shè)備監(jiān)測課件 振動狀態(tài)監(jiān)測技術(shù)基礎(chǔ)知識
- 服裝廠員工績效考核與獎懲制度
- 專題15平面解析幾何(選擇填空題)(第一部分)(解析版) - 大數(shù)據(jù)之十年高考真題(2014-2025)與優(yōu) 質(zhì)模擬題(新高考卷與全國理科卷)
- 部門考核方案
- 茜草素的藥代動力學(xué)和藥效學(xué)研究
- 檢測費(fèi)合同范本
- T-CPQS C010-2024 鑒賞收藏用潮流玩偶及類似用途產(chǎn)品
- 林業(yè)管理制度
- HG/T 3811-2023 工業(yè)溴化物試驗方法 (正式版)
評論
0/150
提交評論