版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
/圖3.4圖3.5Minard/圖3.6uJ>:<Duo?doteda>oOJGDPpercapita,PPP(constant2005internationalRegiPopulation,▼Lin0000Z000二00001000"oooooz0000SI0000010000S圖3.24圖3.25_/圖3.27e(9*4,9613.1圖K-Means_4.18K-Means和基于密度的聚類 ABABC/圖4.22LL63%11%圖6.2-少圖6.4J!”圖6.8圖6.13圖6.20中心極限定律,這也能算數(shù)學(xué)?從應(yīng)用學(xué)科的角度看(例如,計(jì)算機(jī)、管理學(xué)),統(tǒng)計(jì)學(xué)太數(shù)學(xué),一點(diǎn)也不應(yīng)用。分析數(shù)據(jù)就好好分析數(shù)常為此,反省自問(wèn):?jiǎn)栴}到底出在哪里?我輩應(yīng)該如何作為?學(xué)作為一個(gè)歷史非常短的學(xué)科,在它的發(fā)展歷史中,有不少杰出的學(xué)者做出了卓著的貢獻(xiàn)。是他們的卓著努力為統(tǒng)計(jì)學(xué)建立了扎實(shí)的理論基如果,我們有能力把統(tǒng)計(jì)學(xué)中最閃光的智慧,用最樸素而有趣的語(yǔ)言,結(jié)合生動(dòng)而有趣的故事表述出來(lái),那世界又會(huì)怎樣?如果能夠做到,統(tǒng)計(jì)學(xué)的美就可以被大家感受到。屆時(shí),統(tǒng)計(jì)學(xué)是不是數(shù)學(xué)重要嗎?統(tǒng)計(jì)學(xué)是不是應(yīng)用重要嗎?統(tǒng)計(jì)學(xué)就是統(tǒng)計(jì)學(xué),她既有理論,又有應(yīng)用。關(guān)鍵是,她很美,她真的很美,美得令人窒息,美得令人流連忘返,而我們都陶醉于她那獨(dú)特的美。請(qǐng)問(wèn),到哪里去找這樣一本書,專要寫這樣一本書的難度可想而知。首先,你要對(duì)統(tǒng)計(jì)學(xué)的宏觀理論框架,從歷史到最新前沿,非常熟悉。說(shuō)來(lái)慚愧,我做不到。其次,你要數(shù)學(xué)公式自由穿插,流暢而優(yōu)美地交織在一起。這對(duì)我來(lái)說(shuō)也很難。這樣一本書一定是跨學(xué)科的。與數(shù)據(jù)科學(xué)相關(guān)的領(lǐng)域可不僅僅是統(tǒng)計(jì)正當(dāng)我一籌莫展的時(shí)候,突然老天眷顧,統(tǒng)計(jì)之都大俠艦哥送給我他的新書《統(tǒng)計(jì)之美》。首先,我一下子就被目錄吸引了。從統(tǒng)計(jì)學(xué)科學(xué)何現(xiàn)有專著或者教材完全不同。這些章節(jié)的框架設(shè)計(jì)恢宏壯美,討論的問(wèn)題深刻而樸素,覆蓋的內(nèi)容從過(guò)去到未來(lái)。這樣的框架設(shè)計(jì),散發(fā)(或案例)有:上帝擲骰子、女士喝茶、尋找失蹤的核潛艇等。每個(gè)小故事都突出講述了一個(gè)統(tǒng)計(jì)學(xué)的智慧,一個(gè)知識(shí)點(diǎn)。通過(guò)這樣精煉而經(jīng)典的小故事,讓人們感受到統(tǒng)計(jì)學(xué)之美,她美在哪里?她美就美在統(tǒng)計(jì)學(xué)的智慧上,這些智慧變成了統(tǒng)計(jì)學(xué)思想,統(tǒng)計(jì)學(xué)思想變成了統(tǒng)計(jì)學(xué)理論,統(tǒng)計(jì)學(xué)理論變成了統(tǒng)計(jì)學(xué)的模型算法。噢,這個(gè)路途太長(zhǎng)了,難怪當(dāng)人們看到模型算法的時(shí)候,實(shí)在是想不起她原來(lái)的美了。2018年12英國(guó)學(xué)者李約瑟研究中國(guó)科技史時(shí)提出了一個(gè)問(wèn)題:“盡管中國(guó)古代對(duì)人類科技發(fā)展做出了很多重要貢獻(xiàn),但為什么科學(xué)和工業(yè)革命沒(méi)有在(Needham'sGrandQuestiono17世紀(jì)的西方,特別是文藝復(fù)興之后的歐洲?”李約瑟通過(guò)對(duì)中國(guó)科學(xué)技術(shù)史的研究⑴,在社會(huì)制度和地理環(huán)境中尋找答案。但這個(gè)問(wèn)題一直被國(guó)人拿來(lái)反思自己的文化和傳統(tǒng),很多人都分析出了各種原因,大多數(shù)人認(rèn)為中國(guó)的傳統(tǒng)文化中缺少科學(xué)精神、甚至沒(méi)有能夠產(chǎn)生現(xiàn)代科學(xué)的基因,再結(jié)合現(xiàn)實(shí)生活中的各種亂象,無(wú)不痛心疾首,都想治病救人。讓我們把時(shí)間拉回到百年前的中國(guó),轟轟烈烈的新文化運(yùn)動(dòng)已經(jīng)開(kāi)始,“德先生”和“先生”進(jìn)了中國(guó)。國(guó)人深切地認(rèn)識(shí)到了科學(xué)的威力,無(wú)數(shù)仁人志士立志向?qū)W,1923二千多年的無(wú)賴鬼”[2,很多科普作者越科普越心焦,質(zhì)疑中國(guó)科學(xué)精神的言論也仍然甚囂塵上。業(yè)的科學(xué)知識(shí)不應(yīng)苛責(zé),這是正?,F(xiàn)象,不同科學(xué)領(lǐng)域、不同知識(shí)內(nèi)容的科普是一項(xiàng)漫長(zhǎng)而有意義的事業(yè),更需要普及的可能是科學(xué)思維。學(xué),也不能說(shuō)理性主義是科學(xué)而經(jīng)驗(yàn)主義就不是科學(xué)。不同的歷史文化可能側(cè)重不同,我們不能因?yàn)橹袊?guó)歷史上三百年的特殊時(shí)期就質(zhì)疑整個(gè)歷史的科技成就,也不能因?yàn)橹袊?guó)傳統(tǒng)公理體系的缺失就否認(rèn)整個(gè)文化的科學(xué)精神,這是不科學(xué)的做法,也屬于沒(méi)有文化自信的表現(xiàn)。時(shí)代下已經(jīng)充分證明了經(jīng)驗(yàn)主義、歸納推理的強(qiáng)大之處,即使是如日中天的人工智能實(shí)際上也是大數(shù)據(jù)加上深度學(xué)習(xí)的歸納方法的成功。我科學(xué)的根基。庫(kù)恩認(rèn)為,科學(xué)很重要的特點(diǎn)在于其獨(dú)特的范式,在科學(xué)領(lǐng)域里大部分時(shí)間并沒(méi)有競(jìng)爭(zhēng)學(xué)派在質(zhì)問(wèn)彼此的目的和標(biāo)準(zhǔn),因此相比其他領(lǐng)域能夠取得明顯的進(jìn)步同。在不同的領(lǐng)域,大家遵循公認(rèn)的科學(xué)范式進(jìn)行研究,不管認(rèn)識(shí)論和推理邏輯方面有何不同的傾向,都巧合的是,當(dāng)年科玄論戰(zhàn)中“科學(xué)派”的主要理論基礎(chǔ)就是統(tǒng)計(jì)學(xué)大宗師卡爾?皮爾遜早期的代表作《科學(xué)的規(guī)范》【7】。當(dāng)年的皮爾遜還通向整個(gè)知識(shí)區(qū)域的唯一門徑。但是他也認(rèn)為無(wú)論在哪種情況下科學(xué)都不能證明任何固有的必然性,也不能以絕對(duì)的確定性證明它必須重差理論、概率論、統(tǒng)計(jì)理論來(lái)實(shí)現(xiàn)。后來(lái)隨著統(tǒng)計(jì)學(xué)的發(fā)展成熟,直到今天大數(shù)據(jù)和人工智能成為顯學(xué),都驗(yàn)證了皮爾遜當(dāng)年的觀點(diǎn)。也許是因?yàn)榭茖W(xué)這個(gè)詞聽(tīng)起來(lái)太高端,也可能是科學(xué)比較接近真理,現(xiàn)在很多科普過(guò)于強(qiáng)調(diào)精確科學(xué)或者“硬”科學(xué),有時(shí)候站在了普通人有些矯枉過(guò)正,我覺(jué)得還是允執(zhí)厥中比較好。能夠在概念世界和知覺(jué)世界⑺中達(dá)到和諧、能夠在演繹法與歸納法中達(dá)到平衡,統(tǒng)計(jì)學(xué)可能是納精神,或者神農(nóng)嘗百草的試驗(yàn)精神,還是后世天人合一的整體思維、觀過(guò)知仁的結(jié)果導(dǎo)向、未戰(zhàn)而廟算的預(yù)測(cè)習(xí)慣,都是深合統(tǒng)計(jì)之道很多人受到各種原因的誤導(dǎo)之后對(duì)中國(guó)的文化不自信,易于走向崇洋媚外的極端,這是不對(duì)的。即使是作為很多科學(xué)基礎(chǔ)的數(shù)學(xué),也不止一融合無(wú)間【91962年的文章Ml析?”[叫如今大師們的論斷都已言中,統(tǒng)計(jì)學(xué)與算法結(jié)合解決實(shí)際問(wèn)題,已經(jīng)漸成主流,甚至發(fā)展出了一門新的學(xué)科一據(jù)科學(xué)??ㄍ吡欣镌碓谖鞣綌?shù)學(xué)史中被認(rèn)為是微積分發(fā)明前的重要基礎(chǔ),而中國(guó)的祖眶原理與之等價(jià)[12]。萊布尼茨在提出二進(jìn)制的那篇著名文章[13]里直接引用了伏羲八卦,他還認(rèn)為“如果說(shuō)我們(歐洲人)在手工技能上與他們(中國(guó))不分上下、在理論科學(xué)方面超過(guò)他們的話,那么,在實(shí)踐哲學(xué)方面……我不得不汗顏地承認(rèn)他們遠(yuǎn)勝于我們”[14厲害(如果是這個(gè)目的的話,可以舉更多例子或者寫另一本書),僅僅只是為了澄清一些誤解,這些誤解既是對(duì)中國(guó)傳統(tǒng)的某種誤讀,同時(shí)也是科學(xué)思維上的某類誤區(qū)。我們追求理性和完美的體系,也希望能止于至善,但我們也不應(yīng)忽視經(jīng)驗(yàn)主義和觀察、試驗(yàn)、歸納、計(jì)算的力量,這些都是科學(xué),不應(yīng)偏頗。尤其對(duì)于普通人來(lái)說(shuō),多從觀察身邊的小事、解決實(shí)際問(wèn)題的角度訓(xùn)練科學(xué)思維,可能效果更好,畢竟“刻在如今這個(gè)理性與經(jīng)驗(yàn)、理論與實(shí)踐、演繹與歸納、公理體系與算法程序和諧統(tǒng)一的大好時(shí)代里,我們多了解一些統(tǒng)計(jì)學(xué),關(guān)注一下數(shù)據(jù)科時(shí)注意到的例子,嘗試介紹統(tǒng)計(jì)學(xué)的發(fā)展歷程、理論方法和應(yīng)用實(shí)務(wù)。受本人的經(jīng)驗(yàn)和學(xué)識(shí)所限,很多例子并不是最好的,也肯定存在各種疏漏,但是希望能做一些嘗試,和更多的人一起探索統(tǒng)計(jì)中的美,分享科學(xué)思維中比較人性化的一面。文中類似“⑴”的符號(hào)對(duì)應(yīng)到圖書最后的“參考文獻(xiàn)”中查找。全書中重要的概念和人名也可以到書末的“索引”中查找相應(yīng)的頁(yè)碼。這本書計(jì)劃了很久,也拖延了很久,感謝本書的策劃人成都道然科技有限責(zé)任公司的姚新軍先生,幫助我們謀篇布局、規(guī)劃時(shí)間以及處理各女兒從動(dòng)筆之初就開(kāi)始的陪伴。當(dāng)然,最需要的是提前感謝讀者的寬宏大量,本人才疏學(xué)淺,難免或有所遺漏或偏頗,希望能多多海涵和多2018年8第1?R^in664H-99 4-^-;+hr1:1^5CV|J*?1-*地船工11**±71157¥;66斷步3&4 ,.豕第2??ijtfrfEtC^II6捧呂和14.士堆k釗?三&uh¥黑客帝國(guó)和變形金剛??土苻人M/HIII-?耳地出5$白占箱盜施T1??結(jié)?;-!■田相壬n??文H唏土htTr顯壬1日勞利相親多少次與神奇的37?3.2.3深水王子與針眼畫師??…863.2.4“挑戰(zhàn)者”號(hào)航天飛機(jī)???88第4茗灑呂百重帀戻???吊用就VT煢棧上口和rs^-TT卜歹快腺J腔雄T&障華以IS5左吉4杲1-/KK-略匹砧4=fife第5孜不旳殳H統(tǒng)計(jì)學(xué)的hk?謝太垢在**kT7V+C-T-誰(shuí)說(shuō)菜鳥不會(huì)數(shù)據(jù)分析?AIExcel統(tǒng)計(jì)軟件和BI土棧丄柱圳卩旳取發(fā)Pythonmi本書作者最愛(ài)的R?…?R第1大英百科全書給統(tǒng)計(jì)學(xué)的定義是:“一門收集數(shù)據(jù)、分析數(shù)據(jù),并根據(jù)數(shù)據(jù)進(jìn)行推斷的藝術(shù)和科學(xué)”。關(guān)于統(tǒng)計(jì)的科學(xué)性,各種各樣介紹方共同點(diǎn)都是來(lái)源于生活,很多身邊的小事、長(zhǎng)輩的經(jīng)驗(yàn)、處事的直覺(jué),都蘊(yùn)含了豐富的統(tǒng)計(jì)學(xué)原理。統(tǒng)計(jì)學(xué)是一門應(yīng)用的科學(xué),枯燥的定理和嚇人的公式是其科學(xué)性的基礎(chǔ),但是很多應(yīng)用的原理和思路并沒(méi)有那么復(fù)雜。在本章中,我們將會(huì)第1理黃金時(shí)代及之前,科學(xué)家大多相信世界具有確定性,但是最近100第2學(xué)的數(shù)學(xué)基礎(chǔ)即可,讀者可以通過(guò)其中的內(nèi)容來(lái)了解概率論的發(fā)展過(guò)程和熟悉概率的思維方式。第3的科學(xué)內(nèi)涵。本節(jié)將通過(guò)具體的例子來(lái)探討這些統(tǒng)計(jì)思想中的科學(xué)道理和數(shù)學(xué)原理,不需要太多數(shù)學(xué)知識(shí),關(guān)鍵在于理解。第4邊界并沒(méi)有那么容易把握,一不小心就容易陷入機(jī)械論或者玄學(xué),如何更好地理解和應(yīng)用科學(xué),可以通過(guò)統(tǒng)計(jì)學(xué)來(lái)澄清很多問(wèn)題?!度w》【閔是劉慈欣的雨果獎(jiǎng)作品,是一部家喻戶曉的科幻小說(shuō)。男主角(或者說(shuō)線索人物)應(yīng)用物理學(xué)家汪森在開(kāi)篇就卷入了一起頂尖(參見(jiàn)圖1.1)o但是丁儀讓汪森想象幾種其他的情況:"第一次,白球?qū)⒑谇蜃踩攵磧?nèi);第二次,黑球走偏了;第三次,黑球飛上了天花板;第四次,黑球像一只受驚的麻雀在房間里亂飛;第五次,黑球以接近光速的速度飛出太陽(yáng)系"。很顯然,第一次是正常的情況,第二次也不是不可能發(fā)生,擊球的過(guò)程中手抖或者沒(méi)瞞準(zhǔn)也不一定進(jìn)得了必進(jìn)球。但后三種情況就匪夷所思了。對(duì)于科幻小說(shuō)來(lái)說(shuō),這段描述引出了后續(xù)的情節(jié)。但是在日常生活中,后三種情況基本上是不可能發(fā)生的。圖1.1了力與加速度的關(guān)系:F=ma,其中F是對(duì)物體沿某方向施加的力,m是該物體的質(zhì)量,a是該方向上的加速度。力和加速度之間存在因果關(guān)系,臺(tái)球受力后將會(huì)產(chǎn)生一個(gè)瞄準(zhǔn)方向上的加速度,于是白球運(yùn)動(dòng)起來(lái)撞擊到黑球。然后在運(yùn)動(dòng)方向上給黑球一個(gè)力,使得黑球也運(yùn)動(dòng)起所以,臺(tái)球高手會(huì)計(jì)算好擊球的力度和角度,從而控制白球的速度與線路,這樣可確保撞擊黑球后能使黑球按照預(yù)期的速度與軌道前行。整擊球的瞬間就能感覺(jué)到。繼續(xù)訓(xùn)練一下手的穩(wěn)定性或者大腦的計(jì)算能力就能提高準(zhǔn)確性。大千世界正如臺(tái)球世界一般,被很多簡(jiǎn)單的、強(qiáng)大的物理規(guī)律所支配,有因必有果,結(jié)果是確定的。人們都知道,再厲害的臺(tái)球高手也沒(méi)辦法對(duì)自己的手部肌肉和目測(cè)角度實(shí)現(xiàn)百分之百的控制,所以臺(tái)球這項(xiàng)運(yùn)動(dòng)才有懸念。那么假設(shè)人能百分之百地控制出桿擊球(),擦力,球和球臺(tái)的材料表面都有可能不均勻,空氣中會(huì)有阻力,可能還有風(fēng),這些都是非?,F(xiàn)實(shí)的可能會(huì)對(duì)臺(tái)球的運(yùn)動(dòng)軌跡產(chǎn)生影響的因我們能夠窮舉所有可能的影響因素嗎?答案是肯定的,至少在目前的物理體系下可以。我們能夠計(jì)算出所有可能的影響因素嗎?至少在臺(tái)球的影響因素要么小得可以忽略不計(jì)(比如空氣阻力),要么發(fā)生的可能性極低(比如極端大風(fēng)或者地震),數(shù)學(xué)工具來(lái)描述它,至少?gòu)闹庇^上來(lái)看這些因素是有辦法處理的,通常我們稱之為隨機(jī)的方法。當(dāng)然,在這個(gè)例子中,我們所說(shuō)的隨機(jī)不一定是真正的隨機(jī),很可能只是綜合了大量難以測(cè)量的確定性因素后的一種處理方式,這樣并沒(méi)有系統(tǒng)【"I明可能也是三體人在使壞,不僅物理學(xué)家會(huì)崩潰,統(tǒng)計(jì)學(xué)家也要崩潰。無(wú)論世界是一套難以預(yù)測(cè)的確定性系統(tǒng),還是具備真正的不確定性,或者具有完全的隨機(jī)規(guī)律,我們都可以借助“隨機(jī)”這個(gè)工具來(lái)更好地當(dāng)然也更不是確定性。隨著概率論和統(tǒng)計(jì)學(xué)的發(fā)展,隨機(jī)方法成了科學(xué)家手中越來(lái)越強(qiáng)大的武器,可以用來(lái)描述更加復(fù)雜的世界現(xiàn)象。尤其是社會(huì)科學(xué),任何一個(gè)問(wèn)題的影響因素都是錯(cuò)綜復(fù)雜的,所以需要統(tǒng)計(jì)工具來(lái)處理。從這個(gè)意義上來(lái)說(shuō),隨機(jī)的世界已經(jīng)廣泛地被人類所接受,我們理解世界的方式也經(jīng)歷了從確定性到隨機(jī)性的轉(zhuǎn)變。不確定性,用科學(xué)的方法、用統(tǒng)計(jì)學(xué)來(lái)解決問(wèn)題是行之有效的,這也是今天我們能享受光輝燦爛的人類文明的原因之一吧。確定性:對(duì)誤差有著完全了解的認(rèn)知情況,或沒(méi)有疑惑的精神狀態(tài)。(維基百科不確定性:缺乏知識(shí)來(lái)描述當(dāng)前情況或估計(jì)將來(lái)的結(jié)果。(維基百科)分布。(維基百科)1927年101.2可能比這次會(huì)議更出名,時(shí)常以“世界上最智慧的大腦”為名在網(wǎng)絡(luò)上被轉(zhuǎn)載。這次會(huì)議通常被認(rèn)為是愛(ài)因斯坦與玻爾在量子論觀點(diǎn)上的決戰(zhàn)LI,“上帝不會(huì)擲骰子”的觀點(diǎn)也從此流傳1926仰,也是很多持有決定論觀點(diǎn)的物理學(xué)家的信仰。但這并不意味著他們是經(jīng)典物理時(shí)代的守舊者,即使是今天,上帝究竟擲不擲骰子也沒(méi)有定論。只是在那場(chǎng)大會(huì)上,愛(ài)因斯坦不斷地挑戰(zhàn)玻爾的觀點(diǎn)都沒(méi)有成功,在爭(zhēng)論上以失敗告終,讓人感覺(jué)上帝開(kāi)始擲骰子了而已。關(guān)于上帝擲骰子的討論背景來(lái)源于量子力學(xué)的發(fā)展初期,1925式在數(shù)學(xué)上是等價(jià)的,但兩派對(duì)于物理學(xué)上的表述和理解產(chǎn)生了嚴(yán)重分歧。1926年7月的解釋打開(kāi)了一個(gè)潘多拉的魔盒,他認(rèn)為申代表了一種隨機(jī)性,中2表示電子在某個(gè)位置出現(xiàn)的概率。這種解讀是對(duì)決定論的顛覆。后來(lái)海森堡基于他的矩陣論于1927年3月提岀了著名的“測(cè)不準(zhǔn)原理”(圖1.2不確定性原理),測(cè)出精確的結(jié)果,用“坍縮”來(lái)解釋,“觀測(cè)者”的意識(shí)居然參與到了物理過(guò)程中,更是驚世駭俗。海森堡和玻爾以及玻恩、泡利、約爾當(dāng)這批人大多數(shù)曾在哥本哈根工作過(guò),他們也被稱為“哥本哈根學(xué)派”,而他們的這套解釋也被稱為量得不承認(rèn)該理論能做出很好的解釋。即使針對(duì)一些“思維試驗(yàn)”的質(zhì)疑(比如薛定帶的貓)也能很好地自圓其說(shuō)。關(guān)于量子論和真實(shí)的物理世界到底如何,超出了本書的討論范圍,也超出了本書作者的學(xué)識(shí)范圍??傊?,在1927但很多領(lǐng)域的決定論都被打破了,比如力學(xué)家賴特希爾爵士于19861閔發(fā)表300周年的集會(huì)上發(fā)表了著名他們把它總結(jié)成一種可預(yù)言的系統(tǒng)。而且說(shuō)實(shí)話,我們?cè)?960經(jīng)誤導(dǎo)了公眾,向他們宣傳說(shuō)滿足牛頓運(yùn)動(dòng)定律的系統(tǒng)是決定論的,但是這在1960年后已被證明不是真的。我們都愿意在此向公眾表示道上一節(jié)我們提到過(guò),很多事情處理成隨機(jī)的方式只是為了操作的簡(jiǎn)便,并不意味著其中的物理規(guī)律是完全隨機(jī)的,比如空氣對(duì)臺(tái)球運(yùn)動(dòng)軌跡然可以認(rèn)為是確定的??墒菍?duì)于很多我們身處其中的社會(huì)規(guī)律,越來(lái)越多地接受了隨機(jī)性的假設(shè),這也是很多社會(huì)科學(xué)的基石。雖然主流的社會(huì)科學(xué)和物理學(xué)完全是兩套體系,但是我們也可以看到統(tǒng)計(jì)學(xué)研究隨機(jī)性的方法在兩個(gè)領(lǐng)域中都可以應(yīng)用得很好。100個(gè)問(wèn)題已經(jīng)不再困擾大家了。讓我們引用被譽(yù)為“活著的傳奇”的統(tǒng)計(jì)學(xué)家C.R.勞【19】的名言作為本節(jié)的結(jié)尾:是另外事件的發(fā)生。(維基百科)量子力學(xué):是物理學(xué)的分支,主要描述微觀的事物,與相對(duì)論一起被認(rèn)為是現(xiàn)代物理學(xué)的兩大基本支柱。(維基百科美劇《數(shù)字追兇》(Numb3rs)第1季的第1Don是FBI的探員,對(duì)于一個(gè)毫無(wú)線索的連環(huán)殺人案一籌莫展。他的數(shù)學(xué)天才弟弟Charlie通過(guò)犯罪地點(diǎn)推測(cè)出了一幅熱區(qū)圖,交給他的哥哥重點(diǎn)設(shè)網(wǎng)。第一次并沒(méi)有抓到罪犯,但是CharlieCharlie為了給探員解釋隨機(jī)性,請(qǐng)求5位探員站出來(lái),要求隨便站,結(jié)果5位探員都不自覺(jué)地分散開(kāi)來(lái),每個(gè)人的距離也差不多。Charlie指出真正的隨機(jī)會(huì)有一些人聚在一起,而普通人很難直觀選擇隨機(jī)的順序。所以罪犯也會(huì)刻意避開(kāi)平?;顒?dòng)的模式給人以一種"隨機(jī)”的感覺(jué),實(shí)際上恰好掉入了隨機(jī)性的陷阱。雖然武俠小說(shuō)常說(shuō)“最危險(xiǎn)的地方就是最安全的地方”,但大部分人沒(méi)有這個(gè)膽子和運(yùn)氣,人總是容易陷入思維的誤區(qū)。兇手總覺(jué)得在自己現(xiàn)有什么規(guī)律,想人為地制造隨機(jī),結(jié)果反而不自覺(jué)地把“均勻”當(dāng)成了隨機(jī)。比如圖1.3所示的是隨機(jī)模擬的點(diǎn),其中左圖用了正態(tài)分布-右圖用了均勻分布。這兩種分布都是隨機(jī)分布,但是自然界中的正態(tài)分布明顯更常見(jiàn),所以稱為“正態(tài)”(normal),本意是“正常”。我們可以看到,正態(tài)分布的圖中出現(xiàn)了一些點(diǎn)聚集在一起的現(xiàn)象,而均勻分布圖中的點(diǎn)散得比較開(kāi),比較接近人們心中對(duì)“隨機(jī)性”的直覺(jué)。實(shí)際上這也是一種把均勻當(dāng)作隨機(jī)的思維。圖1.3遺傳學(xué)家霍爾丹曾說(shuō)過(guò)“人類是一種常規(guī)動(dòng)物,并不能模仿自然界的無(wú)序”,說(shuō)的就是這個(gè)道理。像《數(shù)字追兇》中這樣的試驗(yàn)做起來(lái)不是很容易,而且不好量化。我們可以看一下C.R.?到醫(yī)院去搜集1000?投擲10001關(guān)于分布的詳細(xì)介紹在“第56頁(yè):2.2.3?想象投擲1000對(duì)于每個(gè)實(shí)驗(yàn)的1000個(gè)數(shù)據(jù),我們按照順序?qū)?個(gè)分為1組,那么各有2005個(gè)數(shù)據(jù),所以每組正面朝上(男孩)的次數(shù)可能是0到5之間的6表1.1C.R.正面朝上(男孩)以表1.1的第一行為例,200組醫(yī)院數(shù)據(jù)中男孩數(shù)目為0的組數(shù)為2,2005,200組想象投擲硬幣的數(shù)據(jù)中未出現(xiàn)正面朝上的組數(shù)為2。我們比較3比如次數(shù)為2、3、4的情況中,差距比較大。對(duì)于這個(gè)數(shù)據(jù),我們還能用嚴(yán)格的統(tǒng)計(jì)方法來(lái)檢驗(yàn)其中的差別,比如疋檢驗(yàn),我們?cè)凇暗?0頁(yè):1.3.1女士品茶”中將會(huì)對(duì)假設(shè)檢驗(yàn)進(jìn)行詳細(xì)介紹。此處我們直觀地比較這3組數(shù)據(jù)就能看出差異,不影響理解。關(guān)于這個(gè)實(shí)驗(yàn),很明顯,醫(yī)院出生的小孩性別是一種自然界的隨機(jī),我們都知道男女出生比例接近1:1,但無(wú)法判斷下一個(gè)出生的孩子是男是象中投擲一枚硬幣的時(shí)候,總是沒(méi)辦法抹去隨機(jī)的執(zhí)念,怕正反比例失衡,所以當(dāng)我們想象了很多次正面之后,會(huì)不自覺(jué)地多想象一些反面的情況。關(guān)于這個(gè)實(shí)驗(yàn),大家可以自己嘗試一下,看看自己想象中的隨機(jī)和實(shí)際的隨機(jī)是否一致,可能可以加深對(duì)隨機(jī)性的理解。正常:符合一般規(guī)律和情況。(《現(xiàn)代漢語(yǔ)大詞典》均勻:分布或分配在各部分的數(shù)量相同。(《現(xiàn)代漢語(yǔ)大詞典》蒲豐(Buffon)1707年出生于法國(guó),是博物學(xué)家、數(shù)學(xué)家、生物學(xué)家、啟蒙時(shí)代著名作家,概率論中著名的“蒲豐投針”就是以他的名字命名的。德摩根(DeMorgan1806年出生于印度,7的概念嚴(yán)格化???皮爾遜(KarlPearson)1857年出生于英國(guó),是現(xiàn)代數(shù)學(xué)統(tǒng)計(jì)學(xué)的開(kāi)創(chuàng)者,生物統(tǒng)計(jì)學(xué)的奠基人。羅曼諾夫斯(Romanovsky是蘇聯(lián)數(shù)學(xué)家,1906們都做過(guò)一種很"無(wú)聊”的事情:扔硬幣。表1.2列出了他們?nèi)佑矌诺拇螖?shù)和正面朝上的結(jié)果。表1.2很久以前,人類就具備了隨機(jī)性的思想,《易經(jīng)》算卦甚至需要設(shè)置隨機(jī)數(shù)種子。就算從科學(xué)性的角度來(lái)看,也能追溯到古時(shí)候人們對(duì)賭博1654年【20],通常認(rèn)為這一年帕斯卡12的通信,所以費(fèi)馬也被認(rèn)為是概率論的創(chuàng)始人之一。在當(dāng)時(shí),還沒(méi)有“概率”(Probability)這個(gè)術(shù)語(yǔ),人們常用“機(jī)會(huì)”(Chance)之類的詞表達(dá)概率的含義。一般認(rèn)為安托萬(wàn)?阿爾諾(AntoineArnauld)與皮埃爾?尼古拉(PierreNicole)在1662年出版的《波爾?羅亞爾邏輯》中第一次對(duì)“概率”一詞賦予了數(shù)學(xué)的含義。概率論嚴(yán)格的數(shù)學(xué)體系直到203在1774年正式提出的:〔BlaisePascal(1623年6月19H-1662年8月19H),法國(guó)神學(xué)家、哲學(xué)家、數(shù)學(xué)家、物理學(xué)家、化學(xué)家、音樂(lè)家、教育家、氣象學(xué)家,壓2PierredeFermat(1601年8月17H—1665年1月12H),3Laplace(1749年3月23H-1827年3月5是雅各布?伯努利1提出來(lái)的,包含在他的著作《猜度術(shù)》[11]為P,另一種可能結(jié)果出現(xiàn)的概率為1-P,則該試驗(yàn)稱為伯努利試驗(yàn)2?;谶@個(gè)試驗(yàn),伯努利還進(jìn)行了很多數(shù)學(xué)上的研究,推導(dǎo)出了一些很顯然,我們這個(gè)扔硬幣的試驗(yàn)就是一個(gè)伯努利試驗(yàn),正常情況下硬幣扔出去只會(huì)有兩種結(jié)果(我們稱為事件彳):正面朝上或者反面朝0.5o0.5,有時(shí)候比0.5大,有時(shí)候比0.5上一節(jié)里我們就說(shuō)了,自然界的隨機(jī)不一定是均勻的。那么我們似乎可以合理地猜測(cè),是不是扔的次數(shù)越多則正面朝上的概率越接近于0.5呢?這似乎是一個(gè)規(guī)律,從表1.2伯努利大數(shù)定律的數(shù)學(xué)描述非常簡(jiǎn)單,假設(shè)做一個(gè)伯努利試驗(yàn),重復(fù)n(比如硬幣正面朝上)的概率是p,總成功次數(shù)記為S“,則limP(|——pl<e)= ”->oo其中e代表一個(gè)任意小的正數(shù),該公式用中學(xué)數(shù)學(xué)里的極限知識(shí)即可理解。把S“就是利用了大數(shù)定律。因?yàn)檎鎸?shí)世界中的事件誰(shuí)也沒(méi)辦法確認(rèn)它一定是個(gè)隨機(jī)變量,只是從試驗(yàn)和常識(shí)的角度來(lái)看符合這種“數(shù)據(jù)越多越穩(wěn)1JakobI.Bernoulli(1654年12月27H-1705年8月160),瑞士數(shù)學(xué)家,伯努利家族代表人物之一。其著作《猜度術(shù)》在他去世后第8(1713年)2關(guān)于伯努利試驗(yàn)的詳情請(qǐng)參看“第51頁(yè):2.2.13事件可以認(rèn)為是具有一定概率出現(xiàn)的結(jié)果,關(guān)于隨機(jī)試驗(yàn)和事件的詳細(xì)介紹,參看"第51頁(yè):2.2.1概率:又稱或然率、機(jī)會(huì)率或幾率、可能性,是數(shù)學(xué)概率論中的基本概念,是一個(gè)在0到1(維基百科大數(shù)定律:簡(jiǎn)稱LLN(Lawoflargenumbers),樣本數(shù)量越多,則其平均就越趨近期望值。(維基百科被稱為現(xiàn)代會(huì)計(jì)學(xué)之父的盧卡?帕西奧利在其1494Pol。假設(shè)兩個(gè)人A和B在玩一種游戲,每局只有勝負(fù)之分,勝者得10分,負(fù)者得0分,先得到60分的人獲勝。如果A和B在玩的過(guò)程中因?yàn)槟承┰蛲V沽?,而此時(shí)A的得分是50分,B的得分是30分,獎(jiǎng)金應(yīng)該如何分配給A和B才算公平?這個(gè)問(wèn)題在今天來(lái)看可能只是中學(xué)生水平的數(shù)學(xué)題,但是在500文藝復(fù)興時(shí)期著名學(xué)者卡爾達(dá)諾(Cardano)大約在1539年的時(shí)候?qū)@個(gè)問(wèn)題做了解答,他認(rèn)為A只要再贏1局即可獲勝.而B還要贏3局才能獲勝??栠_(dá)諾可能意識(shí)到了B要贏3次是建立在前兩次都贏的基礎(chǔ)上的,因此他給了一個(gè)計(jì)算公式:(1+2+3):1=6:1,答案即為A和B按照6:11654年,32歲的帕斯卡想挑戰(zhàn)這個(gè)問(wèn)題。他的思路很直觀,從游戲停止的時(shí)刻算起,如果下一局A勝,則A獲得全部獎(jiǎng)金,如果下一局B勝,那么B得到40BA贏一局獲勝,或者B贏一局后得50分。如果是B贏,那么A和B都得50分,下一局誰(shuí)勝誰(shuí)就拿走所有獎(jiǎng)金。所以分配的金額比例應(yīng)該根據(jù)可能性來(lái)計(jì)算,A應(yīng)該獲,所以A和B的獎(jiǎng)金分配應(yīng)該是7:1,該解題思路可以用圖1.4X1_2X1_2+XX1_2+X1_2X1_2圖1.4馬。費(fèi)馬經(jīng)過(guò)思索之后給出了另一個(gè)思路。無(wú)論如何,最多三輪這個(gè)游戲就會(huì)結(jié)束,那么假設(shè)游戲必須繼續(xù)進(jìn)行3輪,一共有8種可能:AAA、AAB、ABA、ABB、BAA、BAB、BBA、BBBO在這8種可能中,只有出現(xiàn)BBB的時(shí)候B才能贏得獎(jiǎng)金,另外7種可能在這個(gè)規(guī)則下都應(yīng)該是A贏,因此A和B的獎(jiǎng)金分配應(yīng)該是7lo雖然在這個(gè)問(wèn)題的解答上費(fèi)馬似乎技高一籌,但是在那一年他們的信件中還討論了很多其他概率問(wèn)題,帕斯卡都提出了很多清晰而全面的解1654的發(fā)展史上有著重要的地位,今天的我們憑借中學(xué)的數(shù)學(xué)知識(shí)就可以理解先賢的成果,可能感覺(jué)只是小小的進(jìn)步,尤其是放在歷史的背景下將要被其后很多偉大科學(xué)家的光芒掩蓋。1654年,在人類歷史上只是普通的一年,這一年牛頓12歲,一個(gè)新的時(shí)代等著他來(lái)開(kāi)啟。而在遙遠(yuǎn)的東方,南明喪失了最后的機(jī)會(huì),苦苦支撐的永歷帝開(kāi)始茍延殘喘,一個(gè)文明的巔峰即將謝幕,就要陷入近300年的黑暗期。不過(guò)所有的一切都不一定有這個(gè)簡(jiǎn)單的例子重要,當(dāng)時(shí)的人們也不一定能想象“概率”這個(gè)神奇的東西被人類掌握后將會(huì)帶來(lái)多大的能量,其實(shí)未來(lái)改變世界的那道“隨機(jī)”的大門從此刻起就已經(jīng)被打開(kāi)了。概率論創(chuàng)立之后一直持續(xù)發(fā)展,當(dāng)時(shí)雖然還未建立一套數(shù)學(xué)公理化體系,但是已經(jīng)有了一套完整的數(shù)學(xué)基礎(chǔ)和計(jì)算方法,尤其是應(yīng)用到實(shí)際1812概率論完善的標(biāo)志,他明確給出了概率的古典定義,并在概率論中引入了更強(qiáng)大的數(shù)學(xué)分析工具,證明了很多重要的定理,建立了一套較為嚴(yán)密的體系。古典概率論也稱為傳統(tǒng)概率論,以概率的計(jì)算和大數(shù)定律為基礎(chǔ),偏重于解決實(shí)際問(wèn)題。1900年,德國(guó)數(shù)學(xué)家希爾伯特(DavidHilbert)23道最重要的數(shù)學(xué)問(wèn)題,為206在其中起重要作用的物理學(xué),首先是概率論和力學(xué)”。后來(lái)這個(gè)問(wèn)題也被拆分成“物理學(xué)公理化”和“概率論公理化”這兩個(gè)分支問(wèn)題。1933Kolmogorov)出版也成為現(xiàn)代概率論誕生的標(biāo)志事件。從此,人類進(jìn)入了現(xiàn)代概率論的時(shí)代。不過(guò)對(duì)于大部分的應(yīng)用場(chǎng)景來(lái)說(shuō),古典概率論和現(xiàn)代概率論并沒(méi)有本質(zhì)的區(qū)別,所以即使沒(méi)有深厚的數(shù)學(xué)背景,也能使用概率論這一強(qiáng)大的武器,在實(shí)際工作中發(fā)揮重要的作用。概率分布和數(shù)字特征。(統(tǒng)計(jì)大詞典)6連號(hào)和142009年6月12日,武漢市5141124名市民當(dāng)中有6人的購(gòu)房資格證明的編號(hào)是連續(xù)的。經(jīng)查,6人申請(qǐng)材料系造假,購(gòu)房資格被取消。巧合的是,2009年7月29日,老河口市第二期經(jīng)濟(jì)適用住房的搖號(hào)結(jié)果被發(fā)在了網(wǎng)上,很快有網(wǎng)民發(fā)現(xiàn),在1138戶具有購(gòu)房資格的申請(qǐng)者中,抽中了514戶購(gòu)房者,其中有14戶資格證編號(hào)相連,經(jīng)過(guò)多方調(diào)查,未發(fā)現(xiàn)該次搖號(hào)中出現(xiàn)暗箱操作。這兩次事件激發(fā)了網(wǎng)友計(jì)算概率的熱情,新聞也不斷報(bào)道,出現(xiàn)了很多不同的結(jié)果。一時(shí)間,這兩個(gè)問(wèn)題的概率究竟如何計(jì)算難倒了很多人,直到新聞熱點(diǎn)冷卻也還沒(méi)有一個(gè)大范圍流行的正確解法。6連號(hào)和14連號(hào)背后的數(shù)學(xué)問(wèn)題是一樣的,都可以描述成:從N1到N)中等概率地抽取1m個(gè)數(shù),求出現(xiàn)k連號(hào)的概率P(N,m,k),其中k連號(hào)指不少于k個(gè)數(shù)字相連。這是一個(gè)典型的概率計(jì)算問(wèn)題,也是古典概率中常見(jiàn)的表述方式。我們知道,從Nm個(gè)數(shù)的可能組數(shù)是組合數(shù)的問(wèn)題,共有C?種可能的組合方式。我們需要計(jì)算出其中包含k連號(hào)的組數(shù)。把兩個(gè)數(shù)目相除就是這個(gè)問(wèn)題要計(jì)算的概率。這個(gè)概率計(jì)算的關(guān)鍵就是求排列組合1也稱為簡(jiǎn)單隨機(jī)抽樣:SimpleRandomSampling不失一般性,我們假設(shè)要從8個(gè)數(shù)中抽取5個(gè)數(shù),計(jì)算3C|種結(jié)果,再把其中出現(xiàn)3個(gè)以上連號(hào)的組數(shù)挑選出來(lái)。結(jié)果見(jiàn)表1.3。表1.38選5中35688768887888845656567757777333454455446651IX11xIXIX1-110^0^678787888877884576657775667733345446645566IXIXIX1-1A111A0^78688877878878455675667666673344545564555611±1X1-1±11IX1-0^00從表1.3可知,56種抽簽結(jié)果中包含了40組3連號(hào)的情況,那么其概率為40/56=0.7143。如果數(shù)據(jù)量比較大,很難像這樣全部列出來(lái)然后挑選符合情況的組數(shù),因此需要找到一個(gè)計(jì)算這類問(wèn)題的數(shù)學(xué)公式??梢韵胂?,如果有8個(gè)箱子,編號(hào)從1到8,我們把5個(gè)球隨機(jī)地放到箱子中(每個(gè)箱子中最多只能放1個(gè)球),出現(xiàn)3“14568”這種組合的結(jié)果,可以表示成圖1.5所示的結(jié)果形式,白色表示空箱子,黑色表示放了球,很顯然其中包含了3連號(hào)。 圖1.5對(duì)于這個(gè)問(wèn)題,我們很難用一個(gè)公式表示出包含3連號(hào)的所有組合,記這個(gè)組合數(shù)的函數(shù)為在本例中其為f(8,5,3)如果1號(hào)箱子里沒(méi)有球,那么在剩下的7個(gè)箱子中抽取5個(gè)計(jì)算3連號(hào),總數(shù)為f(7,5,3)如果1號(hào)箱子里有球,2號(hào)箱子里沒(méi)球,那么在剩下的6個(gè)箱子中抽取4個(gè)計(jì)算3連號(hào),總數(shù)為如果1號(hào)和2號(hào)箱子里有球,3號(hào)箱子里沒(méi)球,那么在剩下的5個(gè)箱子中抽取3個(gè)計(jì)算3連號(hào),總數(shù)為如果1號(hào)、2號(hào)、3號(hào)箱子里都有球,那么剩下的5個(gè)箱子里無(wú)論怎樣排,都會(huì)包含3連號(hào),所以總數(shù)為以上4種情況包含了所有的可能性,而且是互斥的,所以可得f(8,5,3)=f(6,4,3)+f(5,3,3)+/⑸3,3)+C影這是一個(gè)遞推公式,其中/(6,4,3)等項(xiàng)仍然可以用這種思路遞歸地計(jì)算。我們將這個(gè)方法擴(kuò)展到任意N,m,k的情況,可以得到公式:f(N,m,k)=^f(N-i,m-i+1,k)+f(N,tn,k)=l,如果N=tnf(N,m,k)=O,如果N<.k或m<k或N<.在“第142頁(yè):4.4.26連號(hào)和14連號(hào)7(5141,124,6)=((1138,514,14)=可見(jiàn),在武漢的6連號(hào)事件中,出現(xiàn)這種6于這種通過(guò)小概率進(jìn)行判斷的例子,我們將在“第25頁(yè):1.3.3六西格瑪?shù)钠孥E”中進(jìn)行詳細(xì)介紹。排列:從n個(gè)元素中取出k個(gè)元素,如果這k組合:從"個(gè)元素中取出k個(gè)元素,不考慮順序,則稱為組合,計(jì)算公式為:洋=善=頃気。(維基百科)三門問(wèn)題,又稱蒙提霍爾問(wèn)題,出自美國(guó)的電視節(jié)目《讓我們做筆交易》(Let'sMakeaDeal),得名于該節(jié)目的主持人蒙提霍爾(MontyHall)。這個(gè)節(jié)目大概在1975年的時(shí)候進(jìn)入公眾視野,節(jié)目的參者會(huì)看見(jiàn)三扇關(guān)閉著的門,其中一扇的后面有一輛汽車,選中后面有車的那扇門就可以贏得該汽車,而另外兩扇門后面則各藏有一只山羊(參見(jiàn)圖1.6)。當(dāng)參者選定了一扇門,但未去開(kāi)啟它的時(shí)候,知道門后情形的節(jié)目主持人會(huì)開(kāi)啟剩下兩扇門中的其中一扇,露出其中一只山羊。主持人其后會(huì)問(wèn)參者要不要換另一扇仍然關(guān)上的門。問(wèn)題是:換另一扇門是否會(huì)增加參者贏得汽車的概率?這可能只是一個(gè)簡(jiǎn)單的概率問(wèn)題,但自其誕生后帶來(lái)了很大的影響。因?yàn)?991年的時(shí)候,瑪麗蓮(MarilynvosSavant)參與進(jìn)來(lái)了,她是被吉尼斯世界紀(jì)錄所認(rèn)定的擁有最高智商的人類。1956年9月,瑪麗蓮在剛滿10歲的時(shí)候初次接受斯坦福比奈智力量表(Stanford-BinetIntelligenceScale)的測(cè)試,測(cè)得智商高達(dá)228,隨后進(jìn)行過(guò)多次測(cè)試,在1985年的時(shí)候以HoeflidsMegaTest測(cè)試得分186的正式成績(jī)登上吉1990是最后的世界紀(jì)錄,雖然后來(lái)有韓國(guó)人金恩榮在斯坦福比奈智力量表中得到210的成人最好成績(jī),但已經(jīng)沒(méi)有這個(gè)紀(jì)錄了。所以從某種意義上來(lái)說(shuō),這位定格為人類歷史上“官方”記載智商最高的人是一位女性,而且曾經(jīng)干過(guò)大事。這件大事就是蒙提霍爾問(wèn)題,從20世紀(jì)80年代開(kāi)始,瑪麗蓮在《展示雜志》(ParadeMagazine)上開(kāi)了專欄“問(wèn)問(wèn)瑪麗蓮”,作為人類智商最高者解答各種問(wèn)題。在1991年的時(shí)候,有人問(wèn)了這個(gè)蒙提霍爾問(wèn)題,瑪麗蓮的答案是“該換,換完就有2/3的概率贏得汽車”。結(jié)果引發(fā)了很多專業(yè)人士的質(zhì)疑,其中包括著名的數(shù)學(xué)家保羅?埃爾德什(PaulErdoso人們可能不愿意相信這么不符合常理的結(jié)果,也可能對(duì)“智商最高”不爽很久T,終于在這次事件中爆發(fā)了,甚至有人說(shuō)出了心聲“也許女人和男人看待數(shù)學(xué)問(wèn)題的角度不一樣吧”[211。在概率的直覺(jué)中,一共有31/2,設(shè)之前一系列的陳述代表了事件A,其概率是P(£),而面臨二選一時(shí)正確的概率是P(B),我們要計(jì)算的概率是P(B|A),根據(jù)條件概率的公式:P(B|A)=囁尹。如果事件▲和B是獨(dú)立發(fā)生的,則有:P(ACB)=P(4)P(B)。很顯然,當(dāng)參者面臨是否更換選擇的時(shí)候,如果他突然忘記了之前的事情,也不會(huì)對(duì)他的選擇造成任何影響,因?yàn)槭O聝蓚€(gè)選項(xiàng)中是羊還是車已經(jīng)確定了。既然如此,先前的選擇和主持人的開(kāi)門似乎和下一次的選擇之間沒(méi)有什么關(guān)系,那么A和B可以認(rèn)為是獨(dú)立的,那么有P(B|A)=P^jB)=P(B),其結(jié)果就是隨機(jī)二選一的概率:1/2O不過(guò)瑪麗蓮的思路并不是這樣的,讓我們從參者最初的選擇開(kāi)始,一共存在兩種可能,各自的最終結(jié)果如下所示情形A:參者選中了汽車(概率為1/3),那么主持人會(huì)打開(kāi)任意一扇有山羊的H,此時(shí)換門后獲勝(記為事件W)的概率P(W|A)=情形B:參者選中了山羊(概率為2/3),那么主持人會(huì)打開(kāi)另一扇有山羊的門,此時(shí)換門后獲勝(記為事件W)的概率P(W|B)=1由于只可能存在情形A或者B,所以換門后最終獲勝的概率P(W)=P(WCA)+P(WCB),根據(jù)條件概率的公式可得P(W)p(wnA)+P(wnBp(w|A)XP(A)+P(W|B)xP(B)-0x1/3+1x2/3=2/3。所以換門后贏得汽車的概率為2/3,麗蓮的計(jì)算是正確的,換門后贏得汽車的概率是2/3情形A:參者選中了汽車(概率為1/3),那么主持人會(huì)打開(kāi)任意一扇有山羊的門,此時(shí)換門后獲勝(記為事件W)的概率P(W|A)=0情形B:參者選中了山羊(概率為2/3),主持人打開(kāi)包含了汽車的門(概率為1/2),該情形不考慮在內(nèi),也不可能贏情形C:參者選中了山羊(概率為2/3),主持人打開(kāi)包含了山羊的門(概率為1/2),此時(shí)換門后獲勝(記為事件W)的概率P(W|C)=p(wnA)+P(W|A)*P(A)+P(W|C)*P:(C)-P(A)+P(0x1/3+1x2/3xl/2)/(l/3+2/3x1/2)=(l/3)/(2/3)=1/2O直覺(jué)中1/2的概率就是這么來(lái)的。在這個(gè)例子里,我們通過(guò)概率的之毫厘,謬以千里,這在計(jì)算概率的時(shí)候是尤其要注意的。對(duì)立事件:對(duì)于事件A,“事件A不出現(xiàn)”作為一個(gè)事件,稱作AP(月)=1P(A)任意事件的加法法則:對(duì)任意事件A和B,有P(AUB)=P(A)+P(B)—P(AC1B)互斥事件:如果事件A和B沒(méi)有交集,則稱事件A和BP(AUBP(A)P(B)條件概率:事件A在另外一個(gè)事件BP(A|B),讀作“在B條件下A的概率”。其計(jì)算公式為P(A|B)-舗尋。(維基百科)1968年5月22日,美國(guó)“天蝎”號(hào)核潛艇(參見(jiàn)圖1.7)99名成員全部遇難。事后的調(diào)查報(bào)告說(shuō)是被自關(guān)注。當(dāng)時(shí)為了尋找"天蝎”號(hào),美國(guó)海軍劃定了一個(gè)半徑32千米、數(shù)千英尺深的圓形海域。如果要搜遍整個(gè)區(qū)域幾乎是不可能完成的任務(wù)。當(dāng)時(shí),人們想到的最可行方案是聘用三四個(gè)潛艇和海洋環(huán)流頂級(jí)專家來(lái)推斷“天蝎”號(hào)的位置。但是美國(guó)海軍特別計(jì)劃部的首席科學(xué)家約翰?克拉芬(JohnPCraven到了"天蝎”號(hào)的殘骸,完成了幾乎不可能完成的任務(wù)。圖1.7背景主要來(lái)自貝葉斯統(tǒng)計(jì),在這個(gè)例子里,用簡(jiǎn)單的貝葉斯公式就能很好地理解。貝葉斯公式也稱為貝葉斯定理,其形式如下所示:?P(A|B)是已知B發(fā)生后A的條件概率,也由于得自B的取值而被稱作A-P(B|A)是已知A發(fā)生后B的條件概率,也由于得自A的取值而被稱作B?P(A)是A的先驗(yàn)概率(或邊緣概率)。之所以稱為“先驗(yàn)”,是因?yàn)樗挥每紤]任何B?P(B)是B在這個(gè)搜尋天蝎號(hào)的例子中,對(duì)于搜尋海域中的某一個(gè)格子,我們記“潛艇在格子中”為事件人,“潛艇被找到”為事件B,“潛艇在格子中”的概率為p,“潛艇在該格子中被找到”的概率為?,那么有p=P(A),g=P(B|A)。我們最關(guān)注的是概率p,其值越大說(shuō)明該范圍內(nèi)存在p。通常會(huì)從概率最大的地方開(kāi)始搜索,如果沒(méi)有在該格子中找到潛艇,說(shuō)明這個(gè)概率沒(méi)有之前想象得那么高,我們可以利用貝葉斯公式重新計(jì)算這個(gè)概—(叭空 心根據(jù)條件概率和互補(bǔ)事件的定義,可得P⑻=P(B|A)P(A)P(B|A)P此P(B|A)=0,將以上各概率的值代入公式1.2.2中可得:p'=P(A|B)卩(11,將減小的概率平均分配到其他格子即可。隨著搜索的進(jìn)行,使用計(jì)算機(jī)算法不斷更新每個(gè)格子的概率,直到搜索到殘骸為止。這種方法的思路非常簡(jiǎn)單,但是在實(shí)際的使用中常常有奇效。尤其是其中的先驗(yàn)概率,可以是主觀的,由此發(fā)展出了一套系統(tǒng)的統(tǒng)計(jì)推斷方法,稱為貝葉斯方法,甚至形成了一個(gè)貝葉斯學(xué)派。隨著計(jì)算機(jī)能力的不斷提高,貝葉斯學(xué)派的影響也變得越來(lái)越大。是數(shù)理統(tǒng)計(jì)學(xué))中很重要的技巧之一。(維基百科)20世紀(jì)20們覺(jué)得兩種液體的混合物在化學(xué)成分上不可能有任何區(qū)別。此時(shí),一位名叫費(fèi)希爾(RonaldAylmerFisher)的男子陷入了沉思,他考慮了各種試驗(yàn)設(shè)計(jì)方法,以確定這位女士是否能判斷出兩種茶的區(qū)別。做完費(fèi)希爾設(shè)計(jì)的試驗(yàn)后,人們驚奇地發(fā)現(xiàn),那位女士正確地判斷出了每一杯茶的制作方式122](參見(jiàn)圖1.8)。這個(gè)故事來(lái)自經(jīng)典的統(tǒng)計(jì)歷史讀物《女士品茶少兇],故事中的費(fèi)希爾是現(xiàn)代統(tǒng)計(jì)學(xué)的奠基者之一,當(dāng)時(shí)不到40歲。這個(gè)試驗(yàn)的詳情包含在了費(fèi)希爾1935MurielBristol)營(yíng)養(yǎng)的機(jī)制方面頗有建樹,不過(guò)在公眾中的名氣似乎主要來(lái)自品茶的女士這個(gè)身份。在古老的英國(guó),人們一直都在爭(zhēng)論這個(gè)問(wèn)題,究竟是先加奶后加茶好喝還是先加茶后加奶好喝。據(jù)說(shuō)貴族傾向于先加茶,平民傾向于先加奶,有人分析說(shuō)有錢人可以用上好的瓷器,比如來(lái)自中國(guó)的茶杯,所以先加滾燙的茶也不會(huì)爆裂,而普通人用的茶杯就只能先加冷的牛奶問(wèn)題才有了很好的解決方案。8杯茶,有4杯是先加茶,4杯是先加奶,茶杯完全一樣,以隨機(jī)的順序交給女士來(lái)品茶。女士嘗完這8的奶茶的數(shù)目作為研究對(duì)象(研究先加奶的也可以),記為X,X的取值有5種可能,分別是0、1、2、3、4。根據(jù)直覺(jué)判斷我們也知道X越大說(shuō)明女士越厲害。當(dāng)然,費(fèi)希爾有除了直覺(jué)之外更好的辦法。讓我們重新拿出概率計(jì)算這個(gè)武器,首先假設(shè)“該女士完全分不出哪些先加茶哪些先加奶”,那么她只能隨機(jī)地猜測(cè),正確區(qū)分每一杯茶的概率只有1/28個(gè)球(4個(gè)黑球4個(gè)白球)中隨機(jī)摸出4個(gè)的問(wèn)題,摸出的4X也是等價(jià)的。根據(jù)排列組合的公式,從8個(gè)球中摸出4個(gè)的組合數(shù)為Cl=70,其中X的不同取值也可以計(jì)算出來(lái),如表1.4所示。表1.4從結(jié)果來(lái)看,如果我們之前的假設(shè)“該女士完全分不出哪些先加茶哪些先加奶”是正確的,那么出現(xiàn)這種結(jié)果(X=4)有0.0143是0.0143。這個(gè)概率很小,比0.05還要小,所以我們有充足的理由認(rèn)為“該女士可以分出哪些先加茶哪些先加奶”O(jiān)?Ho?Hi其中Ho稱為原假設(shè),Hi是Ho的否命題,稱為備擇假設(shè)。我們?cè)谠僭O(shè)的基礎(chǔ)上對(duì)數(shù)據(jù)和試驗(yàn)結(jié)果進(jìn)行深入的研究,可以計(jì)算得到一個(gè)“拒絕“P值”,雖然最近很多文章把PP值的行為,并沒(méi)有否定P值在統(tǒng)計(jì)推斷中極其重要的地位。在本例中,P值就是0.0143,我們專門強(qiáng)調(diào)了這個(gè)值小于0.05,是因?yàn)樵谟?jì)算能力不發(fā)達(dá)的時(shí)代,對(duì)于很多復(fù)雜的問(wèn)題很難精確地計(jì)算P值。所以需要將一個(gè)顯著性水平帶入公式,通常通過(guò)查表的方式來(lái)判斷是否顯著,由于不同的方法和假設(shè)的分布的具體形式差異很大,我們?cè)谶@里就不詳述了。總之,雖然因?yàn)闅v史原因?qū)е?.05這個(gè)數(shù)值成了判斷顯著性的重要標(biāo)準(zhǔn),但我們實(shí)際使用時(shí)也很能說(shuō)得通,因?yàn)樗砹司芙^原假設(shè)犯錯(cuò)誤的概率,如果這個(gè)概率小于0.05,當(dāng)然說(shuō)明我們有充足的理由可以拒絕原假設(shè),換句話說(shuō)也就是接受備擇假設(shè)。需要特別注意的是,最好任何時(shí)候也不要說(shuō)“接受原假設(shè)”這樣的話語(yǔ),即使P味著接受原假設(shè)犯錯(cuò)誤的概率不大。如果P值很大的話,我們應(yīng)該說(shuō)“不能拒絕”而不要說(shuō)“接受”,只有備擇假設(shè)才能“接受”。在這個(gè)女士品茶的例子里,費(fèi)希爾當(dāng)時(shí)使用的方法里并沒(méi)有備擇假設(shè)(實(shí)際上費(fèi)希爾一直也不支持這種套路),用的是另一種類似的方式,P值。這個(gè)思想的核心在于“拒絕”,而不是“證明”,似乎與常規(guī)的思維方式有些不同,但這是一種科學(xué)的思維方式,正如科學(xué)在不斷否定中進(jìn)步和發(fā)推斷統(tǒng)計(jì)學(xué):又稱統(tǒng)計(jì)推斷(StatisticalInference),與描述統(tǒng)計(jì)相對(duì)應(yīng),研究如何根據(jù)樣本數(shù)據(jù)去推斷總體數(shù)量特征的方法“它是在對(duì)樣過(guò)程的觀察來(lái)進(jìn)行推斷的。(維基百科)第一類錯(cuò)誤:在假設(shè)檢驗(yàn)中,如果HoHoP值來(lái)描述。(維基百科)第二類錯(cuò)誤:在假設(shè)檢驗(yàn)中,如果Ho是錯(cuò)誤的(Hi是正確的),錯(cuò)誤地接受了Ho,稱為第二類錯(cuò)誤。(維基百科)關(guān)于“渣男”的話題在很多網(wǎng)站或者社交網(wǎng)絡(luò)上都容易成為熱點(diǎn),百度“渣男去死”可以搜到各種各樣奇葩的故事和極品的人類,有些是很征被總結(jié)出了很多,比如花心、家暴、不負(fù)責(zé)任、自戀、摳門、大男子主義等。但這些特征通常都很難通過(guò)初次見(jiàn)面或者短期相處發(fā)現(xiàn),很多時(shí)候都是相處久了才感受越來(lái)越深,及時(shí)止損都已經(jīng)太晚?!霸小焙鸵话愕膲娜瞬灰粯?,很多所謂很“渣”的事情都不是罪大惡極,如果原則性不太強(qiáng)的話比較容易忽略,再加上“渣男”通常都擅是個(gè)問(wèn)題。原諒吧,怕真的是“渣男”,以后還會(huì)經(jīng)常犯。不原諒吧,怕錯(cuò)傷好人,萬(wàn)一真的只是不小心犯錯(cuò)以后再也不犯了呢?11件很“渣”的事情,那么偶爾犯錯(cuò),人非圣賢、孰能無(wú)過(guò),以后可能就不會(huì)犯了。究竟是不是無(wú)心之失,需要針對(duì)具體的事情來(lái)分析,我們這里只將其類比成一個(gè)統(tǒng)計(jì)問(wèn)題。假設(shè)箱子里有N個(gè)球(N是一個(gè)很大的數(shù)),只可能是黑色或者白色。如果我們隨機(jī)地取出1個(gè)球,然后放回去,如此反復(fù),一共取10次,發(fā)現(xiàn)其中有1次是黑球,請(qǐng)問(wèn)箱子里黑球的比例p是多少?在這個(gè)問(wèn)題里,p總體,其中黑球的比例p稱為一個(gè)“參數(shù)”,參數(shù)通常用來(lái)描述總體的一些重要特征。而隨機(jī)摸取出來(lái)的球的顏色的結(jié)果稱為樣本,樣本的數(shù)量雖然不大,但是可以合理地認(rèn)為其中包含很多總體的特征。在這個(gè)例子里,每一次取球取到黑球的概率其實(shí)就是參數(shù)po摸取10次后得到一個(gè)樣本量為10的樣本。我們是否可以利用這個(gè)樣本來(lái)推斷出總體中p的大小呢?通過(guò)樣本來(lái)推測(cè)總體是一種非常重要的統(tǒng)計(jì)思想,假設(shè)通過(guò)某種摸取的方式()后樣本可以代表總體,說(shuō)明樣本和總體具有一些相同的性質(zhì),如果總體中存在某些參數(shù)可以描述各種性質(zhì),那么通過(guò)樣本來(lái)推斷總體的參數(shù),就稱為參數(shù)估計(jì)。估計(jì)的思想在統(tǒng)計(jì)中非常常具體的估計(jì)方法有很多種,其實(shí)在判斷“渣男”的例子中就提到了一種。有的女生覺(jué)得犯一次錯(cuò)就不可饒恕,因?yàn)榘l(fā)生的事件應(yīng)該是可能性(也稱為極大似然)打靶,一聲槍響后發(fā)現(xiàn)十環(huán)被打中,那么人們通常都會(huì)猜測(cè)這一槍是射擊冠軍打的。本質(zhì)上都是最大似然思想在生活中的應(yīng)用。把這種思想應(yīng)用到參數(shù)估計(jì)上也是可行的,比如在上面摸球的例子中,我們可以計(jì)算得到該結(jié)果(摸10次有1次是黑色)的概率p=p1.(1-P)9所謂最大似然,就是尋找一個(gè)p,使得P*(1P’=1?(1-p)9一p?9(l—p)*= (1-3-解得p0.1時(shí)P具有最大值。因此P0.1是參數(shù)p10個(gè)球抽中1個(gè)所以是0.1的結(jié)果完全相同。如果模型或者參數(shù)的分布更復(fù)雜,就沒(méi)辦法靠直覺(jué)來(lái)求解了,但這種最大似然的思想是一致的,也是我們進(jìn)行參數(shù)估計(jì)的最常用方法之一。(維基百科)六西格瑪(SixSigma),又稱六標(biāo)準(zhǔn)差,是一種用于流程改善的工具與程序,也是一種管理的戰(zhàn)略和方法。一般認(rèn)為其核心思想誕生于20世紀(jì)70年代的摩托羅拉公司(Motorola)o1986年,工程師比爾?史密斯(WilliamB.Smith)制定了管理摩托羅拉的一系列方法,因此他也被稱為“六西格瑪之父”。后來(lái)由于通用電氣(GE第八任CEO杰克?韋爾奇(JackWelch)的推廣,六西格瑪于1995不去深究它的應(yīng)用方式和管理學(xué)內(nèi)涵,主要討論“六西格瑪”中所包含的一種統(tǒng)計(jì)思想,也就是小概率的思想。六西格瑪?shù)臉?biāo)準(zhǔn)寫法是“6h,正態(tài)分布及其參數(shù),我們將在“第56頁(yè):223棣莫弗的正態(tài)”進(jìn)行詳細(xì)介紹,在這里我們只需要了解圖1.9中的幾個(gè)數(shù)值即可。圖6a該圖描述了一個(gè)標(biāo)準(zhǔn)正態(tài)分布(均值為0,標(biāo)準(zhǔn)差為1),所謂6(r,就是指正負(fù)62a和6a以外的情形。比如x2的左邊與x=2右邊的陰影面積,表示2c之外的面積。在正態(tài)分布中這兩塊陰影的面積之和與整個(gè)鐘形區(qū)域的面積之比即為概率,比如標(biāo)準(zhǔn)正態(tài)分布下2a之外的概率為2x0.02275=0.0455。所謂6a的管理方式,其最早來(lái)源是基于當(dāng)時(shí)通用的3a缺陷率,也就是說(shuō),在當(dāng)時(shí)的工業(yè)領(lǐng)域,普遍認(rèn)為如果缺陷率在標(biāo)準(zhǔn)正態(tài)分布的3a以外0.0026。所謂6a的管理,簡(jiǎn)單理解就是朝著更高的目標(biāo)“6我們利用標(biāo)準(zhǔn)正態(tài)分布計(jì)算可得真實(shí)的6a以外的概率應(yīng)該是0.00000000197,約等于十億分之二。但是摩托羅拉公司在提出六西格瑪管理方法1.5。的偏移。如果放在64.5<T,另一側(cè)變成了7.5°(只有3.2x10-14,小到可以忽略不計(jì)),所以我們通常說(shuō)的6a實(shí)際上指的是4.5<r的缺陷率,這個(gè)數(shù)值是0.0000034,也就是我們熟知的百萬(wàn)分之三點(diǎn)四。極大的作用。在很多場(chǎng)景下,都可以通過(guò)小概率幫助我們做決策,比如之前提到的假設(shè)檢驗(yàn),如果概率小于0.05就可以拒絕原假設(shè)了。但0.05的概率并不意味著不可能發(fā)生,甚至并不足夠小。所以如果我們需要一個(gè)更小的概率來(lái)描述幾乎不可能發(fā)生的事情,6a理論中的百萬(wàn)實(shí)的生活中有理由認(rèn)為概率低于百萬(wàn)分之三點(diǎn)四的事情不會(huì)發(fā)生。有趣的是,英國(guó)數(shù)學(xué)家李特爾伍德(JohnEdensorLittlewood)回到“第13頁(yè):1.2.26連號(hào)和14連號(hào)”中的例子,武漢6連號(hào)事件中計(jì)算的概率是百萬(wàn)分之0.8,而老河口14連號(hào)事件中計(jì)算的概率是百分之0.8把計(jì)算概率的方法和這種小概率的思想結(jié)合起來(lái),能夠幫助我們進(jìn)行更好的決策和判斷。平均數(shù)(Mean):常用于表示統(tǒng)計(jì)對(duì)象的一般水平,是描述數(shù)據(jù)集中趨勢(shì)的一個(gè)統(tǒng)計(jì)量,樣本均值的計(jì)算方式為:f=勺+卑…+叫標(biāo)準(zhǔn)差(StandardDeviation):簡(jiǎn)稱為SD,一般用數(shù)學(xué)符號(hào)a來(lái)表示,是數(shù)值自平均值分散開(kāi)來(lái)的程度的一種測(cè)量觀念。一個(gè)較大的標(biāo)準(zhǔn)差,差,代表這些數(shù)值較接近平均數(shù)。樣本標(biāo)準(zhǔn)差的計(jì)算公式為;SDv/(Xl_E)2±(X2_E)2+...+a”至。(維基百科)約翰?康杜特曾經(jīng)記載了牛頓和蘋果的故事:“1666年,當(dāng)他在一座花園中沉思散步時(shí),他突.然想到重力(它的作用讓一個(gè)蘋果從樹上掉到地WilliamStukeley在他的《艾薩克?牛頓爵士生平回憶錄》中記錄了1726年4月15日與牛頓的一次談話"從前,引力的概念進(jìn)入了他的腦海。在他正在沉思時(shí),蘋果的下落引起了他以上是關(guān)于牛頓和蘋果的故事的一些出處的記載,雖然現(xiàn)在有些人質(zhì)疑牛頓從蘋果落地得到萬(wàn)有引力的靈感的真實(shí)性,但不妨礙牛頓的蘋果的記錄,另一方面主要是萬(wàn)有引力的規(guī)律實(shí)在是太鬼斧神工了,讓人很難相信一個(gè)蘋果就能啟發(fā)如此天才的靈感。不過(guò)無(wú)論是否質(zhì)疑這個(gè)蘋果的存在,人們都關(guān)心的問(wèn)題是這需要多么天才的頭腦才能憑空想到萬(wàn)有引力的公式?。咳f(wàn)有引力定律(Newton'slawofuniversalgravitation)是牛頓在1687年于《自然哲學(xué)的數(shù)學(xué)原理》[18]上發(fā)表的定律。讓我們先來(lái)看看萬(wàn)其中F表示萬(wàn)有引力,G是一個(gè)常數(shù),精確測(cè)量后得到其值約為6.67x1011N加2煬2,加1和m2分別表示兩個(gè)物體的質(zhì)量,「是它們之間的距這個(gè)公式為什么驚世駭俗?關(guān)鍵是其中的那個(gè)“等號(hào)”。等號(hào)意味著這是絕對(duì)的物理規(guī)律,不會(huì)有任何偏差,如果有偏差那一定是測(cè)量的誤差。100(Cavendish)于1797年到1798過(guò)卡文迪許實(shí)驗(yàn)測(cè)得了大量物體之間的萬(wàn)有引力,同時(shí)也測(cè)量了物體的質(zhì)量、間距等數(shù)據(jù),慢慢發(fā)現(xiàn)物體的質(zhì)量、間距會(huì)是關(guān)鍵的影響因F=f(〃i,wi2/)+ (1-3-如果引力和質(zhì)量、間距之間真的存在規(guī)律,那么ef(mvm2,r)e的存在,我們無(wú)法得到一個(gè)完美的等號(hào),但是可以表達(dá)足夠強(qiáng)的規(guī)律,得到一個(gè)統(tǒng)計(jì)模型。這就是擬合的思想,也是最常見(jiàn)的統(tǒng)計(jì)思想之一。擬合(Fitting):已知的數(shù)據(jù)相吻合。(維基百科)《水滸傳》里有兩個(gè)神機(jī)妙算的軍師(參見(jiàn)圖1.10)圖1.10朱武雖然排名比較靠后,但也是72地煞星的第1上去好像沒(méi)那么多鬼點(diǎn)子,但是只要斗陣必勝,讓人感覺(jué)很安心。當(dāng)然,《水滸傳》中還有一個(gè)預(yù)測(cè)能力很強(qiáng)的人,或者說(shuō)不是人,那就是計(jì)學(xué)顯然是其中最科學(xué)的。我們正好可以通過(guò)《水滸傳》中的例子來(lái)介紹不同的預(yù)測(cè)方法。朱武的預(yù)測(cè)能力最清晰直白,他看一眼敵軍的陣法就能發(fā)現(xiàn)其中的關(guān)鍵并預(yù)測(cè)下一步的走勢(shì),然后指揮己方軍隊(duì)有針對(duì)性地布陣,對(duì)其進(jìn)行克制。朱武為什么能這么厲害?是因?yàn)樗皩W(xué)習(xí)過(guò)各種各樣的陣法,所以一看到敵陣的某個(gè)片段、某些特征就能預(yù)測(cè)出這是一個(gè)什么陣,用專業(yè)的術(shù)語(yǔ)說(shuō),朱武做了一個(gè)正確的分類。我們可以認(rèn)為朱武胸中蘊(yùn)藏了一個(gè)非常強(qiáng)大的分類模型,可以精準(zhǔn)地對(duì)任何陣法進(jìn)行分類。而立模型,然后用來(lái)做預(yù)測(cè),這種預(yù)測(cè)通常稱為Prediction,詳情可以參見(jiàn)“第124頁(yè):4.2.4樹木與森林”。吳用的預(yù)測(cè)能力感覺(jué)存在感更高,因?yàn)樗?jīng)常能未卜先知,針對(duì)很多問(wèn)題都有自己的直覺(jué),而不是像朱武那樣胸中藏有分類模型。我們細(xì)看析模型,比如時(shí)間序列,我們通常把這種預(yù)測(cè)稱為預(yù)報(bào),對(duì)應(yīng)的英文單詞是Forecasting,詳情可以參見(jiàn)“第114頁(yè):4.1.4股票的走勢(shì)”。無(wú)論是Prediction還是Forecasting,都有科學(xué)的方法進(jìn)行統(tǒng)計(jì)推斷。統(tǒng)計(jì)學(xué)家埃弗龍(BradleyEfron)曾說(shuō)過(guò)“統(tǒng)計(jì)是僅有的系統(tǒng)地研究推預(yù)測(cè)(Prediction):研究和預(yù)估不確定事件的發(fā)生及結(jié)果,是統(tǒng)計(jì)推斷的一部分,通常需要基于已有的經(jīng)驗(yàn)和知識(shí)。(維基百科預(yù)報(bào)(Forecasting):基于過(guò)去的數(shù)據(jù)對(duì)未來(lái)進(jìn)行預(yù)測(cè)。(維基百科)預(yù)言(Prophecy):通過(guò)神力或者非凡的能力所獲得的對(duì)現(xiàn)時(shí)的真理和事實(shí)的宣布。(維基百科)1996年2月10日,IBM公司的超級(jí)電腦深藍(lán)首次挑戰(zhàn)國(guó)際象棋世界冠軍卡斯帕羅夫,但以2:4落敗。比在2月17日結(jié)束。其后研究小組把深藍(lán)加以改良,1997年5月再度挑戰(zhàn)卡斯帕羅夫,比在5月11日結(jié)束,最終深藍(lán)電腦以3.5:2.5擊敗卡斯帕羅夫,成為首個(gè)在標(biāo)準(zhǔn)比時(shí)限內(nèi)去敗國(guó)際象棋世界冠軍的電腦系統(tǒng)。2016年3月,GoogleDeepMind開(kāi)發(fā)的人工智能圍棋程序AlphaGo(被戲稱為"阿爾法狗”)挑戰(zhàn)世界冠軍韓國(guó)職業(yè)棋手李世石九段,分別于3月9日、10日、12日、13日和15日進(jìn)行了五番棋,最終AlphaGo4:1戰(zhàn)勝了李世石(參見(jiàn)圖1.11)o2017年5月23日,AlphaGo在中國(guó)烏鎮(zhèn)開(kāi)始挑戰(zhàn)世界圍棋第一高手中國(guó)的柯潔九段,最終以3:0圖1.11兩個(gè)時(shí)代里機(jī)器挑戰(zhàn)人類的比,雖然過(guò)程不同,但最終的結(jié)果都是機(jī)器獲勝。國(guó)際象棋被譽(yù)為人類智慧的試金石,結(jié)果特級(jí)大師敗得毫無(wú)懸念,圍棋曾被認(rèn)為是人工智能無(wú)法攻克的堡壘,結(jié)果也出乎所有人意料地獲勝了。這兩次震驚世界的大都引發(fā)了新一輪的人工智能熱潮,尤其是AlphaGo獲勝的這一次,對(duì)人類帶來(lái)的驚天動(dòng)地的影響還在繼續(xù),而且看不到衰減的趨勢(shì)。人類雖然輸了比,但是贏了未來(lái)。深藍(lán)和AlphaGo雖然都被稱為人工智能,但是它們實(shí)現(xiàn)的原理和思維方式卻完全不同。深藍(lán)(DeepBlue)是由IBM開(kāi)發(fā)的,專門用以分析國(guó)際象棋的超級(jí)計(jì)算機(jī)。當(dāng)時(shí)電腦的計(jì)算能力普遍不行,深藍(lán)作為超級(jí)計(jì)算機(jī),主要靠算能力來(lái)搜索各種可能。國(guó)際象棋的變化相對(duì)較少,那時(shí)即使無(wú)法搜索全部的可能性,也能覆蓋很大一部分,再加上人們專門針對(duì)國(guó)際象棋的規(guī)則進(jìn)行開(kāi)發(fā),甚至請(qǐng)來(lái)了特級(jí)大師教程序員制定對(duì)付卡斯帕羅夫的規(guī)則。所以深藍(lán)的勝利主要是硬件和優(yōu)化算法的勝利。AlphaGo,直譯是阿爾法圍棋,當(dāng)2015是當(dāng)時(shí)的計(jì)算能力可以染指的,直到阿爾法狗戰(zhàn)勝李世石,同時(shí)人們深入研究了Google公開(kāi)的論文之后,才明白其中的道理。狗就像一個(gè)不眠不休不死不睡的高手,仍然能通過(guò)不斷的學(xué)習(xí)(包括學(xué)習(xí)自己的棋譜)繼續(xù)進(jìn)步。關(guān)于深藍(lán)和阿爾法狗的技術(shù)細(xì)節(jié)我們就不進(jìn)行詳細(xì)的對(duì)比了。其中最關(guān)鍵的差異在于兩種不同的推理方法:演繹和歸納。演繹法最早是古希到各種各樣合理的結(jié)果。歸納法的思維方式正好相反,主要是通過(guò)特定的結(jié)果來(lái)研究前提,是一種由特殊推向一般的推理過(guò)程,通過(guò)現(xiàn)象去匹配假設(shè),過(guò)程中可以產(chǎn)生新的知識(shí),但因?yàn)檫@種推理過(guò)程中包含很多不確定性,所以并不能確保得到準(zhǔn)確的結(jié)果。[19】回到深藍(lán)和阿爾法狗的例子,深藍(lán)就是典型的演繹推理,通過(guò)各種預(yù)設(shè)規(guī)則和最優(yōu)化算法,根據(jù)場(chǎng)上形勢(shì)不斷推演,尋找最優(yōu)解。阿爾法狗規(guī)則,在深度學(xué)習(xí)的模型中甚至都不是顯式的規(guī)則,也沒(méi)辦法教給人類,但用在棋局中能獲勝。能,也是以歸納推理為主,從數(shù)據(jù)中得到知識(shí),也可以稱為數(shù)據(jù)科學(xué),在“第154頁(yè):5.1.4大數(shù)據(jù)時(shí)代新紀(jì)元”中有更詳細(xì)的討論。歸納(Induction):對(duì)事物特殊的代表進(jìn)行有限觀察,把性質(zhì)或關(guān)系歸結(jié)到類型,或基于對(duì)反復(fù)再現(xiàn)的現(xiàn)象的模式進(jìn)行有限觀察,總結(jié)出公式或規(guī)律。(維基百科)演繹(Deduction):2015年10月8日,中國(guó)科學(xué)家屠呦呦獲得2015年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng),成為第一個(gè)獲得諾貝爾自然學(xué)獎(jiǎng)的中國(guó)人。無(wú)論是作為中國(guó)人的驕反對(duì)者很快樹殳一個(gè)“人們認(rèn)為青蒿素是中藥”的靶子,開(kāi)始大肆攻擊,持續(xù)的進(jìn)攻將中國(guó)傳統(tǒng)醫(yī)學(xué)和中藥貶得一錢不值。其實(shí)兩派的爭(zhēng)論由來(lái)已久,參與網(wǎng)絡(luò)爭(zhēng)論的這兩撥兒人大多數(shù)并不懂中藥也不懂西藥,爭(zhēng)論的源頭很可能純粹是信仰的差異。對(duì)于這個(gè)話題,我們不涉及信仰之爭(zhēng),主要談藥。藥和醫(yī)是不同的,中醫(yī)和西醫(yī)都是太大的領(lǐng)域,說(shuō)來(lái)話長(zhǎng)。相對(duì)來(lái)說(shuō),藥學(xué)比較偏技術(shù),也依賴數(shù)據(jù),統(tǒng)計(jì)學(xué)可以在其中發(fā)揮很重要的作用。一款新藥的研發(fā)和上市要經(jīng)過(guò)非常復(fù)雜的流程。一般來(lái)說(shuō),首先是新藥發(fā)現(xiàn)和臨床前試驗(yàn)(Preclinical)驗(yàn)階段。如果按照FDA(美國(guó)食品藥品監(jiān)督管理局)的標(biāo)準(zhǔn)流程進(jìn)行試驗(yàn)的話,需要進(jìn)行四期的臨床試驗(yàn),只有通過(guò)了層層考驗(yàn)之后,才能在新藥研發(fā)的過(guò)程中,無(wú)論是時(shí)間還是資金成本,最大份額都在于臨床試驗(yàn),這是搞統(tǒng)計(jì)的人可以愉快玩耍的領(lǐng)域。而網(wǎng)絡(luò)上西藥和中藥的中藥支持者驕傲的理由是青蒿素“新藥發(fā)現(xiàn)”的靈感來(lái)自中藥的方子,而后面的動(dòng)物試驗(yàn)到人體試驗(yàn)都和目前主流的新藥研發(fā)流程沒(méi)什么區(qū)別。中醫(yī)反對(duì)者認(rèn)為中醫(yī)在其中的作用完全只是巧合。保護(hù)期不會(huì)等人,藥廠面臨的壓力很大。本來(lái)化合物的篩選就像撞大運(yùn)一般,沒(méi)有特別好的方法來(lái)找到人們想要的。據(jù)媒體 報(bào)道,當(dāng)年美國(guó)為了越戰(zhàn)抗瘧的需要篩選了30仍然拿青蒿素來(lái)舉例,西藥的藥理學(xué)會(huì)研究化合物對(duì)人體的作用,通常的表述方式是這樣的:“它們將修飾或抑制瘧原蟲生長(zhǎng)所需要的大分據(jù)建立藥物進(jìn)入血液后的藥動(dòng)學(xué)模型和藥效學(xué)模型,這樣才可以量化地研究其規(guī)律,用統(tǒng)計(jì)模型來(lái)描述藥和人體之間的關(guān)系,然后通過(guò)各項(xiàng)試驗(yàn)的數(shù)據(jù)來(lái)驗(yàn)證,并依賴且僅依賴于大規(guī)模人體試驗(yàn)的數(shù)據(jù)來(lái)判斷該藥是有效且輕害的。中醫(yī)和中藥的全部,從神農(nóng)嘗百草開(kāi)始的試驗(yàn)思想以及以療效為唯一目的的統(tǒng)計(jì)思想才是值得稱道的?,F(xiàn)在有些人過(guò)多地關(guān)注數(shù)學(xué)模型相對(duì)于玄學(xué)模型的優(yōu)勢(shì),而忘了模型的本質(zhì)只是研究真實(shí)世界的一種不得已而用之的手段,刻意強(qiáng)調(diào)方法的“科學(xué)性”而忽視大規(guī)模數(shù)據(jù)的驗(yàn)1.12描述了西藥中的房室模型和中藥中的經(jīng)學(xué)是唯一的真理,但相信科學(xué)是目前認(rèn)識(shí)世界的最好工具。圖1.12目前來(lái)看,中藥和西藥最大的差異在于藥理,很顯然古代中藥的藥理學(xué)很不科學(xué),現(xiàn)代人致力于將中藥理論科學(xué)化但是效果并不好??墒乾F(xiàn)代制藥流程中最接近真理的地方可能并不在于藥理,而是藥效,甚至可以認(rèn)為現(xiàn)代藥學(xué)最核心的部分就是試驗(yàn)。就拿所有人都不會(huì)反對(duì)的FDA(美國(guó)藥監(jiān)局)FDA的經(jīng)典之作?,F(xiàn)代社會(huì)的西藥之所以安全,主要因?yàn)榇笠?guī)模試驗(yàn)后的數(shù)據(jù)分析,這就是統(tǒng)計(jì)學(xué)的重要作用。神,歷史也證明了中醫(yī)對(duì)整個(gè)民族的貢獻(xiàn),我們看問(wèn)題要實(shí)事求是,不能用是否具有“科學(xué)”的數(shù)學(xué)模型來(lái)一刀切。那么統(tǒng)計(jì)學(xué)是否能支持中藥呢?很顯然,統(tǒng)計(jì)不拒絕任何對(duì)人類有幫助的東西,我們只相信數(shù)據(jù)及其結(jié)論。但是實(shí)際的情況是,中藥基本上以很容易地設(shè)計(jì)臨床試驗(yàn)和進(jìn)行統(tǒng)計(jì)分析。而中藥在臨床試驗(yàn)中面臨的最大問(wèn)題就是混合物的問(wèn)題。哪怕只包含兩個(gè)化合物,光是研究協(xié)同不容易,如果對(duì)精度要求不高,也得用最優(yōu)化的方法來(lái)求解,如果要求嚴(yán)格的比例控制的話,基本就不可能了。中國(guó)藥監(jiān)局還是美國(guó)的FDA,藥,都能在統(tǒng)計(jì)學(xué)的護(hù)持下健康地發(fā)展。藥物代謝動(dòng)力學(xué)(Pharmacokinetics):簡(jiǎn)稱為“藥動(dòng)學(xué)”,主要是定量研究藥物在生物體內(nèi)的活動(dòng)過(guò)程(吸收、分布、代謝和排泄),并運(yùn)用數(shù)學(xué)原理和方法闡述藥物在機(jī)體內(nèi)的動(dòng)態(tài)規(guī)律的一門學(xué)科。2013年3月28日,統(tǒng)計(jì)學(xué)家喬治?伯克斯(GeorgeBox)93歲。他的離去引來(lái)社會(huì)各界的無(wú)限追思。伯克斯教授被公認(rèn)為20世紀(jì)后半期最重要的三位統(tǒng)計(jì)學(xué)家之一(另兩位是約翰?圖基和D.R.考克斯),在工業(yè)、經(jīng)濟(jì)、商業(yè)、農(nóng)業(yè)、環(huán)境等諸多領(lǐng)域都留下了很多以他的名字命名的方法。對(duì)公眾來(lái)說(shuō),印象最深的可能還是那句名言:"所有模型都是錯(cuò)誤的,但有些是“所有模型都是錯(cuò)誤的”,聽(tīng)起來(lái)有些極端,有些人會(huì)感覺(jué)信仰受到了傷害,還有些人會(huì)借此來(lái)攻擊統(tǒng)計(jì)模型。實(shí)際上,如果我們足夠了解是邪教,以科學(xué)的初衷做出很多不科學(xué)的事來(lái),可能會(huì)帶來(lái)比較大的危害。我們?cè)凇暗?7頁(yè):1.3.4或者現(xiàn)象(),然后一個(gè)天才人物站在巨人的肩膀上提出一個(gè)假說(shuō)(),再后來(lái)會(huì)有很多真實(shí)數(shù)據(jù)或者實(shí)驗(yàn)來(lái)支持這個(gè)假說(shuō)(卡文迪許實(shí)驗(yàn))。一旦發(fā)現(xiàn)某個(gè)反例,說(shuō)明該假說(shuō)被證偽,或者在一定范圍內(nèi)被證偽,然后就會(huì)有新的理論進(jìn)行彌補(bǔ)或者替代(比如量子力學(xué)),然后進(jìn)入新的發(fā)展周期,于是科學(xué)在不斷否定中進(jìn)步。人類社會(huì)也跟著科學(xué)一起發(fā)展進(jìn)步。波普爾1和實(shí)驗(yàn)來(lái)驗(yàn)證,如果每次驗(yàn)證都是對(duì)的,不能說(shuō)命題就是對(duì)的,但只要有一次驗(yàn)證發(fā)現(xiàn)錯(cuò)了,那么就被證偽了,這個(gè)命題也就被推翻法精確地證偽,而很多命題被證偽了也不一定是科學(xué)命題,比如“處女座的人都有潔癖”顯然不是科學(xué)命題。們?cè)凇暗?1頁(yè):1.4.2深藍(lán)與阿爾法狗”也介紹了歸納推理和演繹推理的差異,確實(shí)使用歸納邏輯更容易犯錯(cuò),iKarlRaimundPopper(1902年7月280-1994年9月17日),出生于奧地利,逝于英國(guó)倫敦,猶太人,被譽(yù)為20世紀(jì)最偉大的哲學(xué)家之(尤其是對(duì)歷史數(shù)據(jù)進(jìn)行分析)要注意不能把特殊性當(dāng)成一般性,盲目相信數(shù)據(jù)和經(jīng)驗(yàn)。使用演繹思維的時(shí)候,也不能陷入極端的封閉中越繞越接近真理,但通常會(huì)更有用。用科學(xué)的方式得到有用的假說(shuō)是大家都認(rèn)可的,歸納和演繹其實(shí)最大的差別是得到“更好的”假說(shuō)的方式。(JohnMacmurray)曾說(shuō)過(guò):“對(duì)科學(xué)來(lái)說(shuō),并不在決問(wèn)題,就是好的模型。當(dāng)發(fā)現(xiàn)不管用的時(shí)候,或者出問(wèn)題的時(shí)候,我們需要繼續(xù)尋找一個(gè)更好的模型,這才是科學(xué)的態(tài)度,也是解決問(wèn)題科學(xué)(Science):是通過(guò)經(jīng)驗(yàn)實(shí)證的方法,對(duì)現(xiàn)象(原來(lái)指自然現(xiàn)象,現(xiàn)泛指包括社會(huì)現(xiàn)象等現(xiàn)象)進(jìn)行歸因的學(xué)科。(維基百科)哲學(xué)(Philosophy):(維基百科)第2統(tǒng)計(jì)學(xué)是一門關(guān)于數(shù)據(jù)的科學(xué),但是針對(duì)數(shù)據(jù)進(jìn)行分析的方法并不只有統(tǒng)計(jì)學(xué)這一種。只要能夠從數(shù)據(jù)中獲取價(jià)值,可以通過(guò)可復(fù)制的方式科學(xué)性,所以能夠?qū)崿F(xiàn)可重復(fù)研究,同時(shí)又不局限于數(shù)學(xué)的背景,所以能以更加靈活的方式從數(shù)據(jù)中獲取價(jià)值。但是對(duì)于各類方法,如果能有堅(jiān)實(shí)的數(shù)學(xué)基礎(chǔ),將能更好地理解其中的原理和應(yīng)用邊界,否則很容易誤解或者不自信。在當(dāng)今的時(shí)代里,各作,但其中的危險(xiǎn)性也不可不知,這就需要掌握一定的數(shù)學(xué)知識(shí),從而可以對(duì)方法有比較透徹的理解。第1了解,可以參閱線性代數(shù)【23】的相關(guān)書籍,也可以跳過(guò)此處內(nèi)容,不太影響后續(xù)的閱讀。第2節(jié)“隨機(jī)變量和分布”介紹了概率分布的基礎(chǔ),和第1章中介紹的古典概率論不同,此處引入了隨機(jī)變量和分布函數(shù)這些專業(yè)的工具,但概率論的相關(guān)書籍【24】,也可以跳過(guò)此處內(nèi)容,不太影響后續(xù)的閱讀。第3節(jié)“認(rèn)識(shí)數(shù)據(jù)”主要是從工程角度對(duì)數(shù)據(jù)的介紹,如果有實(shí)際的數(shù)據(jù)處理經(jīng)驗(yàn)(使用過(guò)Excel或者數(shù)據(jù)庫(kù)等)將能更好地理解其中的內(nèi)第4基礎(chǔ)不夠,可以參考一些數(shù)理統(tǒng)計(jì)相關(guān)書籍Ml,也可以跳過(guò)其中的數(shù)學(xué)公式,結(jié)合具體的例子理解其中的統(tǒng)計(jì)思想即可。在一維的世界里,整個(gè)空間就是一根線,假設(shè)里面生活了一只題子,那么蟲子永遠(yuǎn)只知道前后,不知道左右。在二維的世界里,空間是一個(gè)可憐蟲。三維世界是我們生活的世界,除了前后左右之外,我們的空間還有上下之分(參見(jiàn)圖2.1)o是否存在四維空間?我們不知道也想象不到,正如“夏蟲不可以語(yǔ)冰”一般,三維蟲不可以語(yǔ)四維也。所謂空間,在數(shù)學(xué)上有嚴(yán)格的定義,也存在各種各樣不同的空間,但最常用也最符合我們理解真實(shí)世界直覺(jué)的是歐幾里得空間(EuclideanSpace的就是笛卡兒坐標(biāo)系(CartesianCoordinateSystem),也稱為直角坐標(biāo)系。圖2.2中箭頭所在的點(diǎn)的坐標(biāo)為(3,2)O圖2.2對(duì)于二維平面來(lái)說(shuō),我們通常把橫軸稱為X軸,把縱軸稱為Y軸,為了不失一般性,我們也可以將它們稱為第一軸(記為Xi)為X2)oXi和X2三個(gè)值。超過(guò)三維的"維空間我們想象不出來(lái),但是類比可以知道其中點(diǎn)的坐標(biāo)一定是包含n個(gè)值的。對(duì)于這樣的情況,我們使用向量(Vector)由n個(gè)實(shí)數(shù),???,x?組成的一個(gè)數(shù)組x或X’”稱為向量的維數(shù),表示向量中元素的個(gè)數(shù)。向量默認(rèn)為列的形式,右上角的撇(')(Transpose),也就是旋轉(zhuǎn)成行的形式。所以我們用x來(lái)代表一個(gè)向量的時(shí)候通常是指按列排列的,如果為了排版的需要而橫著排,就記為乂'。向量x在幾何上可表示為一個(gè)n維有向線段,它沿第一個(gè)軸的坐標(biāo)為X1,沿第二個(gè)軸的坐標(biāo)為X2……沿第n個(gè)軸的坐標(biāo)為X”。一個(gè)向量可以表示n維空間中的一個(gè)點(diǎn),即該有向線段(箭頭)的頂點(diǎn)。圖2.2就展現(xiàn)了二維空間中的向量x,根據(jù)向量的定義,我們可以知道該向量為=[3,2]向量可以進(jìn)行運(yùn)算,比如標(biāo)量乘法(ScalarMultiplication),又稱數(shù)乘,向量乘以一個(gè)實(shí)數(shù)相當(dāng)于其每個(gè)元素都乘以該實(shí)數(shù):C"=…,c?x”]向量長(zhǎng)度伸長(zhǎng)或縮短,變?yōu)樵瓉?lái)的c倍,但是方向不變,如圖2.3圖2.3Addition)運(yùn)算。向量加法表示將兩個(gè)向量的各元素分別相加:xix+y(有些領(lǐng)域也稱矢量),具有大小和方向,計(jì)算合力就是做向量加法。如圖2.3的右圖所示。x'[xi,X2,...,xny'yi,y2,???,!/”],我們定義其內(nèi)積(InnerProduct)運(yùn)算如下:x'y=Xiyi+X2yi+???+xnyn內(nèi)積也稱為點(diǎn)積(DotProduct),記為x'y。向量的長(zhǎng)度L’(也記作||x||)兩個(gè)向量之間還存在夾角,我們記向量x和y的夾角為0,則有cos(0)=x'y/(L』y)。如果x'y=0,說(shuō)明0=90°,稱為x與y垂直。向量之間還可以定義距離,在歐氏空間里,對(duì)于向量£= []/1,]/2,...,如,其歐氏距離dxvdxy=d(X1—yi)2+(X2—]/2)2+…+(X”-對(duì)于兩個(gè)向量:xr[xi,x2,...,xn]和???,%],我們還可以定義兀在y上的投影為:豈y。該投影也是一個(gè)向量,與向量y的方向相同,如圖2.4圖2.4中去可以解決更多更復(fù)雜的問(wèn)題。向量(Vector)“Matrix”TheMatrix,里面的“母體”(Matrix統(tǒng)連接,思維活在這個(gè)虛擬的世界而不自知,很多人第一次看的時(shí)候非常震撼?!蹲冃谓饎偂防锩嬗幸粋€(gè)"能源寶"(MatrixofLeadership),Matrix一詞的本意就是母體,英國(guó)數(shù)學(xué)家西爾維斯特(JamesJosephSylvester)于1850年用它來(lái)命名我們今天所熟知的"矩陣”,至此Matrix這個(gè)詞就深入到數(shù)學(xué)應(yīng)用的各個(gè)領(lǐng)域A伉a12久22?Qm2我們記該矩陣為A,用川來(lái)表示矩陣A血a12伉a21A伉仇22?O?22Qm2^2n其中加和卅稱為矩陣的維數(shù)(Dimension),如果兩個(gè)矩陣A和BAB。如果AA為對(duì)稱矩陣(SymmetricMatrix)o設(shè)c為任一實(shí)數(shù),矩陣A={夠},CQ]CC21Cfl22cACC?c?該運(yùn)算稱為矩陣的標(biāo)量乘法(ScalarMultiplication),也稱為“數(shù)乘”。標(biāo)量乘法滿足交換律:c-A=A-co設(shè)矩陣A={a,;}和矩陣B={切}具有相同的維數(shù),A和B之間可以進(jìn)行(mxn) 各種運(yùn)算。直中AB稱為矩陣加法(MatrixAddition?11+a122A+Ba21+?22+22a2n+_aml+Qm2+^m2^mn+矩陣加法滿足交換律:A+B=B+Ao矩陣減法與加法類似:A-B=A+(-l)-AQB稱為哈達(dá)瑪乘積(HadamardProduct11?a1212in*A0Bfl21?fl2222?a2n?_aml*Qm2*bm2amn'AQB設(shè)矩陣A={切}和矩陣B={&,■,},矩陣乘法(MatrixProduct)AB定 刀7=1伉1/?切2?…E/Li-匸7=121?bi2??.E/L1^21-E/L1aml'E/LlQml?bi2…刀7=1伉詼?AB也可記作ABmxn和料xk的兩個(gè)矩陣相乘后,生成的新矩陣的維數(shù)為mxk。注意,矩陣乘法不滿足乘法交換律,亦即AB不一定等于BAO如果一個(gè)矩陣的行數(shù)與列數(shù)相等,則稱為方陣(SquareMatrixo0的方陣稱為對(duì)角矩陣(DiagonalMatrix)o對(duì)角線上的值都為1的對(duì)角矩陣稱為單位矩陣(IdentityMatrix),如下
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 嚴(yán)重精神障礙患者管理指南
- 《GB-T 26599.1-2011激光和激光相關(guān)設(shè)備 激光光束寬度、發(fā)散角和光束傳輸比的試驗(yàn)方法 第1部分:無(wú)像散和簡(jiǎn)單像散光束》專題研究報(bào)告
- 《GBT 29493.7-2013紡織染整助劑中有害物質(zhì)的測(cè)定 第7部分:聚氨酯涂層整 理劑中二異氰酸酯單體的測(cè)定》專題研究報(bào)告
- 《GB-T 38909-2020民用輕小型無(wú)人機(jī)系統(tǒng)電磁兼容性要求與試驗(yàn)方法》專題研究報(bào)告
- 《GBT 29534-2013溫鍛冷鍛聯(lián)合成形鍛件 通 用技術(shù)條件》專題研究報(bào)告
- 《GBT 35618-2017 社會(huì)保險(xiǎn)基金預(yù)算編制基本業(yè)務(wù)規(guī)范》專題研究報(bào)告
- 《GB-T 39588-2020靜電屏蔽包裝袋要求及檢測(cè)方法》專題研究報(bào)告
- 《GB-T 13465.2-2014不透性石墨材料試驗(yàn)方法 第2部分:抗彎強(qiáng)度》專題研究報(bào)告
- 2026年陜西省西安市單招職業(yè)適應(yīng)性考試題庫(kù)及完整答案詳解1套
- 云計(jì)算遷移咨詢協(xié)議
- 醫(yī)學(xué)高數(shù)期末考試題及答案
- 預(yù)征預(yù)儲(chǔ)協(xié)議書
- 單純性腎囊腫護(hù)理
- 表面摩擦磨損機(jī)理-深度研究
- DB11-T 1073-2014 城市道路工程施工質(zhì)量檢驗(yàn)標(biāo)準(zhǔn)
- 資金監(jiān)管三方協(xié)議范本
- 2022年9月國(guó)家開(kāi)放大學(xué)??啤陡叩葦?shù)學(xué)基礎(chǔ)》期末紙質(zhì)考試試題及答案
- 2023-2024學(xué)年廣東省廣州市荔灣區(qū)九年級(jí)(上)期末數(shù)學(xué)試卷(含答案)
- GB/T 45015-2024鈦石膏綜合利用技術(shù)規(guī)范
- 孕期膽囊炎的臨床特征
- 《飼料添加劑枯草芽孢桿菌》編制說(shuō)明
評(píng)論
0/150
提交評(píng)論