版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
鐘形曲線上的窄尾巴2016年2月17日14:54
閱讀409TailsofGreatSoccerPlayers偉大足球運(yùn)動員的窄尾分布作者:Jacob@2015-11-19
譯者:Veidt(@Veidt)
校對:Drunkplane(@Drunkplane-zny)
來源:PutANumberOnIt!,/2015/11/10/003-soccer1/Isn’titstrangethattheChinesearen’tworldchampionsineverysingleteamsport?Here’swhyit’sstrange:Chinahas19%oftheworld’spopulation.Forindividualsportsthatmaynotbeahugedeal:iftennisabilityandopportunityaredistributedequallyaroundtheworld,therewouldbeonlya19%chancethatthebesttennisplayerhailsfromChinaand81%thatheis
Swiss,
Serbian,
Spanish,
Scottish
orfromanyothercountry.Itissomewhatsurprisingseeingthetop5superiorserversandstrikersofsoftspringysphereswithswingsofstringedracquetsallcomefromsovereignstatesthatstartwith“S”,butthat’saseparatestory.中國沒能在所有團(tuán)隊(duì)運(yùn)動項(xiàng)目中成為世界冠軍著實(shí)是件奇怪的事情。這之所以奇怪,是因?yàn)橹袊鴵碛兄澜?9%的人口。對于個人運(yùn)動項(xiàng)目來說,也許這個數(shù)字還并不算太大:如果打網(wǎng)球的能力和機(jī)會在全球均等地分布,那么全世界最好的網(wǎng)球運(yùn)動員來自中國的概率僅有19%,而他來自于瑞士,塞爾維亞,西班牙,蘇格蘭或者任何其它國家的概率則有81%。全世界最具統(tǒng)治力的5名網(wǎng)球選手都來自于國名以“S”開頭的國家這件事情的確有點(diǎn)令人吃驚,但那是另一件事情。Inteamsportsthatshouldbedifferent.IfsoccertalentwasequallyspreadChinashouldhaveonaverage19ofthetop100playersineachgeneration,almostneverlessthan11.CountrieslikeSpain,GermanyandFranceontheotherhandwouldexpecttohave1playerinthetop100,maybe2or3ifthey’relucky.ThatwouldbenomatchfortheloadedChinesesquad.Evenatop3playercan’tdominateallbyhimselfinateam-basedsportlikesoccer,asevidencedbythebelowpictureofsadRonaldo.在團(tuán)隊(duì)運(yùn)動中情況則完全不同。如果踢足球的天賦在世界上均等地分布,那么平均而言,在每一代世界上最好的100名球員中,中國會擁有19個,而這個數(shù)字幾乎絕不可能低于11。另一方面,西班牙,德國和法國這些國家則通常只會有1名球員進(jìn)入全球前100名,即使幸運(yùn)的話也最多只有2或3名。而他們的隊(duì)伍應(yīng)該完全無法與皆由精英組成的中國隊(duì)抗衡。畢竟,即使是排名世界前3的球員也無法在足球這樣的一項(xiàng)團(tuán)隊(duì)運(yùn)動中靠一己之力統(tǒng)治比賽,下圖中C羅悲傷的表情充分證明了這一點(diǎn)。Andyet,theChineseteamisnotgoodatsoccer,andI’mputtingthat
milderthansome.TheChinesemen’snationalsoccerteamisranked
84thintheworld,afewspotsbelow
AntiguaandBarbuda
–anationwithapopulationof90,000.That’sroughlyequaltoasingleneighborhoodinShanghai.但實(shí)際上中國足球隊(duì)的水平并不高,而我的這種表述方式已經(jīng)比一些人溫和得多了。中國男子國家足球隊(duì)的世界排名是第84位,他們的積分比安提瓜和巴布達(dá)還要低上幾分,而這個國家的人口僅有9萬,幾乎只相當(dāng)于上海的一個街區(qū)。Motivationisoftenbroughtupasanexplanation:perhapstheChinesehavethetalentandopportunitytoplaysoccer,but
all1.3billionofthem
choosenotto.Perhapsinsteadofplayingsoccertheychoosetostudy.Thosethatplaysoccertheleastandstudythemostcangointomedicine,andthosethatstudyhardestofallandhavenoroomforsoccermakeitintotopmedicalschoolsintheUS.常被提到的一個理由是動力不足:也許中國人擁有踢足球的天賦和機(jī)會,但是13億中國人卻選擇不去踢。也許他們寧愿把時間花在學(xué)習(xí)上。那些踢球踢得少,讀書讀得多的孩子可以去學(xué)醫(yī),而那些在學(xué)習(xí)上最用功以至完全沒時間踢球的孩子將在未來進(jìn)入美國最好的醫(yī)學(xué)院。Certainlywedon’texpect
those
Chinesetoplaysocceratall,andyetbelowisagroupphotooftheEmoryUniversitymedicalschoolsoccerclub.ThesummerIwasthereweplayedatleast4hoursaweek.Youcaneasilyfindmeonthephoto,I’moneof
threenon-Chinese
peopleontheteam.顯然我們不會相信中國人完全不踢足球,下面是一組埃默里大學(xué)醫(yī)學(xué)院足球俱樂部的照片。在那個夏天,我每周至少在那里踢上4個小時足球。你可以輕松地在照片上找到我,我是那支球隊(duì)里僅有的三名非華人球員之一。Thesuccessofanationalsoccerteamshoulddependontwofactors:thepoolofavailableplayers(population)andsomecombinationofnaturaltalent,infrastructureandopportunitythatdetermineroughlyhowsuccessfulanaveragepersoninthatcountrycanbeatsoccer.I’llcallthecombinedsecondthing
nationalsocceraffinity,andwillimmediatelynotethatit’sa
huge
simplificationtothrowsomanydisparatethingsintoasinglefactor.一支國家足球隊(duì)的成功主要依賴于以下兩個因素:可供他們選擇的球員人數(shù),還有某種天賦、基礎(chǔ)設(shè)施和機(jī)遇的組合,這大體上決定了這個國家的普通人能在足球方面所能達(dá)到的平均高度。在后文中我會將這種組合稱作一個國家的“足球親和性”,并會很快提到將如此多不相關(guān)的東西整合到一個因子里實(shí)際上是一種極大的簡化做法。Mygoalistoseparatetheeffectsofpopulation,soaffinityisbasicallyeverythingthat’sindependentofacountry’stotalsize.Iammakingnoguessesregardingthecomponentsofsocceraffinity(maybeit’sallabouthavingenoughsunshinedaysforkidstoplayoutdoors),onlyinthecomparisonbetweencountries.ThequestionIwanttoinvestigateis:我的目標(biāo)是將人口因素單獨(dú)分離出來,所以“親和性”這個概念基本就是所有與一個國家的人口數(shù)量不相關(guān)的因素。我也不會對“足球親和性”這個概念的具體組成做任何的猜測(也許它只涉及有足夠多晴朗的日子讓孩子們在室外踢球),而僅僅是在國家之間進(jìn)行比較。我想探索的問題是:Relativetotheirpopulation,whichcountriesarethebestandworstatsoccer?Andwhy?
相對于其人口數(shù)量,哪些國家在足球方面做得最好?而哪些國家又做得最差?為什么?Ifweimaginethatsocceraffinityis
normallydistributed,acountry’spopulationisthesizeofthebellcurveandthenationalaffinityishowfartotherightontheabilityaxisthecenterofthebellcurveis.Thelevelofacountry’snationalteamishowfarontheabilityaxisthebest11menandwomenare.如果我們假設(shè)“足球親和性”這個因子服從正態(tài)分布,一國的人口就是鐘形曲線的面積,而一個國家的“足球親和性”則可以被定義為鐘形曲線的中心線在能力軸上的投影與原點(diǎn)之間的距離。而該國國家隊(duì)的水平則取決于該國最優(yōu)秀的11名男球員和女球員在能力軸上所處的位置。Clearly,havingalargerbellcurve(morepeopleateverylevelofplay)andshiftingthecurvetotheright(betterplayersonaverage)should
both
contributetoboostingthelevelofthenationalteam.Thefactthatthereareover15,000
ChineseforeachAntiguan,andyetthesoccerteamsarecomparableinlevel,presentsthefollowingpuzzle:很顯然,擁有一個面積更大的鐘形曲線(在各種水平上都擁有更多的人口)以及讓鐘形曲線向右移動(更高的球員平均水平)都有助于提升一國國家隊(duì)的水平。而中國的人口是安提瓜人口的15000倍,但這兩國的國家隊(duì)水平卻處于同一檔次這一事實(shí)則向我們提出了如下的難題:Whydoesitseemthatnationalteamleveldependsonaffinitymuchmorethanonpopulation?
為什么國家足球隊(duì)的水平對“足球親和性”的依賴程度要遠(yuǎn)遠(yuǎn)高于對人口的依賴程度?Theanswertothatpuzzleis:
Becausethetailsofanormaldistributionfallmuchfasterthanyouthink.而這個問題的答案是:因?yàn)橐粋€正態(tài)分布的尾部下降的速率比你想象的要快得多。Inplain(er)English:everypointonabellcurveissomedistanceawayfromthemiddle(themean).Thefurtherawayfromthemeanyougothelesspointsthereare(lowercurve).Thesedistancesareoftenmeasuredinstandarddeviations,orSD,shownbytheverticalredlinesonthepicture.Onastandardbellcurve,justover68%ofthepointsarefoundadistanceoflessthan1SDfromthemeanineitherdirection.更直白的就是:鐘形曲線上每個點(diǎn)和中心(也就是平均值)都存在一個距離。與平均值的距離越遠(yuǎn),這個水平上的點(diǎn)數(shù)也就越少(在曲線上就越低)。而與中心的距離通常是以標(biāo)準(zhǔn)差計(jì)的(在圖中用紅色的垂直線條表示)。在一個標(biāo)準(zhǔn)的鐘形曲線上,有68%的點(diǎn)都會落在均值兩端一個標(biāo)準(zhǔn)差的距離之內(nèi)。Lookingnaivelyatthefamiliarbellpicture,itseemsthatthecurvedropssharplyoverthefirst2or3SDtoeithersideandthenlevelsoffaround0whenyoumovefurtheraway.That’sextremelymisleading:the
relativeheight
ofthecurveactually
dropsfaster
the
furtherout
yougo.It’sinvisibleonthechartbecausethelinefurtherthan3SDoutissquishedverycloseto0.Theheightofthecurveat1SDis4.5timeshigherthanthatat2SD.Thecurveat5SDis250timeshigherthanthatat6SDanditkeepsgettingsteeperandsteeper.如果我們直觀地看一下這條熟悉的鐘形曲線,看起來曲線兩端在距離中心最初的兩三個標(biāo)準(zhǔn)差內(nèi)下降得非???,而在之后更遠(yuǎn)的距離上就會在零附近以一種接近水平的方式緩慢下降。而這實(shí)際上會造成巨大的誤導(dǎo):事實(shí)上,距離中心越遠(yuǎn),曲線的相對高度下降的速度越快。但由于在3個標(biāo)準(zhǔn)差之外,曲線被壓縮到了非常接近0的高度,所以在圖上我們看不到。曲線上1標(biāo)準(zhǔn)差處的高度是2標(biāo)準(zhǔn)差處的4.5倍,而5標(biāo)準(zhǔn)差處的高度則是6標(biāo)準(zhǔn)差處的250倍,而隨著離中心越來越遠(yuǎn),曲線的陡峭程度還在不斷上升。ThebestmalesoccerplayerinChina(ZhengZhi?)isalmostliterallyoneinabillion,whichmeansthathe’salmost6standarddeviationbetterthantheaverageChinese.IfthepopulationofChina
doubled
(they’reworkingonit!),therewouldbe2playersasgoodasZhengis.However,ifthepopulationofChinabecamejustonestandarddeviationbetteratsoccer,therewouldbeover200playersatleastasgood,andafewdozenwhoaremuchbetter.中國最好的男性球員(是鄭智嗎?)在中國差不多是十億里挑一了,這意味著他的水平比中國人的平均足球水平要高6個標(biāo)準(zhǔn)差。如果中國的人口增加一倍(他們的確在努力這么干?。?,那么中國將會出現(xiàn)兩個和鄭智一樣優(yōu)秀的球員。然而,如果中國人的平均足球水平能夠提高一個標(biāo)準(zhǔn)差的話,那么中國就會有超過200名球員和鄭智水平一樣高了,而且還會有幾十名球員的水平比他高得多。Itcouldbethatanormallydistributedsoccerskillmodeliswhollywrong,butitdoesseemtoexplainsomeofwhatweseeinreality.Foranythingthat’sdistributedroughlylikeabellcurve,thequalityofthe
best
peopleinalargeenoughgroup(likeacountry)dependsmuchmoreonsmalldifferencesinthe
average
levelthanonlargedifferencesin
total
population.Hey,Iwonderifthat’swhysomanyNobelprizewinnersare…*getsrepeatedlyelectrocuted*實(shí)際上這個正態(tài)分布的足球水平模型可能是完全錯誤的,但是它看起來的確解釋了一些我們在現(xiàn)實(shí)中觀察到的現(xiàn)象。對于任何一個分布接近鐘形曲線的群體,在一個足夠大的群體(比如一個國家)中,水平最高者的能力更多地取決于平均水平上的微小差異,而人口總數(shù)上的巨大差異所發(fā)揮作用則要小得多。嘿,現(xiàn)在我開始懷疑這就是為什么如此多的諾貝爾獎得主都死于觸電的原因了。Whoops,sorryaboutthat.Let’sseethiseffectinactionontheonetraitthatwecanallagreeisclosetonormallydistributedandvariesamongnations:
humanheight.抱歉這個梗有點(diǎn)欠。讓我們通過一個特征來看看這種效應(yīng)的實(shí)際力量,該特征的近似正態(tài)分布得到了大家認(rèn)可,而且在國家間存在差異:那就是人的身高。TheaverageIndiandude(sorryfortheandrocentrism,ladies,there’sjustbetterdataonmaleheightsandmalesoccerteams)is165cm(5′5″)andthereareroughly630millionofthem.TheaverageNorwegiandudeis180cm(5′11″)andthereare2.5million.Thestandarddeviationofmaleheightisaround6cmaroundtheworld.Ifheightsweredistributedinaperfectnormalbellcurvewiththoseparameterstheywouldlooklike:印度6.3億成年男性(女士們,抱歉了,這里看起來似乎有點(diǎn)大男子主義,但有關(guān)男性身高和男子足球隊(duì)的數(shù)據(jù)質(zhì)量的確更好)的平均身高是165厘米(5英尺5英寸)。而挪威250萬成年男性的平均身高則是180厘米(5英尺11英寸)。全世界身高的標(biāo)準(zhǔn)差大約是6厘米。如果身高完全服從一個由這些參數(shù)構(gòu)建的正態(tài)鐘形分布,那么看起來將會像下圖這樣:Asweplotthemsidebyside,theIndiancurvecompletelydwarfstheNorwegianone,evenforprettytalldudes.Thereare9Indianswhoareexactly180cm(5′11″)tallforeveryNorwegian.5′11″istall,butnot
super
tall.Thehighermeaneffectonlykicksinfortherealoutliers,solet’szoomtheaboveplotintothe
really
talldudes.當(dāng)我們把整個分布畫在一起,印度的曲線看起來完全壓倒了挪威的曲線,即使對于身高很高的成年男性也是這樣。印度和挪威身高180(5英尺11英寸)厘米的人口數(shù)量比例是9比1。5英尺11英寸算是高了,但并不是非常高。高均值效應(yīng)只有在那些真正的異常值上才會起作用,那么讓我們將圖上那些真的很高的成年男性所對應(yīng)的部分放大看看。Here,thepicturereversescompletely.Thereare100timesasmanyNorwegiansabove195cm(6′4″)asthereareIndians.Underanormaldistributionassumption,thetallestIndianat6′7″wouldonlymatchthe1,000thtallestNorwegian.在這里,情況完全顛倒了過來。身高超過195厘米(6英尺4英寸)的成年男性數(shù)量,挪威和印度的比例是100比1。在正態(tài)分布的假設(shè)之下,印度最高的成年男性的身高將是6英尺7英寸,而這個身高在挪威人中只能排在第1000位。It’simportanttorememberthatanormalbellcurveisaverysimplisticmodel,reallifeismessy,and
DharmendraSinghis8′1″.Eveninsidetherealmofmathematics,anormaldistributionhas
narrowertails
(theheightdropsfasterasyougetawayfromthemean)thanmostotherwidelyuseddistributionsthatlooksortalikeabellcurve(likethe
student’st
orthe
gamma
distributions).Anormalmodelunderestimatesthenumberofoutliersandoverstatestheimportanceofshiftingthemean.我們必須記住的是,正態(tài)分布的鐘形曲線是一種非常簡化的模型,真實(shí)情況要復(fù)雜得多,實(shí)際上印度最高的男性DharmendraSingh的身高是8英尺1英寸。即使在數(shù)學(xué)王國中,相比其他大多數(shù)常用的看起來像鐘形曲線的分布(例如學(xué)生t分布或gamma分布),正態(tài)分布也有著窄得多的尾部(這意味著在遠(yuǎn)離均值時,曲線下降的速度更快)。一個正態(tài)分布模型會低估異常值點(diǎn)的數(shù)量,同時會高估平均值移動的重要性。Withthatsaid,mymainpoints
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年中醫(yī)藥基礎(chǔ)知識理論與實(shí)際運(yùn)用練習(xí)題
- 2026年環(huán)境保護(hù)項(xiàng)目成本估算實(shí)戰(zhàn)測試題
- 2026年軟件工程行業(yè)職業(yè)水平考試題目解析
- 2026年旅游地理知識要點(diǎn)考試題庫
- 2026年公共關(guān)系從業(yè)人員技能測試題庫公關(guān)策略與危機(jī)處理
- 天主教在線婚前培訓(xùn)
- 2026年湖北藝術(shù)職業(yè)學(xué)院單招綜合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年江蘇衛(wèi)生健康職業(yè)學(xué)院單招綜合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年合肥物質(zhì)院附屬學(xué)校教師招聘2人考試參考試題及答案解析
- 2026上半年貴州事業(yè)單位聯(lián)考黔西市招聘295人筆試模擬試題及答案解析
- 超聲振動珩磨裝置的總體設(shè)計(jì)
- 新媒體藝術(shù)的發(fā)展歷程及藝術(shù)特征
- 醫(yī)保違規(guī)行為分類培訓(xùn)課件
- 講課學(xué)生數(shù)學(xué)學(xué)習(xí)成就
- 醫(yī)療器械法規(guī)對互聯(lián)網(wǎng)銷售的限制
- 西葫蘆栽培技術(shù)要點(diǎn)
- 系桿拱橋系桿預(yù)應(yīng)力施工控制要點(diǎn)
- 高中學(xué)生學(xué)籍表模板(范本)
- 三亞市海棠灣椰子洲島土地價格咨詢報告樣本及三洲工程造價咨詢有限公司管理制度
- 常見磁性礦物的比磁化系數(shù)一覽表
- 高中心理健康教育-給自己點(diǎn)個贊教學(xué)課件設(shè)計(jì)
評論
0/150
提交評論