2024年中級統(tǒng)計師考試統(tǒng)計方法筆記_第1頁
2024年中級統(tǒng)計師考試統(tǒng)計方法筆記_第2頁
2024年中級統(tǒng)計師考試統(tǒng)計方法筆記_第3頁
2024年中級統(tǒng)計師考試統(tǒng)計方法筆記_第4頁
2024年中級統(tǒng)計師考試統(tǒng)計方法筆記_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

記錄措施筆記第壹章記錄和數(shù)據(jù)第壹節(jié):記錄的含義壹、什么是記錄學●記錄是用來處理數(shù)據(jù)的,是有關數(shù)據(jù)的壹門學問。1、記錄學:是用以搜集數(shù)據(jù)、分析數(shù)據(jù)和由數(shù)據(jù)得出結論的壹組概念、原則和措施。2、記錄分析數(shù)據(jù)的措施分為:(1)描述記錄(2)推斷記錄描述記錄:是研究數(shù)據(jù)搜集、處理和描述的記錄學措施。其內(nèi)容包括怎樣獲得研究所需要的數(shù)據(jù),怎樣用圖表形式對數(shù)據(jù)進行處理和展示,怎樣通過對數(shù)據(jù)的綜合、概括與分析,得出所關懷的數(shù)據(jù)特性。推斷記錄:是研究怎樣運用樣本數(shù)據(jù)來推斷總體特性的記錄學措施。內(nèi)容包括參數(shù)估計和假設檢查兩大類;推斷記錄包括:(1)參數(shù)估計(2)假設檢查二、記錄的應用(壹)記錄的應用領域記錄是合用于所有學科領域的通用數(shù)據(jù)分析措施,是壹種通用的數(shù)據(jù)分析語言。第二節(jié)、數(shù)據(jù)類型壹、變量與數(shù)據(jù)變量的特點是從壹次觀測到下壹次觀測會出現(xiàn)不壹樣的成果,把觀測數(shù)據(jù)記錄下來就是數(shù)據(jù)。二、數(shù)據(jù)類型(壹)定性變量(數(shù)據(jù))與定量變量(數(shù)據(jù))(1)定性變量定性變量的觀測成果稱為定性數(shù)據(jù)。定性變量的特點:只反應現(xiàn)象的屬性特點,不能闡明詳細量的大小和差異;●定性變量包括分類變量和次序變量。●分類變量:只反應現(xiàn)象分類特性的變量稱分類變量。分類變量沒有數(shù)值特性,因此不能對其數(shù)據(jù)進行數(shù)學運算。分類變量觀測成果就是分類數(shù)據(jù);分類數(shù)據(jù)只能用來辨別事物,不能用來表明事物之間的打下、優(yōu)劣關系?!翊涡蜃兞浚杭偃珙悇e具有壹定的次序,這樣的變量稱為次序變量。次序變量不僅能用來辨別客觀現(xiàn)象的不壹樣類別,并且還可以表明現(xiàn)象之間的大小、高下、優(yōu)劣關系。次序變量的觀測成果就是次序數(shù)據(jù)。次序數(shù)據(jù)最重要的特性在于不管它的數(shù)據(jù)是用數(shù)值表達還是文字表達,都存在壹定的客觀次序,壹定可以按照大小、高下、優(yōu)劣進行排序。次序雖然可以比較大小,卻無法計算互相之間大小、高下或優(yōu)劣的距離,不能用來反應事物在數(shù)量上的差異,因此,從本質(zhì)上將,次序數(shù)據(jù)仍然是定性數(shù)據(jù)的壹種;2、定量變量定量變量也稱為數(shù)值變量,定量變量的觀測成果稱為定量數(shù)據(jù)。定量變量的特點:可以用數(shù)值表達其觀測成果,并且這些數(shù)值具有明確的數(shù)值含義,不僅能分類并且能測量出來詳細大小和差異。數(shù)值型數(shù)據(jù)的特性在于它們都是以數(shù)值的形式出現(xiàn)的,有些數(shù)值型數(shù)據(jù)只可以計算數(shù)據(jù)之間的絕對差(絕對距離),而有些數(shù)值型數(shù)據(jù)不僅可以計算數(shù)據(jù)之間的絕對差,還可以計算數(shù)據(jù)之間的相對差(相對距離)。顯然,數(shù)值型數(shù)據(jù)的計量功能要遠不小于前面簡介的兩種定性數(shù)據(jù),其計量精度也遠遠高于定性數(shù)據(jù),因此在記錄研究中,數(shù)值型數(shù)據(jù)有著最廣泛的用途。由數(shù)值型數(shù)據(jù)的特點決定了對數(shù)值型數(shù)據(jù)可以運用多種不壹樣的數(shù)學措施進行計算,從而給記錄學多種分析措施的應用奠定了基本的數(shù)據(jù)基礎,在記錄學研究中對數(shù)值型數(shù)據(jù)的研究是定量分析的重要內(nèi)容。(二)觀測數(shù)據(jù)和試驗數(shù)據(jù)不管是哪壹類數(shù)據(jù),根據(jù)獲取數(shù)據(jù)的措施不壹樣,都可以分為觀測數(shù)據(jù)和試驗數(shù)據(jù)。觀測數(shù)據(jù)也許是全面數(shù)據(jù)也也許是樣本數(shù)據(jù),試驗數(shù)據(jù)壹般都是樣本數(shù)據(jù)。1、觀測數(shù)據(jù):是對客觀現(xiàn)象進行實地觀測所獲得的數(shù)據(jù),在數(shù)據(jù)獲得的過程中壹般沒有人為的控制和條件約束。觀測是獲得數(shù)據(jù)最重要的措施。諸多社會經(jīng)濟問題不適合應用試驗的措施,職能通過向實際做調(diào)查得到數(shù)據(jù),用多種調(diào)查措施得到的數(shù)據(jù)都屬于觀測數(shù)據(jù)。2、試驗數(shù)據(jù):壹般是在科學試驗環(huán)境下獲得的數(shù)據(jù),在試驗中,試驗環(huán)境是受到嚴格控制的,數(shù)據(jù)的產(chǎn)生壹定是某壹約束條件下的成果。在自然科學研究中試驗的措施應用非常普遍,因此,自然科學研究中所用的數(shù)據(jù)多為試驗數(shù)據(jù)。第三節(jié)數(shù)據(jù)來源于搜集數(shù)據(jù)的措施壹、數(shù)據(jù)的來源從使用者的角度看,記錄數(shù)據(jù)資料的來源重要有兩種渠道:(1)是通過直接的調(diào)查或試驗獲得的原始數(shù)據(jù),這是記錄數(shù)據(jù)的直接來源,壹般稱之為原始或第壹手記錄數(shù)據(jù);(2)是他人調(diào)查的數(shù)據(jù),并將這些數(shù)據(jù)進行加工和匯總後公布的數(shù)據(jù),壹般稱之為次級數(shù)據(jù)或第二手簡潔的記錄數(shù)據(jù)。壹切簡潔的記錄數(shù)據(jù)都是從原始的、第壹手數(shù)據(jù)過渡而來。(壹)數(shù)據(jù)的直接來源——原始數(shù)據(jù)搜集數(shù)據(jù)最基本的形式就是進行記錄調(diào)查或進行試驗活動,記錄調(diào)查或進行試驗就是記錄數(shù)據(jù)的直接來源。1、記錄調(diào)查:是根據(jù)記錄研究預定的目的,規(guī)定和任務,運用科學的措施,有計劃、有組織地向客觀實際搜集資料的過程。通過記錄調(diào)查得到的數(shù)據(jù),壹般稱為觀測數(shù)據(jù)。2、試驗法:是直接獲得記錄數(shù)據(jù)的重要來源。通過試驗法得到的數(shù)據(jù)就是試驗數(shù)據(jù)。通過故意識地變化或控制某些輸入變量,觀測其他輸出變量的變化,從而到達對事物本質(zhì)或互相聯(lián)絡的認識。為了觀測對輸入變量的控制與否導致了輸出變量的變化,在試驗中往往需要將研究對象分兩個組,壹種試驗中,壹種對照組,對試驗組的輸入變量加以控制和變化,而對照組則不加控制,根據(jù)兩組的輸出成果,可以看到輸入變量對輸出的影響。運用試驗法要注意的是:(1)首先試驗組和對照組的產(chǎn)生應當是隨機的;(2)另壹方面試驗組合對照組還應當是匹配的;(二)數(shù)據(jù)的間接來源——次級數(shù)據(jù)(1)公開出版的記錄數(shù)據(jù):重要來自官方的記錄部門和政府、組織、學校、科研機構。如《中國記錄年鑒》、《人口普查資料匯編》、《北京市記錄年鑒》、《世界發(fā)展匯報》、某大學、科研機構公布的研究數(shù)據(jù)、專業(yè)調(diào)查征詢機構公布的調(diào)查成果數(shù)據(jù),多種媒體和圖書中公布的記錄數(shù)據(jù)等;(2)尚未公開刊登的記錄數(shù)據(jù):如各企業(yè)的經(jīng)營報表數(shù)據(jù)、專業(yè)調(diào)查征詢機構未公開公布的調(diào)查成果數(shù)據(jù)。假如公開引用未公開刊登的數(shù)據(jù)需要征得數(shù)據(jù)所有者的同意,同步要為自已公布的數(shù)據(jù)負責。恰當?shù)倪\用間接數(shù)據(jù),需要注意壹下幾點:①與否理解并對的理解簡潔數(shù)據(jù)中變量的含義、計算口徑、計算措施、以防止誤用錯用他人的數(shù)據(jù);②引用間接數(shù)據(jù)時要注明數(shù)據(jù)來源,尊重他人的勞動成果和知識產(chǎn)權;二、搜集數(shù)據(jù)的措施記錄調(diào)查是根據(jù)調(diào)查的目的與規(guī)定,運用科學的調(diào)查措施,有計劃、有組織地搜集記錄數(shù)據(jù)資料的過程。(1)普查:是專門組織的壹次性的全面調(diào)查,用來調(diào)查屬于壹定期點上或壹定期期內(nèi)的社會現(xiàn)象總量。他適于搜集某些不能或不合適于定期的全面記錄報表搜集的記錄資料,以摸清重大的國情、國力。特點:它是壹種全面調(diào)查,具有資料包括范圍全面、詳盡、系統(tǒng)的長處;缺陷:它是壹次性的專門調(diào)查,由于普查的工作量大,耗資也多,時間周期較長,壹般不適宜常常舉行。(2)抽樣調(diào)查:是壹種非全面調(diào)查,它是按照隨機原則從總體中抽取壹部分單位作為樣本進行觀測研究,以抽取樣本的指標去推算總體指標的壹種調(diào)查。隨機原則規(guī)定所有調(diào)查單位均有壹定的概率被抽取。特點:①樣本單位按隨機原則抽取,排除了主觀原因對選用樣本單位的影響;②可以根據(jù)部分調(diào)查的實際資料對調(diào)查對象的總體的數(shù)量特性進行推斷,從而到達對調(diào)查總體的認識。③在抽樣調(diào)查中會存在抽樣誤差,不過這個誤差可以事先計算并加以控制;長處:既能節(jié)省人力、物力、財力,又可以提高資料的時效性,并且能獲得比較對的的全面的記錄資料,具有許多長處。抽樣措施重要有兩種:概率抽樣和非概率抽樣;(1)概率抽樣:是根據(jù)壹種已知的概率隨機選用被調(diào)查者。從理論上講,概率抽樣是最科學的抽樣措施,它能保證抽出來的部分單位(樣本單位)對總體單位的代表性,并且它能將抽樣誤差限制在壹定范圍之內(nèi)。常用的概率抽樣形式為:①簡樸隨機抽樣:是最基本的形式,是完全隨機地選擇樣本。②分層抽樣:是首先將總體提成不壹樣的層(或組),然後在每壹層內(nèi)進行抽樣。③整群抽樣:是將壹組被調(diào)查者視為壹種抽樣單位,每次抽取時抽出來的是壹組(群),而不是壹種個體單位。調(diào)查者將對被抽中的某個居委會中的美甲每戶進行調(diào)查。④系統(tǒng)抽樣:又稱等距抽樣,是在總體的名目框中每隔壹定距離抽選壹種被調(diào)查者。(2)非概率抽樣:是沒有完全按照隨機原則選用樣本單位。缺陷:理論上講,不能保證抽出來的部分單位(樣本單位)對總體單位的代表性;不能由樣本的特性精確地推斷總體的特性;長處:措施簡樸、經(jīng)濟,因此也是人們常用的措施。(三)記錄報表:是按照國家統(tǒng)壹規(guī)定的調(diào)查規(guī)定與文獻(指標、表格形式、計算措施等)自上而下地提供記錄資料的壹種調(diào)查方式。國家運用它定期地獲得全社會的國民經(jīng)濟和社會發(fā)展狀況的基本記錄資料,是國家獲得調(diào)查資料的措施之壹。按照報送范圍,記錄報表有全面報表和非全面報表之分:全面報表:規(guī)定調(diào)查對象匯總的每壹種單位均要填報;非全面報表:規(guī)定壹部分調(diào)查單位填報;按照報送周期,記錄報表重要有月報、季報、年報構成。月報內(nèi)容簡樸,時效性強,年報則內(nèi)容比較全面;記錄報表的內(nèi)容:(1)表式:是由國家記錄部門根據(jù)研究的任務和目的而專門設計制定的記錄報表表格,用于搜集記錄資料,它是記錄報表制度的主體。(2)填表闡明:它是對登記表的記錄范圍、指標等作出的規(guī)定,詳細有:填報范圍、指標解釋、分類目錄、其他有關事項的規(guī)定;長處:對于大型、國有企業(yè)來說,運用登記表搜集數(shù)據(jù),具有時間快、成本低的長處;(對于小型、非國有經(jīng)濟單位,則難以全面采用記錄報表調(diào)查。)(四)重點調(diào)查:是在調(diào)查對象中選擇壹部分對全局具有決定性作用的重點單位進行的壹種非全面調(diào)查。特點:這些重點單位雖然數(shù)目不多,但它們所研究的現(xiàn)象總量在總體總量中占據(jù)絕大部分;●當調(diào)查的任務只規(guī)定掌握事物的基本狀況與基本的發(fā)展趨勢,而不規(guī)定掌握全面的精確資料,并且在總體中確實存在著重點單位時,進行重點調(diào)查是比較合適的。●長處:重點調(diào)查可以節(jié)省人力、財力、并且及時,因此當調(diào)查任務只規(guī)定掌握事物的基本狀況時,采用重點調(diào)查為好。(五)經(jīng)典調(diào)查:是壹種非全面的調(diào)查,是根據(jù)調(diào)查的目的與規(guī)定,在對被調(diào)查對象進行全面分析的基礎上,故意識地選擇若干具有經(jīng)典意義的或有代表性的單位進行的調(diào)查。經(jīng)典調(diào)查的作用:(1)補充全面調(diào)查的局限性(2)在壹定條件下可以驗證全面調(diào)查數(shù)據(jù)的真實性?!裉攸c:經(jīng)典調(diào)查具有靈活機動、通過少數(shù)經(jīng)典即可獲得深入詳實的記錄資料的長處,不過易受人們主觀認識上的影響,必須同其他調(diào)查結合起來使用,才能防止出現(xiàn)片面性。第二章數(shù)據(jù)描述第壹節(jié)用圖表展示定性數(shù)據(jù)定性數(shù)據(jù)包括分類數(shù)據(jù)和次序數(shù)據(jù),它們的圖表展示措施劇本相似,壹般可以分為頻率分布表和圖形來描述;壹、生產(chǎn)頻數(shù)分布表定性數(shù)據(jù)自身就是對事物的壹種分類,因此,只要先把所有的類別都列出來,然後記錄處每壹類別的頻數(shù),就是壹張頻數(shù)分布表。二、定性數(shù)據(jù)的圖形表達有:(1)餅圖(2)條形圖(3)環(huán)形圖●餅圖是運用圓形及圓內(nèi)扇形面積來表達數(shù)值大小的圖形。●條形圖是用寬度相似的條形的高度或長度來表述數(shù)據(jù)多少的圖形。●假如想比較不壹樣變量之間的構造差異,可以通過環(huán)形圖來實現(xiàn)。第二節(jié)用圖表展示定量數(shù)據(jù)定性數(shù)據(jù)的圖示表達措施,也都合用于定量數(shù)據(jù)。但定量數(shù)據(jù)尚有某些特定的圖示措施,它們并不合用于定性數(shù)據(jù)。壹、生產(chǎn)頻數(shù)分布表●生成定量數(shù)據(jù)的頻數(shù)分布表的環(huán)節(jié):(1)對數(shù)據(jù)進行分組,壹般壹組個數(shù)在5-15之間;(2)確定組距(所謂組距指每個組變量值中最大值和最小值之差。大值稱為上限,小值稱為下限。組距=上限-下限)(3)記錄出各組的頻數(shù)及頻數(shù)分布表●在確定組距時應掌握的原則:(1)要考慮各組的劃分與否能辨別總體內(nèi)部各個構成部分的性質(zhì)差異。(2)要能精確地清晰地反應總體單位的分布特性?!裨诖_定組距時,在研究的現(xiàn)象變動比較均勻的狀況下,可以采用等距分組;而當研究的現(xiàn)象變動很不均勻時,壹般采用不等距分組?!耦l數(shù):是指頻數(shù)分布表中落在某壹特定類別的數(shù)據(jù)個數(shù)?!裨谟涗浉鹘M頻數(shù)時,恰好等于某壹組的組限時,則采用上限不在內(nèi)的原則,即將該頻數(shù)計算在與下限相似的組內(nèi)。二、定量數(shù)據(jù)的圖形表達常用來表述定量數(shù)據(jù)記錄圖形:直方圖、折線圖和散點圖。此外尚有莖葉圖、箱線圖等;(壹)直方圖它的橫坐標代表變量分組,縱坐標代表各變量值出現(xiàn)的頻數(shù)。(二)折線圖運用線段的升降來闡明現(xiàn)象變動的壹種記錄圖,它重要用于表達現(xiàn)象的分派狀況,現(xiàn)象在時間上的變化和兩個現(xiàn)象之間的依存關系等。(三)散點圖第三節(jié)用登記表來表達數(shù)據(jù)登記表的五個構成部分:(1)表頭:放在表的上方,闡明表的重要內(nèi)容;(2)行標題:放在第壹行,表達所研究問題的類別名稱(3)列標題:放在第壹列,表達所研究問題的指標名稱(4)數(shù)字資料(5)表外附加:壹般放在登記表的下發(fā),用來闡明資料來源、指標注釋和必要的闡明等內(nèi)容。壹般狀況下,登記表的左右兩邊不能封口。第四節(jié)用數(shù)字來概括數(shù)據(jù)數(shù)據(jù)的分布特性:(1)集中趨勢,即壹組組數(shù)據(jù)的數(shù)值向其中心值的靠攏程度(2)離散程度,即壹組數(shù)據(jù)的各個數(shù)值遠離其中心的趨勢和程度壹、定性數(shù)據(jù)的數(shù)字特性定性數(shù)據(jù)重要是計數(shù),比較簡樸,對定性數(shù)據(jù)的集中趨勢常用的措施就是計算比例、中位數(shù)和眾數(shù);(1)比例(2)中位數(shù):它是數(shù)據(jù)按照大小排列之後位于中間的那個數(shù)。假如樣本量為偶數(shù),則是中間兩個數(shù)的平均。(3)眾數(shù):就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值。在定性數(shù)據(jù)中由于記錄的是頻數(shù),因此眾數(shù)用得多些。二、定量數(shù)據(jù)的數(shù)字特性反應數(shù)據(jù)集中趨勢的水平度量:平均數(shù)、中位數(shù)、眾數(shù)和分位數(shù)等反應數(shù)據(jù)離散程度的差異度量:(1)極差(2)四分位差(3)原則差(4)方差(壹)水平的度量1、平均數(shù):也稱均值,是把某壹組數(shù)據(jù)進行算術平均,用以表述某壹事物的平均水平,它在記錄中也叫均值。2、中位數(shù):它是數(shù)據(jù)按照大小排列之後位于中間的那個數(shù)。假如樣本量為偶數(shù),則是中間兩個數(shù)的平均。3、眾數(shù):就是數(shù)據(jù)中出現(xiàn)次數(shù)或出現(xiàn)頻率最多的數(shù)值。在定性數(shù)據(jù)中由于記錄的是頻數(shù),因此眾數(shù)用得多些。4、用哪個值代表壹組數(shù)據(jù)●平均數(shù)在實際應用中較多,但重要確定是更輕易受少數(shù)極端數(shù)值的影響,對于嚴重偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差;●中位數(shù)和眾數(shù)提供的信息不像平均數(shù)那樣多,但它們也有長處,例如不受極端值的影響,具有記錄上的穩(wěn)健性,當數(shù)據(jù)為偏態(tài)分布,尤其是偏斜程度較大時,可以考慮選擇中位數(shù)和眾數(shù),這時它們的代表性比平均數(shù)好。(二)差異的度量1、極差:又稱全距,是壹組數(shù)據(jù)中的最大值和最小值之差。缺陷:不過它僅僅受最大值和最小值的影響,不能反應壹組數(shù)據(jù)變量分布狀況,并且它非常輕易受數(shù)據(jù)中極端值的影響,不能精確的描述數(shù)據(jù)的分散程度。極差是從壹種范圍反應數(shù)據(jù)的差異程度,比較粗略。2、方差與原則差為了能反應數(shù)據(jù)中的每壹種觀測值和平均水平的差異程度就必須引入方差和原則差(1)方差試講各個變量值和其平均值離差平方的平均數(shù)作為樣本數(shù)據(jù),它反應了樣本中各個觀測值到其均值的平均離散程度。(2)原則差是方差的平均根,它與方差相比更具量綱性,并且與變量值的計量單位相似,使用的范圍也比方差更廣泛。●方差用表達,總體原則差用表達,樣本原則差用表達,離散系數(shù)用表達,原則分數(shù)用表達?!裨谝挤N記錄樣本中,其原則差越大,闡明它的各個觀測值分布的越分散,它的趨中程度就越差。反之,其原則差越小,闡明它的各個觀測值分布的越集中,它的趨中程度就越好?!裨瓌t差的大小會受到數(shù)據(jù)自身數(shù)值大小的影響。兩個數(shù)列的原則差相似,不過兩數(shù)列的差異程度卻不壹樣。為了更精確地反應差異程度,要計算離散系數(shù)。3、離散系數(shù):是將壹組數(shù)據(jù)的原則差除以其均值,用來測度數(shù)據(jù)離散程度的相對數(shù)。為了更精確地反應研究現(xiàn)象的差異程度,我們要計算離散系數(shù)。4、原則分數(shù):是變量值與其平均數(shù)的離差除以原則差的值,用以測定某壹種數(shù)據(jù)在該組數(shù)據(jù)中的相對位置。原則分數(shù)最大的用途可以吧兩組數(shù)據(jù)中的兩個不壹樣均值、不壹樣原則差的數(shù)據(jù)進行對比,以鑒定它們在組中的位置。例如:某男176CM,某女170CM,兩位同學的相對身高更高某些?我們理解到男生的身高均值172,原則差2.8女生身高的均值是164,原則差2.5某男身高的原則分數(shù):Zi=Xi-X/S=176-172/2.8=1.43某女身高的原則分數(shù):Zi=Xi-X/S=170-164/2.5=3.2顯然某女在女生中的身高要高于某男在男生中的身高。第三章參數(shù)估計根據(jù)樣本數(shù)據(jù)對總體數(shù)據(jù)特性進行估計、判斷的過程就是記錄推斷。記錄推斷包括參數(shù)估計和假設檢查;第壹節(jié)抽樣分布壹、總體分布于總體參數(shù)總體分布:是總體中所有觀測值所形成的分布。由于總體中的觀測值是有差異的,可以視為隨機變量,假如我們用X表達,X的分布就是總體分布??傮w參數(shù):是對總體特性的某個概括性的度量??傮w參數(shù)指標有:(1)總體平均數(shù)()(2)總體方差()(3)總體比例()等。二、記錄量與抽樣分布●記錄量是樣本的函數(shù)。構成記錄量的函數(shù)中不能包括未知原因。●由于樣本是從總體中隨機抽取的,樣本具有隨機性,由樣本數(shù)據(jù)計算出來的記錄量也是隨機的。因此在抽取樣本前,理論上記錄量是壹隨機變量;●由樣本記錄量所形成的概率分布就是抽樣分布,如樣本均值的分布,樣本比例的分布等?!駱颖居涗浟恐笜擞校海?)樣本均值()(2)樣本方差()(3)樣本比例()●記錄量的概率分布構成了推斷總體參數(shù)的理論基礎。(壹)有關樣本均值的抽樣分布:(1)設總體共有個元素,從中隨機抽取壹種容量為的樣本,在重置抽樣時,共有種抽法;在不反復抽樣時,共有個樣本。(2)樣本均值的抽樣分布就是指所有也許抽出來的樣本的分布。(3)樣本均值的均值就是總體均值,即。(4)重置抽樣時,樣本均值的原則差為總體原則差的,即;不重置抽樣時,樣本均值的方差為。(5)當總體服從正態(tài)分布時,樣本均值壹定服從正態(tài)分布,即有:~時,~。(6)若總體為未知的非正態(tài)分布時,只要樣本容量足夠大(壹般規(guī)定≥30),樣本均值仍會靠近正態(tài)分布,其分布的期望值為總體均值,樣本方差為總體方差的。(7)假如總體不是正態(tài)分布,當為小樣本時(壹般<30),樣本均值的分布則不服從正態(tài)分布。(二)有關樣本比例的抽樣分布:(1)當樣本容量比較大時,樣本比率近似服從正態(tài)分布,且有的數(shù)學期望就是總體比率,即。(2)在重置抽樣時,的方差為。(3)在不重置抽樣時,的方差為。(4)在重置抽樣時,的分布為~(5)在不重置抽樣時,的分布為~三、有關記錄量的原則誤差:(1)記錄量的原則誤差也稱原則誤,它是指樣本記錄量分布的原則差。原則誤差是用于衡量樣本記錄量的離散程度。在參數(shù)估計中,用于衡量樣本記錄量與總體參數(shù)之間差距的壹種重要尺度;(2)樣本均值的原則誤計算公式為:(3)當總體原則差未知時,可用樣本原則差替代計算,這時計算的原則誤差稱為估計原則誤差。(4)樣本比例的原則誤計算公式為:(5)當總體比例的方差未知時,可用樣本比例的方差替代。第二節(jié)參數(shù)估計參數(shù)估計:就是用樣本記錄量去估計未知的總體參數(shù)。壹、點估計與區(qū)間估計用樣本記錄量估計總體參數(shù)的兩種措施:(1)點估計(2)區(qū)間估計●常用的點估計有:(1)用樣本均值估計總體均值(2)用樣本比例估計總體比例(3)用樣本方差估計總體方差(例如:你花510元狀況,你可以說花500元狀況,不過付款卻要付510;)●區(qū)間估計:就是根據(jù)估計可靠程度的規(guī)定,運用隨機抽取的樣本的記錄量值確定可以覆蓋總體參數(shù)的也許區(qū)間的壹種估計措施;區(qū)間估計是包括樣本記錄量在內(nèi)的壹種區(qū)間,該區(qū)間壹般是由樣本記錄量加減估計原則誤差得到的。有關區(qū)間估計:(1)原則正態(tài)分布(0,1)的均值為0,原則差為1。(2)原則化的公式為:(觀測值-均值)÷原則差(3)以68.27%的置信水平推斷總體參數(shù)的置信區(qū)間為:(4)以95.45%的置信水平推斷總體參數(shù)的置信區(qū)間為:(5)以99.73%的置信水平推斷總體參數(shù)的置信區(qū)間為:(例如:常常說這個人有1.7-1.8米高,有70-80斤)二、評價估計量的原則有:(1)無偏性(2)有效性(3)壹致性●無偏性是指估計量抽樣分布的期望值等于被估計的總體參數(shù)。、、分別是總體均值、總體比例、總體方差的無偏估計量。●有效性是指估計量的方差盡量小。對同壹種總體參數(shù)的兩個無偏估計量,有更小方差的估計量更有效。●壹致性是指壹種大樣本給出的估計量要比壹種小樣本給出的估計量更靠近總體的參數(shù)。樣本均值是總體均值的壹種壹致估計量。三、壹種總體均值的區(qū)間估計:(1)在對總體均值進行區(qū)間估計時,需要考慮總體與否為正態(tài)分布、總體方差與否已知、用于估計的樣本是大樣本()還是小樣本()等狀況。(2)大樣本狀況下,總體服從正態(tài)分布,總體方差已知,總體均值在置信水平下的置信區(qū)間為(3)大樣本狀況下,總體服從正態(tài)分布,總體方差未知,總體均值在置信水平下的置信區(qū)間為(4)小樣本狀況下,總體服從正態(tài)分布,總體方差已知,總體均值在置信水平下的置信區(qū)間為(5)小樣本狀況下,總體服從正態(tài)分布,總體方差未知,總體均值在置信水平下的置信區(qū)間為四、壹種總體比例的區(qū)間估計在大樣本條件下,若,,則二項分布可用正態(tài)分布近似,在的置信水平下的置信區(qū)間為?!駱颖玖颗c置信水平成正比關系,與總體方差成正比,與容許的估計誤差的平方成反比?!窦偃缈傮w比例的值不懂得可以用樣本比例替代,或者取=0.5,使得到達最大。第四章假設檢查假設檢查:是根據(jù)樣本信息推斷未知的總體參數(shù),而假設檢查是先對總體參數(shù)或分布形式提出某種假設,然後運用樣本信息和有關記錄量的分布特性去檢查這個假定,做出與否拒絕本來假設的結論。第壹節(jié)假設檢查的基本理論怎樣進行假設檢查小概率事件:是指在壹次事件中幾乎不也許發(fā)生的事件,壹般稱為“明顯性水平”,用表達。●明顯性水平壹般取值為=0.05或=5%。假設檢查的過程:(1)提出原假設和備擇假設(2)確定檢查記錄量(3)確定明顯性水平(4)根據(jù)數(shù)據(jù)計算檢查記錄量值和與這個記錄量值對應的概率值值,并進行決策●原假設也稱為零假設,記為;備則假設也稱為備選假設,記為?!裨趯傮w的均值進行檢查時,大樣本應用正態(tài)分布檢查,計算記錄量,小樣本壹般用分布檢查,計算記錄量。●拒絕對的零假設的錯誤稱為第壹類錯誤或棄真錯誤();當備選假設對的時反而說零假設對的的錯誤稱為第二類錯誤或取偽錯誤()。對假設檢查的總結:(1)假設檢查根據(jù)的是小概率原理(2)小概率原則在抽樣前依需要確定(3)假設檢查的成果只能是拒絕或不拒絕本來假設,而不能證明原假設成立(4)記錄假設檢查的成果不是絕對對的有關總體均值的假設檢查:(1)在對總體均值進行假設檢查時,采用什么檢查記錄量,取決于所抽檢的樣本是大樣本()還是小樣本(),還需要考慮總體與否為正態(tài)分布、總體方差與否已知等狀況。(2)大樣本狀況下,當總體方差已知時,總體均值檢查的記錄量為:(3)大樣本狀況下,當總體方差未知時,總體均值檢查的記錄量為:(4)小樣本狀況下,當總體均值服從正態(tài)分布,總體方差已知時,總體均值檢查的記錄量為:(5)小樣本狀況下,當總體均值服從正態(tài)分布,總體方差未知時,總體均值檢查的記錄量為:總體比例的檢查的三種基本形式:(1)雙側檢查:,(2)左側檢查:,(3)右側檢查:,●總體比例的假設檢查,在大樣本時,樣本比例會近似服從正態(tài)分布,因此檢查記錄量仍用記錄量,其基本形式為:第五章有關分析與回歸分析對現(xiàn)象之間數(shù)量關系的研究,記錄上是從兩個方面進行的:首先分析現(xiàn)象之間關系的親密程度——有關分析另首先是找出現(xiàn)象之間數(shù)量變化依存關系——回歸分析第壹節(jié)有關分析壹、有關關系:是存在著親密的聯(lián)絡但又不是嚴格的、確定的關系。有關分析的重要內(nèi)容包括如下幾種方面:(1)確定現(xiàn)象之間有無關系,這是有關分析的起點,只有存在有關依存關系,才有必要進行深入的分析。(2)確定有關關系的體現(xiàn)形式,只有判明了現(xiàn)象之間有關關系的詳細體現(xiàn)形式,才能運用對應的回歸分析措施深入分析現(xiàn)象之間的數(shù)據(jù)依存關系,假如把曲線有關誤認為是直接有關,按直線有關來分析,便會出現(xiàn)認識上的偏差,導致錯誤的結論。(3)測定有關關系的親密程度?,F(xiàn)象之間的有關關系是壹種不嚴格的數(shù)量關系,因此給人的感覺是松散的,有關分析就是要從這種松散的數(shù)量關系中,鑒定其有關關系的親密程度。二、有關關系的描述——散點圖●對于兩個變量X和Y,通過觀測或試驗,我們可以得到其若干組數(shù)據(jù),記為(Xi,Yi)(i=1,2,…..n),將這些數(shù)據(jù)按X值由大到?。ɑ蛴尚〉酱螅┮孕蛄斜肀磉_,即構成有關表?!裢ㄟ^有關表可以粗略地看出兩個變量之間存在著有關關系,并且兩者之間是變化方向是壹致的,即存在著正有關。●將壹壹對應的(Xi,Yi)描點于坐標系上,即構成散點圖,又稱為有關圖。(壹)有關的形態(tài)分為:(1)線性有關:若變量Y和變量X的有關關系體現(xiàn)為線性組合,或繪制的散點圖近似地體現(xiàn)為壹條直線或直線帶;(2)非線性有關:若Y和X是非線性組合,或繪制的散點圖近似地體現(xiàn)為壹條曲線,則稱之為非線性有關或曲線有關。(二)有關的方向分為:(1)正有關:當兩個變量的變動方向總體上相似,即壹種變量增長,另壹種變量也對應地增長,或壹種變量減少,另壹種變量也對應地減少,兩個變量之間的關系屬于正有關。(2)負有關:當兩個變量的變動方向總體上相反,即壹種變量增長,另壹種變量也對應地減少,兩個變量之間的關系屬于負有關。●正有關是兩個變量的變動方向總體上相似,負有關是兩個變量變動的方向總體上相反。三、有關程度的測定(壹)有關系數(shù)的計算有關系數(shù):是測定變量之間關系親密程度的量,它可以以數(shù)字精確地描述變量之間的有關程度。Pearson有關系數(shù)是反應定量變量之間有關程度;Spearman等級有關系數(shù)是反應定序變量Pearson有關系數(shù)是用來度量兩個定量變量X與Y之間的線性有關程度。有關系數(shù)具有如下性質(zhì):(1)的取值范圍為-1≤≤1。r>0表明與之間存在正線性有關關系;r<0表明與之間存在負線性有關關系;r值越靠近1(或-1)就越正(或負)有關,越靠近0就越不有關。r=1或r=-1表明與之間為完全有關關系(實際上就是函數(shù)關系)(2)具有對稱性。與之間的有關系數(shù)和與之間的有關系數(shù)相等。(3)r數(shù)值大小與和的數(shù)據(jù)原點及計量尺度無關。變化和的數(shù)據(jù)原點或計量尺度,并不變化r數(shù)值的大小。(4)r僅僅是與之間線性關系的壹種度量,它不能用于描述非線性關系。折舊意味著=0只表達兩個變量之間不存在線性有關,并不表明變量之間沒有任何關系。(5)r雖然是兩個變量之間線性關系的壹種度量,卻不壹定意味著與壹定有因果關系。根據(jù)經(jīng)驗可將有關程度分為如下幾種狀況:當|r|≥0.8時,可視為高度有關;當0.5≤|r|<0.8時,可視為中度有關;當0.3≤|r|<0.5時,視為低度有關;當|r|<0.3時,闡明兩個變量之間的有關程度較弱。(二)有關系數(shù)的檢查檢查的環(huán)節(jié):(1)確定原假設(2)計算記錄量t值(3)運用其對應的概率值進行判斷,假如概率值不不小于或等于指定的明顯性水平(壹般a=0.05),則我們可以拒絕原假設,接受備擇假設,即兩變量之間存在線性的有關關系。第二節(jié)壹元線性回歸分析●有關分析意在測度變量之間關系的親密程度,它所使用的測定工具就是有關系數(shù)?;貧w分析是考察若干自變量X與因變量Y之間的數(shù)量變化規(guī)律的記錄措施和技術?;貧w分析的重要內(nèi)容:(1)從樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學關系式;(2)估計回歸模型參數(shù)(3)對所確定的關系式進行多種記錄檢查,并從影響某壹特定變量的諸多變量中找出影響明顯的變量?!窕貧w方程的擬合程度分析最常用的指標是鑒定系數(shù)。的取值范圍在[0,1],=1時,擬合是完全的,即所有觀測值都在直線上。越靠近于0,回歸直線的擬合程度越差。●估計原則誤差也是闡明回歸直線擬合程度的指標,越小,根據(jù)回歸方程進行預測就越精確。第六章時間序列分析時間序列:是指反應社會、經(jīng)濟、自然現(xiàn)象的數(shù)據(jù)準時間先後次序記錄形成的數(shù)列。時間序列的兩個構成要素:(1)現(xiàn)象所屬的時間(2)對應不壹樣步間的記錄指標數(shù)值第壹節(jié)時間序列的分析指標壹、增長量分析時間數(shù)列的增長量分析重要有:增長量和評價增長量分析。(壹)發(fā)展水平:是時間數(shù)列中對應某個時期(或時點)的指標數(shù)值,闡明現(xiàn)象在各個時期(或時點)上所到達的規(guī)模和水平,壹般用符號Yt(t=1,2…,n)表達,其中t表達所對應的時間。(二)增長量:是指時間數(shù)列中兩個不壹樣步期的發(fā)展水平之差,反應社會經(jīng)濟現(xiàn)象匯報期比基期增長或減少的數(shù)量,即:增長量=匯報期水平-基期水平由于采用的基期不壹樣,增長量有如下兩種:①逐期增長量:它是匯報期水平與前壹期水平之差,闡明匯報期比前壹時期增長的絕對數(shù)量。可以表達為:y2-y1,y3-y2,…yn-yn-1②合計增長量:它是匯報期水平與某壹固定期期水平之差,它闡明本期比某壹固定期期增長的絕對數(shù)量,也闡明某壹較長時期內(nèi)總的增長量。兩者的關系:逐期增長量之和等于對應時期的合計增長量。(三)平均增長量:是某種社會經(jīng)濟現(xiàn)象在壹定期期內(nèi)平均每期增長(或減少)的絕對數(shù)量。壹般用合計增長量除以增長的時期數(shù)目計算。二、增長率分析反應時間序列增長率的指標重要有:發(fā)展速度、增長速度、平均發(fā)展速度和平均增長速度;(壹)發(fā)展速度:是表明現(xiàn)象發(fā)展程度的動態(tài)相對自次奧,它是兩個不壹樣步期的發(fā)展水平對比的成果。發(fā)展速度=匯報期水平/基期水平*100%由于采用的基期不壹樣,發(fā)展速度可分為環(huán)比發(fā)展速度和定基發(fā)展速度。環(huán)比發(fā)展速度:是匯報期水平與前壹期水平之比,反應現(xiàn)象逐期發(fā)展變化狀況;定基發(fā)展速度:是匯報期水平與某壹固定期期水平之比,表明現(xiàn)象在較長時期內(nèi)總的發(fā)展變化速度,又稱總速度;環(huán)比發(fā)展速度與定基發(fā)展速度存在如下關系:(1)環(huán)比發(fā)展速度的連乘積等于對應的定基發(fā)展速度。(2)相鄰時期的兩個定基發(fā)展速度相除的商,等于對應的環(huán)比發(fā)展速度。(二)增長速度增長速度是表明現(xiàn)象增長程度的動態(tài)相對指標。它是增長量與基期水平的成果。其計算公式:增長速度=增長量/基期發(fā)展水平增長速度與發(fā)展速度有著親密的關系,兩者只相差壹種基數(shù),即:增長速度=增長量÷基期發(fā)展水平=發(fā)展速度-1(三)平均發(fā)展速度和平均增長速度平均發(fā)展速度是壹定期期內(nèi)各個環(huán)比發(fā)展速度的平均數(shù),它闡明某種現(xiàn)象在壹定期期內(nèi)逐期平均發(fā)展變化的程度。平均增長速度是各個環(huán)比增長速度的平均數(shù),但它不是根據(jù)各個環(huán)比增長速度計算的,而是根據(jù)平均發(fā)展速度計算的。它闡明某種現(xiàn)象在壹種較長時期內(nèi)逐期平均增長變化的程度。平均發(fā)展速度和平均增長速度的關系:平均增長速度=平均發(fā)展速度-1第二節(jié)長期趨勢分析壹、時間數(shù)列影響原因的分解●時間數(shù)列的四個影響原因:(1)長期趨勢(2)季節(jié)變動(3)循環(huán)變動(4)不規(guī)則變動(壹)長期趨勢:是指時間數(shù)列在壹段長時期的變動,若將其用圖形表達,可得壹長線趨勢,將其分解,其中長期趨勢原因就可畫出趨勢圖,如趨勢圖是直線,則稱為直線趨勢,若趨勢線是曲線,則根據(jù)其曲線形式稱為某種曲線趨勢,如二次曲線趨勢、長期趨勢等。(二)季節(jié)變動:季節(jié)變動是時間數(shù)列有季節(jié)性原因而引起的周期性變動,許多經(jīng)濟領域的時間數(shù)列都受這種變動的支配。當反應時間數(shù)列的數(shù)據(jù)時按照周、月、即的時間間隔記錄時,季節(jié)變動很明顯。(三)循環(huán)變動:是以年度記錄的時間數(shù)列所體現(xiàn)出來的某種周期性變動。如某些經(jīng)濟活動序列體現(xiàn)出的以8年或9年為壹種周期的循環(huán),這種循環(huán)壹般也稱為商業(yè)周期。(四)不規(guī)則變動:是時間數(shù)列除去長期趨勢、季節(jié)變動和循環(huán)變動止嘔余留下來的變動;這種變動細分為兩個類型:壹是嚴格的隨機變動,它是由許多細小的原因綜合引起的;二是不常常出現(xiàn)的某些孤立的或不規(guī)則的、但卻是強有力的突發(fā)性活動。如政治動亂,戰(zhàn)爭爆發(fā),大的自然災害產(chǎn)生的影響。上述四種原因的變化構成事物在壹定期期的變動,它們是怎樣互相結合與互相作用的,壹般有兩種分解形式:加法模式和乘法模式。加法模式是假定四種變動原因是互相獨立的,則時間數(shù)列各期發(fā)展水平是各個影響原因相加的總和;乘法模式是假定四種變動原因存在著某種互相影響關系,互不獨立。因此,時間數(shù)列各期發(fā)展水平是各個影響原因相乘之積。二、長期趨勢分析措施(1)回歸方程法:就是運用回歸分析法,將試講作為解釋變量,建立現(xiàn)象隨時間變化的趨勢方程。首先要確定趨勢的形態(tài),最常用的措施是先畫散點圖。若散點圖屬直線趨勢形態(tài),可擬合直線方程,若為曲線形態(tài),則可擬合曲線方程;還可以根據(jù)動態(tài)分析指標判斷,若時間數(shù)列的逐期增長量近似壹種常量,則趨勢近似壹條直線;若時間數(shù)列中的二級增長量大體相似,則趨勢近似壹條拋物線;若時間數(shù)列中各環(huán)比發(fā)展速度大體相似,則趨勢近似壹條指數(shù)曲線。直線趨勢方程的壹般公式:式中:表達時間數(shù)列的長期趨勢;表達時間數(shù)列中指標所屬的時間;、為待定參數(shù)。(2)簡樸移動平均法:是壹種用來測定期間數(shù)列長期趨勢的最基本措施。它將時間數(shù)列的數(shù)據(jù)逐項移動,依次計算包括壹定騎術的序時平均數(shù),形成壹種新的時間數(shù)列的措施。(3)指數(shù)平滑法:是對時間數(shù)列由近及遠采用具有逐漸衰減性質(zhì)的加權處理,對移動平均法做出了改善;根據(jù)指數(shù)平滑次數(shù)的不壹樣,指數(shù)平滑法又壹次指數(shù)平滑、二次指數(shù)平滑等;壹次平滑法:也稱簡樸指數(shù)平滑法,簡記為SES第三節(jié)季節(jié)變動分析季節(jié)變動的三個特點:(1)季節(jié)變動每年反復進行(2)季節(jié)變動按壹定的周期進行(3)每個周期變化強度大體相似季節(jié)變動的措施:壹是不考慮長期趨勢的季節(jié)指數(shù)法;二是考慮長期趨勢的回歸方程法消除法;壹、不考慮長期趨勢——季節(jié)指數(shù)法季節(jié)指數(shù)法:是壹種通過計算各月(或季)的季節(jié)指數(shù)(又稱季節(jié)比率),來反應季節(jié)變動的壹種分析措施。季節(jié)比率的計算措施是:首先計算出各

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論