推論統(tǒng)計學(xué)(一).ppt_第1頁
推論統(tǒng)計學(xué)(一).ppt_第2頁
推論統(tǒng)計學(xué)(一).ppt_第3頁
推論統(tǒng)計學(xué)(一).ppt_第4頁
推論統(tǒng)計學(xué)(一).ppt_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Fred Li, 2009,描述、推論統(tǒng)計學(xué)(一),Fred Li, 2009,統(tǒng)計學(xué)的定義,統(tǒng)計學(xué)是在面對不確定的情況下,提供人們能做出聰明決策的科學(xué)方法。其過程包括資料的蒐集、整理、呈現(xiàn)結(jié)果、解釋與分析。透過此一過程,並可進(jìn)而根據(jù)分析的結(jié)果加以推論,從而可以獲得合理的研判與有效的結(jié)論。 數(shù)理統(tǒng)計學(xué)與應(yīng)用統(tǒng)計學(xué)為主要分支,Fred Li, 2009,統(tǒng)計學(xué)的主要目的,萃取精華且具有意義的資訊 描述或分析各種變項之間的之關(guān)係與差異 處理不確定性的問題: 研究由樣本資料推論母群特質(zhì)之可靠機(jī)率或不確定性之大小 進(jìn)行有效率之預(yù)測 研究實驗設(shè)計與統(tǒng)計方法之關(guān)係,Fred Li, 2009,統(tǒng)計資料之要

2、素與來源,DATA之三要素:(1)個案錄(record) (2)變項(variable) (3)觀察值(observation) DATA之主要來源:(1)調(diào)查結(jié)果 (2)實驗結(jié)果 (3)模擬研究,Fred Li, 2009,統(tǒng)計分析之主要步驟,描述統(tǒng)計:(1)資料搜集(2)記錄與整理 (3)描述性統(tǒng)計量數(shù)或圖表 (4)解釋與結(jié)論 推論統(tǒng)計:(1)資料抽樣(2)記錄與整理 (3)描述性統(tǒng)計量數(shù) (4)母群推論,Fred Li, 2009,抽樣&推論,Fred Li, 2009,推論統(tǒng)計類別,參數(shù)估計(如推估當(dāng)選市長的機(jī)率) 假設(shè)檢定(如檢驗事先所提的假設(shè)是否成立) 分類(如區(qū)別分析) 簡化資料

3、(如因素分析)。,Fred Li, 2009,常見之統(tǒng)計術(shù)語,母群(population)樣本(sample) 母數(shù)(parameter)統(tǒng)計量(statistic) 常數(shù)(constant)與變項(variable): (1)自變項與依變項 (2)連續(xù)變項與間斷變項 (3)依測量層次分:名義變項、次序變項、 等距變項、比率變項 (4)量與質(zhì)的變項,Fred Li, 2009,統(tǒng)計基本概念(1),母群(population):整個研究對象的群體或根據(jù)樣本資料所欲推論的研究對象。 母數(shù)(parameter):描述母群性質(zhì)的量數(shù),通常以希臘字母表示,例如以表平均數(shù)、表標(biāo)準(zhǔn)差、表相關(guān)係數(shù)、表百分比。

4、通常只有神才知道這些母數(shù),所以用希臘字母來表示。,Fred Li, 2009,統(tǒng)計基本概念(2),樣本 (sample):由母群中所抽出的部份代表性群體。 統(tǒng)計數(shù)(statistic):描述樣本性質(zhì)的量數(shù),通常以英文字母表示,例如以M表平均數(shù)、S表標(biāo)準(zhǔn)差、r表相關(guān)係數(shù)、p表百分比。假如想利用樣本統(tǒng)計數(shù)來估計母數(shù),我們也可稱他為母數(shù)的估計值(estimate)。,Fred Li, 2009,統(tǒng)計基本概念(3),常數(shù)(constant):群體中之每一份子在某一屬性上均具有一成不變的特質(zhì)。 變項(variable):群體中之每一份子在某一屬性上,分屬不同類別或具有不同的特質(zhì),前者為質(zhì)的變數(shù),後者為量

5、的變數(shù)。,Fred Li, 2009,統(tǒng)計基本概念(4),自由度(degree of freedom):乃是變項中可以自由變動的數(shù)值之個數(shù),通常Df=# of data - # of means used,例如t考驗或F考驗時之自由度;或為實際觀察值(observations)個數(shù)(n)與變項個數(shù)(k)的函數(shù),例如迴歸分析時殘差之自由度:(df=n-k-1);或為Full model時預(yù)測變項個數(shù)(k)減去Nulll model或Restricted model時預(yù)測變項個數(shù)(h) ,例如迴歸分析時回歸係數(shù)之自由度(df=k-h)。 請問z-test的自由度如何計算?,Fred Li, 200

6、9,統(tǒng)計基本概念(5),對立假設(shè)(alternative hypothesis) 相當(dāng)於研究假設(shè) 虛無假設(shè)(null hypothesis) 為統(tǒng)計考驗的對象,Fred Li, 2009,統(tǒng)計基本概念(6),第一類型錯誤 vs 第二類型錯誤,Fred Li, 2009,描述統(tǒng)計學(xué): Descriptive Statistics,數(shù)字(Numbers ) 用以量化待研究資料的特質(zhì) 圖表(Tables & Graphs) 描繪與摘要待研究資料的有用資訊,Fred Li, 2009,描述統(tǒng)計學(xué)的內(nèi)涵,集中量數(shù)(central location) 資料點集中情形的最佳代表值 離散量數(shù)(dispersi

7、on or variation) 資料點的分散程度 偏態(tài)與峰度(skewness & kurtosis) 資料點偏離常態(tài)的程度,Fred Li, 2009,描述統(tǒng)計的運(yùn)用,為推論統(tǒng)計的依據(jù) 應(yīng)報告每一變項之Mean, sd, range, and n 次數(shù)與百分比亦可合併應(yīng)用,Fred Li, 2009,選擇適當(dāng)?shù)拿枋鼋y(tǒng)計,常態(tài)分配或無極端值: 平均數(shù)與標(biāo)準(zhǔn)差 偏態(tài)或有極端值: 中位數(shù)與四分位數(shù)、盒鬚圖(極大、極小值、Q1、Q2、Q3) 遇比率量尺時,可用幾何平均數(shù)或調(diào)和平均數(shù),Fred Li, 2009,描述統(tǒng)計功能,摘要每一變項的重要資訊: Number of cases Central

8、tendency Dispersion 協(xié)助研究者描述變項 推論統(tǒng)計中,用以分析變項間的關(guān)係與差異,Fred Li, 2009,Data Record,Fred Li, 2009,常態(tài)分配曲線,為一典型的分?jǐn)?shù)分配曲線 Majority of cases distributed around the peak in the middle Progressively fewer cases moving away form the middle Symmetrical one side mirrors the other Mean, median, and mode have the same v

9、alue,Fred Li, 2009,常態(tài)曲線,Fred Li, 2009,Skewed Distributions,非對稱性,正偏,負(fù)偏,Fred Li, 2009,個案人數(shù),以 n (樣本) 或 N(母群)表示 例如: n = 231 Cases may be people, speaking turns, episodes,Fred Li, 2009,集中量數(shù),Mean Arithmetic mean or average Most sensitive to extreme scores Median Middle of all scores on one variable Mode S

10、core or scores that appear most often,Fred Li, 2009,離散量數(shù),Describes the variability or spread of scores Should be reported with mean Range Highest to lowest score Standard deviation or sd If sd = 0, all scores are the same Larger the sd, the more the scores differ from the mean,Fred Li, 2009,Standard

11、 Deviation,Fred Li, 2009,標(biāo)準(zhǔn)差的特性,Theoretical normal curve is divided into equal standards The more normal a distribution of scores, the more this theoretical property applies 68.26% of scores fall within +1 to 1 standards,Fred Li, 2009,變項種類,Fred Li, 2009,不同資料的描述,Fred Li, 2009,平均數(shù),Fred Li, 2009,變異數(shù)與標(biāo)準(zhǔn)

12、差,Fred Li, 2009,母群變異數(shù)與標(biāo)準(zhǔn)差的估計值,Fred Li, 2009,變異數(shù)係數(shù),Fred Li, 2009,常態(tài)分配圖,例如: 全國學(xué)生的 大學(xué)入學(xué)成績,Fred Li, 2009,正偏:非對稱性,臺大學(xué)生的入學(xué)成績,Fred Li, 2009,負(fù)偏: 非對稱性,落榜學(xué)生的入學(xué)成績,Fred Li, 2009,偏態(tài): Skewness,Fred Li, 2009,Skewness,Fred Li, 2009,峰度: Kurtosis,Fred Li, 2009,常態(tài)屬性,Skewness = 0 Kurtosis = 3,Fred Li, 2009,常態(tài)屬性,Fred Li

13、, 2009,Fred Li, 2009,圖例,Fred Li, 2009,圖例: 加註常態(tài)曲線,Fred Li, 2009,盒鬚圖,中位數(shù),PR=25,PR=75,非極端值下限,非極端值上限,極端值,Fred Li, 2009,圖表法: Tabular and Graphical Methods.,探索式資料分析 交叉表與散佈圖,Fred Li, 2009,Qualitative Data,Quantitative Data,Tabular Methods,Tabular Methods,Graphical Methods,Graphical Methods,Frequency Distri

14、bution Rel. Freq. Dist. Percent Freq. Distribution Crosstabulation,Bar Graph Pie Chart,Frequency Distribution Rel. Freq. Dist. Cum. Freq. Dist. Cum. Rel. Freq. Distribution Stem-and-Leaf Display Crosstabulation,Histogram Ogive Scatter Diagram,Data,Fred Li, 2009,探索式資料分析,包含能夠快速摘要資料的簡單算術(shù)及簡易製圖 例如: 莖葉圖:

15、(the stem-and-leaf plot) 次數(shù)多邊圖 圓餅圖 直方圖,Fred Li, 2009,莖葉圖的製作,Each digit on a stem is a leaf.,Each line in the display is referred to as a stem.,To the right of the vertical line we record the last digit for each item in rank order.,The first digits of each data item are arranged to the left of a vert

16、ical line.,可保留原始資料值,莖葉圖可以顯示資料的次序關(guān)係與分配型態(tài),Fred Li, 2009,實例: 小學(xué)生的智力成績,林森國小李老師為了解55名學(xué)生在魏氏兒童智力量表上的成績,Fred Li, 2009,莖葉圖,5 6 7 8 9 10,2 7,2 2 2 2 5 6 7 8 8 8 9 9 9,1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9,0 0 2 3 5 8 9,1 3 7 7 7 8 9,1 4 5 5 9,a stem,a leaf,Fred Li, 2009,Stretched 莖葉圖,Whenever a stem value is stated

17、 twice, the first value corresponds to leaf values of 0 - 4, and the second value corresponds to leaf values of 5 - 9.,If we believe the original stem-and-leaf display has condensed the data too much, we can stretch the display by using two stems for each leading digit(s).,Fred Li, 2009,Stretched 莖葉

18、圖,5 5 9,1 4,7 7 7 8 9,1 3,5 8 9,0 0 2 3,5 5 5 6 7 8 9 9 9,1 1 2 2 3 4 4,5 6 7 8 8 8 9 9 9,2 2 2 2,7,2,5 5 6 6 7 7 8 8 9 9 10 10,Fred Li, 2009,Stretched 莖葉圖,Leaf Units,Where the leaf unit is not shown, it is assumed to equal 1.,Leaf units may be 100, 10, 1, 0.1, and so on.,In the preceding example, t

19、he leaf unit was 1.,A single digit is used to define each leaf.,Fred Li, 2009,Leaf Unit = 0.1,8 9 10 11,Leaf Unit = 0.1,6 8,1 4,2,0 7,8.6 11.79.49.110.211.08.8,Fred Li, 2009,Leaf Unit = 10,16 17 18 19,Leaf Unit = 10,8,1 9,0 3,1 7,1806171719741791168219101838,The 82 in 1682 is rounded down to 80 and

20、is represented as an 8.,Fred Li, 2009,雙向交叉表與散佈圖,雙向交叉表與散佈圖: (Crosstabulation and a scatter diagram),同時處理雙變項(或以上)間的關(guān)係,Fred Li, 2009,雙向列表,左上與正上方通常列出變項的類別,使用時機(jī): 一個變項為質(zhì)的變項, 另一個變項為量的變項 兩個變項皆為質(zhì)的變項 兩個變項皆為量的變項,Fred Li, 2009,學(xué)費,市立 私立 綜合 縣立,Total, $9,000,18 1 19 12,50 50,30 20 35 15,Total,100,12 19 16 3,學(xué)校類別,實例: 國中生每學(xué)期的學(xué)費,quantitative variable,qualitative variable,Fred Li, 2009,學(xué)費,市立 私立 綜合 縣立,Total, $9,000,36 2 3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論