從部分到整體的有效推論方式——推斷統計

Jan 20, 2023

稻果學院, "從部分到整體的有效推論方式——推斷統計." Enago英論閣部落格：論文撰寫與科學研究發表支援. January 25, 2023. https://www.enago.com/academy/tw/inferential-statistics/.

Copy

推斷統計學（inferential statistics）是研究如何根據樣本資料推斷總體特徵的方法，是在對樣本資料進行描述的基礎上，對統計總體的未知數量特徵做出概率形式表述的推斷。推斷統計包括總體參數估計和假設檢驗。相比之下，描述統計學（descriptive statistics）研究資料反映客觀現象的特點，並通過圖表形式對樣本資料進行加工處理和顯示，得出規律性數量特徵。

總體（population）是研究物件的整個群體。樣本（sample）是從總體中選取的一部分資料。樣本數量是指有多少個樣本。樣本大小（又稱樣本容量）是指每個樣本包含多少個體。統計量（statistic）指的是關於樣本的測量，而參數（parameter）指的是關於總體的測量。概率樣本的置信區間（confidence interval）是對該樣本的某個總體參數（例如均值）的區間估計，展示的是這個參數的真實值以一定概率落在測量結果周圍的程度。置信區間給出的是被測量參數的測量值的可信程度，即前面所要求的“一定概率”。這個概率即為置信水準，亦稱置信度。置信度b與顯著性水準a之間的關係為b=(1-a)´100%。例如，95%置信度的置信區間意味著，如果你以完全相同的方式用一個新樣本重複研究100次，你可以預期估計值在指定的值範圍內的次數達到95次。以上是相關統計學概念的簡介。下面談一下總體參數估計和假設檢驗。

總體參數估計是指通過樣本對總體特徵進行估計，即如何從局部結果推論總體情況。總體參數估計可分為點估計（point estimate）和區間估計（interval estimate）。點估計是在用樣本統計量估計總體參數時，估計的結果以一個點的數值表示。點估計總是存在誤差的，並且無法指出對總體參數給予正確估計的概率有多大。因此，點估計只能作為一種不精確的大致估計，更好的辦法是對總體參數進行區間估計。區間估計是根據樣本統計量，利用抽樣分佈原理，用概率表示總體參數可能落在某數值區間內的推算方法。在區間估計中，給定置信度，根據估計值確定真實值可能出現的區間範圍，該區間通常以估計值為中心。區間估計的種類有很多，主要包括總體平均值的區間估計、總體百分數的區間估計、標準差和方差的區間估計、相關係數的區間估計等。從構造估計值的方法來看，包括矩法估計、最小二乘法估計、最大似然估計、貝葉斯估計等。區間估計通常需要處理兩個問題：（1）求出參數的估計值；（2）在一定置信度下指出所求估計值的精度。精度用估計值與被估參數之間的接近程度或誤差來度量。例如，由於發動機產品投試樣品的數量通常較少，造成可靠度估計帶有較大的不確定性。使用帶有置信區間或給定置信度（例如90%）的可靠度區間估計方法比使用僅具有50%置信度的可靠度點估計方法更為重要。

在統計學中，通過樣本統計變數得出的差異做出一般性結論，判斷總體參數之間是否存在差異，並且判斷樣本與樣本、樣本與總體的差異是由抽樣誤差（sampling error）引起的還是由本質差別造成的。這種推論過程稱為假設檢驗（hypothesis testing，又稱統計假設檢驗）。抽樣誤差是測量樣本值與真實總體參數值之間的差值，其產生的原因是由於樣本的大小總是小於總體的大小，所以樣本資料無法捕獲一些總體特徵。在假設檢驗中，給定置信度，根據真實值的假設值確定估計值可能出現的區間範圍，該區間通常以假設值為中心。如果計算得到的估計值在此區間範圍內，則接受原假設，否則拒絕原假設。例如，在10個地點進行森林間伐後，樹木的生長速度提高了25%，而在另外10個地點沒有進行森林間伐，要求使用推論統計決定增長率的增加是出於偶然還是真實的。如果假設森林稀疏對樹木生長速率沒有影響，那麼這種假設被稱為零假設。假設檢驗分為參數核對總和非參數檢驗。若進行假設檢驗時總體的分佈形式已知，需要對總體的位置參數進行假設檢驗，稱其為參數假設檢驗。若對總體分佈形式所知甚少，需要對未知分佈函數的形式及其他特徵進行假設檢驗，稱之為非參數假設檢驗。顯著性檢驗是假設檢驗中最常用的一種方法，也是一種最基本的統計推斷形式。其基本原理是先對總體的特徵做出某種假設，然後通過抽樣研究的統計推理，對應該拒絕此假設還是接受做出推斷。常用的假設檢驗方法有Z檢驗、t檢驗、卡方檢驗、F檢驗等。

綜上所述，推斷統計是廣泛用於生物醫學和可靠性工程等概率性（非確定性）分析問題的常用方法，也是學術素養中資料處理方法的重要組成部分。在學術論文中運用推斷統計時，需要注意在“材料與方法”部分對相關概念和假設的應用給出完整嚴謹的論述。