16

描述性研究與相關性研究的區別

在學術論著的創新性判斷中,發現新事物的存在通常具有最強的創新性,其次是揭示新事物的影響因素相關性。如果沒有存在,就談不上相關性。相關性包括因果關係和雜訊關係。因果關係(causal relationship指的是原因與結果之間的關係。雜訊關係(noise relationship包括非因果關係的其他影響關係。揭示“存在”問題的研究是描述性研究(descriptive research。揭示“相關”問題的研究是相關性研究(correlation research。當然,相關性研究也可以用來揭示新事物的“存在”。這兩種研究類型代表兩種不同的試驗研究方法,是在無法進行理論模型推導計算時所必須採用的科研方法。本文論述描述性研究與相關性研究之間的區別。

以天文學為例,發現行星的存在與研究行星運動軌跡受哪些因素影響,屬於兩種不同創新性類型的研究問題。再以醫學為例,研究某種致病原因對發病結果的影響,與研究性別(視為雜訊因子)與是否發病之間的關聯,屬於兩種不同相關性類型的研究問題。在描述性研究中,所有參數均稱為特徵參數,不存在自變量(又稱因子)因變量(又稱回應)之間的劃分,因為描述性研究只需展示事物或其某種分佈的存在,而不關心因果關係或影響關係。然而,在相關性研究中,必須劃分因子和回應,將能夠干預改變的因子稱為控制因子(例如發動機功率),而將不能干預改變的因子稱為雜訊因子(或稱非控制因子,例如環境大氣溫度)。相關性研究包括無雜訊因子和有雜訊因子兩種。

如果沒有雜訊因子存在,當控制因子的取值發生改變時,回應參數將獲得一個確定的取值。比如,當踩下車輛的油門後,車子會加速行駛。然而,當雜訊因子存在時,回應參數的取值就不再是確定的數值,而是呈現出一條概率密度分佈函數或長條圖形式。例如,在某個固定的車輛油門開度下,由於道路上隨機變化的橫風風速的影響,車輛會呈現橫向微偏,這些微偏值也是隨機變化的,可能會呈現出一條正態分佈曲線的形式。這條正態分佈曲線具有兩個特徵量,一個稱為均值,另一個稱為偏差(散度)。當雜訊因子存在時,如果控制因子的某個取值給出一組均值和偏差,而另一個取值給出另一組均值和偏差,而且如果這兩個偏差不相等,那就構成一個穩健性問題,又稱抗擾性或魯棒性問題。穩健性問題的核心任務是找到優化的控制因子取值,使得均值最優(最大、最小或達到目標值)、散度最小——這構成一個雙目標優化問題。

如果描述性研究中的特徵參數沒有被賦予時間維度,即所有參數的取值均發生在同一時間,這種研究稱為橫斷面研究(cross-sectional study,例如研究全國人口普查的職業、年齡等分佈特徵。當描述性研究中的特徵參數被賦予時間維度時,稱為時間序列研究(time series study縱向研究(longitudinal study,例如研究流行病發病率隨年份變化的趨勢。

無雜訊因子的相關性研究(又稱控制性研究)需要在具有嚴格控制條件的實驗室中進行,例如改變藥物劑量,觀察經過嚴格篩選分組後的受試者的生理反應。有雜訊因子的相關性研究(又稱控制加雜訊研究)可以在不具備嚴格控制條件的實驗室中進行(例如改變藥物劑量,觀察具有不同的年齡、性別、體重、病史的受試者的生理反應),或者可以使用描述性研究資料,因為描述性研究資料中可能包括控制因子和雜訊因子,而時間就可以是一個典型的雜訊因子。當然,描述性研究資料中也可能不包括任何相關性內容,比如展示某個地區的性別比例和受教育程度的分佈資料。

描述性研究的目的是揭示新事物存在。相關性研究的目的是揭示因果關係和雜訊關係,當然也可以用來揭示新事物存在。描述性研究的資料是可以用來進行相關性研究的,只是這種資料中存在大量的雜訊因子,處理起來難度較大。從產生有價值的新發現角度評價,描述性研究和相關性研究都有其各自的難度。從收集資料的難易程度評價,描述性研究(尤其是橫斷面研究)是最容易產生試驗資料的,而無雜訊因子的相關性研究(控制性研究)是最難產生試驗資料的。

因子之間的相互作用是指回應參數隨一個因子的變化趨勢受到另一個因子的取值的影響。例如,當發動機進氣量隨轉速變化的規律受到海拔高度的影響,則稱轉速與海拔高度之間存在相互作用。揭示相互作用是系統工程研究的核心任務,也是研究複雜性影響所必須具備的內容。回應曲面方法最擅長高效處理因子相互作用。因此,它是用於相關性研究的最有效工具之一。

在相關性研究中,當因子的個數多於兩個時,尤其當因子的水準值較多時,使用全析因試驗設計(又稱參變數掃值法)就很不方便,因為試驗資料點太多。這時,就需要使用部分析因設計方法完成試驗設計,以便高效收集資料。由於描述性研究的資料無法事先針對因子進行控制或設計,這種資料在特徵參數的水準值數量上呈現出隨機特徵或不確定特徵,可以視為一種特殊的、各因子具有不同水準值數量的拉丁超立方設計(又稱空間填充設計)。

綜上所述,描述性研究和相關性研究在資料特徵上可以具有共同點和重疊部分(即關於雜訊因子的部分),而在研究目的上則是完全不同的。

X

請訂閱以繼續閱讀

關於科研寫作和學術出版的文章與學術資源,包括:

  • 820 +文章
  • 50+ 免費線上講座
  • 10+ 專家Podcast
  • 10+ 電子書
  • 10+ 檢查清單
  • 50+ 資訊圖
全球科研人調查

大學在研究和學術寫作中應該採取什麼立場?