14

調査研究におけるサンプリングの重要性

研究を進めるためには具体的な計画が不可欠です。研究の対象、測定・評価方法、評価期間など決めなければならないことは多々あります。研究計画は慎重に検討しておく必要があります。同様に重要なのは、研究における調査対象の抽出( サンプリング )です。大方の調査では、限られた調査対象から得られる回答(データ)をもとに全体を推定します。調査の対象となる特性を持つ全体を母集団、母集団の性質を忠実に反映するように母集団から抽出される部分を標本(サンプル)と呼びます。サンプル数が多いほど、母集団の性質をより確実に反映する確率が高くなりますが、調査結果の信頼性を高めるにはサンプルの数とともにランダム性も大事な要素であると覚えておきましょう。以下に、サンプリングについてまとめてみます。

サンプリングの方法-確率抽出法と非確率抽出法

ひとつの例として以下のような調査を考えてみます。

炭坑での労働が健康におよぼす悪影響を調べたいとします。炭坑労働者全員を調べることは実質的に不可能なため、調査対象を絞ってデータ収集することが必要となります。この調査では、ある地域の炭坑労働者を調査対象としてサンプルに設定します。

このように母集団(炭鉱労働者)からサンプル(調査対象)を選ぶ方法としては、確率抽出法と非確率抽出法の2つに大きく分けられます。

1. 確率標本抽出法

母集団から標本を適当に選んだのでは、その調査結果の評価が難しくなります。また、一定の偏りが生じるような抽出法は避けるべきです。そこで、母集団を構成している全て(成員)が一定の確率で(必ずしも同じ確率でなくてもよい)調査対象となるように選ぶ抽出法が確立標本抽出法です。これにはいくつかの手法がありますが、最も広く利用されるのは母集団のどの構成要素にも等しい抽出確率を付与する単純無差別抽出法です。他に、層別抽出法(層化抽出法)、クラスター抽出法(集落抽出法)、系統抽出法などがあります。上述の地域を限定して炭鉱者のサンプルを選出した例は、クラスター抽出法です。

2. 非確率抽出法

確率標本抽出法とは異なり、確率的でない基準に基づき調査対象を選ぶ方法です。サンプルに選ばれる確率が不均等なので、標本誤差(サンプルを無作為抽出して調査した結果にともなう誤差)を統計的に推定することはできません。研究者が、調査研究の目的等に応じて選択的にサンプルを選びたい場合にこの方法が採用されます。非確率抽出法には、機縁法・縁故法、応募法、インターセプト法、割り当て法、有意抽出法などがあります。

質的調査、量的調査とサンプリング

サンプリングをした対象者からデータが得られたら、次は分析です。それには、言葉による説明などを行う質的調査と、情報を数量化して捉える量的調査の2つがあり、双方の特性を理解した上で、どちらが自分の研究に適しているか総合的に判断する必要があります。

質的調査

質的調査では、調査対象の非数値的な特性データが対象となります。数字には表れない特性が周囲にどのように影響するかを計測する定性的な調査です。そのため、研究にあわせたサンプリング方法を工夫しなければなりません。質的調査に使用されるサンプリング方法の主なものとして3つあります。

  • 有意抽出法
    調査対象の標本を、研究者のもつ情報や経験、勘などの主観的な判断によって、作為的に(有意に)選ぶ方法です。収集できる標本数が少ない場合、無作為ではかえって誤差が大きくなってしまう場合などに、あえてこの方法を選ぶこともあります。サンプルの「代表性」を高めるために、特定の条件・特徴に着目し、それらの標本平均が母集団の平均と同一になるように標本を抽出することも行われます。
  • 割り当て法
    サンプリングの際、例えば性別・年齢構成を国勢調査の結果と同一とするなど、特定の特性についての構成比が母集団と等しくなるように、特性ごとに収集する標本数を指定する方法です。無作為抽出が難しい、あるいはあまり意味をもたない場合などに使用されます。
  • 機縁法(縁故法)
    調査のテーマに合った特定の調査対象者を、知人の紹介、調査員の対人関係や関係者の縁故関係などから集める方法です。知人の紹介などを連鎖的につないでいく方法であるため、雪だるま法とも呼びます。非確立抽出法のひとつです。

量的調査

量的調査は数量的なデータを収集して、統計手法を用いて変数間の関係を明らかにする調査方法です。仮説の検証を目的として行われることが多く、アンケートなどを通して行われる調査です。使用される主なサンプリング方法を3つあげます。

  • 単純無作為抽出法
    母集団のどの構成要素からも選ばれる確率が等しくなるようにサンプリングする方法です。選定の確率に偏りが生じないように、乱数表を用いる方法が代表的でランダム性が保証されます。
  • 層化抽出法
    母集団を既知の状況(年齢比、男女比など)に応じていくつかの層に分けておき、各層のなかから必要な数のサンプルを無作為に抽出する方法です。層別の例としては、性別、年齢層別、職業別などがあります。メリットとしては、層間の比較を行える、各層において分布が大きくことなる場合にも使用できる、などがあります。
  • 系統抽出法
    無作為抽出を実現するための実践的な手法の一つです。母集団の数が多いなどで無作為抽出が難しい場合、頭だけを無作為に抽出し、以降は等間隔で抽出する方法です。例えば、抽出元のデータに一連の番号をつけておき、その番号順に等間隔(例えば、5個おきとか10個おきのように)でサンプルを選んでいきます。調査対象の母集団が電話帳のように一覧形式で記録されている場合に便利です。

適切なサンプリング方法の採用が大切

抽出したサンプルの統計処理・分析から結果が導かれることを鑑みれば、研究におけるサンプリングは重要な要素です。とはいえ、調査対象を無作為に抽出して調査を行うサンプリング調査では、その結果が必ずしも母集団の値と一致するとは限らず、何らかの差が生じることになります。サンプリング調査を行うときには、この標本誤差のことを忘れずに、適切な標本抽出方法とサンプル数を採用するようにします。

標本誤差が生じる原因のうち、よく見かけられるものは次の3つです。

  • サンプルが母集団の特性の分布を正しく反映していない、サンプル抽出に偏りがある場合。
  • 層化抽出において、適切でない層からサンプルを抽出している場合。結果として、母集団を適切に反映しないサンプルとなってしまう。
  • 標本の調査対象データの測定に系統誤差が存在する場合。系統誤差とは、不適切なサンプリング方法を取ることで結果が歪められることであり、方向性のある誤差を意味する。系統誤差は、原因を突き止めなければ解消しないものであるため、測定方法に注意するしか対策がない。この場合も母集団の特性と大きく異なる調査結果となってしまう。

研究において、サンプリングはさまざまな場面で必要となります。複数あるサンプリング方法の中から、調査の目的に合致したものを選定し、それを正しく使用していくことが、調査研究の成否に大きく影響します。サンプリング法を的確に理解し、適切なサンプリングを行うことが極めて大事です。

X

今すぐメールニュースに登録して無制限のアクセスを

エナゴ学術英語アカデミーのコンテンツに無制限でアクセスできます。

  • ブログ 560記事以上
  • オンラインセミナー 50講座以上
  • インフォグラフィック 50以上
  • Q&Aフォーラム
  • eBook 10タイトル以上
  • 使えて便利なチェックリスト 10以上

* ご入力いただくメールアドレスは個人情報保護方針に則り厳重に取り扱い、お客様の同意がない限り第三者に開示いたしません。

研究者の投票に参加する

研究・論文執筆におけるAIツールの使用について、大学はどのようなスタンスをとるべきだと考えますか?