サンプリング1(無作為抽出法)──国際社会学I2012年6月12日

6月12日の授業では、サンプリングを取り上げました。全国規模の世論調査をする場合、1億2000万人あまりの日本人全員から回答を集めるのは、あまりにも労力がかかりすぎるので、1億2000万人から1000~5000人くらいのサンプルを選んで、サンプルに選ばれた人だけから回答を得ます。そのサンプルの回答結果から「現在の日本人の世論はこうなっている」と結論するのです。

このような調査法を「標本調査」と言います。こうした標本調査をすれば、サンプルの選び方(サンプリング)が重要になってきます。すなわち、「代表性」の高いサンプルを選ぶことが必要です。もっとも代表性の高いサンプリングが、無作為抽出法(ランダム・サンプリング)と呼ばれるものです。

しかし、この無作為抽出法をおこなっても、誤差からはまぬがれえません。標本調査の結果を見るときは、常にこの誤差を念頭に置く必要があります。

この日の授業では、大谷他『社会調査へのアプローチ』にもとづいて、テレビの視聴率調査における誤差の問題を取り上げました。後半は、無作為抽出法の具体的なやり方について説明しました。


講義ノートはこちら(MS Word, 31Kb)
https://dl.dropbox.com/u/22647991/20120612%E5%9B%BD%E9%9A%9B%E7%A4%BE%E4%BC%9A%E5%AD%A6I%EF%BC%88%E7%84%A1%E4%BD%9C%E7%82%BA%E6%8A%BD%E5%87%BA%E6%B3%95%EF%BC%89.docx

==========
講義ノートテキスト版
==========

20120612国際社会学I(サンプリング1)
サンプリング1──無作為抽出法

標本調査と無作為抽出法
標本調査とサンプリング
 調査票調査(質問紙調査、ソーシャル・サーベイ)は、一般的に標本調査で行われる。
 標本調査では、母集団から抽出されたサンプル(標本)の結果をもとに、母集団の状態を推定する
 鍋のスープの味を確かめるのに、スプーンで取り出したスープの一部を飲んで味見をするようなもの
 サンプリングとは、母集団からサンプルを選び出す(抽出する)こと

母集団とサンプル
 母集団
 調査の対象となるすべての人びとの集合
 鍋のスープ全体
 サンプル
 母集団から抽出された実際に直接調査(=実査)をされる人びと
 鍋からスプーンで取り出したスープ

無作為抽出法(ランダム・サンプリング)
 標本調査では、サンプルが母集団をよく代表していることが重要(代表性の基準)
 そのための最良の方法が、無作為抽出法(ランダム・サンプリング)
 ランダム・サンプリングとは、母集団の各構成要素が、「同一の確率」でサンプルに選ばれる可能性をもつように抽出するサンプリング
 スープの味見をするときに、事前に鍋のスープを良くかき混ぜるイメージ

全数調査(悉皆調査)
 母集団に含まれる人すべての人一人一人を実際に調査する
 国勢調査など
 莫大なコストがかかる
 それに比べ、標本調査は、費用対効果が高い

標本誤差
 母集団から標本を抽出すること(サンプリング)によって生じる誤差。
 無作為抽出法を使っても、必ず標本誤差が生じる
 しかし、無作為抽出法を使えば、標本誤差を統計的に計算できる


標本誤差の具体例──視聴率調査(大谷他 2005)
 ビデオリサーチ社の視聴率調査(関東地区 オンラインメーター方式)
 関東1600万のテレビ所有世帯(母集団)でどの程度その番組が見られていたかという数字を、600世帯(標本)に機械を設置して推定しようとする標本調査
http://www.videor.co.jp/rating/wh/index.htm

問題1:視聴率30%という数字は、どんなことを意味する?
 標本に選ばれた600世帯中、180世帯が「その番組を見ていた」という意味
 関東1600万世帯(母集団)で「その番組を観ていた」世帯の数を推定
 危険率5%(100回調査して5回外れる)で推定
 標本誤差の「比率の公式」を利用(大谷他 2005: 134)
 標本誤差を考慮に入れると、視聴率30%とは「26.3%~33.7%」という意味になる
 420万8000世帯から539万2000世帯が視聴していたと95%の確率で言える

問題2:視聴率30%25%では、差があるといえるか
 標本誤差の「比率の公式」で計算
 危険率5%で推定
 視聴率30%とは、「26.3%~33.7%」
 視聴率25%とは、「21.5%~28.5%」
 解答:差があるとは言えない
 95%の信頼区間で、重複する部分があるため

問題3:標本数を2倍に増やすと、どのくらい精度が上がるか
 標本誤差の「比率の公式」で計算
 危険率5%で推定
世帯数 標本誤差
300世帯 5.2%
600世帯 3.7%
3000世帯 1.65%
3万世帯 0.51%
30万世帯 0.16%

サンプルの精度
 サンプルの数をn倍にすると、精度は、√n倍になる
 サンプル数を2倍にすると、精度は、 √2倍=1.4142倍になる
 サンプル数を4倍にすると、精度は、 √4倍=2倍になる
 母集団の大きさは、サンプルの精度にあまり影響しない
 誤差の幅±5%で必要な標本数
 10万都市:383人
 100万都市:384人
 誤差の幅±2.5%で必要な標本数
 10万都市:1514人
 サンプルの量と質
 サンプルは大きければ大きいほど精度が高い
 しかし、「大規模でも母集団の特性を反映しない質の悪いサンプルは、小規模でも母集団の特性を反映したサンプルにくらべて不正確だろう」(メイ 2005: 134)
 したがって、どのくらいの大きさにするかは、「費用対効果」の問題
 「[時間や費用などの]利用できる資源に対して、どのレベルの統計的「誤差」ならば許容できるか」(メイ 2005: 134)
 標本数決定で考慮すべき要因
 コスト(金銭的・人的要因)と相談
 コストが、標本数の上限を決める
 明確な比較分析が困難になるので、誤差の±が10%を超えないようにする
 そのためには最低でも標本数が100必要
 クロス集計表を想定して、各セルの数字が少なくなりすぎないようにする
 調査票の回収率を考慮に入れる


無作為抽出の方法
単純ランダム・サンプリング
 母集団に1番から順に番号をつけ、標本に抽出する人の番号を、乱数表を引いたり、サイコロを振るなどして決めて、その都度抽出する
 長所
 精度が高い
 短所
 サンプリング作業・調査作業・サンプリング台帳の調達が大変
 500標本を抽出するのにサイコロを500回振らねばならない
 日本国民全員を母集団として標本を抽出した場合、調査対象者は日本各地の広範囲に分散する。そうなると、標本を抽出するために、それぞれの市役所に行き、選挙人名簿や住民基本台帳を閲覧しなければならない
 エクセルによる乱数発生
 「RAND」という関数を使うと、0から1までの乱数を発生してくれる

等間隔抽出法(系統抽出法)
 サンプルを抽出する労力を軽減する手法
 母集団に1番から順に番号をつけ、スタート番号だけを乱数表で決め、残りの標本をそこから等間隔に選んでいく方法。抽出間隔は母集団の数と標本数から決定。
 人口45万の西宮市民を対象として500標本を抽出する場合、45000÷500=900より、抽出間隔は900
 スタートが52番の人なら、そこから900ずつ足していき、952番目の人、1852番目の人、と抽出していく。
 長所
 サンプリング作業が簡単
 短所
 精度が落ちる

多段抽出法
 調査員が回答者に面接に出かける労力を軽減する手法
 抽出を複数段階繰り返して標本抽出する
 日本国民を母集団として標本を抽出する際、まず第1段目に市町村などのより狭い調査区域を抽出し、第2段目にその市町村の中から個人を抽出する
 抽出を複数段階繰り返しても、最終的に、母集団の構成要素が標本に選ばれる確率を同一にする(無作為抽出の要件)
 長所
 調査作業が簡単(特に調査員が回答者を訪問する場合)
 短所
 精度が落ちる

層化抽出法
 母集団についての既知の情報を利用して、サンプルの代表性を高めようとする手法
 例
 大学で学部ごとに学生のアルバイトがどのように異なっているかを調べたい
 「男女間、理系文系間で顕著に違うのではないか」と仮説
 大学生を単純無作為抽出法で抽出するよりは、あらかじめわかっている各学部の学生数や男女比率に基づいて層化し、各層ごとに母集団の構成比率と同じだけの標本抽出をしたほうが、標本と母集団の学部男女比率は正確に一敦し、それだけ代表性が高くなる。
 実際の調査票調査では、等間隔抽出法、多段抽出法、層化抽出法が組み合わされてもちいられる


参考文献
 メイ, T, 2005,『社会調査の考え方──論点と方法』世界思想社.
 大谷信介他, 2005, 『社会調査へのアプローチ──論理と方法[第2版]』 ミネルヴァ書房.



社会調査へのアプローチ―論理と方法 (MINERVA TEXT LIBRARY)
ミネルヴァ書房
大谷 信介

amazon.co.jpで買う
Amazonアソシエイト by 社会調査へのアプローチ―論理と方法 (MINERVA TEXT LIBRARY) の詳しい情報を見る / ウェブリブログ商品ポータル



社会調査の考え方―論点と方法
世界思想社
ティム メイ

amazon.co.jpで買う
Amazonアソシエイト by 社会調査の考え方―論点と方法 の詳しい情報を見る / ウェブリブログ商品ポータル


ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0

この記事へのコメント

この記事へのトラックバック