サンプリング2(その他のサンプリング)──国際社会学I2012年6月19日

6月19日の授業でも、引き続きサンプリングの話をしました。最初は、無作為抽出法の実例ということで、この授業でも取り上げたEASS2006のサンプリングについて、実際の手順を解説しました。この調査では、層化二段無作為抽出法という方法がもちいられています。これは、多段抽出法、層化抽出法、等間隔抽出法の三つを組み合わせたものです。EASS2006はJGSS2006に組み込まれて実施されているので、授業ではJGSS2006のサンプリングの話をしています。

次に、母集団の成員すべてを網羅したサンプリング台帳がない場合のサンプリングについて話しました。住民基本台帳や選挙人名簿などのサンプリング台帳が使える日本のような国は少数派です。他の国では、そうした名簿がないなかで、さまざまな工夫をおこなっています。

最後に、回収率を取り上げました。この回収率も、サンプリングと並んで、サンプルの「代表性」に大きく関わります。JGSS2006はかなりしっかりした調査ですが、それでも回収率は60%ほどです。

JGSS2006のサンプリングや回収率については、『日本版 General Social Surveys基礎集計表・コードブックJGSS-2006』に詳しいです。簡単にダウンロードできますので、ぜひご覧ください。
http://jgss.daishodai.ac.jp/research/codebook/JGSS-2006_Codebook_Published.pdf


講義ノートはこちら(MS Word, 247Kb)
https://dl.dropbox.com/u/22647991/20120619%E5%9B%BD%E9%9A%9B%E7%A4%BE%E4%BC%9A%E5%AD%A6I%EF%BC%88%E3%81%9D%E3%81%AE%E4%BB%96%E3%81%AE%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AA%E3%83%B3%E3%82%B0%EF%BC%89.docx

==========
講義ノートテキスト版
==========

20120619国際社会学I(その他のサンプリング)
サンプリング2──その他のサンプリング

無作為抽出法の実際──EASS2006(JGSS2006)
 多段抽出法+層化抽出法+等間隔抽出法

概要
 日本では、JGSS2006に、EASS2006モジュールを組み込んで実施された
 JGSS: Japanese General Social Survey
http://jgss.daishodai.ac.jp/
 EASSモジュールは、留置調査票B票に組み込まれている

JGSS2006の標本抽出
調査地域 全国
調査対象 2006年9月1日時点で満20歳以上89歳以下の男女個人
(大正5年9月2日~昭和61年9月1日までに生まれた男女)
1億0176万0916人
標本数 8000人
抽出台帳 選挙人名簿
抽出方法 層化二段無作為抽出法
(全国を6ブロックに分け、市郡規模によって4段階に層化し、人口比例により526地点を抽出。各地点において等間隔抽出法により、14~16名を抽出。)

JGSS-2006のサンプリング手順
 全国の市町村を24に層化する
 「1 北海道・東北」「2 関東」「3 中部」「4 近畿」「5 中国・四国」「6 九州」× 「1 大都市」「2 人口20万人以上の市」「3 人口20万未満の市」「4 郡部」
 地点の配分
 24の各層の人口規模に比例させて、各層から抽出すべき地点数を産出
 地点の抽出
 各層ごとに、等間隔抽出法で地点を抽出
 対象者の抽出
 抽出された各地点ごとに、等間隔抽出法で対象者を抽出

層化の方法(大阪商業大学比較地域研究所他 2008: 14)



その他のサンプリング
サンプリング台帳(大谷他 2005: 150-1)
 サンプリング台帳とは、母集団の成員をもれなく重複なく記載した名簿のこと
 無作為抽出するのにサンプリング台帳は不可欠
 逆に言えば、サンプリング台帳がなければ、無作為抽出はできない
 日本におけるサンプリング台帳の例
 住民基本台帳
 市役所の市民課などで取り扱っている住民票の原簿
 基本的に世帯ごとに子どもから老人まで全世帯員のデータが記載されている
 選挙人名簿抄本
 自治体の選挙管理委員会に保管されている
 20歳以上の男女。3ケ月に一度住民基本台帳を基に選挙管理委員会が作成する有権者名簿

日本のようにサンプリング台帳が使えない場合
 日本のようにサンプリング台帳が使える国は少数派
 ISSP2005における各国のさまざまなサンプリング法(西・荒牧 2009: 29)
 無作為抽出によって個人を直接選べている国(32カ国中12カ国)
 オーストラリア、ドイツ、ハンガリー、ノルウェー、スウェーデン、スロベニア、ニュージーランド、日本、デンマーク、ベルギー、フィンランド、台湾
 残りの国は、地域や世帯を無作為抽出し、そのなかから個人を「誕生日法」や「Kish法」で選ぶ
 誕生日法:その家庭で、たとえば最近誕生日を迎えた人を選ぶ
 Kish法:調査対象となりうる家族全員のリストを作成し、一種の乱数表と対応させ、そのなかから1名を対象者として選ぶ

ランダム・ルート・サンプリングとエリア・サンプリング(吉野 2010: 71-5)
 ランダム・ルート・サンプリング
 リストのなかから「道」を統計的にランダムにサンプリングし、抽出された道のスタート地点からその道に沿って家庭を訪問し、あらかじめ決められた数の回答者を得る手続き
 別名:ランダム・ルート・サンプリング(欧州)、ランダム・ウォーク(米国)、ライト・ハンドメソッド(インド)
 エリア・サンプリング
 リストのなかから「地区」を統計的にランダムにサンプリングし、抽出された道のスタート地点からその道に沿って家庭を訪問し、あらかじめ決められた数の回答者を得る手続き
 家庭訪問時に、その家庭の誰に回答してもらうかは、「誕生日法」や「Kish法」をもちいる。
 訪問した家庭(イタリア、オランダ)の協力率は30~40%(吉野 2010: 73)
 計画した有効回答者を得るには、おおよそ計画した世帯数の3倍から5倍を当たらねばならない(吉野 2010: 78)
 問題点
 個人の抽出確率が必ずしも同一ではないため、厳密には、無作為抽出とは言えない
 家庭は同確率で抽出されても、たとえば、4人家族と2人家族では個人の抽出確率が2倍異なる。

エリア・サンプリングの実際(大谷他 2005: 156-8)
 アメリカのギャラップ社の例(1976年出版の本に書かれていた方法)
 面接地点の抽出──等間隔抽出法
 アメリカ人口を地理的な順序で州別に配列し、ついで各州のなかも地理的な順序で地区別に配列する
 抽出間隔は、18歳以上の1億48000万人を、面接地点数300で割ることによって、49万人となる
 第1地点を1から45万の数字のなかから無作為に選ぶ。第2地点から300地点までは、第1地点の数字に抽出間隔45万を加えていく
 面接ブロックの抽出
 抽出地点のなかから、国勢調査局が発行しているブロック統計を用いて、その調査区のなかから一つないし若干のブロックが抽出される。
 家庭の抽出
 抽出されたブロックにおいて、面接員にランダムに選ばれたスタート地点があたえられる
 面接員は、そのスタート地点から、指定どおりに次々に住宅を訪問する。
 3軒おき、5軒おきなどのやり方もある
 個人の抽出
 訪問した家庭のなかから、Kish法や誕生日法をもちいて、回答してもらう個人を選ぶ

割当法(クォータ法)
 層化抽出法のように、既知の情報にもとづいて層を作り、その構成比率がサンプルに反映されるようにサンプリングの数を決める。
 たとえば、「性別」「年齢」「人種」の3つの属性で回答者数を割り当てる
 ただし、そのサンプリングはランダムには行わず、計画した回答者数を確保できるまで続ける
 この点が、無作為抽出法である層化抽出法と違う点

RDD(大谷他 2005: 170-2)
 Random Digit Dialingの略
 コンピュータで電話番号をランダムに発生させて、業務用を除いて家庭用の電話にかかった場合にのみ調査する方法
 利点
 電話番号を電話帳に掲載していない世帯にも調査ができる
 欠点
 母集団が確定できないので、厳密な意味での「回収率」や「標本誤差」がわからない
 携帯電話やIP電話などの普及によって、調査地域が特定できない
 見知らぬ番号からの電話に出ない人が増えている


回収率
 無作為抽出で選ばれたすべての人が回答してくれるわけではない。
 回収率は、30%~70%と、調査によって大きな違いがある
 調査目的や実査方法などによって回収率に違いが生じる
 回答してくれない人はどのような人か
 忙しい人
 調査目的に関心のない人
 回収率が下がれば、それだけサンプルの代表性も低下する

JGSS2006の回収状況(大阪商業大学比較地域研究所他 2008: 19-23)
 回収率の計算式
 アタック数(計画標本サイズ): 8000
 有効回収数:4254
 回収率: 59.8%
 4254÷(8000-住所不明154-転居315-長期不在131-病気148-入院91-死亡17-その他30)
 欠票の理由
 サンプル台帳の不備
 転居、住所不明、死亡
 回答者が回答不能
 入院中・入所中、病気・ケガ、聴力・言語障害
 回答者の都合
 長期不在、一時不在
 欠票理由の実数と割合
実数 (人)
  転居 住所
不明 死亡 長期
不在 一時
不在 拒否 入院中・入所中 病気・ケガ、聴力・言語障害 その他 合計
男性 182 90 14 78 419 1039 35 57 18 1932
女性 133 64 3 53 347 1055 56 91 12 1814
合計 315 154 17 131 766 2094 91 148 30 3746

割合 (%)
  転居 住所
不明 死亡 長期
不在 一時
不在 拒否 入院中・入所中 病気・ケガ、聴力・言語障害 その他 合計
男性 9.4% 4.7% 0.7% 4.0% 21.7% 53.8% 1.8% 3.0% 0.9% 100.0%
女性 7.3% 3.5% 0.2% 2.9% 19.1% 58.2% 3.1% 5.0% 0.7% 100.0%
合計 8.4% 4.1% 0.5% 3.5% 20.4% 55.9% 2.4% 4.0% 0.8% 100.0%

 表1・表2からわかる欠票の年齢傾向(大阪商業大学比較地域研究所他 2008: 20)
 20代と80代の回答が少ない
 60代と70代の回答が多い
 表5・表6からわかる欠票の傾向(大阪商業大学比較地域研究所他 2008: 20)
 理由は「拒否」がもっとも多く(5~6割)、次いで「一時不在」が多い(2割)
 男女差は比較的小さい
 「拒否」は女性が多い


参考文献
 大阪商業大学比較地域研究所・東京大学社会科学研究所編, 2008, 『日本版 General Social Surveys基礎集計表・コードブックJGSS-2006』大阪商業大学比較地域研究所(http://jgss.daishodai.ac.jp/research/codebook/JGSS-2006_Codebook_Published.pdf , 2012.06.18閲覧)
 西久美子・荒牧央, 2009, 「仕事の満足度が低い日本人──ISSP国際比較調査「職業意識」から」『放送研究と調査』(日本放送出版協会) 59(6): 18-31.
 大谷信介他, 2005, 『社会調査へのアプローチ──論理と方法[第2版]』 ミネルヴァ書房.
 吉野諦三・林文・山岡和恵, 2010, 『国際比較データの解析』朝倉書店






社会調査へのアプローチ―論理と方法 (MINERVA TEXT LIBRARY)
ミネルヴァ書房
大谷 信介

amazon.co.jpで買う
Amazonアソシエイト by 社会調査へのアプローチ―論理と方法 (MINERVA TEXT LIBRARY) の詳しい情報を見る / ウェブリブログ商品ポータル


"サンプリング2(その他のサンプリング)──国際社会学I2012年6月19日" へのコメントを書く

お名前
メールアドレス
ホームページアドレス
コメント