『行動科学の統計学』(永吉2016)

更新2021年5月12日

 「Rjpwiki」の「R本リスト」にあった書籍。「はじめに」によれば、本書では様々な大学学部から大学院までのレベルの計量分析の方法とその解釈方法を、Rを使いながら体得できる。自学自習にも対応しており、計量分析に馴染みのないディシプリンの人々が計量分析を学べるという(p.v)。副題の「社会調査のデータ」とは調査票に基づく大規模なサンプリング調査データである。国や地域別の経済統計ではなく、個々の人々の社会的状況や家族構成、価値観や心理のデータである。
 伊達は、本書を「社会学の統計について独学が十分に可能である」(伊達2017:160)、「大学生に戻った気分で楽しく本書を読み進めることができた」(伊達2017:162)と評する。計量分析のテキストには「実用向け」と「理論向け」がある。前者では操作法はわかっても考え方が十分の見込めず、後者では操作法や結果の読み方がわかりにくい。本書は「実用書」として読んでも考え方の理解にもつながり、逆に計量分析の考え方を知りたくて読んでも、同時に実践的スキルの体得につながる。両方を備えたテキストである。自学自習に最適なテキストの一つに挙げることができる。まさに、自学自習に最適なテキストの一つに挙げることができる。
 本書の目次は下記のとおりである。この他に「本シリーズの刊行にあたって」「はじめに」「解答」「付表」「索引」がついている。
  • 第1章 行動科学における社会調査データ分析
  • 第2章 記述統計量
  • 第3章 母集団と標本
  • 第4章 仮説と統計的検定
  • 第5章 クロス集計表
  • 第6章 平均の差の検定
  • 第7章 分散分析
  • 第8章 相関分析
  • 第9章 3変数の関連
  • 第10章 単回帰分析
  • 第11章 重回帰分析
  • 第12章 ダミー変数の利用と交互作用効果の検証
  • 第13章 主成分分析
  • 第14章 探索的因子分析
  • 第15章 マルチレベル分析
  • 付録 社会調査データ分析のためのRの使い方の基礎
 まず、第1章の後半はRの使用方法の基礎が述べられるが、その前の部分で社会調査の特徴(調査票やデータセット、変数の種類など)が説明される。第2章は、平均値や中央値などの代表値、標準偏差などのばらつき度、グラフ化などが述べられている。
 第3章と第4章は推測統計学に属し、前者は推定、後者は検定を扱う。第5章以降の布石ともいえる。第5章から第7章は二変数間の関係をみるための分析法である(第7章後半の二元配置の分散分析は多変量解析)。
 第9章は、三つ以上の変数を分析する多変量解析の考え方が解説される。たとえば、多重クロス表分析、偏相関係数の分析などである。第10章以降への布石といえる。
 第10章から第12章は、重回帰分析に係る一続きの解説といえる。まず、第10章で一つの量的変数を一つの独立変数で説明する単回帰分析を解説したのちに、第11章では一つの量的変数を二つ以上の独立変数で説明する重回帰分析、そして、第12章では重回帰分析の精度を向上させるための様々な分析法が解説される。第13章と第14章は、複数の変数をより少数の変数に圧縮する分析法を解説する。
 第15章は、再び回帰分析の解説に戻るが、ここでは個人がグループ(地域、職場、国など)に含まれる形を想定した分析法を述べる。重回帰分析が個人を「平面的」に掴む方法だと表現するならば、マルチレベル分析は「立体的」に掴む方法と表現できよう。
 付録は、Rの使用方法の解説である、社会調査データの分析に必要なより実践的な操作方法(欠損値の扱い方、高齢者のみの分析といった条件付けの方法)を述べる。
 評者は次の読み方がよいと考える。まず、第1章から第9章までを読む。そのうえで、第10章から第12章、そして第15章を読む。これらは一つの従属変数を複数の独立変数で説明するタイプの分析法(回帰分析)として大括りにできるからである。そのうえで、第13章と第14章(複数の変数を少数の変数に圧縮する方法)をまとめて読むと理解が進みやすいだろう。
 本書の特徴として評者は以下の4点を挙げる。第一に、分析結果の表の読み方がわかりやすく解説されている。たとえば、クロス表分析(p.82の表5.1ならびにp.100の表5.7)、相関分析(p.156の表8.4)、重回帰分析(p.214の表11.2)、階層的重回帰分析(p.217の表11.3)、因子分析(p.296の表14.5)である。実際の報告書などで提示される表と同じスタイルで提示され、表のどの箇所をどのように読めばよいかがわかる。
 第2に、各種の仮説や概念が丁寧に解説されている。特に第4章では、理論仮説と作業仮説、操作化などの概念を図式化しながら解説している。ここの説明で例示されるR.Inglehartの理論とその操作化も興味深い。
 第3に、回帰分析を中心とする多変量解析のロジックの説明の秀逸である。たとえば、第9章では疑似相関や媒介効果、因果関係などの考え方が詳解される。また、各章の最初では、その章の分析に関する事例が詳解される。特に、第9章から第12章、第15章の事例では疑似相関を見抜く議論が取り上げられているため、読み進めるうちに第9章で学んだ多変量解析をより身近に感じることができる。階層回帰分析が詳述されているのがよい。
 第4に、Rの使用方法について本書の実習に必要な解説が過不足なく述べられるとともに、Rで表示された分析の読み方がわかりやすく説明されている。また、csv以外の形式のファイルの読み込み方も解説される(pp.16-18、pp.341-342)。データファイルには何らかのパッケージソフト用の形式になっているものもあるため、親切である。
 本書には以上のような様々な魅力がある。ただ、もし敢えて要望を述べるとするならば、次の二つを挙げる。第一に、本書が扱っていない分析法である。伊達(2017)は対数線形モデル・潜在クラスモデル・イベントヒストリー分析を(伊達2017:162)、そして竹ノ下(2018)はロジスティック回帰分析を(竹ノ下 2018:157)を挙げている。評者は歪みの大きい従属変数の分析に向いた分析法(ポアソン回帰分析など)の解説も読みたいところである。たとえば、前者はデモの参加頻度や海外居住年数、転職回数などの分析に、後者は様々なメディア使用の志向性の分析において、より有用だと推察することができる。
 第二に、海外の分析事例や海外のデータ分析を想定した分析のコツなども読んでみたいところである。「はじめに」で指摘されるような海外の社会調査データの蓄積状況を考えれば(p.v)、海外のデータを分析する機会も増えると予想できる。マルチレベル分析を駆使した国際比較分析もより重要な関心事になろう(例えば、Ruiter and Tubergen 2009)。本書では階層研究や教育社会学に含まれる議論が日本の事例を中心に紹介されているが、海外の事例も参照することで日本社会の特徴もより鮮明に見えてくるのではないか。
 本書は400頁近い大著であり、高度な内容も少なくない。だが、学習者の立場に立ったわかりやすくかつ実践的なつくりになっている。計量分析に馴染みがなくとも、本書を気軽に手にすれば、計量分析を体感すること、そして何よりも、計量的研究を読むことの愉しさを感じ取れるだろう。
参考文献
  • 伊達平和(2017)「書評 照井伸彦/小谷元子他編/永吉希久子著『行動科学の統計学―社会調査のデータ分析─』〈共立出版・2016年〉392頁・本体3,900円+税」『フォーラム現代社会学』16:160-162。
  • Ruiter, Stijn and Frank Van Tubergen (2009) "Religious Attendance in Cross-National Perspective: A Multilevel Analysis of 60 Countries," American Journal of Sociology 115 (3): 863-895.
  • 竹ノ下弘久(2018)「書評 『行動科学の統計学:社会調査のデータ分析』永吉希久子著 共立出版 2016年 378ページ」『理論と方法』(33)1:156-157。