資料

Resource
最終更新日:

※講義資料をDocswell(ドクセル) に移行しています。
各リンクをクリックすると,ファイルの置いてあるページへと移動します。

本ページからダウンロード可能な資料は全てCC BY-NC 4.0ライセンスの下に提供されています。 CC BY-NC 4.0

講義資料

これまでに担当した講義のために作成した資料

講義全体の説明
社会科学のいたるところで利用されているベイズ統計について,基本的なところから多少の数理的な説明,そしてstanでの実践までをカバーすることを目指す講義。
  • 講義中で使用したcsvファイルは,スライド中の download をクリックするとダウンロード可能です。
  • 正規分布の表記は,N(平均, 標準偏差)で統一しています。一般的にはN(平均, 分散)であることが多いのでご注意ください。(そのうち表記を修正します)

まとめてダウンロード
  1. イントロダクションDocswellダウンロード

    ベイズ統計とは何かを簡潔に紹介し,なぜベイズ統計が利用されているのか,その理由をいくつか紹介する。 また,cmdstanrのインストールも簡単に解説する。

  2. 確率の基本とベイズの定理Docswellダウンロード

    確率に関するいくつかの基本的なことを復習したあとで,ベイズの定理をきちんと理解するための練習と,ベイズ統計学におけるベイズの定理の位置づけを説明する。

  3. 尤度Docswellダウンロード

    尤度および尤度関数についておさらいした後で,ベイズ統計学における尤度関数の位置づけを説明する。 また,stanで尤度関数がうまく復元できることを確認しつつstanの基本中の基本的なことを説明する。

  4. 事前分布・基本的なベイズ推論(1)Docswellダウンロード

    ベイズ統計における事前分布の設定および共役事前分布について説明する。 また,最も基本的な問題として二項分布のパラメータ推定問題について,最尤法・共役事前分布を用いた解析的な導出・stanでの推定を試し,結果の比較や点推定・区間推定を行う。

  5. 基本的なベイズ推論(2)Docswellダウンロード

    前の資料に引き続き,基本的な問題としてポアソン分布・正規分布のパラメータ推定問題について,最尤法・共役事前分布を用いた解析的な導出・stanでの推定を行う。

  6. マルコフ連鎖モンテカルロ法(1)Docswellダウンロード

    ベイズ統計で頻繁に用いられるMCMC法を理解するための準備段階として,「モンテカルロ法」と「マルコフ連鎖」についてそれぞれ解説する。

  7. マルコフ連鎖モンテカルロ法(2)Docswellダウンロード

    代表的なMCMC法のアルゴリズムである「メトロポリス・ヘイスティングス法」「ギブスサンプリング」,stanで採用されている「ハミルトニアンモンテカルロ法」をそれぞれ解説する。

  8. マルコフ連鎖モンテカルロ法(3)Docswellダウンロード

    MCMCによって得られたサンプルの適切さを評価する方法として,Rhatや有効サンプルサイズを解説する。 また,cmdstanrを使用する際の様々な設定や,得られた結果を可視化する様々な方法を紹介する。

  9. モデル評価・仮説検証Docswellダウンロード

    作成した統計モデルがデータにフィットしているかを評価する方法として事後予測チェックを紹介する。 また推定されたパラメータの事後分布に基づいて仮説を検証する方法として,pd (probability of direction),ROPE (region of practically equivalent),MAP-based p-valueについて解説する。

  10. モデル比較・周辺尤度Docswellダウンロード

    ベイズ統計の枠組みで複数の統計モデル(仮説)を比較するためのツールとして,ベイズファクターおよび周辺尤度について解説する。 また,周辺尤度を数値計算する方法であるブリッジサンプリング法の実装および情報量規準についても簡単に紹介する。

  11. ベイズ階層モデリング(1)Docswellダウンロード

    線形回帰分析のマルチレベルモデルをベイズ統計モデリングの枠組みで実装し,階層的に事前分布を設定するベイズ階層モデリングの基本を解説する。

  12. ベイズ階層モデリング(2)Docswellダウンロード

    マルチレベル線形回帰分析について,階層事前分布を使うことのメリットについて少し解説した後で, モデルを拡張する方向性の1つとして「レベル2の説明変数」「回帰係数間の相関構造」をstanで扱うためのモデルの書き方を解説する。

  13. 混合分布モデルDocswellダウンロード

    より複雑な確率分布を表現するために,複数の確率分布を混ぜる混合分布の考え方を紹介する。 また,stanで混合分布を実装する際に重要な離散パラメータの取り扱いについて説明する。

講義全体の説明
記述統計量から統計的仮説検定(t検定くらい)までを解説する。
統計学の講義の一歩目なので「経営」に特化した内容は特になく,「基礎統計1」「心理統計学」みたいな名前の講義だとしてもそのまま通用しそうな内容。

公開後の更新履歴

※部分的な更新に伴い,スライド間での参照の番号が一致していない箇所があるかもしれません。いつかまとめて修正します。
  • 2025/05/12:(資料10)帰無仮説との整合性に関する考え方の説明を追加(p. 9)
  • 2025/05/03:(資料2-4,8,9)分散と標準偏差の表記が資料ごとに異なっていたのを統一
  • 2025/04/28:(資料9)説明をすこし修正 (p. 9),標準誤差の説明を追加 (p. 11)
  • 2025/04/28:(資料8)標準誤差の説明を資料9に移動,標本分散の標本分布の説明に補足を追加 (pp. 23, 26)
  • 2025/04/28:(資料6)用語を正しい使い方に変更 (pp. 5-6)
  • 2025/04/05:(資料2)記法について補足 (p. 5),標準化に関する説明の順序を入れ替え (pp. 32-36)
  • 2025/04/05:(資料1)表中の表現をすこし変更 (pp. 33, 43)
  • 2025/04/03:(資料1)間隔尺度の紹介を変更(p. 41)
  • 2025/04/01:(資料7)幾何分布の定義とプロットが一貫していなかったので修正 (p. 17),ポアソン分布が近似する正規分布の表記を修正 (p. 42)
  • 2025/02/06:(資料2)変数変換と代表値・散布度の説明の表記を修正 (pp. 14-16)
  • 2024/12/10:(資料10)p値関数の話を追加 (pp. 18-21)
  • 2024/11/29:(資料8)自由度1のカイ二乗分布の図の誤りを修正,中心極限定理の証明をこちらに移動
  • 2024/11/29:(資料6)離散変数の期待値・分散の計算式のミスを修正 (pp. 15-16)
  • 2024/11/22:(資料7)幾何分布の期待値のミスを修正
  • 2024/11/22:(資料4)回帰分析の考え方の導入を追加 (pp. 3-6)
  • 2024/01/19: 講義資料の公開を完了

まとめてダウンロード
  1. データの性質Docswellダウンロード

    ウォーミングアップとして,統計学の視点からみた「データ」について考える。
    同じ数字であってもできる処理が異なることから尺度水準の考え方を導入。

  2. 1変数の記述統計量Docswellダウンロード

    平均値・中央値・最頻値などの代表値と,偏差や分散・標準偏差といった散布度の指標を紹介。

  3. 2変数の記述統計量Docswellダウンロード

    量的な2変数の関係を表す指標として,共分散および相関係数を紹介。
    相関係数の利用に関する注意点(疑似相関や因果関係との違いなど)の説明。
    質的な2変数の関係を表す指標として,連関係数を紹介。

  4. 回帰分析Docswellダウンロード

    量的な2変数の関係を表す方法として回帰分析を紹介。
    回帰直線の意味,最小二乗法の考え方,決定係数などの説明。
    複数の説明変数を用いる重回帰分析についても軽く解説。

  5. 母集団と標本Docswellダウンロード

    統計的推測の話に入るための第一歩として,統計的推測の目的から「母集団」と「標本」という2つのグループの関係性について説明。

  6. 確率変数と確率分布Docswellダウンロード

    統計的推測では確率的な推論を行うため「そもそも確率変数とは何か」という話から,データを確率変数として考えるということ, そして確率分布とは何かを説明。

  7. 代表的な確率分布Docswellダウンロード

    ベーシックな統計学で頻繁に登場する代表的な離散確率分布(二項分布・ベルヌーイ分布・ポアソン分布・幾何分布)および連続確率分布(正規分布・指数分布)を紹介。 また,標準正規分布表を用いた確率の計算方法および確率分布間の関係性についても解説。

  8. 標本分布Docswellダウンロード

    推測統計の目的である母数に関する推測のために必要となる,標本統計量の分布(標本分布)の考え方を導入。

  9. 推定Docswellダウンロード

    データをもとに,母数を推定(点推定・区間推定)する方法およびその理論的基盤を解説。

  10. 統計的仮説検定の考え方Docswellダウンロード

    あらゆる統計的仮説検定の背景にある「帰無仮説・対立仮説」「有意水準」「検定統計量」「検定力」などの概念を導入。

  11. 統計的仮説検定の例Docswellダウンロード

    仮説検定の割とベーシックなもの(正規母集団の母平均:分散既知・未知の場合など)をもとに,実際の仮説検定の流れを紹介。 また,仮説検定と区間推定の関係性についても解説。

  12. 回帰分析の統計的推測Docswellダウンロード

    回帰分析モデルにおける統計的推定および統計的仮説検定の解説。 また,回帰分析モデルをもとに「統計モデリング」の考え方を紹介。

  13. 社会における統計学の利用Docswellダウンロード

    これまでの講義内容を元に,実際に社会科学ではどのように統計学が用いられているかの一例として,一般化線形モデル・統計的学習・統計的因果推論・多変量解析・ベイズ統計を簡単に紹介。

講義全体の説明
経営学でもよく使われている(らしい)心理尺度を用いたアンケート調査データを分析するための方法論の講義。
本当は尺度構成・調査票設計からデータ分析までをすべてカバーしようと考えていたが,半期では不可能と悟ったため,現在は「収集したデータの前処理」から分析までを扱っている。
講義内容を一冊ですべてカバーする本が現状ないと思われるため,すべてRmarkdownで資料を作成した。
(一応因子分析もSEMもIRTも「応用」回帰分析,ということで以前は別の名前で開講していました。)

(公開後の更新履歴はHTML版の表紙に載せています。)

PDF版(全体) HTML版
  1. イントロダクションDocswellダウンロード

    講義準備としてRのインストールから基本操作を念のため説明。

  2. データの読み込み・基本操作Docswellダウンロード

    Rによるデータの読み込みと,この後の講義で必要になるデータフレームの基本操作を一通り説明。

  3. データの前処理Docswellダウンロード

    データを分析できる状態にするための前処理(欠測値の削除・適当な回答の検出・逆転項目の処理)の考え方およびRでの実行方法を紹介。

  4. 予備的な分析と信頼性・妥当性Docswellダウンロード

    収集したデータを問題なく分析にかけられるかを評価するための方法として,項目分析(I-T相関・トレースライン)を紹介。
    また,使用した尺度(項目)に問題がなかったかを判断するために,信頼性や妥当性の考え方について説明。

  5. 回帰分析のおさらいDocswellダウンロード

    各種分析手法の紹介に向けた準備として,各手法のベースにある回帰分析の理論的な部分をおさらいしつつ,いくつかの重要な概念を説明。

  6. 因子分析Docswell ダウンロード

    複数の項目への回答に影響する共通の要因を抽出する分析法である(探索的)因子分析について, 前半では理論的な考え方とRでのやり方を説明し,後半では実践上のいくつかのトピック(事前分析・回転・因子数の決定など)を解説。

  7. 構造方程式モデリングDocswellダウンロード

    複数の観測変数間の関係性について柔軟なモデルをあてはめて分析を行う構造方程式モデリングについて, 前半では理論的な考え方とlavaanでのやり方を説明し,後半では実践上のいくつかのトピック(モデル適合度・モデル修正・多母集団同時分析・PLS-SEMなど)を解説。

  8. 項目反応理論Docswellダウンロード

    データから「回答者の特性値」と「項目の特性値」を同時に推定する分析法である項目反応理論について, 前半では理論的な考え方とmirtでのやり方を説明し,後半では実践上のいくつかのトピック(多値,多次元モデル・テスト情報量・様々な拡張など)を解説。


  1. 心理尺度の難しさダウンロード

    導入として,心理尺度データを分析することの難しさについて説明。

講義全体の説明
公認心理師科目の一つである「心理学統計法」を担当。
計6回開講した中で紆余曲折はあったものの,最終的には半期で記述統計から統計的仮説検定の枠組みまでを紹介できるように構成。
講義資料では,文系学生向けにできるだけ数理的な説明を抑えた。 また理解を定着させるために各回につき10問ずつ演習問題を作成し,授業時間の半分程度を解説(=前回の復習)にあてた。
※演習問題は書籍などからの借用もあるため公開していません。気になる方はご連絡ください。
本講義の資料は公開していません。
代わりに本資料をもとに作成した「経営統計」の講義資料をご覧ください。

講義全体の説明
ベイズ統計学について,「理論的な側面」と,Rおよびstanによる「実践的な側面」を両方ともカバーすることを目指した講義。
本講義の資料は公開を停止しました。
代わりに本資料をもとに作成した「統計的方法論特殊研究(ベイズ統計)」の講義資料をご覧ください。

プログラム・コード

研究の過程で作成したRやstanのコード

内容説明
英文校正にtexファイルを提出した際に,コメントアウトした部分も含めてめちゃくちゃな校正をされてしまった経験から作成したRコード。
  • すべてのコメント(各行の%以後)を削除
  • 文中で改行されている箇所(ピリオドで終わらない行)を修正

ダウンロード

内容説明
rstanでは,引数parsを使えば不要なパラメータ(相関行列の元になるcholesky_factor_corr型など)を保存せずに済んだのですが, 一方でcmdstanrsampling()にはそのような設定が無さそう(ある?)なので,全て保存されてしまい出力のサイズが莫大になってしまうことがありました。 そこで,事後的にcsvファイルを直接書き換えて不要なパラメータに関する部分を削除するRコードを作成しました。
これに加えて,sampling()時に引数sig_figs(各サンプリングを何桁保存するか)を3くらいまで小さくすると更にサイズを小さくできます。
  • sampling()時に引数output_dirおよびoutput_basenameを指定しておいてファイルの保存先を明示する
  • cmdstanr_extract_variables()の第1引数にpaste0(output_dir, output_basename)を指定する
  • 引数remove_zerovar = TRUEにすると,分散がゼロのパラメータ(相関行列の対角成分など)も削除する

ダウンロード

内容説明
cmdstanrsampling()結果をsummary()したものから,特定の列だけを抜き出してlist型に変換します。
この際,例えばvector型やmatrix型のパラメータなどはそのままのサイズで抜き出すことができます。
  • CmdStanFit型オブジェクト(sampling()後のもの)を与えた場合は$summary()を行い,パラメータをlist型に変換します。
  • draws_summary型オブジェクト($summary()の出力)を与えた場合は,そのままパラメータをlist型に変換します。

ダウンロード

その他の資料

研究会やセミナーのために作成した資料など

内容説明
学部科目「経営統計」の内容について,具体的な数値を用いてひたすら手を動かしたほうが概念や公式の意味を理解できる学生がいるかもしれないと思い作成。 ページをリロードするたびに新しい問題が出題されるので,何度も繰り返し練習ができる。
※ページの作成には生成AI(GitHub Copilot, Cline)を利用しているため,細かい表記に統一性が無いところがあるかもしれません。とりあえず動くのでヨシとしています。
アクセス

内容説明
ベイズ統計学の超基本的な考え方から,事後分布を用いた仮説検証のフレームワークまでを90分程度で紹介するために作成した資料。 ほとんどの内容はベイズ統計の講義資料からの抜粋。
ダウンロード

内容説明
セキュリティ教育に限らず,効果を測定するために用いられるテスト(サーベイ調査/ペーパーテストなど)の設計および性能評価の方法(信頼性・妥当性の考え方)について紹介。
セミナーの詳細はこちら
ダウンロード

実験・調査モジュール

オンラインで特殊な形式のデータを収集するために作成したモジュールのサンプル

内容説明
左右に項目を並べて表示し,対応する選択肢をクリックで回答してもらう形式。
html-button-responseモジュールをもとに,ボタンを大きくしたり矢印を付けたりとcssで見た目を調整した。

ためす