本章の構成
本補足チャプターは,神戸大学経営学研究科で2022年度より担当している「統計的方法論特殊研究(多変量解析)」の初回の講義資料です。CC BY-NC 4.0ライセンスの下に提供されています。
本講義では,心理尺度と呼ばれるような人の心の内面を自己申告で回答する形式の質問によって得られたデータを主に分析するための手法について解説していきます。 本編に入る前に,そもそもなぜ心理尺度で集めたデータの分析が厄介なのかをお話しておきましょう。 ここでは,ワークエンゲージメントの測定を例に見てみます1。
A.1 ワークエンゲージメント測定の(簡単な)歴史
ワークエンゲージメントは,もともとバーンアウトの対極にあるものとして考えられていたようです。 そのバーンアウトを測定する尺度としては,Maslach-Burnout Inventory (MBI: Maslach & Jackson, 1981)というものがあります。 この尺度は情緒的消耗(emotional exhaustion),脱人格化(depersonalization),個人的達成感の低下(lack of personal accomplishment)の3つの構成概念を測定しようとしたものです。 この3つの構成概念からもなんとなく分かるように,MBIは人と関わるタイプの職業におけるバーンアウトを測定するために開発された尺度でした(尺度が開発された1980年ごろには,バーンアウトは対人関係が重要な職業で起こりやすいと考えられていたらしい?)。 MBIには日本語に翻訳されたバージョン(増田,1997)が作成されており,具体的な項目は 表 A.1 の17項目で構成されています。 回答者は,この各項目に示された感情をどの程度の頻度で感じているかを,「全くない」から「月に1回程度」「週に1回程度」「毎日」など,何段階かで用意された選択肢の中から一つ一つ選択していくわけです。 このように,複数個並べられた質問文に対して程度や頻度を数段階の中から選択させることで,回答者の態度や性格などを評価する測定法は,考案者の名前を取ってリッカート尺度 (Likert scale: Likert, 1932) と呼ばれています。
項目 | |
---|---|
1 | 「こんな仕事,もうやめたい」と思うことがある |
2 | 我を忘れるほど仕事に熱中することがある* |
3 | 細々と気配りすることが面倒に感じることがある |
4 | この仕事は私の性分に合っていると思うことがある* |
5 | 同僚や利用者の顔を見るのも嫌になることがある |
6 | 自分の仕事がつまらなく思えて仕方のないことがある |
7 | 1日の仕事が終わると「やっと終わった」と感じることがある |
8 | 出勤前,仕事に出るのが嫌になって,家にいたいと思うことがある |
9 | 仕事を終えて,今日は気持ちのよい日だったと思うことがある* |
10 | 同僚や利用者と,何も話したくなくなることがある |
11 | 仕事の結果はどうでもよいと思うことがある |
12 | 仕事のために心にゆとりがなくなったと感じることがある |
13 | 今の仕事に,心から喜びを感じることがある* |
14 | 今の仕事は,私にとってあまり意味がないと思うことがある |
15 | 仕事が楽しくて,知らないうちに時間がすぎることがある* |
16 | 体も気持ちも疲れ果てたと思うことがある |
17 | 我ながら,仕事をうまくやり終えたと思うことがある* |
その後,バーンアウトは対人関係の有無に関わらずあらゆる職業で起こるものだとみなされるようになった (北岡 他,2011) ことを受けて,1996年にMBI-General Survey (MBI-GS: Maslach et al., 1996)が開発されました。 この尺度は,オリジナルのMBIの3つの要因を非対人場面にも適用できるように拡張したようなものになっていて,その3つの構成概念は消耗(exhaustion),シニシズム(cynicism,仕事から距離を置こうとする態度),職務効力感(professional efficacy)です。 この3つの尺度得点をもとに,消耗・シニシズムが高く職務効力感が低い人はバーンアウト状態だとみなすことができます。
ワークエンゲージメントがバーンアウトの対極にあると考えるならば,消耗・シニシズムが低く職務効力感が高い人はワークエンゲージメントが強いと考えることができそうです。 しかし,そもそもこの仮定は正しいのでしょうか?つまり,本当にワークエンゲージメントとバーンアウトは対極にあるものなのか,という点について,この時点ではまだ仮説の段階でしかなかったようです。 そして厄介なことに,MBI-GSの得点によってバーンアウトとワークエンゲージメントを定義している以上は,この2つの関係性(e.g., ワークエンゲージメントが強い人はバーンアウトが低いのか?)の検証は不可能です。
そこでSchaufeliらは別の視点から考え,理論的な分析を行った結果,働くことに関するwell-beingが2つの次元(activationとidentification)で構成されていると指摘しました。これをもとに,バーンアウトは「activationとidentificationが低く,かつ職務効力感が低い状態」,エンゲージメントは「activationとidentificationが高く,かつ没頭度が高い状態」と考えました。ポイントは職務効力感と没頭度が対極に位置づけられるものではないという点です。したがって,一つの尺度でバーンアウトとエンゲージメントを同時に測定することは不可能であると考え,エンゲージメントを測定するための尺度が開発されました。こうして誕生したのがユトレヒトーワークエンゲージメント尺度 (UWES: Schaufeli et al., 2002)です。この尺度は活力(vigor),熱意(dedication),没頭(absorption)という3つの構成概念からなります。また,一つ一つの項目を見ても,MBI-GSでは「自分は職場で役に立っていると思うことがある」というように特定のイベントや行動に関するものが並ぶ一方で,UWESでは「仕事をしていると,活力がみなぎるように感じる」などのように特定のイベントの発生の有無ではなく持続的な感情を訪ねている項目が多いという特徴があります。
A.2 心理尺度・構成概念の曖昧さ
…という感じで,ワークエンゲージメントの測定では,最初はMBI-GSが用いられていましたが,現在ではUWESが最も一般的なようです。といっても今でもMBI-GSが全く用いられていないというわけでもなさそうだったりします。 このように,心理学では似たような構成概念を測定するための心理尺度が結構たくさんあり,場合によっては同じような尺度が乱立しているという現状があります。ちなみにバーンアウトの測定尺度にもOldenburg Burnout Inventory (Demerouti et al., 2003) という別のものがあったりするようです。 こんなことになってしまう大きな理由は,人の心は誰にも見えないという一点に尽きると思います。
身長や体重であれば,誰が見ても納得できる客観的な基準(e.g., 1m, 1kg)があり,それを目に見える形で測定可能です。なので測定された体重の値に対して「この体重計が本当にものの重さを測っているとは言い切れないじゃないか!」などと文句を付ける人はいないでしょう。 それに対して心理尺度は非常に曖昧です。ワークエンゲージメントの例でも,SchaufeliらはMBI-GSの(低)得点をそのままエンゲージメントの指標として用いることに対して「MBI-GSの得点が低いことが本当にワークエンゲージメントの低さを示しているとは言い切れないじゃないか!」と疑問を抱いて新しい尺度を開発しました。 現在ではUWESがデファクトスタンダードになっていますが,将来的にはこれに対してもまた別の視点から捉え直す動きが出てきてもおかしくないのです。
A.3 尺度項目の構成
UWESはもともと17項目で構成されている尺度です。が,場合によっては17項目というのは多いかもしれません。特に他の質問と合わせて実施するような場合は,一つ一つの尺度の項目数は少ないほうが色々な内容について聞くことができます。 そういったモチベーションから,数多くの心理尺度には短縮版が作成されてきました。UWESに対しても同様に短縮版が作られ,最も短いものは Schaufeli et al. (2019) の3項目版(もともと3つの構成概念からなる尺度なので,1つの構成概念を1項目で尋ねている)です。
- 仕事をしていると,活力がみなぎるように感じる(活力)
- 仕事に熱心である(熱意)
- 私は仕事にのめり込んでいる(没頭)
当然ですが,基本的に心理尺度の項目数は多ければ多いほど目的の構成概念についてより詳細に評価できるようになります。 これは健康診断とよく似ていると思っています。ある人の健康状態を知るためには,身長・体重・視力・心電図・レントゲン・血液検査…といろいろな項目をチェックして,総合的な判断を下します。もし健康診断が血液検査だけになったとしたら,検査時間は短縮されて受診者の負担は減る一方で,不整脈などを検出することはできなくなってしまいます。 心理尺度も同じように,本来のフルバージョン尺度ではカバーできていた構成概念の内容が短縮版で失われてしまっている可能性があります。例えばUWESのフルバージョンには「活力」の項目として「職場では,元気が出て精力的になるように感じる」や「朝に目がさめると,さあ仕事へ行こう,という気持ちになる」といった項目があります。短縮版の「仕事をしていると,活力がみなぎるように感じる」という1項目は,こうした他の項目の情報を十分にカバーできているでしょうか2。 同様のことは,短縮版ではない尺度でも起こりえます。UWESは,本当にその17項目でエンゲージメントのすべてを内包できているのでしょうか。そしてそのことを,我々はどうやって証明したら良いのでしょうか。これは非常に難しい問いなのです。
A.4 尺度の利用の難しさ
UWSCはその名が示す通りオランダで開発された尺度ですが,現在では日本語版 (Shimazu et al., 2008) が用意されています。海外で開発された尺度を日本で使用するのは,実は結構たいへんです。 その理由としては大きく分けて二つあると私は考えています。
- 通常異なる言語間で全く同じ内容を指し示す項目を作成するのが本質的に不可能なケースすらある,という点です。例えば日本語の「仕事」と英語の「work」は全く同じ概念でしょうか?(私も英語に強いわけではないので調べてみたところ)この二つの単語は対価の有無や専門性の有無などによって微妙に異なるニュアンスになっているようです。心理尺度の目的は特定の構成概念を測定することにあるため,こうした繊細な言語の違いが回答内容に影響しないように翻訳を行う必要があったりします。
- そもそも日本と海外では「働く」ということの意味や社会的な位置づけが異なる可能性があります。例えば「お金のために働く」ことを美徳としない国があったとしたら,その国の人が感じるワークエンゲージメントは全然違うものになるでしょう。つまり完璧に翻訳できたとしても,オリジナルの尺度と全く同じ構成概念を測定できるとは限らないのです。
この2点目に関しては,文化の違いに関する難しさです。同じようなことは,日本国内だけを見ても起こり得る話です。つまり,もともと日本語で作成された尺度であっても様々な要因によって使えない尺度になる可能性が出てきます。 その最たる要因は時代でしょうか。同じ日本国内であっても,仕事に対する価値観は時代とともに変化します。ここ数年だけを見ても,新型コロナウィルスの流行によりリモートワークが普及したことは,職場の選び方やワークライフバランスに対する考えを大きく変えました。あるいは世代による違いも大きいかもしれません。終身雇用が当たり前だった団塊の世代では転職はあまり良いものと捉えられていなかったかもしれませんが,現代では職場を転々とすることへの抵抗感はほぼないでしょう。 このように時代の流れなどに対して,心理尺度は普遍的ではない可能性があるのです。
A.5 まとめ
ワークエンゲージメントの尺度を例にとり,心理測定の難しさをいくつか挙げました。いずれの問題も一言で言えば人の心は誰にも見えないというのが原因と言えるでしょう。 つまり究極的には「その質問で本当に測定したい構成概念を測定できているのか」は誰にも分かりません。 だからこそ分析者には「本当に測定したい構成概念を測定できている」ことをきちんと説明する義務があります。海外で開発された「ナントカ」という構成概念を測定する尺度があったというときに,それを自分でそれっぽく訳して日本人に尋ねたとしても,それだけではオリジナルの構成概念を再現できているとは言えないのです。 ただし「本当に測定したい構成概念を測定できている」ことは,どこまで行っても証明しきれないものです。
この講義で扱う因子分析 ( Chapter 6 ) やSEM ( Chapter 7 ) などの分析方法は,「数値として得られたデータ」に対して何らかの解を出してくれる手法です。 その分析の最中においては,データが表す数字が何を表しているかは全く関係ありません。 どういう内容の概念を,どういう言葉遣いで尋ねて,どういう方法で回答してもらったかに関わらず,出力された(例えば)1から5の数字の集まりに対して何か複雑な計算をしているだけなのです。 したがって,もし「数値として得られたデータ」が意味不明なものだったとしたら,分析の結果として「何かしらの数字」は出力されても,その結果には何の意味もないのです。 ということで,分析に入る事前準備として,講義の前半では「数値として得られたデータ」が本当に使い物になるデータなのかを考えるための概念的なお話もしていく予定です。
といっても,この尺度の背景に詳しいわけではないので,もし気になる方は元論文を辿ってみてください。あるいは詳しい方がいればこっそり補足・訂正をしてもらえると助かります。↩︎
オリジナルバージョンによっぽどのムダが無い限り,短縮版では基本的にオリジナルバージョンと全く同じレベルで測定するのは不可能です。なので一般的には「たったこれだけの項目数でもこれくらいの精度で測定できているなら良いんじゃないですか」という感じで短縮版尺度が提案されます。短縮版はあくまでも一つの選択肢であり,短縮版を使うかフルバージョンを使うかは調査者に委ねられる,ということです。その他短縮版に関する議論については Sitarenios (2022) などを参照してください。↩︎