ある39の質問項目を6つの質問群に分けしました(「積極性-消極性(第1因子)」「情緒安定-不安定性(第2因子r)」「几帳面-飽きっぽさ(第3因子)」「共感性-非協調性(第4因子)」「進取性-保守性(第5因子)」「非虚構性(第6因子r)」:「因子分析」の項参照.ただしここでは「情緒不安定-安定」および「虚構性」の各因子得点について,正負を逆転させて「情緒安定性-不安定性」「非虚構性」としています).
まず,どの質問群に対してより反応を示したか,その程度で回答者をグループ分けしてみます.データは以下の通り.画像では下が切れてますが,589ssのデータがあります.
ここで,階層的な手法でグループ分けをしてみます.6つの次元(変数)において回答者ひとりひとりの間の距離を計算し,互いに近くにいる人を順に結び付けていきます.こうして,859人が最終的に1つの集団になるまで計算し続けていく様を樹状図で示すと以下の通り.図の左側には859の枝がありましたが,これが順次右に進むにつれ,最終的にひとつになるまで結びついて行っています.
図に引いた赤い線の距離で全体を5つのグループに切断してみます.上から順にグループ1(n=248),グループ2(n=116),グループ3(n=231),グループ4(n=167),グループ5(n=97)とします.この5つのグループごとに,さきの6つの質問群に対する回答を平均値で見てみると以下の通り(平均値表およびレーダーチャート.便宜的に平均値表のセルに色を付けています(0.3以上は赤,-0.3以下は緑)).
おおむねグループ1は「積極的だが,協調性がなく飽きっぽい」,グループ2は「進取的だが,情緒が不安定」,グループ3は「几帳面で共感性があるが,うそをつく」,グループ4は「消極的で情緒不安定」,グループ5は「情緒が安定していてうそをつかない」,といった人たちが含まれるようです.
なお,ここからクラスターごとに属性などを集計していけば,たとえばグループ1には具体的にどんな人が多いか,といったことが見えてきます.
納品物サンプル(excel2010ファイル) / (excel2003ファイル)
(C)2001-2012 DATAEXPLORING