主な方法の紹介

主成分分析

 もとの複数の変数を,より少ない数の変数(合成変数)で効率よくあらわします.測定されている複数の変数から,より少ない数の合成変数をつくります.

因子分析(直交回転)

 (複数の)変数の背後にある,抽象的な概念(潜在変数)を探し出します.測定されている変数は,測定されていない潜在変数から影響を受けていると考えます.

因子分析(斜交回転)

 「3」と似ていますが,直交を前提とせずに軸を回転します.回転以外は直交回転と同じです.通常は軸が直交しないので,散布図は書けません.

対応分析(コレスポンデンス・アナリシス)

 データ行列の,(基本的には)行要素同士/列要素同士の距離関係を図示します.ポアソン分布する値の行列を標準化して特異値分解します.

クラスター分析(階層的)

 多くの対象を,少ないグループ(クラスター)にまとめます.階層的手法では,「多」(ひとつひとつ/ひとりひとり)から始まって「単」(最終的には1つ,全体で1つ)にまでまとめます.

クラスター分析(非階層的)

 全体を,指定した数に分割します.最低限でも,いくつに分割するかは分析者が指定します.

MDS(多次元尺度構成法)

 多次元で表されるデータを,見て分かり易く,低次元の図で表現します.

決定木

 全体から始まり,順次,(普通は)2分割していきます.幹から葉に木が広がっていくイメージで,全体を細かく分けていきます.

テキストマイニング

 シンプルには,形態素解析+MDSで行えます.形態素解析で言葉を文節に分けます.MDSで文節間の近さを決めます.

ご注意ください

戻る


(C)2016 DATAEXPLORING