もとの複数の変数を,より少ない数の変数(合成変数)で効率よくあらわします.測定されている複数の変数から,より少ない数の合成変数をつくります.→
(複数の)変数の背後にある,抽象的な概念(潜在変数)を探し出します.測定されている変数は,測定されていない潜在変数から影響を受けていると考えます.→
「3」と似ていますが,直交を前提とせずに軸を回転します.回転以外は直交回転と同じです.通常は軸が直交しないので,散布図は書けません.
データ行列の,(基本的には)行要素同士/列要素同士の距離関係を図示します.ポアソン分布する値の行列を標準化して特異値分解します.→
多くの対象を,少ないグループ(クラスター)にまとめます.階層的手法では,「多」(ひとつひとつ/ひとりひとり)から始まって「単」(最終的には1つ,全体で1つ)にまでまとめます.→
全体を,指定した数に分割します.最低限でも,いくつに分割するかは分析者が指定します.
多次元で表されるデータを,見て分かり易く,低次元の図で表現します.→
全体から始まり,順次,(普通は)2分割していきます.幹から葉に木が広がっていくイメージで,全体を細かく分けていきます.→
シンプルには,形態素解析+MDSで行えます.形態素解析で言葉を文節に分けます.MDSで文節間の近さを決めます.→
(C)2016 DATAEXPLORING