4 多変量なデータの解析
観察のために多くの変数があると手のつけようがなく、どこから始めればよいのか思いつかない。ここでは、似た者同士を集めたクラスタと主成分が有効な分析になる多変量解析を試みる。これらの分析がデータベースの統計処理になり、客観性をもたらしてくれるからである。
多変量のデータでも、最初は1変数ごとの観察から始まる。似た者同士を集めたクラスタを樹形図からイメージする。それぞれのクラスタの特徴を掴み、それを手掛かりに多変量データの全体像を考えていく。樹形図については、単純な二個二個のクラスタリングの方法を想定し、変数の数や組み合わせを考える。
作成したデータベースから特性が2つあるカラムを抽出し、グループ分けをする。例えば、A五感(1視覚と2それ以外)、Bジェスチャー(1直示と2比喩)、C情報の認知プロセス(1旧情報と2新情報)、D情報の認知プロセス(1問題解決と2未解決)というように文系と理系のカラムをそれぞれ2つずつ抽出する。
まず、ABCDそれぞれの変数の特徴について考える。次に、似た者同士のデータをひとかたまりにし、ここでは言語の認知ABと情報の認知CDにグループ分けをする。得られた変数の特徴からグループそれぞれの特徴を見つける。
最後に、各場面のラインの合計を考える。それぞれの要素からどのようなことがいえるであろうか。「千曲川のスケッチ」のバラツキが縦のカラムの特徴を表しているのに対し、ここでのクラスタは、一場面のカラムとライン双方の特徴を表している。
なお、外界情報の獲得に関する五感の割合は、視覚82%、聴覚11%、嗅覚4%、触覚2%、味覚1%とする。(片野2018)
花村嘉英(20202)「社会学の観点からマクロの文学を考察するー自然や文化の観察者としての作家について」より