Χ2乗検定のP値

私も、お手伝いしましたが、アメリカ在住でNOAAの研究員である今木さんが、昨年の12月に渋谷の環境の専門学校の環境工科学園で12月3日、12月4日の2日間にわたりオープンソースGISの講習会を開かれました。主催は、環境NPOのGCNです。このときに、使用されたのが日光の猿の出現位置のデータです。今木さんが学生のときに集められたもので、今から、20年近く前データです。私も使用と公開許可をいただきましたので、環境素人ながら自分の頭で考えた解析をしてみたいと思っています。
下の図は今木さんが、URL
http://www.geopacific.org/opensourcegis/gcngisbook/GCN_book/7b2c57ae0/8oo25e
で公開している図と同様の図です。植生図(第5回調査環境省自然環境局生物多様センタから引用)に猿の出現位置とHomeRangeで95%行動圏を求めた図を重ね合わせた図です。
 
 猿は6群(A,B,C,OG,GO,KI)に分かれています。今木さんはそのうちの1つの群のGO群の植生利用度を調べておられます。これにヒントを得て、各群れの植生利用度調べることにより、各群れが受けている人間活動の影響の大きさが分かるのではないかと思い、解析してみました。勿論、単純に出現位置の植生自然度を使用すれば同様のことが出来ますが、植生自然度の与え方が、植物の知識があまり無い私にはよく分からないことと、このようなスカラー化は、人によって様々でしょうから、スカラー化するのは先に延ばしたほうが良いだろうと考えたからです。使用したのは統計的検定(χ2乗検定)で出てきますP値です。皆さんは、P値をこのような問題に適応されたことはないでしょうが、私は、経験的に、P値は、単に差がある(無し)の結論を出す尺度ではなく、2つの量の類似度の尺度として使えると思っています。次に、

  • 猿のA群の95%行動圏出現位置と植生
  • 出現位置属性と面積比

を示します。

面積比が%でなく、%を100で割った値となっているのは、χ2乗検定をするためです。猿が、もし、95%行動圏内で植生の何らの選好度(好き嫌い度)を持っていないとすると、面積比で出現することになります。選好度が強いと出現は、面積比とかけ離れたものになります。このかけ離れ具合(あるいは、類似度)を測定するのに、R言語のRコマンダのχ2乗検定を使用しました。
Rコマンダでは日本語が使えないので、表1の「95%行動圏内個体数」と「面積比」を「monkey」と「area_rate」に変更し、テーブルのあるファイルをクリップボード(コピーできる状態にする)にし、R言語のGUIであるRコマンダを立ち上げデフォルトの「Dataset」に読み込ませます。そして、次のようにして、面積比を与えられた確率Pとしてχ2乗検定をします。
x<-Dataset$monkey
y<-Dataset$area_rate
chisq.test(x,p=y)
A群のχ2乗検定の結果はつぎの通りです。
Chi-squared test for given probabilities
data: x
X-squared = 33.4672, df = 7, p-value = 2.166e-05
次の表2から表6は、残りの群れの個体数と面積比を示したものです。


全ての群に上の検定を実施し、P値を取り出すと次表と次図を得ました。

 いずれも、5%よりも小さいので、「差あり」となりますが、その中でも、比較的差が無いのがC群で、差があるのが、OG群、GO群、KI群となります。差がある群は、自然度が低く、人の生活圏近くで行動しているので、行動が限定されるのだと想像します。