csvtファイル

久しぶりの更新になってしまいました。
今日は、佐々木さんの質問に2月20日、今木さんが回答されている内容の補足です。
QGISプラグインの属性結合でcsvファイルをdbfに結合したとき、何もしないと整数や少数がすべて文字になってしまいます。回避策としては「csvtファイルを作成すればよい。」ですが、その詳細を以下に示します。
以下は開発者のcsvtファイルの説明の英語のサイトです。
http://planet.qgis.org/planet/user/4/tag/ogr/
2011.3.7の記事がそれです。
何もしないで「属性結合」(Join attributes)するとcharacter(文字)になってします。(属性テーブルを開くと数字がCITYNAMEと同じく欄の左よりに配置されているので文字だと分かります。)

以下に回避策を記します。
csvファイルと同じ名称で拡張子のみがcsvtである1行のファイルを作ります。csvtの中身は次のとおりです。
総務省鎌倉市国勢調査のデータで説明します。

左から順に、整数、整数、文字、文字、文字、整数、整数、整数、整数、整数なので、csvtファイルは次のようになります。

(小数点つき数値ががある場合はrealを使用します。)
後は、通常の属性結合の手順で結合するだけです。

すると次の属性ファイルを持つshpファイルが出来ます。

数字が欄の右になっていることが分かります。
もちろん、数が少ない場合は、次のように属性ファイルの編集の整数化機能を使って整数化してもよいです。
属性ファイルを開き
により編集モードにし、フィールド計算機を
によりオープンし、新規フィールドを作り、フィールド計算式にT0000026(65歳以上の女性人数)を整数化する式を入力します。

すると次図を得ます。
新規フィールドabove_65_femail欄のの人数が欄の右側に表示されるので整数化されたことが分かります。

Χ2乗検定のP値

私も、お手伝いしましたが、アメリカ在住でNOAAの研究員である今木さんが、昨年の12月に渋谷の環境の専門学校の環境工科学園で12月3日、12月4日の2日間にわたりオープンソースGISの講習会を開かれました。主催は、環境NPOのGCNです。このときに、使用されたのが日光の猿の出現位置のデータです。今木さんが学生のときに集められたもので、今から、20年近く前データです。私も使用と公開許可をいただきましたので、環境素人ながら自分の頭で考えた解析をしてみたいと思っています。
下の図は今木さんが、URL
http://www.geopacific.org/opensourcegis/gcngisbook/GCN_book/7b2c57ae0/8oo25e
で公開している図と同様の図です。植生図(第5回調査環境省自然環境局生物多様センタから引用)に猿の出現位置とHomeRangeで95%行動圏を求めた図を重ね合わせた図です。
 
 猿は6群(A,B,C,OG,GO,KI)に分かれています。今木さんはそのうちの1つの群のGO群の植生利用度を調べておられます。これにヒントを得て、各群れの植生利用度調べることにより、各群れが受けている人間活動の影響の大きさが分かるのではないかと思い、解析してみました。勿論、単純に出現位置の植生自然度を使用すれば同様のことが出来ますが、植生自然度の与え方が、植物の知識があまり無い私にはよく分からないことと、このようなスカラー化は、人によって様々でしょうから、スカラー化するのは先に延ばしたほうが良いだろうと考えたからです。使用したのは統計的検定(χ2乗検定)で出てきますP値です。皆さんは、P値をこのような問題に適応されたことはないでしょうが、私は、経験的に、P値は、単に差がある(無し)の結論を出す尺度ではなく、2つの量の類似度の尺度として使えると思っています。次に、

  • 猿のA群の95%行動圏出現位置と植生
  • 出現位置属性と面積比

を示します。

面積比が%でなく、%を100で割った値となっているのは、χ2乗検定をするためです。猿が、もし、95%行動圏内で植生の何らの選好度(好き嫌い度)を持っていないとすると、面積比で出現することになります。選好度が強いと出現は、面積比とかけ離れたものになります。このかけ離れ具合(あるいは、類似度)を測定するのに、R言語のRコマンダのχ2乗検定を使用しました。
Rコマンダでは日本語が使えないので、表1の「95%行動圏内個体数」と「面積比」を「monkey」と「area_rate」に変更し、テーブルのあるファイルをクリップボード(コピーできる状態にする)にし、R言語のGUIであるRコマンダを立ち上げデフォルトの「Dataset」に読み込ませます。そして、次のようにして、面積比を与えられた確率Pとしてχ2乗検定をします。
x<-Dataset$monkey
y<-Dataset$area_rate
chisq.test(x,p=y)
A群のχ2乗検定の結果はつぎの通りです。
Chi-squared test for given probabilities
data: x
X-squared = 33.4672, df = 7, p-value = 2.166e-05
次の表2から表6は、残りの群れの個体数と面積比を示したものです。


全ての群に上の検定を実施し、P値を取り出すと次表と次図を得ました。

 いずれも、5%よりも小さいので、「差あり」となりますが、その中でも、比較的差が無いのがC群で、差があるのが、OG群、GO群、KI群となります。差がある群は、自然度が低く、人の生活圏近くで行動しているので、行動が限定されるのだと想像します。

鎌倉聴き旅

昨年の暮れ、音声観光案内の「鎌倉聴き旅」を初体験しました。
「鎌倉聴き旅」とは、観光音声ガイドサービスで次のところがやっています。
・企画・監修:鎌倉市観光協会
・コンテンツ制作:NPO法人 鎌倉シチズンネット
鎌倉聴き旅
     
 
   雨の中の東慶寺の金仏様                   鎌倉聴き旅の端末      
11時半に鎌倉市東口の観光総合案内書でアンドロイド端末を¥500で借りて、
鶴ケ丘八幡宮=>海蔵寺=>亀が谷切り通し=>東慶寺=>円覚寺=>北鎌倉ー(電車)=>鎌倉
と回り、端末を返却しました。歩いていると、GPSで地点を判定するらしく、案内地点の近くに来ると自動的に案内が始まります。この点が最大の長所だと思います。しかし、返却のため出発点に戻らなければならないのが少し不便です。 また、八幡さんは、案内のスポットも13箇所と豊富でしたが、北鎌倉のお寺は、説明スポットがそれぞれ1箇所と少なく物足りないように思いました。八幡さんで、大銀杏の説明がなかったのも少し残念。
また、「右折」・「左折」で案内スポットの位置の案内もする地点があります。進行方向をどうやって認識しているのか疑問におもいました。貸出窓口の人の話では、端末は20台あるそうですが、まだ、サービスを始めたばかりであまり知られていないせいか、1日に1台出るかどうかの状態だそうです。しかし、位置精度もまあまあの感じなので、もっと出るようになると思いました。
同種のITによる観光案内は、京都フリーウォークや奈良フリーウォークがあります。IPODスマートフォンに音声が記録されたファイルをダウンロードして、案内スポットでマニュアルで再生して聞くようです。
京都フリーウォーク Kyoto Free Walks - ホーム | フェイスブック
kyoto-free-walks.com
これらは、案内スポットの近くで、自分で案内音声を開始しなければなりません。「鎌倉聴き旅」の方が、煩わしくなく、良いように思います。
 音声ガイドがない地図アプリの観光案内は、スマートフォンで幾つかあるようです。大きいところでは、ソフトバンクのフラット案内があります。
ふらっと案内 | スマートフォン・携帯電話 | ソフトバンク
でも、直ぐにどこかがスマートフォンで「鎌倉聴き旅」と同じサービスを始めるでしょうね。しかも、準天頂衛星も受信するGPS受信機を内蔵したスマートフォンを使って。