ワークショップ

thieda2008-05-23

更新が滞ってしまいました。
今週は「時系列分析」のワークショップがあるのと、RAの仕事で「ルクセンブルグ所得調査」のデータ解析をやっていたので、もしかしたら論文を書いていたときよりも忙しかったかもしれません。データ解析のほうは一息ついたものの(全然終わっていませんが・・・)、ワークショップは土曜日まで続きます。
時系列分析ワークショップでは古典的時系列分析と時系列クロスセクション分析の諸々のトピックを五日で済ますため、なかなかハードです。教科書はPeter Kennedy(2008)_A Guide to Econometrics_で、初日に「明日までに最初の12章を読んでくるように」とか言われてゲンナリ。でも、なかなか良い教科書で、本文は数学の知識がなくても理解できるように書かれていて、各トピックの研究状況について理解したければ各章につけられた"General Notes"を読み進めることができ、さらに数学的な理解を得るには各章についた"Technical Notes"を読めばよいというように記述が階層化された教科書になっています。線形代数の知識のない政治学専攻が統計のパッケージソフトが裏で何をやっているのかを理解のに適しているのでしょう。もちろん行列を知っているに越したことはありませんが。
授業の内容はというと、担当の教授自体が投票行動専門の政治学者で数学には疎い人なので、「残差の系列相関を調べるにはこのコマンドでこのテストをやればよい」だとか、「残差のヘテロスケダスティシティをチェックするにはこのテスト」といった形で、自身が出版した論文のデータを用いてとにかく実践的に時系列分析の仕方を学んでいます。今日からはジョージタウンから Prof. Dennis Quinn が来たので少し理論的な説明が多くなりましたが、それでもとにかくデータ分析の問題にどう対処すればよいかを実際のデータを使いながら学ぶという点で実践的です。ボルダーでは経済学部の計量経済学セミナーで理論を数学的な証明を通じて学んでいましたが、それとは好対照。これまで時系列国家間比較データを自己流で分析していましたが、いろいろなテストとそれのSTATAでの扱い方を知ることができ、思っていた以上に有益なセミナーと今のところはなっています。

A Guide to Econometrics

A Guide to Econometrics

ルクセンブルグ所得調査(LIS)」のデータ解析のほうはというと、難航中です。データが大規模であることと個人のプライバシーに関わるため、利用者は生のデータにアクセスすることはできず、SyntaxをLISにメールで送信し、LISのサーバーが自動的に解析結果をメールで返信するというシステムになっています。このメールのやりとりの応答時間が、コンピューターによるオートメーションにもかかわらず、サーバーの負荷具合によってまちまちなのがひとつの問題。だいたい数分程度なものの、ときに数時間かかったりします。そして、マイクロデータのため、自分のやろうとしている表や図をつくるためには、データを適切な形にクリーニングし、欲しい集計データを得られるようにプログラムを書かかなければなりません。プログラミングはあまり得意ではないので、数十分かけて書いたプログラムにバグがありデータが返ってこなかったり、データは返って来たものの後でミスを発見したりと、手戻りの連続です。そして、いまは適切な(と思われる)コードでデータを得たものの、結果が少し常識に反するということで、別な方法で一からやり直してみるという状況。でも、将来このデータを使うときのための練習と思えば、時間のある今の時期にやっておくのは良いことなのかもしれません。いまは日本のデータはLISに収録されていませんが*1、LISのHP上には日本の2004年のサーベイデータが「交渉中」となっていたので、近い将来日本のデータを各国と比較できる日が来ることでしょう。

*1:以前書いたようにどこかの大学がマズったらしい。。。