« 樋口=坂野ペーパーのテクニカル面での? | メイン | 阪神・村上氏の交渉と情報規制 »

樋口=坂野ペーパーの意味合いについて

いい国作ろう!「怒りのぶろぐ」のまさくにさんが権威主義?それとも・・・というエントリーで、次のように指摘をされています。

金利上限引下げ問題の記事を書いていて、不思議に思うことがある。それは、「早稲田大学消費者金融サービス研究所」の出してるペーパーをある種の「証拠」として提示している人たちが、なぜその内容に何らの疑問を感じないのか、ということだ。・・・
・・・「金利上限引下げ論者は(提示されたようなペーパーに対して)論理的に有効な反論をしてから、引下げ論を言うべき」と批判している以上、彼らが論拠となし た「ペーパー」に関しては、十分信頼できると判断した理由というのが必ず存在するはずで、ペーパーへの反論に対しては論理的説明ができるはずだと思う。も しも、信頼できないということならば、当然そのペーパーの意見を自分の意見の論拠として採用しないからだ。
・・・なぜ「早稲田大学消費者金融サービス研究所」のペーパーを鵜呑みにするのか、ということです。鵜呑みという言い方は不適切かもしれませんが、彼らの論の展 開としては、土台の部分では件のペーパーがあってのものだからです。十分信頼できると考えるから採用する訳ですよね?その評価の源は何によるのか、という ことが謎なのです。単に権威主義的に「早稲田大学だから」というようなことで信頼するということでもないですよね?ならば、読み手の評価が必ず存在し、そ の時の評価とは「彼らが知っている経済学的理論」に十分適合したものであるはずなのです(それ故採用したわけで)。彼らは政策についても、「経済学的理論で評価するべき」と求める訳ですし。その「読み手の評価」というのがあるのであれば、素人に湧いてくるような程度のごく普通の疑問は、きっと説明可能なものであると思います。

まず、最初におことわりしておきますと、私自身を含めて金利上限引下げ反対について経済学的議論をしている人が「論拠」としているのは、早稲田ペーパーそのものではなく、経済学のごく基本的なロジックです。それは、磯崎さんのブログで早稲田ペーパーが紹介される以前から、私を含めて金利上限引下げ反対論者が主張していたことからも明らかだろうと思います。

・・・と、予防線を張っておくのは、どだい、どんなに慎重に設計され、注意深くなされた実証研究であっても、およそ現実の社会を相手にする経済学における計量分析については、けちをつけようと思えば、いくらでもけちをつける余地があるからです。

なので、「早稲田ペーパーに問題があるから、上限金利規制引下げ反対論の論拠は崩れた」という論法は不毛だからです。上限金利引下げ反対のロジックと非整合的な実証研究があれば、ロジックとの乖離を考えることに意味はありますが、たとえ、まさくにさんの議論が全て正しかったとしても、根本的な経済学のロジックにおいて金利引下げ規制が望ましくないという論拠が示されたことにはならないというところは、最初に確認させていただきたいと思います。

それでも、早稲田ペーパーは、現在入手可能なデータの範囲で最も包括的な分析を行っているものですので、その結果が、経済学のロジックと整合的であるということは、「経済学のロジック通りに世の中が動くとは限らない」と主張する方々に対しての一つの反証にはなるとは思っています。

その意味で、樋口=坂野ペーパーは、昨日のエントリーでも書いたように、個々の係数の解釈については異論を差し挟む余地もありますが、結論に関してはロジックの援用に使えると判断しているわけです・・・と、ようやく本題ですが、まさくにさんが「貸金業の上限金利問題~その9」で仰っていることについて、現在進行形で統計的分析をかじっている身として、少しフォローしてみたいと思います。


樋口=坂野ペーパーでは何を見ているのか?

まさくにさんは、樋口=坂野ペーパーをガン発生率になぞらえた上で次のように仰っています。

このような条件で「発生群」と「非発生群」を比較し、「タバコDの初期投与量、及び追加投与量」と「肺ガン」の発生リスクを評価したものが、本論文の分析です。で、結果、「タバコDの初期投与量・追加投与量」が「肺ガン」の発生リスクを増大させるかどうかは「有意差がなかった」という結論が出されています。「収入の減少」とは、タバコの例で言うと、「個体差」ということです。つまり、「タバコDの投与よりも、個体差で説明できる」というのが結論になっています。これは、例えば個人の「一回換気量の低下」とか「肺活量の低下」のような個体特有の変化が説明要因である、とするものです

ここには、樋口=坂野ペーパーの方法論に対する根本的な誤解があるように思われます。
樋口=坂野ペーパーでは「「タバコDの初期投与量・追加投与量」が「肺ガン」の発生リスクを増大させるかどうかは「有意差がなかった」という結論」は出ていません。寧ろ、(昨日書いたように係数の解釈には難しい問題がありますが)「新規貸付額」はモデル1,2,3いずれのモデルにおいても係数0.161~0.170の範囲で統計的に極めて強い有意性を示しています・・・というよりも、このロジスティック回帰分析では、若干の例外を除いてほとんどの係数は統計的に極めて強く有意です。

この点で、樋口=坂野ペーパーの方法論の特徴があります。このペーパでは、普通に多項回帰分析をやって、個々の係数や統計的有意性を見るのではなく、モデルの説明変数を変えていって、「どのモデルが一番よく現実に起きているばらつきを説明できるのか」を見ているわけです。

つまり、肺ガンの比喩でいえば、こういうことです。(あくまでタバコと肺ガンの例に合わせるために、無理をしているので、そのままこの手法が肺ガンに使えるわけではないことにご注意を。)

10年前から今日時点までで、タバコを吸い始めた人の中から肺ガンに罹患した人とそうでない人のサンプルをランダムに同数集める。モデルとして、説明変数に「タバコを吸い始めた時点での属性」(近親者でのガン発症者の有無、両親のタバコ喫煙寮の有無)のみのもの(モデル1)、モデル1に「喫煙寮の増加率」を加えたもの(モデル2)、モデル2に「他の要因での手術・入院」を加えたもの(モデル3)を構築する。
それぞれのモデルで回帰分析を行い、実際の肺ガン発症率を説明できる度合いをみる。
その結果、モデル1とモデル2では実際の肺ガン発症率を15%程度しか説明できなかったので、モデル3では35%を説明することができた。
従って、肺ガン発症率を説明する上では、モデル3で入れられた「他の要因での手術・入院」が最も大きな影響を持っていると推察できる。

この場合、個々の係数や、それが統計的に有意かどうかは、必ずしも重要ではありません。
(昨日のエントリーでは、フルモデルを先に画定した方がいいんじゃないかという疑問も思ったんですが、多分、計量経済学的にはモデルが先にありきなんで、モデル間の比較優劣をする上では、こちらの方がいいんでしょうね・・・統計学の人からは嫌われそうな気もしますが)

サンプルのバイアス? 

上のような調査方法については一つ疑問があるかも知れません。

それは、10年間でランダムにサンプルを選んでしまうと、なかには吸い始めてから1年の人もいるかも知れないじゃないかという点です。まさくにさんが、「対照となる「非発生群」という設定も、一定の観察期間がない状態で評価するのは「発生リスク」を正しく評価していることにはならない」と仰っているのも、このことではないかと思います。

これを解消するための、簡単な方法は勿論「ある一定時点で吸い始めた人のみを対象とする」というものです。しかし、これには、二つの大きな問題があるように思われます。

一つめは、十分な数のサンプルが集められるかどうかというものです。母集団に対して絶対的な発生率自体が低い場合には十分な数のリスク顕在化サンプルが集まらず、却って回帰分析の信頼度が落ちてしまう可能性があります。

ある一定時点のサンプルに依存することは、その「一定時点」に固有の要因が強い説明力を持ってしまう可能性があります。例えば、バブル崩壊直後で、すぐに景気回復すると信じていた時点の消費者行動と不況長期化の見通しがたった時点での消費者行動は異なる可能性があり、推定結果に強いバイアスがかかってしまうおそれがあるように思われます。

従って、サンプルを全期間からランダムにとる手法が、当然に問題なわけではないと思われます。
(個人的には、当初貸付時期から現在/管理債権移行時への経過期間や、貸付年代をコントロールしたものを見てみたいという気はしますが)

これに対して、サンプルを全期間からランダムにとると、経過期間が短い層がサンプルに入ってくるというバイアスがかかりますが、そのバイアスはモデル1~3の全てに対してかかっています。
モデル間の説明力の差が小さい場合には、こうした層が結論に影響を及ぼす可能性が大きいと思いますが、本件ではモデル1,2と3の間の説明力には、かなり明らかな差が見られますので、余り神経質になる必要はないのではないかというのが、私なりの判断です。(また、もし本当に結論に影響を与えるほどのバイアスが出ていれば、統計処理の過程で判別できるはずなので、それに対して適切な対処を行っているだろうという研究者としての学問的誠実性に対する信頼もあります)

実証研究の限界 

何れにせよ、こうした実証研究では、元々のデータの数、内容、サンプルの性質などにさまざまな制約があります。従って、研究者にとっては、その時点で得られるベストセットをベースにせざるを得ません。
その意味で、実験室で行うような形での実証研究は不可能ですし、医療で行われているような形で、予めある目的をもって対象者を長期観察してデータを集めるというやり方も困難な場合がほとんどです。

そうした制約の下での、研究結果としては、私が見た範囲では、最も豊富なデータと洗練された統計的手法を用いているというのが、私が樋口=坂野ペーパーに一応の信頼を置いている理由です。もちろん、新しいデータセットや異なる統計的手法によって反論がなされるのであれば、それは是非見てみたいと思います。

ただ、樋口=坂野ペーパーは、学術論文であって、一般への啓蒙書ではありません。当然統計学あるいは計量経済学についてひととおりの理解を持っていることを前提に書かれています。それを押さえた上での批判であれば有効ですし、有益だと思います。(実際、前回のエントリーでも書いたように、私自身、データや統計過程の処理については、もう少しつっこんで知りたいと思いますし・・・)ただ、用いている手法の理解に必要な基礎的な部分を誤解されたままで「説明不能なペーパー」扱いをするのは、ちょっと可愛そうかなと思います。

何れにせよ、ここで書いていることは、樋口=坂野ペーパーの内容に入る以前の、基本的な統計学とか計量経済学についての理解の問題だと思いますし、統計学とか計量経済学に詳しい方々からの間違いのご指摘は歓迎いたします<(_ _)>

ただ、いちから回帰分析や統計学についての解説して欲しいというリクエストについては、ちょっとテスト中の身としてはお答えする余裕がないので、予めご了承の程を。

Posted by 47th : | 12:15 | Statistics

関連エントリー

トラックバック

このエントリーのトラックバックURL:
http://WWW.ny47th.COM/mt/mt-tb.cgi/443

このリストは、次のエントリーを参照しています: 樋口=坂野ペーパーの意味合いについて:

» 貸金業の上限金利問題〜その10 from いい国作ろう!「怒りのぶろぐ」
「ふぉーりん・あとにーの憂鬱」の47th氏からお答えを頂きました。 試験でお忙しい中、お答えを頂いて有難うございます。貴重なお時間を取らせてしまったこと... [続きを読む]

トラックバック時刻: 2006年05月04日 11:07

» 貸金業の上限金利問題〜その12 from いい国作ろう!「怒りのぶろぐ」
すみすさんからコメント頂いて、大変参考になるアドバイスであったと思います。有難うございます。 特に「逆選択」の部分から考えてみました。また、「情報の非対... [続きを読む]

トラックバック時刻: 2006年05月07日 09:16

コメント

こんにちは
自分は計量経済学を専門にしている大学院生です。

実証の論文をblogで取り上げた方がいると聞いたので遊びに来ました。

まず、この論文を書いた人は推測ですがそれほど計量経済学は知らない方だと思われます。
一般的にこのような離散選択モデル(被説明変数が0,1のモデル)は通常logitといいます。
また、入れ子型(モデル1が正しければモデル2、モデル3が正しいというようなタイプのモデルのことです)のモデル選択を決定係数で行っているのも問題があります。
当然ながら説明変数を加えれば加えるほどモデルの説明力はよくなっていくのでモデル3が常に選ばれることになります。
もし、モデル選択をしたければじゆうどしゅうせい自由度修正済み決定係数を使うべきです。
ただし、logitおよびロジスティック回帰の場合、決定係数を線形回帰のように使って良いかは疑問ですが。

また、この論文は標本の抽出の仕方がかなり恣意的です。
破産をあつかった論文を何本か読んだことがありますが、このような標本抽出をしたのは見たことがありません。
問題点はいくつかあります。
その一、破産者と非破産者のサンプル数が同じです。
当然ながら破産者と非破産者の割合では非破産者の砲が多いはずです。
いくらなんでも破産者が五割に達することはないでしょう。
つまり、破産者に対する重みが大きすぎるのです。

その二、blogでも取り上げていますが、10年間の新規借り入れ者に関して完全にランダムに抽出しています。
この場合標本によって貸出期間がばらばらになり、非常に問題になります。
当然ながら、貸出期間が長ければ長いほど、破産しやすくなるので貸出期間はコントロールするか、そろえるかしなければなりません。
このような場合一般的に行われるのは、破産者、非破産者の区別無くランダムに抽出してある新規借り入れ後一定の期間すぎた後(よく行われるのが一年間後)に破産したか破産していないのかを被説明変数にしたデータを取る方法です。
このような方法ならばある貸出期間がある一定期間のあいだに破産したか破産しなかったかをチェックできるので標本選択によるバイアスを排除できます。

後、他に高額な新規貸し付けと新規貸付額を両方入れるのは多重共線ですね。

以上がざっと眺めてみた論文の問題点です。

Posted by 計量経済学者の卵 : 2006年05月07日 05:35

>計量経済学者の卵さん
はじめまして。ご専門の方からのコメントを頂けて嬉しいです。
私は統計プロパーの教授から教わっているので、計量経済学の作法とは、少し違うのかも知れませんが、retrospective samplingは倒産など母集団における出現頻度が低い場合にはしばしば用いられる手法で、probitでは結果がバイアスを受けてしまいますが、logitの場合にはモデルの説明度や係数の有意性にはバイアスはかからないと教わりました。絶対確率が出ないという面ではprobitに劣りますが、サンプリング手法による影響を受けないという意味ではlogitが優れると。
2点目は、私も貸出期間のコントロールは見てみたい気がします。ただ、本文にも書きましたが、今回のサンプルは10年のスパンで抽出していますし、いくら何でも初貸出から1か月の人をサンプルには入れないだろうと考えているところです。
あと、そもそもロジットにR^2を用いることができるのかは疑問なので、何か代替的指標のことではないかと推測しているんですが、たとえ普通のR^2でも今回の場合サンプル数(N)が1万件あるので自由度修正済みR^2との差はほとんどありませんよね?
これからも、自分の勉強をかねて実証ネタを扱うことがあると思うので、また是非遊びに来てください。
では。

Posted by 47th : 2006年05月07日 15:56

こちらもこんなに統計学を勉強してくださる方がいるととてもうれしいです。
retrospective samplingはlogitに関して、バイアスはないのですが有効性に関して問題になります。
ただ、これだけサンプルがあれば通常有効性は問題がないので、好みの問題かもしれません。
自分はこういうタイプのサンプリングはprobitやduration等に対して比較ができないので、あまり好きではないですね。

>いくら何でも初貸出から1か月の人をサンプルには入れないだろうと考えているところです。
この思いこみは結構危険です(笑)
自分の周りの研究者を考えると、このような失敗を平気でやらかしそうな人は結構います。

R^2と自由度修正済みのR^2ですが確かに絶対的には値はほぼ等しくなりますが、必要となるのは自由度修正済み間のR^2の相対値です。
入れ子型モデルを選択する場合、自由度修正済みのR^2を使わなければ常に一番大きいモデル(ここではモデル3)が選択されます。
今回に関しては結果がはっきり出ているので難しく考える必要は無いですけど。
logit probitのR^2ですが、代替指標は結構あります。
最尤法を使っているのでAICやBICを使うのが楽かもしれません。

Posted by 計量経済学者の卵 : 2006年05月07日 20:05

>計量経済学者の卵さん
素人の疑問にお答え頂き、ありがとうございます^^
仰るとおり、AICを見てみたいというのはありますね。でも、赤池先生や林先生と計量の世界での日本人研究者の存在感は凄いですね。

Posted by 47th : 2006年05月08日 19:36

申し訳ありません。
業者から数千万円、早稲田大学が消費者金融の研究会を立てていただいたので、浅学ながら、適当なもの、書いてみました。中身をそんなに、真剣に計量経済アプローチされましても。答えありきで、どうそれを証拠づけるか、それが課題なんです。
http://www.asahi.com/national/
早稲田は、消費者金融業者の代理看板を貸しているんです。

Posted by 早稲田 : 2006年05月24日 01:18

 
法律・経済・時事ネタに関する「思いつき」を書き留めたものです。
このブログをご覧になる際の注意点や管理人の氏素性についてはAbout This Blogご覧下さい。