疑似パネルデータ

■目次■

  1. 疑似パネルデータとは
  2. 全国消費実態調査疑似パネル
  3. 参考文献

■疑似パネルデータとは■

 パネルデータは、家計や企業行動の実証分析に重要な貢献を行っているが、多年度にわたる同一主体について継続調査が必要となり、調査可能な範囲が限られる問題がある。それに対して、同一主体ではないが、「家計調査」や「全国消費実態調査」のように、継続的に実施されるミクロ統計調査データが存在する。本研究の目的は、このような定期的に実施される家計に関する統計調査データから、疑似パネルデータを作成することである。すなわち、同一主体について時間的に継続的された調査であるパネルデータが利用できない場合、同一主体の調査ではないが継続して実施されるデータから疑似パネルデータ作成し、家計行動のパネル分析が可能となることを示すものである。我が国の「家計調査」や「全国消費実態調査」などの統計調査の場合、同一主体ではないが、定期的に調査され、標本数も非常に多く、本研究の対象として好都合な条件を備えている。

 疑似パネルデータの作成は、個体属性が類似した標本であれば、同一個体と見なす統計的マッチング技法の応用である。すなわち、年齢や地域などの属性に基づいて標本データを集計し、それをコーホートデータと見なそうとするものである。厳密な意味でのパネルデータではないが、コーホートに含まれる標本数が大きい場合や、属性の取り方が適切であれば、パネルデータと同じように「コーホート効果」を「個体効果」と同じように扱うことが出来ることが知られている。

 疑似パネルを用いた分析例としては既に多く存在する。代表的な例として、イギリスの家計調査データ(Family Expenditures Survey)を用いた分析がある。この調査は毎年実施され、標本調査対象は概ね10,000世帯であるが、約7,000世帯について回収されている。Browning, Deaton and Irish (1985)は、1970年から1976年の調査データから、年齢を5歳刻みとし、筋肉労働者と非筋肉労働者に分けてコーホートを作成している。コーホートの数は16、標本の総数は108、一つの標本に含まれる世帯数は、概ね100〜270(最小90、最大313、平均189)である。分析対象となった理論仮説は、消費財需要と労働供給を家計の動学最適化行動から説明するモデルである。イギリスの家計調査データから疑似パネルデータを作成し、家計の動学最適化行動を分析する研究は積極的に行われており、現在は1970から1986年の調査データから疑似パネルが作成されている。このデータに基づいて分析としては次のような研究が行われている。まず、Blundell, Meghir and Neves (1993)とBlundell, Browning and Meghir (1994)は、家計の消費需要と労働供給を動学的最適化行動モデルに基づいて分析している。Attanasio and Weber (1993)とAttanasio and Browning(1995)は、効用関数における異時点間の消費支出の代替弾力性や、消費支出の所得変動に対する過剰反応についての分析を行っている。Alessie, Devereux and Weber (1997)は、消費財を耐久消費財と非耐久消費財に分け、流動性制約が耐久消費財残高に依存すると仮定し、家計行動の動学的最適化モデルを分析している。

 一方、アメリカの家計調査(Consumer Expenditure Survey)についても、同様な疑似パネルが作成さてれいる。この調査は毎年実施され、調査対象となる世帯数は年によってって異なるが、5,700から8,000である。Deaton and Paxson (1994)は、1980年から1990年までの調査データから、年齢を基準としてコーホートを作成している。コーホートの数は14、標本の総数は496、一つの標本に含まれる世帯数は概ね200〜400(最小103)である。彼らは各コーホートごとの消費支出の増加率が違うことに注目して、恒常所得仮説を検証している。Attanasio and Weber (1994)は、同じ期間について疑似パネルを作成し、実際の消費行動が、動学的最適化行動に基づいているかどうかを検証している。なお、Deaton and Paxsonは、イギリスの家計調査(1969年〜1986年)と台湾の家計調査(1976年〜1990年)についても疑似パネルを作成し、アメリカの家計調査と同じ分析を試みている。アメリカについては、労働力調査(Current Population Survey)から疑似パネルを作成する研究も行われている。Card and Lemieux (1996)は、1979年から1989年までの3月調査データから、年齢と教育年限を属性として、225のコーホートを作成し、労働者として保有するスキル、男女間、人種間の賃金格差が、賃金格差に与える影響を分析している。

 我が国の疑似パネルデータの作成例としては、高木(1997)がある。彼は、日本経済新聞社が実施している「金融行動調査」を用いている。このデータは、首都圏の約3,000世帯を対象として、家計の金融商品の選択行動、資産・負債の状況について調査している。高木は、1988年から1993年までの調査データから疑似パネルを作成している。年齢について1歳刻みとし、大卒か否かで作成されるコーホート数は84となる。同様に、年齢を3歳刻みとすれば、コーホート数は28となる。標本の総数は、1歳刻みで215、3歳刻みで82である。一つの標本に含まれる世帯数は、1歳刻みで概ね10から35、3歳刻みで30から100世帯である。高木は作成された疑似パネルを用いて、消費行動の保険仮説を検証したが、1歳刻みのコーホートデータでは推定結果が不安定であるのに対して、3歳刻みのコーホートデータでは安定することを示している。コーホートデータの場合、その中に含まれる標本数の数が重要な役割を果たしていることが分かる。

 疑似パネルデータは、コーホート属性を用いて作成する方法だけでなく、マッチング手法を用いた方法もある。例えば、アメリカの労働力調査(Current Population Survey)の場合、標本調査が同一の世帯について継続して4か月間調査され、8か月後に再び調査対象となり、さらに4か月間調査される。したがって、ある月の調査対象の半分は前年に調査され、残りの半分は翌年に調査されるデータとなる。マッチングは、ある世帯に含まれる個人について一意的に識別する符号が付けられており、その情報に基づいてマッチング作業が行われる。したがって、グループ属性に基づいて集計されたコーホートを疑似パネルとする場合と結果を比較することができる。Peracchi and Welch (1995) は、1979年から1991年までの3月調査データをマッチング作業を行っている。マッチング成功率は2/3、マッチングできた世帯数は20,000から25,000に達している。

■全国消費実態調査疑似パネル■

 疑似パネルデータ作成の統計理論(Mofitt(1993))によれば、time invariantな生年やその他の属性を用いてクロスセクションデータを集計し、その標本平均値をデータとする、いわゆるコーホートデータを用いることが、観測不能な個体効果が大きな影響を与えるパネルモデルの推定における操作変数推定量となっており、それは一致推定量となっている。一方、標本平均が誤差をもつことから、変量誤差モデルによる推定も必要となることが明らかにされている。

 したがって、継続的に調査されるクロスセクションデータが利用可能であるとすれば、分析にとって必要となる変数について、コーホートごとに平均と分散共分散を求めることができれば、パネル分析を行うことができる。本研究では、疑似パネルデータの作成を、1984年、1989年と1994年の3時点で調査された全国消費実態調査について行う。全国消費実態調査の場合、5年ごとの調査であるが、標本数が一調査について50,000以上利用可能であり、各コーホートに含まれる世帯数も十分な数を確保することが出来る。前節で述べたように、疑似パネルデータの分析では、コーホート集計が適切な属性に基づいて行われることが必要であるが、その一方でコーホート内のノイズを低下させるに十分な標本数が要求される。なお、勤労者世帯と全世帯(勤労者世帯を含む)について別々に集計しているが、調査項目の一部が異なるためである。なお、集計にあたっては、73の項目について、各コーホートの平均値と分散を求めているが、共分散については計算を行っていない。

集計概要

 実験では、居住地域について都道府県を単位とし、年齢については各調査時点で、全年齢について、1歳刻みで集計している。但し、1つのセルに含まれるデータ数が2以下の場合は除いている。各調査時点の総標本数、コーホート数、コーホートあたり平均世帯数は下記の通りである。



表1 全世帯(勤労者世帯を含む)
調査年総標本数コーホート数平均
198450383 241520.9
198955510 251722.1
199455507 255821.7


表2 勤労者世帯
調査年総標本数コーホート数平均
198431097 180417.2
198934532 189218.3
199436488 199818.3


 各コーホートに含まれる世帯数の平均は20前後となる。コーホートに含まれる世帯数を増加させるには、年齢刻みあるいは地域区分を粗とすればよい。図は1994年調査において集計した都道府県別・年齢別標本数を示したものであるが、この結果からも機械的な分類は適切でなく、年齢階層や地域を限定して集計することで、セルに含まれる世帯数をコントロールすることが望ましいことは明らかである。



■参考文献■

  1. 高木真吾、1997、Repeated Cross-Section Data を用いた経済モデルの推定・検定、伴 金美編『ネットワーク型パネルデータベースの構築と統計分析の研究』、平成8年度科学研究費補助金(重点領域研究)研究成果報告書、166-212.
  2. 伴 金美・高木真吾、1999、疑似パネルデータの作成実験、伴 金美編『ネットワーク型パネルデータベースの構築と統計分析の研究』、平成10年度科学研究費補助金(特定領域研究)研究成果報告書.
  3. Alessie, R., M.P. Devereux, G. Weber, 1997, Intertemporal Consumption: Durables and Liquidity Constraints: A Cohort Analysis, European Economic Review 41, 37-59.
  4. Attansio O.P. and G. Weber, 1993, Consumption Growth, the Interest Rate and Aggregation, Review of Economic Studies 60, 631-649.
  5. Attansaio, O.P. and M. Browning, 1995, Consumption over the Life Cycle and over the Business Cycle, The American Economic Review 85, 1118-1137.
  6. Attanasio, O.P., and G. Weber, 1995, Is Consumption Growth Consistent with Intertemporal Optimization? Evidence from the Consumer Expenditure Survey, Journal of Political Economy 103, 1121-1157.
  7. Browning, M., and A. Deaton, and M. Irish, 1985, A Profitable Approach to Labor Supply and Commodity Demands over the Life-Cycle, Econometrica 53, 503-543.
  8. Brundell. R., and C. Meghir, 1993, Labour Supply and Intertemporal Substitution, Journal of Econometrics 59, 137-160.
  9. Brundell, R., M. Browning and C. Meghir, 1994, Consumer Demand and the Life-Cycle Allocation of Household Expenditures, Review of Economic Studies 61, 57-80.
  10. Card D., and T. Lemieux, 1996, Wage Dispersion, Returns to Skill, and Black-White Wage Differentials, Journal of Econometrics 74, 319-361.
  11. Deaton, A., 1985, Panel Data from Time Series of Cross-Section, Journal of Econometrics 30, 109-126.
  12. Deaton A., and C. Paxson, 1994, Intertemporal Choice and Inequality, Journal of Political Economy 102, 437-467.
  13. Mofitt R., 1993, Identification and Estimation of Dynamic Models with a Time Series of Repeated Cross-Sections, Journal of Econometrics 59, 99-123.
  14. Peracchi. F., and F. Welch, 1995, How Representative Arr Matched Cross-Sections? Evidence from the Current Population Survey, Journal of Econometrics 68, 153-179.
  15. Verbeek M., and T. Nijman, Minum MSE estimation of a Regression Model with Fixed Effects from a Series of Cross-Sections, Journal of Econometrics 59, 125-136.