このような威勢の良い
本
に対しては,いくつか指摘してみたい気になる.マスコミの世論調査に対しての批判が多いので,私自身に対する批判でもあると受けとめよう.これから少しづつ書いていく.
大阪商業大学の学長として忙しい
谷岡先生
は反論は「文書で」よこせと主張しているが,非常勤講師として忙しい私も,それは面倒なので自分のWEBページに文書を掲載する.
日本の社会調査の「半分はゴミだ」といっている.では「半分は宝」なのか.これは高い評価かも知れない.もう少しチャチャを入れてみよう.1つの社会調査のうちの半分がゴミなのか,それとも100の社会調査のうち50がゴミ調査で,50が宝調査という意味なのだろうか.
最近出版のこの種の本に,渡辺(1998)『調査データにだまされない法』(創元社)があるが,デスマス調の紳士的文体だったせいか,それほど注目されなかったようである.そこでは 「7〜8割がゴミ箱へ直行」と述べている.渡辺はTBSの調査実務家である.
最初に経済企画庁の「豊さ指標」に対する批判から始めている.この本はこのような着眼点が面白い(しかし豊さ指標は「社会調査」ではないだろう).「豊さ指標」については私も
分析記事
を書いたことがあるので,谷岡先生がどのような観点で批判をするのか興味深かった.「指数と指標」の相違を強調している.それがどうしたという第一感想だが,私も再考してみる.
それよりも,やはり妥当性の問題ではないか.そしてここに着目するなら,私のように実際にデータ解析してみて構成概念の妥当性をチェックし,8つの領域(構成概念)を潜在変数とするモデルをデータから同定できないという結果を示したらよいのだ.
日経の電話調査の抽出フレームを「住民票」だと指摘しているのは間違いである(p.156).あげ足をとる気はないが,この本には学者らしからぬ大雑把な記述がある.世論調査を批判している文脈で,谷岡先生がサンプリング方法の事実関係を間違えて書いてはいけない.
笑って許せる間違いもある.「数理統計研究所」は故意だとしたら,ブラックユーモアである(p.31).「統計数理であって,数理統計ではない」と,その存在意義をかけ,その名前を主張して設立されたのが「統計数理研究所」である(例えば,日本統計学会(1983)『日本の統計学五十年』東大出版).
むろん,これはあげ足とりである.こんなことは単なる誤植で済ませればいい.この節の指摘は重要である.女性の社会進出の調査で,女性だけを対象にしていることを指摘しているのだ.まったく同種の問題が話題になったことがある.「若者調査」を企画した時,我々の先輩は「若者の特徴を調べたいのなら,比較の対象が必要である.若者だけを調べるのでなく中年も老年も調べてこそ若者と比較対照が可能である」と主張したが,若者だけが対象ということになった.
統計数理研究所がデータの使用を許可しないとは私も知らなかった.データ利用を拒否された理由が書いてないが,返事はあったと思われるので.統計数理研究所の立場も示しておいた方が公平というものだ.しかし,データは自分で調査・実験してとるべきものじゃあないでしょうか.
能力はあるがゴミを出さないために自分は調査をやらない,とあとがきで宣言している.谷岡先生が社会調査をやれば,どうせ「ゴミを増やす」ことになるに決まっていることを自覚していて立派である.
しかし,それではミもフタもない.もしやればその能力はあるというなら自分でやってみよ,そして我々よりもはるかに高い精度で,たとえば選挙予測調査と解析を独力で成し遂げて見せてみよ.「ここがロードスだ.ここで跳べ!」
彼らは言ふのみにて行はぬなり.また重き荷を括りて人の肩にのせ,己は指にて之を動かさんともせず.凡てその所作(しわざ)は人に見られん為にするなり,即ちその経札を幅ひろくし,衣の総を大きくし,饗宴の上席,会堂の上座,市場にての敬礼,また人にラビと呼ばるることを好む.されど汝らはラビの称(となへ)を受くな.また,導師の称を受くな.
禍害(わざはひ)なるかな,偽善なる学者,汝らは人の前に天国を閉ざして,自ら入らず,入らんとする人の入るをも許さぬなり.盲目(めしひ)なる手引よ,汝らは蚋を漉し出して駱駝を呑むなり.禍害なるかな,偽善なる学者.外は人に正しく見ゆれども,内は偽善と不法とにて満つるなり.禍害なるかな,偽善なる学者,汝らは預言者の墓をたて,義人の碑を飾りて言ふ,「われら,もし先祖の時にありしならば,預言者の血を流すことに与せざりしものを」と.かく汝らは預言者を殺しし者の子たるを自ら証す.汝ら己が先祖の桝目を充せ.蛇よ,蝮の裔よ,汝ら争(いか)でゲヘナの刑罰を避け得んや.(太宰治訳マタイ伝,「如是我聞」より)
私は学者世界の外にいるので「華麗なる学者の世界」は知らないが,博士も大臣と同様にそれほど大衆から尊敬されていないんじゃあないか?.心配しなくても学生諸君は,ちゃんと4年間かけて「先生」を観察して大学を通過していく.
毎日新聞の世論調査のグラフの指摘もいい着眼点だ (p.145).実はこの本が出る前に私も同じ問題
(内閣支持率の表示方法 (PDF))
を書いて講義したことがある.ただ,観点はいいが,非標本誤差についてもう少しいろいろ解説できる題材だ.
マスコミ各社の世論調査の内閣支持率がかなり異なるという指摘をしているが,そういう議論をする時には,私のように10年分くらいのデータを整理して比較してみるとよいのだ(世論調査:日経・朝日・読売の内閣支持率比較).マスコミの内閣支持率を題材にして述べている部分を下に引用してみよう(p.171).
もっと単純な選択肢でも,文言を少し変えただけで結果が驚くほど異なることは,少し調べればわかることで,例えば次の新聞による質問はすべて橋本内閣の支持率を尋ねたものであるが,選択肢が微妙に異なることに気づくはずである.
◆読売新聞(1996年5月29日)「あなたは,橋本内閣を支持しますか,支持しませんか」(数字は%,カッコ内は前回調査)
・支持する 52.0(48.4)
・支持しない 33.3(36.0)
・その他 2.4(1.6)
・答えない 12.3(14.0)
◆朝日新聞(1996年5月15日)「あなたは,橋本内閣を支持しますか.支持しませんか」(数字は%,カッコ内は96年2月調査)
・支持する 44(47)
・支持しない 35(33)
・その他・答えない 21(20)
◆日本経済新聞(1996年6月25日)「橋本内閣を支持しますか,しませんか」(%,カッコ内は前回4月調査)
・支持する 41.5(48.3)
・支持しない 35.0(28.5)
・いえない・わからない 23.5(23.2)
(中略)
読売新聞と朝日新聞のサンプリングその他のリサーチ・デザインを比べてみたが,特に差があるようには見えない.それでは,この支持率の差(8%)はどこから生じたのであろうか.おそらく筆者の知り得ない何か(例えば面接員への指示)が異なっていたものと思われる.
何を言っているのだこの先生は.質問文のわずかな相違が観測値の大きな差異となる例として引用したのではなかったのか.いつの間に「筆者の知り得ない何か」による差異の例にすりかえてしまったのだ.
朝日と読売による支持率の差異は「文言を少し変えただけで結果が驚くほど異なった」ものではないことは「少し調べればわかること」だ.釈迦に説法すれば,文言の効果を確認するには,文言以外の要因を統制する必要がある.しかしそのような実験計画をしていないデータを対象に議論していることは明白だ.
私の経験的・探索的な分析によれば,調査主体名が異なることによる非標本誤差である(これはどういうバイアスか容易に洞察できるだろう.回収率は両社とも100%ではなく,調査主体の名前も被験者に与える刺激である).内閣支持率が,読売>朝日>日経,という傾向で安定して観察できることは「少し調べればわかること」だ.調査実務家たちの経験では,調査主体名以外の制御可能な要因を「同一」ないし「無作為化」した世論調査で,10ポイント前後の差異を生じる質問もあることが知られている.
ましてや「筆者の知り得ない何か(例えば面接員への指示)が異なっていた」のではない.朝日と読売のインストガイドは完全に同一というわけではないが,支持率を誘導するような指示内容が書かれているはずもない.言論機関である新聞各社は世論調査の「手続き」をとても重視している.谷岡先生がデータを熱心に調べず,同時期の内閣支持率で差の大きな例はないかと本のネタ探しに熱心だっただけだ.
朝日や読売の世論調査室は3000人程度の規模の訪問面接調査なら,ほぼ完全な調査員管理をする能力を持っている.しかもそれは数十年にわたって組織的な仕事として継続してきた実績がある.「よろん」(日本世論調査協会報・第85号.2000.3)に朝日新聞社の今井氏が胸を打つ追悼文を書いているので,読んだ方がいい.調査の現場では,いつでもこのような多くの無名のスタッフが,論文やちょっと過激で売れそうな本を書くためでもなく,自分のミッションとして真面目に調査を管理しているのだ,ということを谷岡先生は肝に銘じておいた方がいい.
選挙の1週間前に実施する選挙予測調査で,投票意向率が9割にもなる事実を,回答者のウソによる誤差であると指摘している(p.122〜123).実際の投票率が50〜60%だからというのが根拠であるが,谷岡先生のこの解釈はたぶん間違いである.実際に調査をやってデータ解析してみると分かる.標本の投票意向率が9割近いことに驚くのは理解できるが,実際に自分で解析してみれば,ウソによる誤差ではないことが推察できる.
回答者はむろん善意・悪意でウソをつく.実際に追跡調査をしてみると,回答者単位では回答不一致が顕著だが,集団としての集計値はよく一致することが分かる.谷岡先生のような誤解はよく犯す間違いである.有権者という母集団から無作為抽出した標本ではあるが,調査の回収率は50〜60%であることがヒントである.30秒くらい考えれば分かるだろう.
本書のような啓蒙書の系譜はダレル・ハフ(1968)『統計でウソをつく法』(講談社ブルーバックス)に遡ることができる.そこに問題の多くは出尽くしている.その後も,吉村(1984)『平均・順位・偏差値』(岩波ジュニア新書)があり,最近では,Rao, C. R. (1993) Statistics and Truth: Putting Chance to Work, 2nd Edition. World Scientific Pub Co. (藤越・柳井・田栗訳(1993)統計学とは何か――偶然を生かす.丸善)で,数多くの警鐘が鳴らされている.
社会調査に限定すると,最近では先にあげた渡辺(1998)のほか,平松(1998)『世論調査で社会が読めるか』(新曜社)がある.平松も毎日新聞社の調査実務家である.ところで平松(1998)に出てくる「標本数」という言葉は少し気になる.「標本サイズ」「標本の大きさ」の意味で使っていて文脈から誤解することはないが,統計学で標本数というと「2標本問題」というように,「大きさが1000の1個の標本」「2000個のブートストラップ標本」という使い方である.入手しやすい古典的啓蒙書は,林(1984)『調査の科学−社会調査の考え方と方法−』(講談社ブルーバックス)であるが,この中で「回収率は80%」を目標にするという説教は現在ではほぼ不可能なので,増刷の際には加筆・修正をお願いしたい部分だ.
谷岡先生のいいところは威勢のよさ,権威と集団を頼みとせず,一人で批判していることである.日本の巨匠が一言「電話調査は面接調査より精度が劣る」と言えば,襟を正して有難く拝聴し,「電話調査はダメでゴザイマス」と唱和するような学者とは一味違うはずである.電話調査であれ面接調査であれ,正しく実施しなければどちらもだめになる.安易さは批判すべきだが,可能性は検討すべきである.巨匠が「だめだ」といえば,自分の手で確認もせず,権威の尻馬に便乗して,己は安全な場所で手揉みしながら「電話調査はダメですね」などと阿諛追従するような議論は,徹底的に粉砕しなければならない.「だめだ」「ウソだ」とばかり言うだけでは「だめだ」.
2000.8.10
谷岡先生は電話調査はダメだと認識しているようである.それはどの測定法と比較してダメだと思っているのだろうか?.
書評を書いたせいか電車の中吊り広告を見ていたら、どうも気になってしまい、初めて「SPA!」なる雑誌を買ってしまった.2000年8/16・23夏季合併特大号の総力ワイド「もう,ボクらはダマされない!!」の中で谷岡先生が取材にこう回答している(p.28).
(読売新聞(2000.6.29)の世論調査=「投票に行ったか」の結果を解説して)「この世論調査は電話聴取法で実施されていますが,電話調査では人は平気でウソをつくというのが調査学の常識.非難されないように答えがちなものなのです.それに『投票に行かなかった人も多かったようですが……』という設問の仕方にも問題がある.特定の答えを誘導しやすいですね」(谷岡氏)
かわいそうに.調査学という学問はこんな常識にしか到達していないのだ.実際の投票率と,標本調査の投票率が異なる原因は既に言及した.回答者のウソは面接調査でも電話調査でも,存在し,電話調査に特別に顕著というわけではない.私は1996年の総選挙のあと追跡調査をして,回答者が実際に投票したかどうかを調べるために,選挙管理委員会に投票結果の名簿を閲覧することを要請したが,東京,神奈川ともに断られた.法的禁止行為ではないようだが,自治省よりも各自治体選管の自主判断で断ったようだ.「なにもそこまで調べなくてもいいでしょ」と職員にいわれた.昭和30年当時ではこの閲覧は認められていたようで,林知己夫(1967)が「社会調査における回答誤差−その歪みをどう補正するか−」という報告を『NHK総合放送文化研究所創立二十年記念論文集』に書いている.昭和30年の衆院選後に,面接調査(東京都区部)の回答と実際の投票行動を選挙人名簿でチェックしたものである.14%がウソをついていた.このうち棄権したのに行ったというウソは10%であった.
回答者のウソによる誤差かどうかは選挙人名簿くらい調べてから,どの程度の比率の回答者がウソをついたかを言ったほうがよい.今回の総選挙の投票率が62%で,読売の調査の投票率が86%なので,その差分は回答者のウソだと解説していることが脳天気なのである.
測定法による差異は,質問内容と質問文によっても異なる.同じ質問文を電話と面接で,同時に確率標本に対して実施すると分かるが,質問内容によって差があるものと無いものがあり,電話では面接より,回答者がウソをつく,ということは一般的には言えない,というのが調査の現場の「常識」である.
最近の選挙予測のハズレの原因を電話調査という測定法に求める意見がある.これもまだ決着はしていない.もっとも保守的であったNHKが1998年参院選で電話調査に移行してしまったのが悔やまれる.もしもNHKだけでも1998年の参院選を面接法でやっていたら,面接法と電話法が比較可能だったのに,
毎日新聞の内閣支持率が面接法と電話法ではっきりとした相違を示すのに対し,朝日新聞の内閣支持率では,面接法と電話法はほとんど変わらない(例えば,2000年3/23朝刊参照).毎日の内閣支持率の質問文は,支持,不支持についで「関心がない」という3番目の選択肢があり,面接調査ではこの項目の回答比率が電話調査よりも高くなる,という安定した性質がある.どちらがウソをついているのか判断しがたいのではないだろうか.ウソというより,ある刺激に対するある反応の平均的傾向を示しているに過ぎないのではないだろうか.一方,朝日新聞では,面接と電話ではほとんど支持率の差がない.世論調査において人は電話では面接と違って「平気でウソをつく」という証拠は見当たらない.
社会調査の測定法の性質を知るには,社会を相手にもくもくと継続して探索するしかないのである.そのような実証的な営為の果てにしか見えるものはやってこない.
2000.8.14
谷岡一郎(2000)マスコミ「世論調査」はゴミである.(文芸春秋,2000年9月号)
谷岡先生との違いが少し分かった.「社会調査論の専門家」なのである.同じように調査にかかわる者として,いったいこの違和感がどこから来るのだろうかと思っていたが,社会調査論者と社会調査実践者との違いである.評論家と作家の違いである.谷岡先生を読んでいると,この人は社会調査が嫌いなのではないかと思えてくる.私は仲間とともに調査プロジェクトを遂行し,その結果を夢中で解析している時,とても楽しい.いろいろなことが調査データから現れてくるのが面白い.それを仕事としてやれることも幸いだと思っている.その過程で生じるさまざまな問題点について,実践的な解決方法に腐心することはあるが,鬼の首でもとったかのように諸問題を列挙するような気にはならない.それをするのならもっともっと指摘することができる.社会調査を愛している者と,憎んでいる者との差であろうか.
谷岡先生は「社会調査論の専門家」に過ぎないので的外れな軽薄もあるが,メディア論だと思えば,マスコミに対して警鐘を鳴らす役目を果たす価値はある.
少しだけメディア論に近寄ってみようか.谷岡先生はこう書いている.
しかし,どうせゴミみたいなデータしか集まらず,予想してもサッパリ当たらないのなら(どうせはずれても金を返さない調査会社に丸投げしているのなら),お金と時間の無駄でしかない.予想などやめてしまうのが正解であろう.アナウンス効果も考慮に入れれば,法律で禁止してもいいくらいだ.
まさか自民党の御先棒を担いでいる訳でもないだろうが,自民党の耳に入ればさぞかし歓迎されることであろう.
なぜ選挙予測調査をするのか,という問題については個人的な考えを述べておこう.
予測調査の報道を法規制しても,予測報道そのものはなくならない.「全国の支社・支局の取材網を動員した情報を総合的に判断して」情勢報道がされるであろう.予測するのなら可能な限り正確に報道したい.政治記者の耳と足で集めた情報よりも標本調査による予測の方が,予測精度も高く,手続きと根拠も透明である.予測報道するのなら科学的に達成できる最高の方法で予測すべきである.
では,予測「調査」ばかりでなく,予測「報道」そのものを法規制したらどうなるであろうか.それでも予測調査は実施されるであろう.そしてその情報は与党だけが所有することができ,報道されず有権者に知らされることはない.与党は人知れず正確な情勢判断をしながら終盤の選挙運動を展開するであろう.
情報は富とともに必ず権力に集中する.情報の中央集権を破壊するネットワーク社会が到来しても通信傍受・通信規制を合法化する.権力が持つ情報は本質的に隠蔽を志向する.政治記者による権力の取材はそれを明らかにすることだ.
あまりに明晰に分析されたために,眩しさのあまり権力が眼を開けていられないほど権力を相対化することができるか.それが挑戦する課題だ.
2000.8.20
もはやこれ以上,谷岡論文についていう気もないが,いくつか触発された問題もあり,自分のノートのつもりで書いておこうかとも思う.
その前に「文芸春秋」の副題でもある「丸投げ調査」について感想をのべてみよう.小選挙区比例代表並立制のもとでの初めての総選挙が実施された1996年は世論調査の転換点であった.第一に面接法から電話法への移行という転換があった.同時に新聞社の社内体制による実査を外注したという転換点でもあった.これは面接調査時代の調査員網の喪失でもあった.このような背景から「丸投げ調査」という言葉が出ているように思われる.
1996年の総選挙は新進党の議席を外した.1998年参院選では第一党の議席を外した.2000年の総選挙の外れ方は1998年の参院選を小規模にした外れ方で,見出しの間違いには到らなかった.
このような外れ方が,電話調査への移行と重なって測定法としての非難となっているのだが,日経のように終始,電話調査を実施してきた例を見れば,かつては面接調査と同等以上の的中率だったのだから,電話法という測定法の問題だけでもない.
電話法に移行する時,世論調査の大規模化に対応して各社は調査機関への外注をした.自分たちの手で実施してきた調査を「丸投げ」したから外れるのだ,という非難はここから来ている.しかし,谷岡先生がこのような指摘をするとは意外でもある.これは長年,新聞社の世論調査がどうのように実施されてきたかを知っているような人が言いそうな言葉である.
外注そのものは非難されるべきものではない.外注した方が効果的であるような運営を責任者は考えているはずである.だいたい,外注したから欠陥調査だなんて調査会社もナメられたものである.こういうナメきったセリフを社会調査論者ごときに吐かれた調査会社の社員諸君は敬服していちゃあいけない.
■勝ったのは与党か野党か (2000.8.27)
選挙結果の各紙の一面トップの見出し(6/26)が以下のように割れたことが話題となった.同時に解説記事の見出しも示しておこう
【日経】
与党安定多数,首相続投へ/自公保65議席減/民主が躍進,共産後退
芹川洋一・編集委員(1脇)変化望まなかった有権者/とりあえず「今」を守る
【産経】
与党が絶対安定多数/森首相 続投へ/自民大幅減,民主は躍進
【読売】自公保後退,民主が躍進/与党,「絶対安定」は確保/連立継続,首相続投
弘中喜通・政治部長(1脇)民意踏まえ出直せ
【朝日】
自公保激減 民主躍進/与党,絶対安定多数は確保/自民,半数届かず
橘優・政治部長(1脇)首相信任とは言えない
【毎日】
自民敗北 民主伸びる/森首相,当面は続投/「自公保」で絶対多数
与良正男(2脇)国民の反発招いた「失言僻」 苦しい森首相
この問題については日経の芹川編集委員が夕刊のコラム「ニュース複眼」(6/30)で「格差是正へ比例活用術――政権選択、より明確に」の見出しで解説している.冒頭だけ引用しよう.
こんどの衆院選の結果をめぐり、政党はもちろん、報道機関でも解釈がわかれ、やや混乱が生じている。なぜだろうかと考えてみると、小選挙区制を中心に比例代表制もあわせた今の選挙制度の理解の違いが背景にあるようだ。ここで、もう一度、制度がどんなものかを確認しておくのも無駄ではあるまい。
今回の選挙では、たしかに自民党が議席を減らし、民主党が大きく議席を伸ばしたから、自民党が敗れて民主党が勝ったと判断されやすい。しかし、決してそうではない。勝ったのは自公保、つまり与党であり、敗北したのは民主党なのである。
そもそも小選挙区制は、個人本位だった中選挙区と違って政党本位で、選挙は二大政党を前提に、どちらの政権がいいのかの二者択一を迫るものだ。第一党と第二党、もしくは与党と野党のいずれを選ぶかの判断を有権者に求める選挙である。
政権選択の勝敗ラインは解散時の議席ではなく、過半数の二百四十一議席である。選挙のたびごとに、ご破算で願いましては、で争うわけだ。解散のときの議席と選挙での獲得議席を比べて一喜一憂するのは、中選挙区制での話である。
気持ちはわかるが、民主党が個々の選挙区での善戦ぶりを過大に評価するのは、自己満足でしかない。選挙は全体の数の結果である。願望と現実は違う。政治はリアリズムでなければならない。
これ以上加えていうことはない.
さて,データ解析の学習に戻ろう.この全国5紙を並べて谷岡先生は
「図式化していえば,朝日や毎日が左(革新)寄り,産経が右(保守)寄り,日経と読売は両者の(相対的に)中間に位置する」
と述べている.
このように,我々は現象の表現を空間概念(左翼−右翼)や時間概念(先進−後進)に抽象化して理解することがある.言語的表現を,図的表現や音楽的表現に転位することで,論理的理解と直感的理解を結合するのである.
ここで「図式化していえば」という表現位相の転位を,谷岡先生のように単に言語表現から言語表現に横滑りさせて済ませるのではなく,実際に図的表現に直接変換しよう.この転位のために解析的方法を使う.
結論を先に示してから手順を説明する.データ解析により,5紙の見出しという現象から,以下のような図的表現を得る.このバイプロットの解釈は容易であろう.各自で試みよ.
現象はまず測定され,データとして表現されなければいけない.そのあとデータを解析して座標を求め,グラフィカルに表示する.
この場合の測定方法は単純である.各紙の見出しから受ける印象は異なるが,第1見出しから第3見出しまでを含めたキーワードを検討すると.各紙とも要素としては以下の4つから構成されていることが分かる.この要素のどれを強調するかが各紙で異なっているのだから,各紙の違い(変動)を表現するには,以下の4つの要素を観測変数として測定すればよい.
v1.安定多数
v2.首相続投
v3.与党減少
v4.民主躍進
実際には見出しの文字サイズ,面積,掲載写真なども印象に影響するが,ここでは見出しの順序を数値として与える(従って測定水準は順序尺度である).データによる表現は以下のような行列となる.
日経 1 1 2 3
産経 1 2 3 3
読売 2 3 1 1
朝日 2 4 1 1
毎日 3 2 0 1
測定のあとは解析である.上記のデータ行列 X を特異値分解する.数学的表現は単純で,
X=UΛV’
ここから行座標A(新聞)と,列座標B(見出し)を以下のように定義する.
A=UΛ
B=V’
得られた座標値を以下に示す.ここでは2次元までを採用して平面図を描く.元のデータは4変数なので,4次元データを2次元に縮約したわけでるが,この縮約効率(寄与率)は98%である.平面上の各紙の位置は元データのユークリド距離を近似表現している.(特異値分解する行列 X は標準化してある).
DIM1 DIM2
日経 -1.842080 0.647865
産経 -1.981700 -0.424520
読売 0.911151 -0.323970
朝日 1.232460 -1.068280
毎日 1.680173 1.168899
V1 -1.053190 -0.703610
V2 -0.732700 1.697299
V3 1.051084 0.748107
V4 1.117666 -0.253870
このようにして得た座標値を使って,行(新聞)は平面上の点として,列(見出し)は原点から伸びるベクトルとして表示する.これをバイプロットという.知覚マップと呼ぶこともある.
第1次元(横軸)に沿って毎日と産経が両極に位置する.右側(毎日・朝日・読売)は「与党減少」「民主躍進」を強調した新聞であり,左側(産経・日経)は「安定多数」「首相続投」を強調した新聞であることが図的に表現されている.
第2次元(縦軸)は,左側においては,「首相続投」を第1見出しとした日経を第2象限,第2見出しに扱った産経を第3象限に区別するように機能している.右側においては,ベクトルをみると「与党減少」と「民主躍進」の区別として解釈できるのだが,この影響は実は産経と日経の区別に影響している.毎日,朝日,読売はこの部分の見出しでは同一である.毎日が第2見出しに「首相続投」を使ったことで第1象限に位置し,朝日と読売が第4象限に区別されたのである.
また,「安定多数」と「与党減少」はベクトルの方向が正反対である.与党の安定多数をトップで強調するか,議席減少を強調するかは正反対ということである.元のデータの積率相関係数は「−0.94」である.「首相続投」のベクトルとは直交しているように見えるが,実際には0.3程度の弱い相関がある.2次元平面への近似のためである.以下は観測相関行列である.
V1 V2 V3 V4
V1 1.00000 0.36690 -0.94346 -0.87287 安定多数
V2 0.36690 1.00000 -0.34615 -0.72058 首相続投
V3 -0.94346 -0.34615 1.00000 0.88070 与党減少
V4 -0.87287 -0.72058 0.88070 1.00000 民主躍進
このような手法をマーケティング分野ではポジショニングと呼び,製品戦略やイメージ戦略の分析手段として利用している.多変量解析の目標の1つは,このように低次元にデータを縮約して簡潔化し,見えない関係を見出して理解を促進することである.この例は単純なので,見えない関係が見え始めるような感動はないかも知れないが,それにしても「図式的にいう」ことを言語表現ではなく実際に幾何学的に表現できる価値はあろう.
目の前に並んだ5つの新聞−−マスメディア−−という現象を2次元平面という幾何学的表現に転位させる.「新聞の論調が違う.産経は右寄りだし毎日は左だよ」という印象的記述を,データ解析をすることで,幾何学的表現に変換できたのである(左と右の符号が政治体制とは逆だが相対的問題に過ぎない).上記のような単純で身近なデータ解析例においてさえ,
現象→ 測定→ データ表現→ 解析(数学的表現)→ 図的表現→ 解釈
という手順をたどる.この例からも,最初に現象への良質の洞察がなければ,適切な変数を用意できないし,その段階でデータの質が決定され,最終的な出力結果を制約することが容易に想像できるであろう.最後の解釈は最初のデータを超えることはできない.
付録としてSAS言語による表現を以下に示す.
data shu2000 ;
infile cards ;
input paper$ v1 - v4 ;
array vv(4) v1 - v4 ;
do i = 1 to 4 ;
vv(i) = 4 - vv(i) ;
end ;
label
v1 = "安定多数"
v2 = "首相続投"
v3 = "与党減少"
v4 = "民主躍進"
;
cards ;
日経 1 1 2 3
産経 1 2 3 3
読売 2 3 1 1
朝日 2 4 1 1
毎日 3 2 0 1
;
run ;
%biplot( data = shu2000, var=v1 v2 v3 v4 , id = paper , plot = y ,
factype = jk , scale =2, hlength = 7cm, vlength = 7cm )
■予備サンプルとは何か (2000.8.27)
統計学者であれば,身を震わせて拒絶反応を示すのではなかろうか.あるいは完全に無視するであろうか.実際,統計学者による参考書・教科書には「予備サンプル」という用語は出てこない.理論的には容認しがたいからであろうか.堂々と予備サンプルが語られているのは市場調査の分野である.
supplementary sample.
または追加サンプル.調査不能等による不足分を穴埋めするために,予備サン
プルを用意することがある.回収率を計算するとき,ふつう,この予備サンプ
ルの使用分を入れないので,見掛けの回収率が高くなる.しかし調査しやすい
対象のみにサンプルが偏る傾向はかえって増幅されて,標本誤差の点からはあ
まり有効な方法とはいえない.
無作為抽出された対象のうち調査不能分を,予備サンプルの中から特性がそれ
に近い他の対象で置きかえる場合もある.もちろんこのほうが偏りが小さくな
る.(日本マーケティング・リサーチ協会編(1998)新版マーケティング・リサーチ用語辞典.同友館)
「調査不能等」の「等」が微妙である.住民基本台帳や選挙人名簿を抽出フレームとして利用すると,調査実施時点で転居・死去などで抽出フレームそのものが不備であることが明らかになる.それを補うために利用される.
一方,調査業界には「目標回収率」という言葉がある.これは回収率の高さが調査の品質そのものであるような風潮が背景にある.回収率を達成せんがために,回答拒否者に対しても予備サンプルを適用するのは問題である.また,愚直にまじめに実査をやっても首都圏の調査では回収率を 80% にすることは現在はほぼ不可能であることも認識する必要がある.また「回収率=調査の質」と考えるのも現実的ではない.
■「調査は実態ではない」 (2000.8.27)
林知己夫氏がしばしば書くことの中で「調査は実態ではない」という指摘は,机上の空論ではない.さまざまな問題がこの逆説に込められている.
ある調査である政党の支持率が55%と出ると,本当に55%の人が支持していると受け取る.しかし,本当はこの55%という数字は,世間の人々のかなりの部分,まあ半数以上が支持しているようであるという指標にしかすぎない.質問の仕方を変えれば,また別の数字が出てくるかもしれないのである.(林知己夫(1993)行動計量学序説.朝倉書店)
調査は実態に迫ろうとするけれど,調査結果の数字をそのまま実態だと信じている調査専門家はいない.特に予測問題では調査の信頼性( reliability of mesurement )は重要だが,信頼性さえ高ければ,系統的な偏りがあってもかまわない.偏りを発見し構造化すればよいからである.世論調査の場合は,そう朗らかに割りきれないが,各社で複数の数字が出ることで救済される.念を押す必要はないと思うが,調査がいい加減でもいいという意味ではない.
調査結果の数字が実態と違うことに「ウソだ,ウソだ」と叫ぶ姿は,素人呼ばわりされても仕方ない面もある.
■2刷以降の修正 (2000.12.21)
講演原稿を書こうと思って,ひさしぶりに書店で本を手にすると記述修正があることに気がついた.2刷では以下のようになっている.
<p.31>
[1刷]数理統計研究所
[2刷]ある研究所
[1刷]これはプライヴァシーを主たる理由として公開を禁止する,「統計法」と呼ばれる法律による.
[2刷]これはプライヴァシーを主たる理由とするケースや,「統計法」(指定統計・届出統計)を根拠とするケースである.
<p.13>
[1刷]PTA代表宣言文
[2刷]前述の宣言文
6月に初版で,すでに翌月の7月に2刷が出ている.パラパラとめくっただけで3箇所も修正されている.ほかにもあうだろう.別の書店で目にした限りでは6刷まで確認した.この半年間,毎月増刷のペースだ.かなり売れていると言うことか?.編集部に「いま何刷まできているか」問い合わせたが返事はもらえなかった.
▼ 守一雄氏(信州大学・教育学部教育科学講座)による書評
▼ 中澤港氏(東京大学・大学院医学系研究科国際保健学専攻人類生態学教室)による書評
|