★阿修羅♪ > Ψ空耳の丘Ψ41 > 190.html ★阿修羅♪ |
Tweet |
(回答先: Re: 今回の精度は? 投稿者 一鍼多助 日時 2005 年 9 月 14 日 12:48:10)
まず初めに、私は統計の専門家でも、この種の調査に携わったことがあるわけ
でもなく、ただ手元の本などを参照して書いているので、間違っている可能性
が常にあることをお断りさせていただきます。
出口調査による予測の精度が異常だったかどうか、過去と比べて上がったか
どうかは、残念ながら私には判断できません。
もし精度が上がったとすれば、サンプル数、調査場所や時間帯、聞き取り対象
の選別、地域固有の情報の扱いなどについてノウハウの向上があったのかも知
れません。
いずれにせよ、今回の選挙速報番組の調査結果について、見かけだけから云々
できるようなことはありません。
これだけではあまりに身も蓋もないので、参考のため、世論調査などにおける
サンプル数と精度との関係について、初等的な統計学の本に載っているような
計算を示すとともに、出口調査による予測の方法についても想像して、お茶を
濁すことにします。
[1]
N人からなる母集団(例えば有権者全体)が、該当者(例えば支持者)をK人含
むとし、その母集団からn人のサンプルをランダムに取り出したとき、その中
の該当者数をxとします。
途中の議論は省略して結論だけを述べると、このようなn人のサンプリングを
繰り返したとき、xは一般に超幾何分布に従いますが、通常の調査では、
N >> n >> 1
なので、x、および、それぞれのサンプルで該当する人の割合(サンプル支持
率)p = x/n は正規分布で近似されます。
(n >> 1 がない場合は二項分布になります。)
pの平均、分散はそれぞれ、
E(p) = E(x)/n = P (1)
σ(p)^2 = P*(1-P)/n (2)
(P = K/N:母集団での該当者の真の割合(真の支持率))
で与えられます。
式(2)から、pの標準偏差(ばらつき、精度)σ(p) は√nに反比例し、精度を
2倍上げるためには、サンプル数nを4倍にする必要があることがわかります。
正規分布の場合、pが、E(p)±σ(p)(平均±標準偏差)の間に入る確率は
68.3%、E(p)±1.96σ(p)の間に入る確率は95%になります。
例として、pが±0.5%(%表示の有効数字が1の位まで)の範囲に入る確率が95%
(信頼度95%)となるようにするためには、0.5% = 1.96σ(p) とすればよいの
で、式(2)を用いて、
(0.5%/1.96)^2 = P*(1-P)/n
よって真の支持率 P = 50%に対しては、n = 約3.8万のサンプルが必要になり
ます。
同様に、±0.5%に入る確率を68%にするためには、0.5% = σ(p)により、
n = 1万となります。
[2]
新聞社による内閣支持率などの調査では、概ね n = 1500 程度だったと
記憶しています。
そこで式(2)から、真の支持率 P = 50% に対して、
±σ = ±1.3%
となり、サンプルでの支持率 pが50±1.3%の範囲に入る確率は68%ということ
になります。
また、別のpの範囲とpが入る確率は、正規分布表から、
±0.5% = ±0.387σ; 29%
±1.0% = ±0.775σ; 56%
となります。
つまり、同じ対象に対するサンプル数1500程度からなる、複数の独立した調査
があったとき、真の支持率P = 50%に対する結果は、約半数(56%)が±1.0%の
範囲内に入り、残りの結果がより離れて分布するということです。
従って、もし結果の分布が互いにあまりに近くに集まっていたり、逆に離れ過
ぎている場合は、調査方法に何らかの問題のある可能性があるということにな
ります。
独立した調査の数は多いほどわかりやすいのですが、実際には数社の結果しか
ないので、確実なことを言うのは難しそうです。
また、真の支持率が P = 25%(と75%)のとき、pの範囲とpが入る確率
は、
±0.5% = ±0.447σ; 34%
±1.0% = ±0.894σ; 63%
±σ = ±1.12%; 68%
真の支持率が P = 10%(と90%)のときは、pの範囲とpが入る確率は、
±0.5% = ±0.645σ; 48%
±1.0% = ±1.29σ; 80%
±σ = ±0.77%; 68%
のようになります。
(ただし、以上では正規分布表の読み間違いなどがあるかも知れません。)
実際の出口調査からの当落予想の仕方は知りませんが、一つの方法として世論
調査と同じように、各候補者の得票率をサンプルから推定することが考えられ
ます。
一番得票率の高い候補者が、誤差を考慮しても他の候補者をある程度以上引き
離していれば当確と判断し、差が近い場合は逆転する確率を考慮して、当落数
予想の誤差に含めるわけです。
ついでに、TVの視聴率調査の場合はサンプル数が600とされていて、上記の
場合の1/2.5なので、式(2)からσが1.6倍に広がり、誤差が大きくなります。
従って、調査結果では小数点以下どころか±1%程度の変動も統計的に有意とは
言えません。
▲このページのTOPへ HOME > Ψ空耳の丘Ψ41掲示板