363. 世論調査と組織票
- 2017/10/24
- 19:46
世論調査というのがありますよね。
一般的にその数字は、日本の有権者の意見の推定をした推定値として
信用のおける物であると考えられています。
ただし、推定値なんです。
なので、
どのように推定したのか、
自分たちの用いている道具(推定に使っている手段)がどんなもので、
現実社会でどのように使ったことになっているのかを
考慮に入れないと、
出てきた数字のより正しい判断をすることが出来なくなってしまいます。
前回の記事で、
僕は、世論調査で公表されている数字が正しいという前提で、
出てきている数字が30%ぐらいなので、
自民党を支持する人の割合は実際には15~30%ぐらいと、
推定しました。
15%というのはひどいのではないかと思う方もいらっしゃるかもしれませんが、
半分の人が答えているので、
半分の値が実質上確実にいる人数を反映した数字です。
ですから、これより下にはなりません。
さて、世論調査というのは、
公平に標本抽出した人に電話をかけて、
答えてもらっている
というシステムです。
公平に標本を抽出するのは、
ランダムに選べばよいので、
人数が多ければ、
元の母集団(僕たち全有権者)の様子が強く反映されるでしょう。
しかし、世論調査の結果として用いられている数字、
「XXは○○%でした」という結果を出すために、
「公平に選ばれた人が答えたか、否か」という
人為的な選択原因が必ず含まれています。
たまたま、時間的な都合が悪くて、
答えられなかったというのは、
人数が多ければ、公平に、
時間的に都合の良かった人、悪かった人で2分されるかもしれません。
しかし、もし、「必ずなんとしても答える」という意志を持った人がいたとしましょう。
つまり、ある組織から、その組織の賛同者が多く見えるように、「必ず電話に出て支持していると答えなさい」という
指令をもらっている人がいたとします。
また、指令をもらっていなかったとしても、「必ず支える」と思っている人は、
時間的に都合がよい、悪いという50%(おそらく)のフィルターがかからず、
100%となりますので、
「電話に出て答えたか否か」という要素が、
世論調査が公平な調査にならない要因
になります。
また、「支持している」と答えた人の割合から、
どのように全有権者の「支持している」人の割合を求めるのが、
妥当かということを述べたいと思います。
議題はこんな感じで、
「世論調査における全抽出者の推定をしたいんだけど。」
です。

組織票(100%何があっても答える人)があった場合、このようになります。

なので、組織票が100%だった場合、
世論調査の公表値の半分ということになります。
(x=公表値の半分でy=0なので、実際は公表値の半分)
組織票の割合が少なくなればなるほど、
世論調査の公表値の値に近くなるということです。
(x=0ならば、y=公表値の半分で、実際は公表値に一致)
世論調査で30%とでた場合、
答えた人の確実な割合は15%です。
その中の組織的に動いている人が多い団体だと、
全体での割合は15%になるでしょうし、
動いている人が少ない団体だと、
全体での割合は30%に近い値になると考えられます。
ですから、半分の値から公表値までという推定をしました。
(原理的にはどの値でもそう考えられると思います。)
また、組織票でない人が多い場合、
「100%答えたくない人」で支持者もいるでしょうから、
例えば、かかってきた電話に対して「あなた、誰?怪しい」と思った人など、
世論調査の公表値以上の値になる可能性もあります。
しかし、30%という低い値ですし、
人気があるように見せた方が有利でしょうから、
「100%答えたくないけれど、支持している人」というのが
大多数を占めるとは考えにくいです。
そのため、30%から上乗せはとりあえずしていません。
(もっと値が高いとそういう人の影響が大きくなると思います。)
そして、
特に、
支持者が指令に従って動いている人ばかりだったとすると、
世論調査の値が倍の数字になってしまっている可能性が高い
ことになります。
ところで、
今回の選挙で、
どうやら、自民党は出来る限り自分たちに有利になるように選挙戦をしかけ、
さらに、台風が来たということもあって、投票率が半分ぐらいの低い値になりましたので、
組織的に動いている人の影響が大きく出やすくなりました。
どちらかというと自民党支持者にとって、
投票した方が確実に有利な状況で、
比例のほうで20%ぐらいの値がでているので、
(自民党支持者の人は確実に投票したんじゃないかと思うのですが、
投票出来なかった人はいるかもしれませんが、
投票に行ける人で投票に行ってないということは、支持者ではなさそうですよねぇ。)
世論調査と組み合わせて考えると、
「組織票があるのかしら?」
という結論になるんですよね。
世論調査の推定値の間の値になってますから。
実際にあてはめてみると、
朝日新聞さん的には32%の支持率という答えで、
20%ぐらいの自民党への投票率ですから、
(比例を例に)
「12%が100%答えたい人(組織票を含む)だったのかな?」
という結論になるんじゃないでしょうか?
つまり、x+y+y=20で、(x+y)x2=32より、
「x=12%(100%絶対に答えたかった人)
y=4%(時間的に都合が付けば答えたい人)
だったのかしら?」
ということです。
そういう結論で行くと
全有権者の12%の人が非常に自民党を応援、
全有権者の8%(=yx2)の人が投票するぐらいには積極的
だったということなんでしょうか?
世論調査で見受けられるのは
だいたいが
答えている人が半分ぐらいなので、
出てきた数字をそのまま推定値にしているんだと思うんですが、
(良心的に想像すると、ですが。)
支持者層の姿によって、
さらに、支持すると答えた人の割合の値によって、
世論調査の結果でてきた数字の解釈を変えて
推定しないといけない
と思うのですよ。
NHKのAIの時も書きましたけれど、
自分がどんな道具を使って世界を見ているのか
きちんと把握しないといけないです。
(調査の基本です。)
<追記>2017.10.24
276. 信じちゃっていいのかしら?で書いたのは、
標本の数が少なすぎないかしら???
ということでした。
原理的に上記で書いた世論調査における公平性を欠く結果解釈の要因はありましたが、
今回の選挙で、
原理的に上記で書いた公平性を欠く結果解釈を招く要因が現実的に存在しそうだ
というように思えましたので、
半分の値から公表値までという推定を公表しました。
一般的にその数字は、日本の有権者の意見の推定をした推定値として
信用のおける物であると考えられています。
ただし、推定値なんです。
なので、
どのように推定したのか、
自分たちの用いている道具(推定に使っている手段)がどんなもので、
現実社会でどのように使ったことになっているのかを
考慮に入れないと、
出てきた数字のより正しい判断をすることが出来なくなってしまいます。
前回の記事で、
僕は、世論調査で公表されている数字が正しいという前提で、
出てきている数字が30%ぐらいなので、
自民党を支持する人の割合は実際には15~30%ぐらいと、
推定しました。
15%というのはひどいのではないかと思う方もいらっしゃるかもしれませんが、
半分の人が答えているので、
半分の値が実質上確実にいる人数を反映した数字です。
ですから、これより下にはなりません。
さて、世論調査というのは、
公平に標本抽出した人に電話をかけて、
答えてもらっている
というシステムです。
公平に標本を抽出するのは、
ランダムに選べばよいので、
人数が多ければ、
元の母集団(僕たち全有権者)の様子が強く反映されるでしょう。
しかし、世論調査の結果として用いられている数字、
「XXは○○%でした」という結果を出すために、
「公平に選ばれた人が答えたか、否か」という
人為的な選択原因が必ず含まれています。
たまたま、時間的な都合が悪くて、
答えられなかったというのは、
人数が多ければ、公平に、
時間的に都合の良かった人、悪かった人で2分されるかもしれません。
しかし、もし、「必ずなんとしても答える」という意志を持った人がいたとしましょう。
つまり、ある組織から、その組織の賛同者が多く見えるように、「必ず電話に出て支持していると答えなさい」という
指令をもらっている人がいたとします。
また、指令をもらっていなかったとしても、「必ず支える」と思っている人は、
時間的に都合がよい、悪いという50%(おそらく)のフィルターがかからず、
100%となりますので、
「電話に出て答えたか否か」という要素が、
世論調査が公平な調査にならない要因
になります。
また、「支持している」と答えた人の割合から、
どのように全有権者の「支持している」人の割合を求めるのが、
妥当かということを述べたいと思います。
議題はこんな感じで、
「世論調査における全抽出者の推定をしたいんだけど。」
です。

組織票(100%何があっても答える人)があった場合、このようになります。

なので、組織票が100%だった場合、
世論調査の公表値の半分ということになります。
(x=公表値の半分でy=0なので、実際は公表値の半分)
組織票の割合が少なくなればなるほど、
世論調査の公表値の値に近くなるということです。
(x=0ならば、y=公表値の半分で、実際は公表値に一致)
世論調査で30%とでた場合、
答えた人の確実な割合は15%です。
その中の組織的に動いている人が多い団体だと、
全体での割合は15%になるでしょうし、
動いている人が少ない団体だと、
全体での割合は30%に近い値になると考えられます。
ですから、半分の値から公表値までという推定をしました。
(原理的にはどの値でもそう考えられると思います。)
また、組織票でない人が多い場合、
「100%答えたくない人」で支持者もいるでしょうから、
例えば、かかってきた電話に対して「あなた、誰?怪しい」と思った人など、
世論調査の公表値以上の値になる可能性もあります。
しかし、30%という低い値ですし、
人気があるように見せた方が有利でしょうから、
「100%答えたくないけれど、支持している人」というのが
大多数を占めるとは考えにくいです。
そのため、30%から上乗せはとりあえずしていません。
(もっと値が高いとそういう人の影響が大きくなると思います。)
そして、
特に、
支持者が指令に従って動いている人ばかりだったとすると、
世論調査の値が倍の数字になってしまっている可能性が高い
ことになります。
ところで、
今回の選挙で、
どうやら、自民党は出来る限り自分たちに有利になるように選挙戦をしかけ、
さらに、台風が来たということもあって、投票率が半分ぐらいの低い値になりましたので、
組織的に動いている人の影響が大きく出やすくなりました。
どちらかというと自民党支持者にとって、
投票した方が確実に有利な状況で、
比例のほうで20%ぐらいの値がでているので、
(自民党支持者の人は確実に投票したんじゃないかと思うのですが、
投票出来なかった人はいるかもしれませんが、
投票に行ける人で投票に行ってないということは、支持者ではなさそうですよねぇ。)
世論調査と組み合わせて考えると、
「組織票があるのかしら?」
という結論になるんですよね。
世論調査の推定値の間の値になってますから。
実際にあてはめてみると、
朝日新聞さん的には32%の支持率という答えで、
20%ぐらいの自民党への投票率ですから、
(比例を例に)
「12%が100%答えたい人(組織票を含む)だったのかな?」
という結論になるんじゃないでしょうか?
つまり、x+y+y=20で、(x+y)x2=32より、
「x=12%(100%絶対に答えたかった人)
y=4%(時間的に都合が付けば答えたい人)
だったのかしら?」
ということです。
そういう結論で行くと
全有権者の12%の人が非常に自民党を応援、
全有権者の8%(=yx2)の人が投票するぐらいには積極的
だったということなんでしょうか?
世論調査で見受けられるのは
だいたいが
答えている人が半分ぐらいなので、
出てきた数字をそのまま推定値にしているんだと思うんですが、
(良心的に想像すると、ですが。)
支持者層の姿によって、
さらに、支持すると答えた人の割合の値によって、
世論調査の結果でてきた数字の解釈を変えて
推定しないといけない
と思うのですよ。
NHKのAIの時も書きましたけれど、
自分がどんな道具を使って世界を見ているのか
きちんと把握しないといけないです。
(調査の基本です。)
<追記>2017.10.24
276. 信じちゃっていいのかしら?で書いたのは、
標本の数が少なすぎないかしら???
ということでした。
原理的に上記で書いた世論調査における公平性を欠く結果解釈の要因はありましたが、
今回の選挙で、
原理的に上記で書いた公平性を欠く結果解釈を招く要因が現実的に存在しそうだ
というように思えましたので、
半分の値から公表値までという推定を公表しました。