M-1グランプリ2017の審査に対する数学的な反論「1点の格差」「トップバッターは不利」
目次
まえがきと前提条件は飛ばしても本編を読む分には問題ありません.
まえがき_モチベーション,万人が納得する審査とは
前提条件_審査基準を紐解く
本編_審査結果に対する数学的な反論
問題提起_審査方法の欠点
・1点の格差問題_審査員のパワーバランス
・ネタ順問題_トップバッターは本当に不利なのか?
結論_まとめ,勝利の行方
あとがき_謝辞
まえがき
モチベーション,万人が納得する審査とは
私はお笑いが好きだ.
トークを聞くよりネタを見るのが好きで,好きな芸人もさらば青春の光や東京03など,ネタをしっかりやるイメージのコンビが多い.
そんなわけで,さらば青春の光がキングオブコントやM1グランプリで未だ優勝できない状況を誠に遺憾に思う.
_____乱暴ながら「あんなに面白いネタなのになぜ優勝できないんだ,審査員の採点どうなってんだ!私が審査した方が(略」と思ってしまうこともある.
オタクは思い込みが激しいのである.
(大切なことは全てHUNTER×HUNTERが教えてくれたって本出せば売れると思う.)
私(素人)が審査する方が万人が納得する審査ができる,なんてことはありえないだろう.
私は様々な点でさらば青春の光のネタこそ世の中で一番面白いと思ってるが,所詮はオタク気質な20代男性の「好み」にしか過ぎず,世論が支持するのはトレンディエンジェルなのである.その結果が一昨年(2015)のM-1グランプリの結果だろう.自分の好きなものが世間に認められないのは悔しい
ただ,大衆に理解されないことで逆にニヤリとしてしまう部分も否定できない.オタクは俺だけが分かってるという優越感に浸りがち.
小説やマンガを「マイナーなんだけど」とオタクが付けて呼ぶときには二通りあると思います。
1、「知らないよね、ごめん、申し訳ない、でもしゃべりたいんだ」という下手にでる気持ち。
2、「知らないよね、オレ知ってるよ、どうだ、すごいべ」という上手にでる気持ち。
オタクが「これってマイナーなんだけど」と言う時のキモチ。 - たまごまごごはん
私はこの「俺だけが分かってるという優越感」はお笑いの審査において重要なキーワードだと考える.この「俺だけが分かってるという優越感」を端的に言い換えると「差別」である.
笑いは差別だ、とは中島らもの至言である。
笑いとは差別であるーバカリズムの演じる女性と柳原可奈子の演じる女性の違い - izumishiyou's diary
ネット上の評価を見ると,M1グランプリは2008のNONSTYLE優勝あたりから審査を疑問視する声が大きくなってきたように感じる.恐らく,その原因はNONSTYLEの芸風であるテンポのいいネタが誰にでも分かりやすくて万人受けするネタだからだと思う.
要は,皆に面白さが伝わって「俺だけが分かってるという優越感」が得られにくい,「差別」しにくいNONSTYLEのネタはドヤ顔効率が悪いのだ.
(それでも私はNONSTYLEのネタが大好きです.)
「差別」と書くと聞こえが悪いが,要するに誰にどれだけハマるかという「好み」である.
人それぞれ好みが違うのだから俺と世間一般と審査員とで面白さの評価が一致しないのは当然である.しかも,先述の「自分だけが分かってるという優越感が面白さを生む」という仮定が正しいならば,万人が納得する審査は理論上不可能である.
前提条件
審査基準を紐解く
長々と書いたが,万人が納得する審査は理論上不可能であることはこの記事を読む前から皆様も重々承知だろう.
それでは,テレビに出てる審査員はいったい何を基準にネタの面白さを審査しているのか?それに関するハッキリとしたソースはないため,私の予想であるが,おおよそ
①絶対的な面白さ ②独創性や新規性 ③スタイル ④技術や練習量 ⑤観客の笑い声 という観点で評価しているのではだろうか.
①の絶対的な面白さは2005年のブラックマヨネーズや2006年のチュートリアルのようなネタの方向性や好みを超えた絶対的な笑いの量,いわばスカラーである.
②の独創性や新規性は2004年南海キャンディーズ,2008年オードリー,2009年ハライチ,2010年スリムクラブ,最近のさらば青春の光やジャルジャルに代表されるような漫才の常識をぶち壊す,簡単に言うと王道ではない変わったネタのスタイルである.
③,④,⑤はそのままなので説明を省く.
それっぽく書けば,
審査員の点数 = a × ①絶対的な面白さ + b × ②独創性や新規性 + c × ③スタイル + d × ④技術や練習量 + e × ⑤観客の笑い声
と表すことができ,この重みa~eの取り得る値が違うから審査員によって点数が異なるわけだ.例えば,bの値が高い審査員はジャルジャルのような漫才っぽくないコンビのネタに対し高い点数をつける.そして,その重みa~eの値こそが審査員の好みである.
(松本人志はネタの独創性や新規性について高く評価するのに対し,
島田紳助にはむしろマイナス効果っぽいのは何となく伝わると思う.)
審査員によって①〜⑤のどの項目を重要視するかは違っても良いと思うし,むしろ違うからこそ色んなネタが評価されるのだと思う.
本編
審査結果に対する数学的な反論
問題提起
審査方法の欠点
それでは何が問題なのか?その説明は今年のM1グランプリで各審査員が実際に付けた点数を見ていただいた分かりやすい.大きく分けて2つある.
上の表を見て恐らくこう思ったはずだ.
・松本人志と上沼恵美子の点数のバラつきデカくね?この二人にハマったコンビが有利じゃん!(1点の格差問題)
・ネタの順番前半のコンビ不利じゃね?トップバッターのコンビは会場温まってないんだから不利じゃん!(ネタ順問題)
1点の格差問題
審査員のパワーバランス
選挙で言う一票の格差のようなもので,複数人で審査する以上,どうしても発生しまう有権者のパワーバランスの問題である.
一票の格差とは…
これを踏まえて,もう一度今年の審査結果を見ていただきたい.
松本人志と上沼恵美子は最高点と最低点の差が10点以上あるのに対し,春風亭小朝はわずか5点差である.さらに言えば,春風亭小朝がつけた最低点の89点は松本人志や上沼恵美子がつける点数の平均点とほとんど差がない.
よって,春風亭小朝から面白くないと思われても松本人志か上沼恵美子からのウケがある程度あれば全く問題ないと言える.
逆に言えば,松本人志か上沼恵美子に低いを点数をつけられることは致命的である.
つまり,審査員間のパワーバランスが公平でないため,点数の付け幅が広い特定の審査員に気に入られるネタをした方が有利になる状況が発生してしまっている.
※あえてこのタイミングで強調するが,この問題は誰が悪いというわけではない.
当たり前の話だが,松本人志も上沼恵美子も審査経験豊富だし,自身がトップクラスの芸人だったこともあり,あらゆるジャンルの笑いに理解があり,常に一定の基準でちゃんと公平な審査をしている.点数の付け幅が広いのは厳密な審査で細かい部分も評価に反映させようとした結果であり,むしろ他の審査員よりM-1に懸ける熱量は強いともいえる.
M-1 は素晴らしい大会です。
— 松本人志 (@matsu_bouzu) 2017年12月3日
あんなに漫才のやりやすい環境を作ったお客さんとスタッフにも感謝やな〜。こんな素敵な大会がオレ等の頃にもあったらなぁ〜。少し羨ましいです。
とろサーモン おめでとう。
(ダウンタウンは若手時代,審査員に恵まれず苦労したらしいね)
ネタ順問題
トップバッターは本当に不利なのか?
言わずもがな.
M-1に限らず一般にあらゆる審査において,トップバッターは後の参加者の基準となるため,高得点は得られにくいとされている.特にお笑いにおいては,会場が温まっているかは重要である(実際,大会中も司会の今田耕司や審査員らが言及している.)
逆に,ネタ順が後ろであれば有利であり,2007−2016年のM1では敗者復活(=ネタ順最後)から勝ち上がった全てのコンビがそのままFINALラウンドに進んでいる.
(2007年は特に熱かった.芸人のこーいうのに弱い.)
実際のところネタ見せの順番は順位にどれくらい影響をおよぼすのか?
先述の通り,確かにトップバッターは不利なような気がするが,2005年の笑い飯はトップバッターにも関わらず3位通過でFINALラウンドまで進んでいるという反例もある.
検証
パラレルワールドはあったのか?
先程挙げた2つの問題
1点の格差問題:審査員間のパワーバランスが公平でないため,点数の付け幅が広い特定の審査員に気に入られるネタをした方が有利である
ネタ順問題:前半ほど不利で,後半ほど有利である
これらについて,数学的(正確には統計学)に検証する.
1点の格差問題についての検証は,「審査員間のパワーバランスを公平に調整した場合,実際の順位に入れ替わりが起こるか」を調べれば良い.
具体的には,点数の付け幅をできるだけ統一する.そのため,審査員全員の点数をその年で点数の付け幅が一番小さい審査員の最高点・最低点に合わせて正規化する.
この方法ならば各審査員の好み(審査基準)や各自が考える順位を変えずに審査員間のパワーバランスを公平にすることが出来る.
(実際あの感じで言われたらキレそう.)
理屈を説明するより調整した結果を見ていただいた方が早い
松本人志と上沼恵美子の最高点と最低点の差が調整前より小さくなっており,審査員全員の最高点と最低点の差が同じになっていることが分かる.
実際の順位と比較すると,調整前後で順位に変動はなく,2017年の審査では1点の格差による問題が起きてないことが分かる.つまりM1の審査は数学的にも精度が良いのである.
同じ調子で2016年,2015年,2010年…と遡って調べていったが,順位が入れ替わるようなことはなく,オタクの反論は虚しく終わった.
(笑い飯とナイツの順位が)入れ替わってるーー
(オタクだから流行には逆らいたかったけど,普通に面白かった.)
パラレルワールドはあった.流石にFINAL進出かかった3位と4位間での入れ替わりは大問題だ.
ちなみに昔のM1になればなるほど,審査員間のパワーバランスは不均衡だった.ただ,基本は順位の入れ替わりはなくて,あったとしても9位と8位とかFINAL進出には影響ない順位間だった.
逆に言えば近年のM-1では順位に影響を及ぼすレベルでパワーバランスが不公平になっていることはないため,特に気にしなくても良さそうだ.
ネタ順問題の検証は単純で,各年のネタ順と順位を用意しネタ順を前半と後半で区切り,明確な差があるかどうかを調べれば良い.
以下に結果示す.赤文字は敗者復活から出場したコンビである.
ネタ見せ1~2番目,1~3番目,1~4番目でそれぞれ区切り,それ以降の順番との比較を行っている.有意差があるかどうかを調べている.
この結果から
・ネタ見せ前半のコンビは後半のコンビに比べてほぼ順位2つ分損する
・前半不利&後半有利の傾向は2007年以降特に顕著になっており,特にネタ見せ最後の組(≒敗者復活組)のアドバンテージは圧倒的である.
・不利であるはずの前半で1stラウンド3位をとったとろサーモンと笑い飯は相当な実力者である
といえる.こんなにも以前から何となく分かっていたことだが,数字にするとこんなにも明確な差があるとは思っていなかった.
そう考えると今年から導入された笑神籤(えみくじ)システムはかなり良い試みであったと思われる.ネタ見せ前半が不利な点は全く改善していないが,敗者復活によるアドバンテージを無くし,公平にしている.
結論
まとめ,勝利の行方
まとめとして,
・近年では審査員によって点数のバラつき方が違いすぎる影響で順位が入れ替わることはほとんどないが,過去にはFINALに出場するコンビが入れ替わった年もある.
・ただし,点数の付け幅のバラつきは年々小さくなっている.
・ネタ見せ順トップバッター〜4番目は明確に大幅不利であり,その傾向は年々強くなっている.
・敗者復活組は昨年まで超有利だったが,笑神籤システムによってそのアドバンテージはなくなった.
つまり,M1の審査システムはよく出来ているし,年々改善されている.2017年の審査も異議なし.という私の完敗で終わる結論になった.
(ポジティブに考えれば,推しが負ける ≒ もっと面白いコンビが出たってこと
だから見る側としては幸せなのかもしれない)
あとがき
_謝辞
結果的にやっぱM-1ってすげぇなという情報量0の記事になってしまった.
ネタのスタイルと審査結果の標準偏差を見て,王道ネタが良いのか邪道ネタが良いのかなど色々分析ネタはあったのだが,ネタのスタイルなどを語るには私のお笑いに対する理解が足りないなと思ったので,とりあえずこんな感じで.
最後に…
今回のM1に出てない芸人でも面白いネタをする芸人はたくさんいるので,Gyaoで準々決勝や準決勝の動画を見たり,劇場に行って生で見るのもオススメです.
M-1審査結果まとめ(Google スプレッドシートです.分析するときデータ入力するの手間だと思うので,ぜひご活用ください.)
読んでいただきありがとうございました.
追記 他の方はどういう風に考えてるのかなーと思って調べたら物凄い良記事があった.
別の方がフィギュアスケートの審査方式で分析してくださった