食べログの口コミ改ざん疑惑を数学的に検証して分かった驚愕の事実!

シェアする(SHARE)

  • このエントリーをはてなブックマークに追加
  • Evernoteに保存Evernoteに保存
  • 4
スポンサーリンク(Sponsored link)

親愛なる読者諸君!
オタクパパだ!

昨今、この日本において、森友問題をはじめとして、

捏造や改ざんの問題

が大いに話題になっている。

実際、ここ数年間の間に起こった捏造・改ざんに関する主要な出来事を列挙すると、以下のとおりだ。

2012年

・東大病院の特任教授によるiPS細胞騒動

・阪急阪神ホテルによるメニュー偽装

2014年

・STAP細胞の捏造疑惑

・五輪エンブレムのパクリ疑惑

・自称全盲作曲家によるゴーストライター詐欺

・東大分子細胞生物学研究所の論文捏造と改ざん

2015年

・フォルクスワーゲンによる排ガス改ざん不正

・東洋ゴム工業による免震ゴムデータ偽装

・東芝の不正会計疑惑

2016年

・三菱自動車の燃費不正問題

2017年

・神戸製鋼所・三菱マテリアル・東レによる品質管理データの改ざん問題

・日産・スバル検査不正

2018年

・京大iPS細胞論文捏造

・裁量労働制データ捏造

・森友改ざん問題

このように、ここ数年間だけでも、

政府や大企業、大学など

による捏造・改ざんの問題が

立て続けに発覚している

のだ。

しかも、このような傾向は日本一国だけの話でなく、もはた全世界的な潮流ともいえる。

なにせ、

フォルクスワーゲンや

エンロン、ベル研究所などの

世界的なグローバル企業や

超一流の研究機関でさえも

捏造や改ざんなどの不正を

堂々とおこなっている

のだ!

それゆえ、21世紀のこの現代は、まさしく

捏造・改ざんの時代

あるいは、

偽りの時代

といっても過言ではないだろう。

ここで、あなたは次のように考えるかもしれない。

「ちょっと待てよ?

 政府や大企業、大学が

 これだけ捏造・改ざんを

 しまくっているのなら

 もっと身近なサービスだって

 捏造や改ざんをしまくっている

 んじゃないのか?」

そう考えたあなたは、なかなか

鋭い直感の持ち主

といえる。

そう!

実際、まさしくその通りなのだ!

というわけで、今回は、我々にとって、もっとも身近ともいえる

大手グルメサイト

「食べログ」

改ざん疑惑の真相

について、

数学的に

検証した結果

を紹介したいと思う。

スポンサーリンク(Sponsored link)

「食べログ」の口コミ改ざん疑惑とは?

昨今、我々にもっとも身近になった食の口コミサービスといえば、大手のグルメサイトの

「食べログ」

があげられる。

ところで、実をいうと、この「食べログ」については、これまで、

「食べログ」が

改ざん行為をしている

のではないか?

という黒い疑惑がさまざまなところで指摘されているのだ。

例えば、下の本のAmazonレビューには、

「食べログ」の黒すぎる実態

が詳細に報告されている。

それによると、とあるレビュアーが「食べログ」に悪いレビューを書いたところ、

「店に都合が悪いことは

 書くな」

「食べログ」から修正依頼が来たそうだ。

それだけではない!

削除依頼にしぶしぶ応じたレビュアーが該当箇所を削除して、

「他に書きたいことあったけど利用規約違反とのことで削除しました」

と書いたところ、再び「食べログ」から連絡があり、

「修正したことが分かる

 書き方はするな」

と、

修正の痕跡が

一切残らないよう

証拠隠滅を指導された

という。

また、下の本のレビューにも、同じように「食べログ」から理不尽な目に遭ったレビュアーの不満が報告されている。

このレビュアーによると、「食べログ」のやらせ問題を堂々と批判したところ、なんとレビューだけでなく、

アカウントごと削除された

そうだ。

だが、彼女は、そのような不当極まりない仕打ちにもめげず、Amazonのレビューにも食べログの批判を書いたところ、価格コムからのクレームを受けて、

Amazonのレビューまで

削除された

という。

また、上でとりあげた報告以外にも、ショップに都合の悪い口コミはあっさりと削除され、高評価の偏ったレビューだけが残るという不可解な事例が、「食べログ」に書き込んだことのあるブロガーによって報告されている。

参考

まとめ■口コミはGoogleマップに書き込むべし 僕はこういうブログをやっていま...

この「ブログなんかめんどくせえよ」の管理人であるブロガー、luna luna氏によると、

史上最悪の口コミ

プラットフォームは

「食べログ」

だそうだ。

というのも、luna luna氏は、「食べログ」の初期の頃に何回か書き込んでみたそうだが、

評価の低い口コミは

「すぐに削除」される

ため、口コミサイトとしては、どうにもならなかったという。

それゆえ、luna luna氏は、「食べログ」について、次のように断言する。

「今まで書いた中で、どのサービスが最悪だったかと云われれば間違いなく『食べログ』です。」

このように、

レビュアーやブロガー

の多くが「食べログ」

の改ざん疑惑を

指摘している

のだ!

「食べログ」の改ざん疑惑は本当か?

だが、ここで結論を下すのはまだ早い。

なぜなら、「食べログ」が低評価の口コミを削除したということは、「食べログ」に書き込んだレビュアー本人にしか分からないからだ。

また、上のAmazonのレビュアーが指摘するように、「食べログ」がレビュアーに圧力をかけて、口コミの修正履歴自体が無かったことにするよう巧みに隠蔽工作しているのなら、口コミの内容を詳細に検討したところで、おそらく何の証拠も残っていないだろう。

それゆえ、

「『食べログ』が口コミを改ざんした!」

と声高に叫んだところで、証拠がまったくない以上、

「そんな証拠どこにも

 ありませんよ?

 あなたの妄想でしょ(笑)

 変な言いがかりをつけると

 裁判に訴えるぞゴルァ!」 

と開き直られ、逆にこっちが泣き寝入りするハメになるだけだろう。

すなわち、森友問題と同じく、

巧みに証拠隠滅を図る

狡猾な組織に対して

無力な一般庶民は

なすすべもない

のだ!

どんどん巧妙になるステマの技術

最近、サクラ業者による「やらせ」口コミ、すなわち

ステマレビュー

がどんどん巧妙になり、本物のレビューと見分けることが非常に難しくなっている。

例えば、以前、ステマ疑惑が囁かれていた悪しきプログラム

「Amazon Vine先取りプログラム」

のレビュアーは、Amazonレビュアーの精鋭ともいえるトップレビュアーから選抜されたエリートレビュアー達が採用されていた。

彼らは、トップレビュアーだけあって、文章も長くて説得力があり、他人に長文の口コミを最後まで読ませる筆力など、レビュアーとしての技量がかなり高い。

また、多様な商品をレビューしているため、過去の履歴を調べるような小手先のステマチェックもまったく通用しない。

それゆえ、このような一流のレビュアーが、ステマレビューを書き込んだ場合、通常のレビューと見分けることが極めて難しい。

また、オレオレ詐欺と同じく、サクラ業者の手口もますます巧妙になっているため、レビューの内容をどんなに詳細に検討したところで、そのレビューがステマかどうかを判定するのは、きわめて困難だ。

それでは、我々にはもう、何の手立てもないのだろうか?

いや、絶望するのはまだ早い。

高度なステマの技術を身につけた一流のレビュアーが一般人のフリをして、どんなに巧妙にレビューの内容を書いたとしても、

1つだけ騙せないものがある

それは、

口コミの評価の分布

だ!

そして、我々には、

「数学」という

真実を明らかにする

最強の武器

があるのだ!

結論だけ早く知りたい方へ

なお、ここより下の文章では、

「口コミの分布が正規分布に従うのか?」

という問題を検証すべく、数学的な考察を詳細に述べている。

それゆえ、数学的な内容に興味がなく、結論をすぐに知りたい方は、以下の数学的な考察の部分を読み飛ばして、直接

「食べログ」の口コミ改ざん疑惑の検証方法

の項目に読み進んでほしい。

統計学史上最大の発見!「正規分布」とは

あなたは

正規分布

という言葉をご存じだろうか?

正規分布は18世紀に発見された分布で、ちょうどベルのように、平均付近にピークをもつ左右対称な分布だ。

(↓)正規分布曲線の一例。中心にピークをもち、左右対称な分布をしている。

この正規分布について、19世紀のベルギーの数学者、天文学者、統計学者のアドルフ・ケトレーは、出生や結婚、犯罪など、人間についての現象に関するさまざまなデータを検証し、正規分布に従うかどうかを調べた。

(↓)アドルフ・ケトレー(1796〜1874)

ケトレーは、この正規分布に基づき、人間社会には、平均的な属性を備えた人間である「平均人」が社会の最大多数を占めるという説を唱えた。

ケトレーが活躍した19世紀には、自然界や人間社会の行動や性質など、さまざまな現象の分布が正規分布に従うものと考えられた。

正規分布の「正規」という言葉には、英語でノーマル(normal)という言葉が用いられている。

自然界や人間社会で

ノーマルに見られる分布

という意味だ。

だが、そのようなネーミングにもかかわらず、その後の研究により、

正規分布が当てはまる

現象はごく少数にすぎない

ことが明らかにされている。

例えば、年収(所得)の分布は、正規分布に従わないことが知られている。

実際、年収の分布のグラフを見ると、正規分布とは似ても似つかぬ非対称的な形状を有していることが一目瞭然だ。

(↓)厚生労働省による所得の分布状況を示したヒストグラム。所得金額階級別に世帯数の相対度数分布をみると、「200〜300万円未満」が13.5%と最も割合が多いことがわかる。

出典

平成22年国民生活基礎調査の概況について紹介しています。

また、所得の分布だけでなく、学業成績の分布や体重の分布なども、正規分布に従わないことが明らかになっている。

それゆえ、次のような感想を抱く人も多いかもしれない。

「なーんだ!

 それじゃ、正規分布って

 何の役にも立たねーじゃんw」

いや、結論を出すのはまだ早い。

ここで重要なことは、なぜこのような非対称的な偏りが生じるのか、そのメカニズムを理解することだ。

統計分布が非対称的になるメカニズム

対数正規分布とは?

実は、所得の分布のベースになっている分布は、正規分布ではなく、

対数正規分布

に従っていることが明らかになっている。

このような非対称的な分布になる主な原因として、所得の分布は、完全にランダムな要因で決定される現象ではなく、

過去の所得の分布が

乗数的に累積されるため

とされている。

これは、分かりやすくいえば、

所得の多い人間ほど

将来高い所得を得やすい

または、

所得の少ない人間ほど

将来高い所得を得にくい

という現象によるものだ。

実際、下のブログにおいて、

「収入が5%ずつアップする」

という

過去の所得に累積して

将来の収入が決定される

収入モデル

を想定して、年収の分布をシミュレーションしたところ、年収の分布が左右対称的な分布から非対称的な対数正規分布に近づいていくことが明らかにされている。

これは、収入が多ければ多いほど、将来の収入の上げ幅が大きくなるため、左側の裾野が長くなり、非対称的な分布になるためだ。

べき分布(パレート分布)とは?

一方、所得の分布は完全に対数正規分布に従っているわけでもない。

実際には、高収入の層ほど

べき分布

パレート分布

に従っていることが明らかにされている。

(↓)イタリアの技師にして経済学者、社会学者、哲学者のヴィルフレド・パレート(1848〜1923)。有名なパレートの法則を提唱した。

「べき分布」とは、

相似形をなす階層構造において

一般的に見られる分布

だ。

このような相似的な階層構造は

フラクタル構造

と呼ばれ、自然界に多く見られる構造だ。

(↓)フラクタル構造の一例。構造のどの部分を抜き出しても、全体と相似形になる自己相似形を有するのがフラクタル構造の特徴だ。海岸線や山の形、枝分かれした樹木の形、血管の分岐構造や腸の内壁など、フラクタル構造は自然界に多く見られる構造だ。

収入を例にすると、どのような階層の集団を比較しても、

上位の階層が下位の階層よりも

常に同じ割合で多くの収入を

得ることができる

という不平等な富の配分があるとき、所得の分布は「べき分布」に従うことになる。

例えば、上位2割の階層にいる人間は、下位8割の階層にいる人間とまったく同じ収入ではなく、下位8割の階層にいる人間から余分なマージンを搾取できるという

ゼネコン的な収入構造が

非対称的なべき分布

を生み出す

のだ。

学業成績が正規分布に従わない理由

2つ目の例として、学業成績の分布において、非対称的な分布の偏りが生じるメカニズムを説明しよう。

学業成績で非対称的な分布が生まれるメカニズム1

次のようになるだろう。

・東大出身の親は教育熱心

 ↓

・真面目な親の多大な影響を受けた子供もたくさん本を読み、名門私立小学校を受験して合格する可能性が高まる

 ↓

・名門私立小学校で優秀なクラスメートと切磋琢磨して、名門中高一貫進学校に合格できる可能性が高まる

 ↓

・東大に合格する可能性が高まる

それゆえ、このような

過去の成績の乗数的な累積

が、非対称的な対数正規分布になることは容易に想像できるだろう。

学業成績で非対称的な分布が生まれるメカニズム2

一方、学業成績で非対称的な分布が生まれるもう1つのメカニズムは次のとおりだ。

・東大出身の親は、低学歴の貧乏人よりも多くの収入がある

 ↓

・親の豊富な資金力で小さい頃から名門学習塾に通い、貧乏人の子供よりも多くの知識を身につける可能性が高まる

 ↓

・名門中高一貫進学校のレベルのカリキュラムを受け、優れた教師に出会い、貧乏人の子供よりもレベルの高い教育を積極的に受けられる可能性が高まる

 ↓

・東大に合格する可能性が高まる

このように、貧乏人の子供よりも常に有利な立場で教育を受けられるという、

階層間の不平等な格差構造

により非対称的なべき分布が生まれるのだ。

この結果、

学業成績の分布が

対称的な正規分布にならない

理由が容易に理解できるだろう。

統計分布において非対称的な分布が生じる2つの要因

以上の考察から、統計分布において、非対称的な分布が生じるメカニズムをまとめよう。

非対称的な分布が生じる理由のまとめ

1.過去の分布が乗数的に累積される

  ↓

 対数正規分布

2.階層間の不平等な格差

  ↓

 べき分布

ところで、これらの

数学的な本質

は何だろうか?

実は、これらはそれぞれ、

1.過去の「自己との関係」において何らかの相関がある

2.「他者との関係」において何らかの相関がある

という点に集約される。

すなわち、

自己および他者との

相関を通じて

個々の要素が相互に

影響し合った結果

非対称的な分布が生まれる

のだ。

一方、自己および他者との相関が一切なく、個々の要素が完全に独立に決定されるような分布は、対称的な正規分布になることは、容易に理解できるだろう。

自己および他者との

相関が一切なく

個々の要素が完全に

独立に決定される

 ↓

対称的な正規分布になる

「数学的な思考」が物事の本質の理解に重要な理由

ところで、物事の本質を理解するのに、なぜ数学的な思考が重要なのだろうか?

一つだけはっきりいえることは、

「正規分布に従わない

 現象は少ないんだろ!

 それじゃ正規分布なんて

 全然使えないじゃねーかw

 数学なんて役に立たねー(笑)」

と、思考を停止させてすぐにあきらめる態度は、

数学的な思考とは

全くかけ離れた態度

であることは容易に理解できるだろう。

だが、残念なことに、日本人には、このような短絡的な人間が多いように思われる。

一方、数学的な思考とは、

「正規分布に従う例は少ないのか

 それなら、どのような条件で

 非対称的な分布が生まれるのか?」

ということを徹底的に考え、

「自己および他者との相関があると

 非対称的な分布が生まれて

 正規分布が使えなくなるのか。

 それなら、自己および他者との

 相関が無視できるケースでは

 正規分布が使えるよね!」

と、数学的な本質を理解した上で、適用可能なケースを考えるのが、

数学的な思考

といえるだろう。

口コミの分布は正規分布に従うか?

以上の考察をもとに、口コミの分布について考えてみた場合、非対称的な分布を生み出す自己および他者との相関というものは考えにくい。

なぜなら、口コミは、基本的に

1つの店に対して

各人が独立に

1つのレビュー

を書いて完結する

からだ。

例えば、ある店に5の評価をつけた人が、他の店にも高い評価をつける自己相関が働くというのは考えにくい。

また、5の評価をつける人が、1の評価をつける人よりもウエートが大きくなるという他者相関も考えにくいのは明らかだろう。

それゆえ、各人が独立に評価をつける口コミは、

分布の非対称性を生み出す

自己相関や他者相関がない以上

正規分布に従う

と考えるのが妥当だろう。

口コミの分布が正規分布に従わない場合

もちろん、口コミの分布が正規分布に従わない場合もある。

例えば、平均点が最高評価または最低評価に近い場合、口コミの分布は、最高評価または最低評価付近で正規分布から大きく外れた分布になる可能性がある。

なぜなら、5段階評価で平均点が4.5点の場合、本来5点より高い点数をつけるべき人間が最高評価の5点に集中するため、5点の分布が必要以上に高くなる傾向にあるからだ。

平均点が最高・最低評価に近い場合

 ↓

口コミの分布は

最高・最低評価付近で

正規分布から外れた分布になる

「食べログ」の口コミの分布の検証例

以上、前置きがかなり長くなったが、ここからが本題だ。

以上の考察を考慮した上で、実際に「食べログ」の口コミのサンプルをもとに作成したヒストグラムに正規分布曲線を当てはめてみよう。

上で考察したとおり、口コミの分布に正規分布曲線が見事にフィットすることがわかる。

(↓)下の例は、「食べログ」東京都ランキング一位の「松川」の口コミの分布だ。このように、口コミの分布は平均点を中心にした対称的な分布に従うことがわかる。ちなみに、このときのサンプル数は160だ。

サンプル数は十分か?

ここで、次のような疑問を抱く人も多いかもしれない。

「ちょっと待て!

 口コミのサンプル数が160って

 めっちゃ少ないだろ!

 そんな少ない数で

 正規分布を再現できるのかよ?」

だが、この点は心配無用だ。

なぜなら、統計学的には、店の顧客の母集団の人数が10万人以上の規模であったとしても、100のサンプルを集めることができれば、10%の許容誤差で信頼性の高いデータが得られるのだ。

それゆえ、100サンプルというのは、一見少ないように見えても、統計学的に見ると、決して信頼性の低い数字ではない。

参考

また、実際に「食べログ」のさまざまな口コミの分布をフィッティングしてみたところ、口コミ件数が100件以上で正規分布曲線の良好なフィッティング結果が得られた。

(↓)こちらは、イタリアン「ヴォーロ・コズィ(Volo Cosi)」の口コミ分布。こちらも、132件のサンプル数で平均点付近を中心に対称的で偏りのない良好な分布が得られた。

(↓)こちらは、寿司「さわ田」の口コミ分布。こちらも、131件のサンプル数で平均点付近を中心に対称的で偏りのない良好な分布が得られた。

(↓)こちらは、「スタア・バー・ギンザ(STAR BAR GINZA)」の口コミ分布。こちらは、100件のサンプル数で平均点付近を中心に対称的で偏りのない良好な分布が得られた。

それゆえ、上のフィッティング例からも明らかなように、口コミの分布において、

100サンプルあれば

正規分布の再現には

十分である

といえるだろう。

口コミの分布が正規分布に従う直観的な理由

これまで、数学的な側面から口コミの分布が正規分布に従うか否かについて述べた。

次に、口コミの分布が正規分布に従う理由について、小学生にも分かるように説明しよう。

正規分布の基本的な特徴

正規分布のもっとも基本的な特徴は、次のようなものだ。

特徴1.平均的なものが最大多数である。

これは、先ほど述べたケトレーの「平均人」の考え方であり、正規分布の重要な特徴ともいえる。

例えば、ごくごく平均的なカレーライスの口コミを想定しよう。

この場合、特徴1は、5点中3点の評価をつける人間がもっとも多いということに相当する。

要するに、

一番平均的な意見が

最大多数を占める

のだ。

特徴2.平均以外にも分布が存在する

これは、一見当たり前のようだが、よく考えると奥が深い。

口コミの分布でいえば、評価が平均点のみに集中するのではなく、必ず平均点以外の評価をつける人間が存在することに相当する

実際、「たで食う虫も好きずき」ということわざがあるように、世の中にはさまざまな考え方の人間がいる。

ごくごく平均的なカレーライスであっても、みんなが全員、5段階評価で3点をつけるのではない。

実際には、カレーライスに対して、評価の甘い人間が必ず存在して、

「オレ、普通のカレーが好きすぎてつらい!」

という人間もいれば、

「やっぱり

 普通のカレーが一番だよね!

 これぞ庶民の味って感じ!」

といって、普通のカレーライスに4点や5点の高評価をつける人間もいるだろう。

その一方で、重度のカレーオタクや、普通のカレーに食べ飽きた人間の場合、当然のことながら、ごくごく普通のカレーでは到底物足りず、

「また普通のカレーかよ?

 いいかげん食べ飽きた!」

「普通のカレーなんて論外だ!」

といって、1点や2点の低評価をつける人間も必ず存在する。 

このように、ごくごく平均的なカレーライスの口コミであっても、

平均とは異なる意見をもった

人間が必ず存在する

というのがノーマルな分布の特徴だ。

逆に、100人のレビュアーが100人ともみんな5点の評価をつけていたら、これはノーマルな分布とはいえないだろう。

もし、あなたがこのような口コミの分布を見たとき、その口コミが人為的に操作されている可能性を真っ先に疑うべきだ。

特徴3.平均からかけ離れるほど相対的に数が少なくなる

これは、

極端なものほどレアになる

というものだ。

これも経験則から明らかだろう。

例えば、ごくごく平均的なカレーライスの場合、3点をつける人間がもっとも多く、5点や1点など、平均から離れた評価をつける人間がもっとも少なくなる。

例えば、普通のカレーライスを

これぞ究極のカレーだ!」

と感動する人間がいたとしても、そんな人間はごく少数派だ。

一方、ごくごく普通のカレーライスを

「こんなクソまずいカレーを食べるくらいなら

 ゴキブリでも食ったほうがましだ!」

という人間も存在するかもしれないが、これもやはりレアな存在だ。

仮にもし、極端な評価をする人間が大量に現れたら、その連中はサクラ業者の回し者である可能性を疑ってかかるべきだろう。

特徴4.平均の左右両側の分布は均等に存在する

これは、平均より上の人も、下の人も同じ程度の人数存在するというものだ。

例えば、ごくごく普通のカレーライスについて、平均と比べてカレーが好きな人も、カレーが嫌いな人も同じくらい存在するということに相当する。

ここで、注意したいのは、あくまで

「平均的な評価と比べて」

という点だ。

仮に、「カレー好きの集団」が口コミをした場合、全体の平均点が高くなるだけで、平均よりも好きな人と平均よりも嫌いな人の分布の割合自体は変わらない。

もし、サンプル数が十分であるにもかかわらず、平均点のまわりに均等に分布しないとすれば、

各人の評価は

自己相関か他者相関の

影響を顕著に受けている

か、あるいは

何らかの

人為的なステマ行為

おこなわれている

かのいずれかだ。

平均がもっとも多く

平均から遠ざかるにつれて

低評価側も高評価側も

同じ割合で減少していく

これが正規分布の直観的な理解だ。

「食べログ」の口コミ改ざん疑惑の検証方法

ところで、上の議論において、「食べログ」の口コミの分布が正規分布曲線で見事にフィッティングできることを示した。

この結果を見て、あなたは次のように思うかもしれない。

「なんだ?

 『食べログ』の口コミの分布って

 正規分布になっているのか?

 それじゃ、どこにも

 改ざんの痕跡なんてないよね?」

「やっぱりAmazonの

 頭のイカれたレビュアーの

 妄想じゃねーか!

 ふざけんなボケ!」

「あの大手の『食べログ』が

 改ざんなんて

 そんなセコいまね

 するわけねーだろ!

 変ないいがかりつけんなよ

 オッサン!」

だが、結論を出すのはまだ早い!

なぜなら、上でフィッティングした口コミの分布はどれも、

平均点が4.0点以上

の口コミばかりだからだ。

「ちょっと待てよ!

 改ざんと平均点に

 何の関係があるんだよ?」

大いに関係がある!

なぜなら、平均点が4.0点以上というのは、上のヒストグラムにおいて、

次の評価が3.0点台

だからだ。

よく考えてみてほしい。

3.0点台というのは普通以上の評価だ。

普通以上の評価を

わざわざ削除する

ステマ業者が

存在するだろうか?

ステマ業者が消し去りたいのは、3.0点台の普通以上の評価ではなく、むしろ2.0点台以下の低評価ではないだろうか?

また、正規分布は、これまで見てきたように、平均点から遠ざかるほど極端に分布が小さくなる。

それゆえ、平均点が4.0点台の口コミにおいて、仮に2.0点台の低評価の口コミが削除されたとしても、2.0点台の領域は分布がかなり小さくなっているため、その影響が顕著にあらわれることはないだろう。

上のような事情から、平均点が高いときは、「食べログ」の口コミの分布は、一見、正規分布に従っているように見えるのだ。

平均点が低くなると改ざんの影響が顕著に現れる

逆に考えると、低評価の口コミを削除する改ざんの事実を知りたければ、

平均点が低い口コミを

調べてみればいい

なぜなら、平均点が3.0点に近づいた場合、

すぐ下の評価は2.0点台

だ。

このとき、2.0点台の口コミの分布は、正規分布の左半分の領域を大きく占めることになる。

それゆえ、仮に「食べログ」が2.0点台の低評価の口コミを積極的に削除しているとすれば、

改ざんの痕跡が

口コミの分布に

顕著に現れる

はずだ!

そこで、平均点が3.0点に近い口コミを重点的に調べてみよう。

その結果が、以下のグラフだ!

(↓)とある某店Xの口コミの分布。平均点が3.0点付近にまでシフトしたところ、どういうわけか、2.0点台の低評価の口コミが極端に少なくなった。ちなみに、この口コミのサンプル数は158件だ。

(↓)とある某店Yの口コミの分布。こちらも3.0点以上の評価と比べて、2.0点台の低評価の口コミが極端に少ない。ちなみに、この口コミのサンプル数は99件だ。

(↓)とある某店Zの口コミの分布。こちらも3.0点以上の評価と比べて、2.0点台の低評価の口コミが極端に少ない。ちなみに、この口コミのサンプル数は、なんと400件以上もある。

統計学的には、400件もサンプル数があれば十分な精度を確保できるにもかかわらず、なぜか正規分布に従わないのだ。

(↓)とある某店Wの口コミの分布。こちらも3.0点以上の評価と比べて、2.0点台の低評価の口コミが極端に少ない。

ちなみに、この口コミのサンプル数も250件以上もあるにもかかわらず、なぜか正規分布に従わない。

ここまで明確に差がでれば、

偶然というよりもはや

異常

というほかないだろう。

「『食べログ』の

 口コミの分布

 なんか不自然で

 おかしくね?」

【考察】低評価の口コミ数が極端に減る理由

ここで、「食べログ」の口コミの分布を調査した結果をまとめてみよう。

平均点が高いとき

100程度のサンプル数で

口コミの分布は

対称的な分布だった

それなのに、どういうわけか

平均点が低くなると

2.0点台の口コミ数が

極端に少なくなる

ことが判明した。

このような現象が生じるには、

2.0点台になると

なぜか口コミ数が

極端に減ってしまう

不思議な力が働いている

と考えるのが妥当だろう。

口コミの分布に偏りが生じる原因としては、以下の3つの可能性が考えられる。

1.サンプル数が十分ではない。

2.低評価の口コミを書き込む人が少ない

3.何らかの改ざん行為がなされている

1のサンプル数が十分でないという考え方は、一見もっともらしく思われる。

だが、平均点が高い口コミでは、

サンプル数が

100程度であっても

平均点を中心とした

対称的な分布が

見事に再現されていた

ことを考慮すれば、1の理由は到底考えにくいといえるだろう。

2つ目の可能性としては、「食べログ」のユーザーは、

店に対する配慮が異常に高い

ため、

2.0点台以下の

口コミになると

なぜかみんな一斉に

書き込みを

自重するようになる

という可能性だ。

このように考えれば、上の分布において、

2.0点台以下の低評価の

口コミが極端に少なくなる

という不可思議な現象をうまく説明できるだろう。

そして、3つ目の可能性は、

2.0点台以下の口コミは

見えざる神の手

によって消滅する

奇っ怪な現象

働いている

という可能性だ。

後者2つの可能性のうち、果たしてどちらが正しいのだろうか?

【最後に】オタクパパからのメッセージ

「食べログ」に口コミを

 書き込むおまえらに

 言っておくッ! 

 おれは今

 「食べログ」のスタンスを

 ほんのちょっぴりだが体験した

 い…いや…体験したというよりは

 まったく理解を

 超えていたのだが……

 あ…ありのまま

 今起こった事を話すぜ!

 おれは「食べログ」に

 低評価の口コミを

 書き込んだと思ったら

 いつのまにか削除されていた

 な…何を言っているのか

 わからねーと思うが 

 

 おれも何をされたのか

 わからなかった… 

 頭がどうにかなりそうだった…

 

 催眠術だとか

 超スピードだとか

 そんなチャチなもんじゃあ

 断じてねえ

 

 もっと恐ろしいものの

 片鱗を味わったぜ…」

正直なところ、私自身、「食べログ」の口コミに何が起こっているのかよくわからない。

ひょっとすると、

私がたまたま調査した

口コミのサンプル

たまたま偏った分布

を示しただけ

なのかもしれない。

あるいは、ひょっとすると、

私が調査しなかった

86万以上もの店舗

の口コミは全て

対称的な分布だった

のかもしれない。

それゆえ、ここで結論を述べるのは、あえて差し控えたいと思う。

真相については

あなた自身の手で確かめ

あなた自身の頭で考えて

結論を出してほしい

なぜなら、ここで述べた数学的な分析手法は、あなた自身の手で確認することができるからだ。

また、これまで、

「数学なんて、

 何の役にも立たねーよ!

 勉強するだけ

 時間の無駄無駄!」

と思っていた人は、使いようによっては、

数学的な思考は

真実をあばくための

最強のツールになる

ということを頭に留めておいてほしい。

そして、最後に一つだけ、私から諸君にひと言。

数字は真実を語る

どんなに改ざんしようが、どんなに巧妙に証拠の隠滅を図ろうが、改ざんの結果生じた不自然な数字の分布をごまかすことは不可能だ。

それゆえ、あなた自身の目で口コミの数字を確認して、真実を明らかにしてほしい!

というわけで、諸君も、数学的な思考を武器にして、この捏造・改ざんの時代を生き抜き、充実したオタクライフを存分に満喫するようにしてほしい!

オタクパパより愛を込めて!

スポンサーリンク(Sponsored link)
スポンサーリンク(Sponsored link)

シェアする(SHARE)

  • このエントリーをはてなブックマークに追加
  • Evernoteに保存Evernoteに保存

フォローする(FOLLOW)