検索ヒット数と批評空間のデータ数や中央値に何か関連があるのかさわりだけ調べてみた
- 2016/03/10
- 03:08
みなさん、お疲れ様です
今回もただの思いつきを集計してみた感じです
タイトルにも書きましたが
Chromeの検索ヒット数と
批評空間のデータ数(ついでに中央値)は関連性があるのか?
と思い多少ですが調べてみました
かなり少なめの標本調査となりますが、多少の関連が見られた場合は本調べしようと思っていました
概要としましては
何月No.1の方で集計していたデータを用いて上位30作を使用
その作品群をChromeで検索して、ヒット数を集計
それを相関分析で調べてみました
相関関数というのは、2つのデータの類似性を測るもので
このブログではあまり採用していなかったのですが…
1回使ってみようと思い、今回採用するに至りました
まずは全体データ
「天気雨」と「すみれ」に関しては、他ワードもヒットに入り過ぎる(異常値)となりますので、この時点で除外
そうしてできた散布図がこちら
中央値、データ数どちらも縦に長い群が見えると思います
相関関数を調べても
中央値×ヒット数 0.068
データ数×ヒット数 0.080
となっています
これだけで判断するのはあまりかもしれませんが
これ以上データを取っても相関があると言えるラインまで数字が上がることはないでしょう
可能性としては、2015年分しか集計してないため、まだばらつきがあるということが考えられますが
それはまた気が向いたら調べてみるというレベルで終えておこうと思います
一言言えることとしては、「発売1年程度の作品群はヒット数と相関がなさそうだ」ということですかね
次回があるとしたら、古い作品含めてどう集計していいくのかを考えていきます
それではまた次回をお楽しみください
今回もただの思いつきを集計してみた感じです
タイトルにも書きましたが
Chromeの検索ヒット数と
批評空間のデータ数(ついでに中央値)は関連性があるのか?
と思い多少ですが調べてみました
かなり少なめの標本調査となりますが、多少の関連が見られた場合は本調べしようと思っていました
概要としましては
何月No.1の方で集計していたデータを用いて上位30作を使用
その作品群をChromeで検索して、ヒット数を集計
それを相関分析で調べてみました
相関関数というのは、2つのデータの類似性を測るもので
このブログではあまり採用していなかったのですが…
1回使ってみようと思い、今回採用するに至りました
まずは全体データ
「天気雨」と「すみれ」に関しては、他ワードもヒットに入り過ぎる(異常値)となりますので、この時点で除外
そうしてできた散布図がこちら
中央値、データ数どちらも縦に長い群が見えると思います
相関関数を調べても
中央値×ヒット数 0.068
データ数×ヒット数 0.080
となっています
これだけで判断するのはあまりかもしれませんが
これ以上データを取っても相関があると言えるラインまで数字が上がることはないでしょう
可能性としては、2015年分しか集計してないため、まだばらつきがあるということが考えられますが
それはまた気が向いたら調べてみるというレベルで終えておこうと思います
一言言えることとしては、「発売1年程度の作品群はヒット数と相関がなさそうだ」ということですかね
次回があるとしたら、古い作品含めてどう集計していいくのかを考えていきます
それではまた次回をお楽しみください