av女優の多次元データをSNSの活動性でクラスタリング av女優が影響力を持つために参考すべき人物像は? 

皆さんはavを観ますか?

僕も小さい頃から人並み以上にエロの興味がありました。

僕が小学生位の頃からよく観ていました。

 

小学生の時は動画を観る手段がなく、台風で早退した帰り道に落ちていたエロ本を見つけ、暴風雨の中むさぼり読んだのを覚えています。

 

中学生の頃からタブレットが普及しましたが、動画をみたらタブレットが壊れると思っていたので、初めの頃ははてなブログとかでエロ画像を見ていた記憶があります。

成長するにつれてxvideo,pornhub,fc2....お世話になりました。

 

なんの取り柄もない僕ですが、成人してからはきちんとavを購入して観ていることが胸を張って誇れる数少ないポイントです。

上原亜衣、伊東ちなみ、水卜さくら、羽咲みはる、、、

最近は石川澪さんと宮下玲奈さんの動画を鬼購入しています。どうもありがとう。

 

観たいavを探すのに苦労する経験ってないですか?

いつも宮下玲奈の動画を観ているけど、たまにはギャルもみたいなーとか

でも、どんなギャルでも良い訳ではなくて、自分の好みのギャルってのがあるんですよね。

僕はゆきぽよよりもめるるの方が好きです。

 

av女優を数グループに分けることで、自分の好みの女優さんからオススメのav女優さんを提示するのが今回の目標です。

 

 

av女優のデータ採取

統計の9割はデータ採取で決まります。

好みの女優さんを提示するという目標に対して理想的な因子としては

  • 心身の特徴(二重、身長、性格、体型etc)
  • プレイの特徴(得意な体位、声色、SM etc)

などだと思うのですが、しがない社会人が上記のデータを集めるのは非常に困難であり、、

 

なんとかSNSの活動度はデータ採取できそうなので、とりあえず今回はSNSのデータ(twitter,insta)を利用しました。

 

 

name amount of work amount of single work twitter follower amount of tweet  conversation with friends in twitter the amount of media Bust waist hip cup instagram follower  post in instagram tiktok
kawakitasaika 104 53 291818 1152 1 225 87 57 86 5 734000 246 0
ishikawamio 37 29 595576 4607 1 862 82 58 86 2 104000 73 1
matsumotoichika 1031 303 350497 15817 1 325 83 50 83 1 72000 20 0
yuzuhakarenn 139 66 207678 6834 0 706 96 58 85 8 131000 12 0
mikamiyua 311 118 5067468 15583 0 7966 83 57 88 7 3656000 2737 1
ohananonn 270 139 85099 2549 0 354 86 60 88 6 22000 22 1
itoumayuki 274 111 900033 1339 0 481 88 54 89 6 239000 73 0
nanasawamia 187 82 1060452 6197 1 1145 79 54 80 3 146000 70 0
wakamiyahono 336 102 50618 12697 1 3873             1
aoiibuki 60 38 98356 1800 1 230 86 58 88 7 41000 36 0
yamateria 61 27 699717 1251 0 691 99 58 88 9 226000 604 0
yayoimizuki 654 260 322648 4563 0 745 82 60 85 6      
otsuarisu 463 166 7299 55 0 0 88 59 92 8      
kaedekarenn 125 62 382246 15 0 4              
sakuramomo 218 111 306551 11 0 10 90 56 85 7 150000 0 0
koyoikanonn 90 33                      
shinodayuu 1836 460 670088 11044 0 2712 88 60 88 6 212000 218 1
kuramotosumire 319 138 142700 2278 0 390 85 57 85 3 83000 140 1
kururugiaoi 1236 340 271469 20293 1 2799 84 59 93 4 31000 33 1
aizawaminami 205 98 827931 37460 0 2629 80 54 82 3 950000 1374 1
shiratohana 336 100                      
satsukimei 469 186 97126 25844 0 2059 87 60 86 6 102000 323 1
mitaniakari 1139 348 641567 6734 0 1620 83 58 86 5 295000 176 0
toujounatsu 500 204 138468 4871 1 1670 78 55 85 3 203000 697 1
AIKA 1302 333                      
yamagishiaika 216 95 684988 8807 0 2540 82 59 86 3 389000 679 1
kominatoyotsuha 16 16 112974 2001 0 530 83 59 80 3 42000 69 1
ishikawanozomi 253 83 417263 25118 0 3636 88 58 90 3 88000 96 1
kurokawasumire 496 162                      
morisawanana 1005 404 116753 5050 0 813 86 59 86 6 157000 274 1
miyashitarena 27 21 309982 8329 1 1616 83 57 85 4 103000 37 1

amount of work: 作品数

amount of single work: 単体の作品数

conversation with friends in twitter: ここ1ヶ月でファンの人とtwitterで会話しているか

the amount of media: twitter上での画像数

tiktok: tiktokをしているか

 

av女優なんて数百〜数千人居るらしく、全員のデータを集めてたら完遂した頃にはav業界も廃れていそうなので、FANZAの女優ランキング上位31人と僕の愛する宮下玲奈を合わせ、総32人を被験者としました。

 

ここからTwitterinstagramをやっていない

AIKA 

若宮穂乃

楓カレン

今宵かのん

白桃はな

黒川すみれ

を除き、26人としました。

 

各変数の相関表

 

まずは各データの相関を視覚的に確認するために、散布図行列を描出



相関係数

Bustとcupなんて相関しかないし、、

データ集めが悪いですねすいません、、、

今回の目的はクラスタリングの勉強なので勘弁してください、、

 

クラスター分析

クラスター分析をするということは

各変数に対しての距離を求め、その距離が近い順で結合させて行きます。

このままだと各変数間で数字の桁が違いすぎて正確に評価できないので標準化します。

標準化して、各女優毎の差(ユークリッド距離)を求めると

このようになりました。


この標準化したものを階層型クラスター分析

(距離間:ユークリッド,結合法:最遠距離法)すると

 

3群に分けると


三上悠亜と石原希望が他のav女優を圧倒した影響力を持っていることがわかります。

 

 

再遠近法だと外れ値を持つ女優がクラスターに強く影響を与えそうなので、

average(群平均法)で行うと



三上悠亜と石原希望が強すぎる。

この階層型クラスター解析だと各av女優間の距離を正しく評価できるのですが、全体的な位置関係はイメージがつきづらいです。

 

多次元尺度法

全体的な位置関係が把握しやすいのは多次元尺度法です。

今回のデータだと各av女優は13個の変数を持っています。

本当は13次元空間の点として理解できれば各av女優の位置関係がわかるのですが、人間の頭脳では3次元空間が限界です。

従って、位置関係をなるべく保ちつつ、高次元(主に4次元以上)に存在するデータを低次元(主に2次元)に落とし込ませ、平面上で可視的に距離間が掴めるようにします。

 

低次元に落とし込んでいるので正確な位置関係を提示しているわけではないのですが、参考としては有効です。

クラスター分析だと三上悠亜と石原希望が群を抜いていましたが、この分析表だと、その中でも特に三上悠亜がレベチであることがわかります。

 

隣接行列・無向グラフ

さらに見易くするために、図形で各女優の距離感を掴みます。

頂点(変数:av女優)と辺(av女優間の近さ)で示します。

 

特にベテラン女優達が抜けていることがわかります。

 

av女優が影響力を持つために参考すべき人物像は? 

データの集め方が下手なので結論にもっていけないのですが、、、

AV女優さんの界隈で三上悠亜さんがレベチなのは分かりますが、石原希望さんも群を抜いて影響力が強いのはびっくりしました。

YouTubeの登録人数みても

石川澪:6万

石原希望:7万

三上悠亜:105万

であり、三上悠亜を参考にすることはなかなか難しいかもしれませんが、元芸能人でもない石原希望を参考にするのはよいのかもしれません。