av女優の多次元データをSNSの活動性でクラスタリング av女優が影響力を持つために参考すべき人物像は?
皆さんはavを観ますか?
僕も小さい頃から人並み以上にエロの興味がありました。
僕が小学生位の頃からよく観ていました。
小学生の時は動画を観る手段がなく、台風で早退した帰り道に落ちていたエロ本を見つけ、暴風雨の中むさぼり読んだのを覚えています。
中学生の頃からタブレットが普及しましたが、動画をみたらタブレットが壊れると思っていたので、初めの頃ははてなブログとかでエロ画像を見ていた記憶があります。
成長するにつれてxvideo,pornhub,fc2....お世話になりました。
なんの取り柄もない僕ですが、成人してからはきちんとavを購入して観ていることが胸を張って誇れる数少ないポイントです。
上原亜衣、伊東ちなみ、水卜さくら、羽咲みはる、、、
最近は石川澪さんと宮下玲奈さんの動画を鬼購入しています。どうもありがとう。
観たいavを探すのに苦労する経験ってないですか?
いつも宮下玲奈の動画を観ているけど、たまにはギャルもみたいなーとか
でも、どんなギャルでも良い訳ではなくて、自分の好みのギャルってのがあるんですよね。
僕はゆきぽよよりもめるるの方が好きです。
av女優を数グループに分けることで、自分の好みの女優さんからオススメのav女優さんを提示するのが今回の目標です。
av女優のデータ採取
統計の9割はデータ採取で決まります。
好みの女優さんを提示するという目標に対して理想的な因子としては
- 心身の特徴(二重、身長、性格、体型etc)
- プレイの特徴(得意な体位、声色、SM etc)
などだと思うのですが、しがない社会人が上記のデータを集めるのは非常に困難であり、、
なんとかSNSの活動度はデータ採取できそうなので、とりあえず今回はSNSのデータ(twitter,insta)を利用しました。
name | amount of work | amount of single work | twitter follower | amount of tweet | conversation with friends in twitter | the amount of media | Bust | waist | hip | cup | instagram follower | post in instagram | tiktok |
kawakitasaika | 104 | 53 | 291818 | 1152 | 1 | 225 | 87 | 57 | 86 | 5 | 734000 | 246 | 0 |
ishikawamio | 37 | 29 | 595576 | 4607 | 1 | 862 | 82 | 58 | 86 | 2 | 104000 | 73 | 1 |
matsumotoichika | 1031 | 303 | 350497 | 15817 | 1 | 325 | 83 | 50 | 83 | 1 | 72000 | 20 | 0 |
yuzuhakarenn | 139 | 66 | 207678 | 6834 | 0 | 706 | 96 | 58 | 85 | 8 | 131000 | 12 | 0 |
mikamiyua | 311 | 118 | 5067468 | 15583 | 0 | 7966 | 83 | 57 | 88 | 7 | 3656000 | 2737 | 1 |
ohananonn | 270 | 139 | 85099 | 2549 | 0 | 354 | 86 | 60 | 88 | 6 | 22000 | 22 | 1 |
itoumayuki | 274 | 111 | 900033 | 1339 | 0 | 481 | 88 | 54 | 89 | 6 | 239000 | 73 | 0 |
nanasawamia | 187 | 82 | 1060452 | 6197 | 1 | 1145 | 79 | 54 | 80 | 3 | 146000 | 70 | 0 |
wakamiyahono | 336 | 102 | 50618 | 12697 | 1 | 3873 | 1 | ||||||
aoiibuki | 60 | 38 | 98356 | 1800 | 1 | 230 | 86 | 58 | 88 | 7 | 41000 | 36 | 0 |
yamateria | 61 | 27 | 699717 | 1251 | 0 | 691 | 99 | 58 | 88 | 9 | 226000 | 604 | 0 |
yayoimizuki | 654 | 260 | 322648 | 4563 | 0 | 745 | 82 | 60 | 85 | 6 | |||
otsuarisu | 463 | 166 | 7299 | 55 | 0 | 0 | 88 | 59 | 92 | 8 | |||
kaedekarenn | 125 | 62 | 382246 | 15 | 0 | 4 | |||||||
sakuramomo | 218 | 111 | 306551 | 11 | 0 | 10 | 90 | 56 | 85 | 7 | 150000 | 0 | 0 |
koyoikanonn | 90 | 33 | |||||||||||
shinodayuu | 1836 | 460 | 670088 | 11044 | 0 | 2712 | 88 | 60 | 88 | 6 | 212000 | 218 | 1 |
kuramotosumire | 319 | 138 | 142700 | 2278 | 0 | 390 | 85 | 57 | 85 | 3 | 83000 | 140 | 1 |
kururugiaoi | 1236 | 340 | 271469 | 20293 | 1 | 2799 | 84 | 59 | 93 | 4 | 31000 | 33 | 1 |
aizawaminami | 205 | 98 | 827931 | 37460 | 0 | 2629 | 80 | 54 | 82 | 3 | 950000 | 1374 | 1 |
shiratohana | 336 | 100 | |||||||||||
satsukimei | 469 | 186 | 97126 | 25844 | 0 | 2059 | 87 | 60 | 86 | 6 | 102000 | 323 | 1 |
mitaniakari | 1139 | 348 | 641567 | 6734 | 0 | 1620 | 83 | 58 | 86 | 5 | 295000 | 176 | 0 |
toujounatsu | 500 | 204 | 138468 | 4871 | 1 | 1670 | 78 | 55 | 85 | 3 | 203000 | 697 | 1 |
AIKA | 1302 | 333 | |||||||||||
yamagishiaika | 216 | 95 | 684988 | 8807 | 0 | 2540 | 82 | 59 | 86 | 3 | 389000 | 679 | 1 |
kominatoyotsuha | 16 | 16 | 112974 | 2001 | 0 | 530 | 83 | 59 | 80 | 3 | 42000 | 69 | 1 |
ishikawanozomi | 253 | 83 | 417263 | 25118 | 0 | 3636 | 88 | 58 | 90 | 3 | 88000 | 96 | 1 |
kurokawasumire | 496 | 162 | |||||||||||
morisawanana | 1005 | 404 | 116753 | 5050 | 0 | 813 | 86 | 59 | 86 | 6 | 157000 | 274 | 1 |
miyashitarena | 27 | 21 | 309982 | 8329 | 1 | 1616 | 83 | 57 | 85 | 4 | 103000 | 37 | 1 |
amount of work: 作品数
amount of single work: 単体の作品数
conversation with friends in twitter: ここ1ヶ月でファンの人とtwitterで会話しているか
the amount of media: twitter上での画像数
av女優なんて数百〜数千人居るらしく、全員のデータを集めてたら完遂した頃にはav業界も廃れていそうなので、FANZAの女優ランキング上位31人と僕の愛する宮下玲奈を合わせ、総32人を被験者としました。
若宮穂乃
楓カレン
今宵かのん
白桃はな
黒川すみれ
を除き、26人としました。
各変数の相関表
まずは各データの相関を視覚的に確認するために、散布図行列を描出
相関係数は
Bustとcupなんて相関しかないし、、
データ集めが悪いですねすいません、、、
今回の目的はクラスタリングの勉強なので勘弁してください、、
クラスター分析
クラスター分析をするということは
各変数に対しての距離を求め、その距離が近い順で結合させて行きます。
このままだと各変数間で数字の桁が違いすぎて正確に評価できないので標準化します。
標準化して、各女優毎の差(ユークリッド距離)を求めると
このようになりました。
この標準化したものを階層型クラスター分析
(距離間:ユークリッド,結合法:最遠距離法)すると
3群に分けると
三上悠亜と石原希望が他のav女優を圧倒した影響力を持っていることがわかります。
再遠近法だと外れ値を持つ女優がクラスターに強く影響を与えそうなので、
average(群平均法)で行うと
三上悠亜と石原希望が強すぎる。
この階層型クラスター解析だと各av女優間の距離を正しく評価できるのですが、全体的な位置関係はイメージがつきづらいです。
多次元尺度法
全体的な位置関係が把握しやすいのは多次元尺度法です。
今回のデータだと各av女優は13個の変数を持っています。
本当は13次元空間の点として理解できれば各av女優の位置関係がわかるのですが、人間の頭脳では3次元空間が限界です。
従って、位置関係をなるべく保ちつつ、高次元(主に4次元以上)に存在するデータを低次元(主に2次元)に落とし込ませ、平面上で可視的に距離間が掴めるようにします。
低次元に落とし込んでいるので正確な位置関係を提示しているわけではないのですが、参考としては有効です。
クラスター分析だと三上悠亜と石原希望が群を抜いていましたが、この分析表だと、その中でも特に三上悠亜がレベチであることがわかります。
隣接行列・無向グラフ
さらに見易くするために、図形で各女優の距離感を掴みます。
頂点(変数:av女優)と辺(av女優間の近さ)で示します。
特にベテラン女優達が抜けていることがわかります。
av女優が影響力を持つために参考すべき人物像は?
データの集め方が下手なので結論にもっていけないのですが、、、
AV女優さんの界隈で三上悠亜さんがレベチなのは分かりますが、石原希望さんも群を抜いて影響力が強いのはびっくりしました。
YouTubeの登録人数みても
石川澪:6万
石原希望:7万
三上悠亜:105万
であり、三上悠亜を参考にすることはなかなか難しいかもしれませんが、元芸能人でもない石原希望を参考にするのはよいのかもしれません。