2015年 - ツイート集計!
Updated:
2015年の Twitter でのツイート(メインで使用しているアカウントのみ)を Ruby で集計してみました。
当方は、ツイートは全て自宅サーバ(CentOS)上のデータベース(MySQL)に保存しています。
(実際には Ruby + Twitter API で本家からデータを取得して保存)
ほとんど SQL で集計可能でしたが、品詞・単語別の集計は形態素解析エンジン MeCab を使用しました。
集計内容は以下のとおり。
- 月別ツイート数
- 曜日別ツイート数
- 時間別ツイート数
- 文字数別ツイート数
- 1日当たりツイート数別集計
- 品詞別出現回数
- 単語別出現回数
1. 月別ツイート数
[ 年 月 ] [件数] [ 比 率 ]
2015年01月 295 ( 7.47%)
2015年02月 271 ( 6.87%)
2015年03月 276 ( 6.99%)
2015年04月 288 ( 7.30%)
2015年05月 326 ( 8.26%)
2015年06月 360 ( 9.12%)
2015年07月 397 ( 10.06%)
2015年08月 393 ( 9.96%)
2015年09月 303 ( 7.68%)
2015年10月 326 ( 8.26%)
2015年11月 330 ( 8.36%)
2015年12月 382 ( 9.68%)
[ 合 計 ] 3,947 (100.00%)
毎月 300 〜 400 くらいツイートしていたようだ。
2. 曜日別ツイート数
[ 曜 日 ] [件数] [ 比 率 ]
日曜日 503 ( 12.74%)
月曜日 572 ( 14.49%)
火曜日 579 ( 14.67%)
水曜日 535 ( 13.55%)
木曜日 631 ( 15.99%)
金曜日 597 ( 15.13%)
土曜日 530 ( 13.43%)
[ 合 計 ] 3,947 (100.00%)
木・金曜日辺りが若干多めになっていたようだ。
3. 時間別ツイート数
[ 時 間 ] [件数] [ 比 率 ]
00時台 891 ( 22.57%)
01時台 7 ( 0.18%)
02時台 7 ( 0.18%)
03時台 23 ( 0.58%)
04時台 20 ( 0.51%)
05時台 56 ( 1.42%)
06時台 19 ( 0.48%)
07時台 6 ( 0.15%)
08時台 7 ( 0.18%)
09時台 26 ( 0.66%)
10時台 36 ( 0.91%)
11時台 23 ( 0.58%)
12時台 366 ( 9.27%)
13時台 14 ( 0.35%)
14時台 37 ( 0.94%)
15時台 25 ( 0.63%)
16時台 56 ( 1.42%)
17時台 114 ( 2.89%)
18時台 756 ( 19.15%)
19時台 777 ( 19.69%)
20時台 284 ( 7.20%)
21時台 227 ( 5.75%)
22時台 83 ( 2.10%)
23時台 87 ( 2.20%)
[ 合 計 ] 3,947 (100.00%)
通常のツイートは 18時台、19時台が多かったようだ。00時台、12時台は Bot によるツイートがほとんど。
4. 文字数別ツイート数
[ 文字数 ] [件数] [ 比 率 ]
〜 10文字 1 ( 0.03%)
〜 20文字 19 ( 0.48%)
〜 30文字 54 ( 1.37%)
〜 40文字 92 ( 2.33%)
〜 50文字 166 ( 4.21%)
〜 60文字 319 ( 8.08%)
〜 70文字 420 ( 10.64%)
〜 80文字 638 ( 16.16%)
〜 90文字 357 ( 9.04%)
〜100文字 349 ( 8.84%)
〜110文字 316 ( 8.01%)
〜120文字 265 ( 6.71%)
〜130文字 290 ( 7.35%)
〜140文字 659 ( 16.70%)
〜150文字 1 ( 0.03%)
〜160文字 1 ( 0.03%)
[ 合 計 ] 3,947 (100.00%)
文字数の少なすぎるツイートはあまりなく、70〜90文字くらいか140字の制限ギリギリのツイートが多かったようだ。
(140文字を超えるツイートが存在するのは、ツイート時に BitLy 短縮の URL だったのが Twitter API で取得し直すと Twitter 標準の t.co 短縮になり文字数が増えるため)
5. 1日当たりツイート数別集計
[ Tweets ] [日数] [ 比 率 ]
4 1 ( 0.27%)
6 19 ( 5.21%)
7 26 ( 7.12%)
8 41 ( 11.23%)
9 58 ( 15.89%)
10 49 ( 13.42%)
11 41 ( 11.23%)
12 41 ( 11.23%)
13 23 ( 6.30%)
14 21 ( 5.75%)
15 14 ( 3.84%)
16 10 ( 2.74%)
17 8 ( 2.19%)
18 5 ( 1.37%)
19 4 ( 1.10%)
20 1 ( 0.27%)
21 1 ( 0.27%)
24 1 ( 0.27%)
34 1 ( 0.27%)
[ 合 計 ] 365 (100.00%)
1日に9〜10ツイート前後が多かったようで、1回もツイートしなかった日は無かったようだ。
(1回もツイートしなかった日は、2011年7月7日のアカウント開設以来1日もない)
6. 品詞別出現回数
形態素解析エンジン MeCab を使用して品詞別に集計してみた。
[ 品詞 ] [ 出現回数 ]
名詞 115,733
記号 31,187
助詞 28,721
動詞 10,205
助動詞 6,884
接頭詞 1,951
形容詞 1,403
副詞 1,402
連体詞 372
接続詞 295
感動詞 78
フィラー 15
その他 4
[ 合 計 ] 198,250 語
当然ながら、名詞が多い。フィラーとは「えーと」、「あのー」のような、文と文の間を埋めるような単語のこと。
いつもながら、全体的に「こういうものなんだ」と実感する程度。
7. 単語別出現回数
1年間に出現した単語を集計してみた。(100回以上出現した単語を掲載)
[ 単語 ] [ 品詞 ] [ 出現回数 ]
の 助詞 6,982
: 名詞 5,472
。 記号 5,270
▼ 記号 4,080
. 名詞 3,458
、 記号 3,351
日 名詞 3,003
に 助詞 2,940
は 助詞 2,901
が 助詞 2,685
「 記号 2,646
」 記号 2,620
/ 名詞 2,618
月 名詞 2,571
: 記号 2,283
た 助動詞 2,244
( 記号 2,156
) 記号 2,151
t 名詞 2,145
:// 名詞 2,126
co 名詞 2,121
て 助詞 2,070
# 名詞 1,912
で 助詞 1,872
http 名詞 1,723
【 記号 1,686
し 動詞 1,593
を 助詞 1,566
】 記号 1,494
と 助詞 1,223
8 名詞 931
2 名詞 926
3 名詞 882
matsue 名詞 852
松江 名詞 850
も 助詞 846
年 名詞 840
から 助詞 800
2015 名詞 783
市 名詞 769
- 名詞 758
ね 助詞 752
入 接頭詞 742
今日 名詞 731
南中 名詞 729
だ 助動詞 721
12 名詞 720
ない 助動詞 700
( 名詞 697
1 名詞 687
いる 動詞 683
) 名詞 631
な 助動詞 613
10 名詞 609
9 名詞 588
7 名詞 587
4 名詞 581
県 名詞 570
こと 名詞 563
情報 名詞 557
い 動詞 552
5 名詞 551
・ 記号 550
! 記号 547
する 動詞 536
けど 助詞 529
11 名詞 526
@ 名詞 505
32 名詞 502
BLOG 名詞 501
気象庁 名詞 479
さ 動詞 474
※ 記号 471
6 名詞 465
^M 記号 464
https 名詞 461
] 名詞 433
RT 名詞 428
れ 動詞 427
Matsue 名詞 425
Wn 名詞 420
よう 名詞 420
? 記号 402
旧暦 名詞 399
1 名詞 398
頃 名詞 395
日の出 名詞 377
05 名詞 376
か 助詞 373
六 名詞 370
こよみ 名詞 367
曜 名詞 366
干支 名詞 366
明日 名詞 365
月齢 名詞 364
17 名詞 364
出 動詞 362
の 名詞 358
ので 助詞 356
島根 名詞 350
0 名詞 341
です 助動詞 337
IIzWb 名詞 326
Phq 名詞 326
自動 名詞 325
uOKnpLH 名詞 323
gC 名詞 323
18 名詞 319
なる 動詞 313
16 名詞 312
19 名詞 312
第 接頭詞 307
的 名詞 304
や 助詞 303
14 名詞 299
13 名詞 299
で 助動詞 292
06 名詞 289
ある 動詞 287
15 名詞 284
20 名詞 283
う 助動詞 280
個人 名詞 279
台風 名詞 271
2 名詞 255
07 名詞 250
という 助詞 247
04 名詞 243
21 名詞 239
[ 名詞 236
号 名詞 235
なっ 動詞 232
地方 名詞 230
22 名詞 228
でしょ 助動詞 224
だっ 助動詞 220
気象 名詞 210
観測 名詞 207
等 名詞 201
shimane 名詞 199
23 名詞 198
時 名詞 195
00 名詞 194
30 名詞 193
】[ 名詞 192
° 名詞 191
24 名詞 186
まで 助詞 182
09 名詞 173
中 名詞 172
地震 名詞 171
もの 名詞 170
03 名詞 168
人 名詞 167
26 名詞 166
さ 名詞 166
発表 名詞 165
3 名詞 165
れる 動詞 165
No 名詞 163
ん 名詞 163
27 名詞 163
日本 名詞 161
25 名詞 158
28 名詞 158
最大 名詞 156
より 助詞 156
かも 助詞 155
Debian 名詞 154
08 名詞 153
35 名詞 153
そう 名詞 150
使用 名詞 148
01 名詞 147
Linux 名詞 147
02 名詞 144
, 名詞 144
発生 名詞 141
MariaDB 名詞 140
" 名詞 140
鳥取 名詞 140
震度 名詞 139
注意 名詞 138
5 名詞 138
前 名詞 136
ください 動詞 134
29 名詞 134
ない 形容詞 133
震源 名詞 132
サーバ 名詞 130
MySQL 名詞 129
なく 助動詞 128
度 名詞 128
津波 名詞 128
ば 助詞 126
まし 助動詞 125
50 名詞 125
確認 名詞 125
今 名詞 124
54 名詞 122
あっ 動詞 120
57 名詞 120
ます 助動詞 119
M 名詞 119
以外 名詞 118
以上 名詞 118
Ruby 名詞 117
今年 名詞 115
だけ 助詞 115
38 名詞 115
k 名詞 113
→ 記号 112
でし 助動詞 111
気温 名詞 111
気 名詞 110
思っ 動詞 110
のに 助詞 110
E 名詞 110
心配 名詞 109
規模 名詞 109
Jessie 名詞 109
--- 名詞 109
気圧 名詞 108
33 名詞 108
飛行 名詞 107
て 動詞 106
51 名詞 106
52 名詞 106
N 名詞 106
km 名詞 105
上空 名詞 105
にかけて 助詞 104
府県 名詞 104
インストール 名詞 104
たら 助動詞 104
注意報 名詞 104
中国 名詞 103
時間 名詞 103
そう 副詞 103
H 名詞 103
へ 助詞 102
69 名詞 102
OS 名詞 101
31 名詞 101
二 名詞 101
55 名詞 101
: : :
: : :
: : :
[ 合 計 ] 198,250 語
MeCab の仕様による分類なので、半角コロン :
は名詞になり、全角コロン :
は記号になったりと、非常に厳密な分類となっているのがわかる。
例年どおり、今年も助詞の「の」が今年最も使われていた。
単純に数を集計するだけではなく、品詞別に集計するのも面白いものです。
ブログ記事は当方Web サイトで随時検索・参照できるようにしたりしているので、あらためて集計はしていません。
以上。
Comments