2016年 - ツイート集計!
Updated:
改めまして、旧年明けまして、新年おめでとうございます。
2016年の Twitter でのツイート(メインで使用しているアカウントのみ)を Ruby で集計してみました。
当方は、ツイートは全て自宅サーバ(Debian GNU/Linux)上のデータベース(MariaDB)に保存しています。(実際には Ruby + Twitter API で本家からデータを取得して保存)
ほとんど SQL で集計可能でしたが、品詞・単語別の集計は形態素解析エンジン MeCab を使用しました。
集計内容は以下のとおり。
- 月別ツイート数
- 曜日別ツイート数
- 時間別ツイート数
- 文字数別ツイート数
- 1日当たりツイート数別集計
- 品詞別出現回数
- 単語別出現回数
1. 月別ツイート数
[ 年 月 ] [件数] [ 比 率 ]
2016年01月 439 ( 9.03%)
2016年02月 314 ( 6.46%)
2016年03月 310 ( 6.38%)
2016年04月 400 ( 8.23%)
2016年05月 304 ( 6.26%)
2016年06月 334 ( 6.87%)
2016年07月 426 ( 8.77%)
2016年08月 469 ( 9.65%)
2016年09月 450 ( 9.26%)
2016年10月 716 ( 14.73%)
2016年11月 332 ( 6.83%)
2016年12月 366 ( 7.53%)
[ 合 計 ] 4,860 (100.00%)
毎月 300 〜 500 ツイートだが、10月だけ突出していた。
10月は鳥取県中部を震源とする地震が発生した影響で、その関連ツイートを自動リツイートすることが多かったためだろう。
2. 曜日別ツイート数
[ 曜 日 ] [件数] [ 比 率 ]
日曜日 619 ( 12.74%)
月曜日 690 ( 14.20%)
火曜日 681 ( 14.01%)
水曜日 655 ( 13.48%)
木曜日 675 ( 13.89%)
金曜日 801 ( 16.48%)
土曜日 739 ( 15.21%)
[ 合 計 ] 4,860 (100.00%)
2016年は金・土曜日辺りが若干多めになっていたようだ。(2015年は木・金曜日辺りが多かった)
3. 時間別ツイート数
[ 時 間 ] [件数] [ 比 率 ]
00時台 899 ( 18.50%)
01時台 48 ( 0.99%)
02時台 22 ( 0.45%)
03時台 33 ( 0.68%)
04時台 41 ( 0.84%)
05時台 52 ( 1.07%)
06時台 41 ( 0.84%)
07時台 34 ( 0.70%)
08時台 15 ( 0.31%)
09時台 50 ( 1.03%)
10時台 53 ( 1.09%)
11時台 48 ( 0.99%)
12時台 395 ( 8.13%)
13時台 32 ( 0.66%)
14時台 91 ( 1.87%)
15時台 63 ( 1.30%)
16時台 104 ( 2.14%)
17時台 108 ( 2.22%)
18時台 1,168 ( 24.03%)
19時台 716 ( 14.73%)
20時台 329 ( 6.77%)
21時台 252 ( 5.19%)
22時台 167 ( 3.44%)
23時台 99 ( 2.04%)
[ 合 計 ] 4,860 (100.00%)
通常のツイートは、自身の生活スタイルの関係で 18時台、19時台が多くなる。00時台、12時台は Bot によるツイートがほとんど。
4. 文字数別ツイート数
[ 文字数 ] [件数] [ 比 率 ]
〜 20文字 7 ( 0.14%)
〜 30文字 52 ( 1.07%)
〜 40文字 117 ( 2.41%)
〜 50文字 208 ( 4.28%)
〜 60文字 345 ( 7.10%)
〜 70文字 498 ( 10.25%)
〜 80文字 644 ( 13.25%)
〜 90文字 405 ( 8.33%)
〜100文字 356 ( 7.33%)
〜110文字 356 ( 7.33%)
〜120文字 527 ( 10.84%)
〜130文字 324 ( 6.67%)
〜140文字 1,019 ( 20.97%)
〜150文字 1 ( 0.02%)
〜160文字 1 ( 0.02%)
[ 合 計 ] 4,860 (100.00%)
文字数の少なすぎるツイートはあまりなく、70〜90文字くらいか140字の制限ギリギリのツイートが多かったようだ。
(140文字を超えるツイートが存在するのは、ツイート時に BitLy 短縮の URL だったのが Twitter API で取得し直すと Twitter 標準の t.co 短縮になり文字数が増えるため)
5. 1日当たりツイート数別集計
[ Tweets ] [日数] [ 比 率 ]
4 1 ( 0.27%)
5 4 ( 1.09%)
6 8 ( 2.19%)
7 17 ( 4.64%)
8 32 ( 8.74%)
9 31 ( 8.47%)
10 37 ( 10.11%)
11 51 ( 13.93%)
12 35 ( 9.56%)
13 28 ( 7.65%)
14 27 ( 7.38%)
15 17 ( 4.64%)
16 15 ( 4.10%)
17 16 ( 4.37%)
18 10 ( 2.73%)
19 8 ( 2.19%)
20 3 ( 0.82%)
21 5 ( 1.37%)
22 5 ( 1.37%)
23 3 ( 0.82%)
25 2 ( 0.55%)
26 1 ( 0.27%)
27 2 ( 0.55%)
30 1 ( 0.27%)
32 2 ( 0.55%)
34 1 ( 0.27%)
42 1 ( 0.27%)
52 1 ( 0.27%)
80 1 ( 0.27%)
166 1 ( 0.27%)
[ 合 計 ] 366 (100.00%)
1日に11ツイートすることが多かったよう。また、Bot による日時ツイートがあるので1回もツイートしなかった日はなかった。
166回もツイートした日があるが、これも鳥取県中部を震源とする地震に関連したリツイートが多かったため。
(ちなみに、1回もツイートしなかった日は、2011年7月7日のアカウント開設以来1日もない)
6. 品詞別出現回数
形態素解析エンジン MeCab を使用して品詞別に集計してみた。
[ 品詞 ] [ 出現回数 ]
名詞 155,932
記号 42,348
助詞 30,878
動詞 10,379
助動詞 6,498
接頭詞 2,681
形容詞 2,170
副詞 1,261
連体詞 415
接続詞 378
感動詞 64
フィラー 9
[ 合 計 ] 253,013 語
当然ながら、名詞が多い。フィラーとは「えーと」、「あのー」のような、文と文の間を埋めるような単語のこと。
いつもながら、全体的に「こういうものなんだ」と実感する程度。
7. 単語別出現回数
1年間に出現した単語を集計してみた。(100回以上出現した単語を掲載)
[ 単語 ] [ 品詞 ] [ 出現回数 ]
の 助詞 8,129
: 名詞 7,047
▼ 記号 5,905
. 名詞 5,334
。 記号 5,190
、 記号 4,678
( 記号 4,060
) 記号 3,996
: 記号 3,555
日 名詞 3,538
# 名詞 3,241
に 助詞 3,155
は 助詞 3,140
月 名詞 2,939
が 助詞 2,763
https 名詞 2,712
/ 名詞 2,663
t 名詞 2,575
:// 名詞 2,560
co 名詞 2,555
「 記号 2,457
」 記号 2,431
【 記号 2,233
た 助動詞 2,161
て 助詞 2,103
で 助詞 1,893
】 記号 1,852
し 動詞 1,755
県 名詞 1,646
を 助詞 1,636
3 名詞 1,326
と 助詞 1,303
頃 名詞 1,295
情報 名詞 1,271
・ 記号 1,190
年 名詞 1,168
@ 名詞 1,139
4 名詞 1,134
松江 名詞 1,109
matsue 名詞 1,099
10 名詞 1,085
気象庁 名詞 1,075
] 名詞 1,062
RT 名詞 1,051
Wn 名詞 1,049
震度 名詞 1,049
2 名詞 1,043
° 名詞 1,033
1 名詞 1,032
震源 名詞 1,000
8 名詞 907
00 名詞 899
9 名詞 877
鳥取 名詞 876
から 助詞 874
5 名詞 850
12 名詞 820
2016 名詞 813
^M^M 記号 798
中部 名詞 762
入 接頭詞 748
南中 名詞 741
も 助詞 740
※ 記号 717
市 名詞 711
7 名詞 709
- 名詞 684
ね 助詞 655
いる 動詞 648
な 助動詞 646
最大 名詞 641
ない 助動詞 639
6 名詞 627
[ 名詞 621
11 名詞 614
さ 名詞 594
だ 助動詞 590
M 名詞 567
^M 記号 560
32 名詞 552
! 記号 552
する 動詞 549
規模 名詞 542
* 名詞 541
1 名詞 536
35 名詞 529
N 名詞 527
E 名詞 521
こと 名詞 508
Japan 名詞 500
km 名詞 498
さ 動詞 482
深 形容詞 480
津波 名詞 477
BLOG 名詞 474
第 接頭詞 473
17 名詞 471
15 名詞 462
心配 名詞 462
16 名詞 453
い 動詞 449
18 名詞 446
14 名詞 443
けど 助詞 432
なし 形容詞 431
島根 名詞 424
ので 助詞 418
地方 名詞 417
や 助詞 416
Matsue 名詞 410
旧暦 名詞 408
→ 記号 407
133 名詞 404
明日 名詞 403
05 名詞 399
なる 動詞 396
再 接頭詞 395
れ 動詞 392
か 助詞 387
よう 名詞 383
の 名詞 382
20 名詞 380
日の出 名詞 375
六 名詞 371
曜 名詞 369
月齢 名詞 369
出 動詞 368
干支 名詞 368
こよみ 名詞 367
】[ 名詞 365
2 名詞 363
0 名詞 361
台風 名詞 356
gC 名詞 354
3 名詞 354
uOKnpLH 名詞 353
06 名詞 350
19 名詞 347
的 名詞 346
です 助動詞 339
21 名詞 337
13 名詞 335
今日 名詞 334
61 名詞 333
備忘録 名詞 325
に関する 助詞 321
確認 名詞 312
30 名詞 309
観測 名詞 307
個人 名詞 304
? 記号 304
23 名詞 303
OctEdvaY 名詞 301
号 名詞 298
22 名詞 297
ある 動詞 296
07 名詞 295
気象 名詞 293
04 名詞 291
時 名詞 288
中国 名詞 278
ください 動詞 277
飛行 名詞 277
まで 助詞 277
注意 名詞 274
No 名詞 272
--- 名詞 271
う 助動詞 270
以外 名詞 269
記号 269
… 記号 267
気温 名詞 264
28 名詞 264
以上 名詞 259
なっ 動詞 257
で 助動詞 244
25 名詞 242
でしょ 助動詞 241
09 名詞 240
26 名詞 238
24 名詞 236
旅客機 名詞 233
物体 名詞 233
Ruby 名詞 231
約 接頭詞 229
程度 名詞 229
度 名詞 223
shimane 名詞 221
地震 名詞 216
( 名詞 216
発表 名詞 215
〜 記号 212
という 助詞 212
01 名詞 211
03 名詞 209
5 名詞 201
れる 動詞 200
27 名詞 200
計算 名詞 200
熊本 名詞 196
速報 名詞 194
回 名詞 192
02 名詞 190
, 名詞 186
08 名詞 184
発生 名詞 184
だっ 助動詞 176
西 名詞 175
警戒 名詞 175
ます 助動詞 174
29 名詞 166
にかけて 助詞 166
等 名詞 164
より 助詞 163
IIzWb 名詞 160
Phq 名詞 160
音 名詞 156
中 名詞 156
最高 名詞 155
そう 名詞 154
50 名詞 149
分 名詞 149
) 名詞 148
59 名詞 147
51 名詞 146
日赤 名詞 145
ん 名詞 145
予報 名詞 145
値 名詞 145
大雨 名詞 143
日本 名詞 142
でし 助動詞 142
もの 名詞 141
31 名詞 140
まし 助動詞 140
機 名詞 139
Linux 名詞 139
52 名詞 138
秒 名詞 138
なく 助動詞 136
earthquake 名詞 134
℃ 名詞 134
それ 名詞 133
あり 動詞 133
北部 名詞 131
目 名詞 131
など 助詞 131
H 名詞 131
東 名詞 130
人 名詞 130
北 名詞 128
ない 形容詞 127
お 接頭詞 127
気圧 名詞 127
OS 名詞 123
33 名詞 123
警報 名詞 122
その 連体詞 122
55 名詞 121
高温 名詞 121
旋回 名詞 120
Quake 名詞 120
ヘリ 名詞 119
今年 名詞 118
47 名詞 116
58 名詞 116
災害 名詞 116
:/… 名詞 116
正午 名詞 115
" 名詞 113
瞬間 名詞 113
45 名詞 112
かも 助詞 111
46 名詞 111
低 接頭詞 111
39 名詞 109
注意報 名詞 108
ちなみに 接続詞 108
使用 名詞 108
🌀 記号 106
夜 名詞 106
56 名詞 105
思っ 動詞 105
たら 助動詞 104
ば 助詞 104
落雷 名詞 104
37 名詞 103
40 名詞 103
による 助詞 102
東部 名詞 102
今後 名詞 101
何 名詞 101
について 助詞 101
報 名詞 101
kp 名詞 101
typhoon 名詞 101
36 名詞 100
緊急 名詞 100
: : :
: : :
: : :
[ 合 計 ] 198,250 語
MeCab の仕様による分類なので、半角コロン :
は名詞になり、全角コロン :
は記号になったりと、非常に厳密な分類となっているのがわかる。
例年どおり、今年も助詞の「の」が今年最も使われていた。
単純に数を集計するだけではなく、品詞別に集計するのも面白いものです。
ブログ記事は当方Web サイトで随時検索・参照できるようにしたりしているので、あらためて集計はしていません。(但し、文字数が多すぎるので、品詞分類は行っていない)
以上。
Comments