2017年 - ツイート集計!
Updated:
改めまして、旧年明けまして、新年おめでとうございます。
2017年の Twitter でのツイート(メインで使用しているアカウントのみ)を Ruby で集計してみました。
当方は、ツイートは全て自宅サーバ(Debian GNU/Linux)上のデータベース(MariaDB)に保存しています。(実際には Ruby + Twitter API で本家からデータを取得して保存)
ほとんど SQL で集計可能でしたが、品詞・単語別の集計は形態素解析エンジン MeCab を使用しました。
集計内容は以下のとおり。
- 月別ツイート数
- 曜日別ツイート数
- 時間別ツイート数
- 文字数別ツイート数
- 1日当たりツイート数別集計
- 品詞別出現回数
- 単語別出現回数
1. 月別ツイート数
[ 年 月 ] [件数] [ 比 率 ]
2017年01月 380 ( 7.55%)
2017年02月 330 ( 6.56%)
2017年03月 412 ( 8.19%)
2017年04月 431 ( 8.57%)
2017年05月 423 ( 8.41%)
2017年06月 392 ( 7.79%)
2017年07月 540 ( 10.74%)
2017年08月 467 ( 9.28%)
2017年09月 478 ( 9.50%)
2017年10月 448 ( 8.91%)
2017年11月 399 ( 7.93%)
2017年12月 330 ( 6.56%)
[ 合 計 ] 5,030 (100.00%)
毎月 300 〜 500 ツイートだが、7月だけ少し多めだった。
台風関連のリツイートでしょう。
2. 曜日別ツイート数
[ 曜 日 ] [件数] [ 比 率 ]
日曜日 693 ( 13.78%)
月曜日 719 ( 14.29%)
火曜日 735 ( 14.61%)
水曜日 749 ( 14.89%)
木曜日 741 ( 14.73%)
金曜日 730 ( 14.51%)
土曜日 663 ( 13.18%)
[ 合 計 ] 5,030 (100.00%)
ほぼ平均的だが、土曜日が少なめだった。
(2016年は金・土曜日辺りが若干多め、2015年は木・金曜日辺りが多めだった)
3. 時間別ツイート数
[ 時 間 ] [件数] [ 比 率 ]
00時台 1,033 ( 20.54%)
01時台 15 ( 0.30%)
02時台 8 ( 0.16%)
03時台 20 ( 0.40%)
04時台 41 ( 0.82%)
05時台 75 ( 1.49%)
06時台 24 ( 0.48%)
07時台 22 ( 0.44%)
08時台 24 ( 0.48%)
09時台 34 ( 0.68%)
10時台 44 ( 0.87%)
11時台 51 ( 1.01%)
12時台 389 ( 7.73%)
13時台 25 ( 0.50%)
14時台 41 ( 0.82%)
15時台 42 ( 0.83%)
16時台 125 ( 2.49%)
17時台 42 ( 0.83%)
18時台 1,674 ( 33.28%)
19時台 727 ( 14.45%)
20時台 210 ( 4.17%)
21時台 157 ( 3.12%)
22時台 93 ( 1.85%)
23時台 114 ( 2.27%)
[ 合 計 ] 5,030 (100.00%)
通常のツイートは、自身の生活スタイルの関係で 18時台、19時台が多くなる。00時台、12時台は Bot によるツイートがほとんど。
4. 文字数別ツイート数
[ 文字数 ] [件数] [ 比 率 ]
〜 10文字 1 ( 0.02%)
〜 20文字 11 ( 0.22%)
〜 30文字 28 ( 0.56%)
〜 40文字 84 ( 1.67%)
〜 50文字 162 ( 3.22%)
〜 60文字 321 ( 6.38%)
〜 70文字 488 ( 9.70%)
〜 80文字 740 ( 14.71%)
〜 90文字 473 ( 9.40%)
〜100文字 414 ( 8.23%)
〜110文字 401 ( 7.97%)
〜120文字 704 ( 14.00%)
〜130文字 352 ( 7.00%)
〜140文字 850 ( 16.90%)
〜150文字 1 ( 0.02%)
[ 合 計 ] 5,030 (100.00%)
文字数の少なすぎるツイートはあまりなく、71〜80文字か140字の制限ギリギリのツイートが多かったようだ。
(140文字を超えるツイートが存在するのは、ツイート時に BitLy 短縮の URL だったのが Twitter API で取得し直すと Twitter 標準の t.co 短縮になり文字数が増えるため)
(ちなみに、2017年途中から140文字超ツイートできる仕様になっている)
5. 1日当たりツイート数別集計
[ Tweets ] [日数] [ 比 率 ]
5 1 ( 0.27%)
6 4 ( 1.10%)
7 8 ( 2.19%)
8 13 ( 3.56%)
9 27 ( 7.40%)
10 24 ( 6.58%)
11 36 ( 9.86%)
12 53 ( 14.52%)
13 41 ( 11.23%)
14 29 ( 7.95%)
15 27 ( 7.40%)
16 21 ( 5.75%)
17 21 ( 5.75%)
18 21 ( 5.75%)
19 10 ( 2.74%)
20 7 ( 1.92%)
21 2 ( 0.55%)
22 4 ( 1.10%)
23 3 ( 0.82%)
24 1 ( 0.27%)
25 4 ( 1.10%)
26 2 ( 0.55%)
28 1 ( 0.27%)
29 1 ( 0.27%)
33 1 ( 0.27%)
34 1 ( 0.27%)
40 1 ( 0.27%)
42 1 ( 0.27%)
[ 合 計 ] 365 (100.00%)
1日に12回前後ツイートすることが多かったようだ。また、Bot による日次ツイートがあるので1回もツイートしなかった日はなかった。
(ちなみに、1回もツイートしなかった日は、2011年7月7日のアカウント開設以来1日もない)
6. 品詞別出現回数
形態素解析エンジン MeCab を使用して品詞別に集計してみた。
[ 品詞 ] [ 出現回数 ]
名詞 142,756
記号 87,234
助詞 30,938
動詞 9,816
助動詞 6,549
接頭詞 3,037
形容詞 1,468
副詞 1,076
接続詞 377
連体詞 343
感動詞 316
フィラー 15
[ 合 計 ] 283,925 語
当然ながら、名詞が多い。フィラーとは「えーと」、「あのー」のような、文と文の間を埋めるような単語のこと。
いつもながら、全体的に「こういうものなんだ」と実感する程度。
7. 単語別出現回数
1年間に出現した単語を集計してみた。(100回以上出現した単語を掲載)
[ 単語 ] [ 品詞 ] [ 出現回数 ]
: 記号 9,758
1 名詞 9,537
の 助詞 8,240
/ 記号 7,860
0 名詞 7,575
2 名詞 7,509
、 記号 5,913
3 名詞 5,057
。 記号 4,577
. 記号 4,359
# 記号 4,331
▼ 記号 4,142
5 名詞 4,038
日 名詞 3,635
( 記号 3,316
4 名詞 3,316
- 記号 3,281
) 記号 3,263
7 名詞 3,159
に 助詞 3,112
は 助詞 3,052
o 記号 2,917
が 助詞 2,804
https 名詞 2,720
: 記号 2,649
t 記号 2,573
c 記号 2,521
た 助動詞 2,369
9 名詞 2,319
6 名詞 2,291
8 名詞 2,216
【 記号 2,188
】 記号 2,188
で 助詞 2,062
て 助詞 1,978
「 記号 1,835
」 記号 1,828
を 助詞 1,824
し 動詞 1,784
※ 記号 1,581
情報 名詞 1,288
頃 名詞 1,275
と 助詞 1,271
matsue 名詞 1,243
松江 名詞 1,220
月 名詞 1,215
年 名詞 1,154
県 名詞 1,108
* 記号 1,016
@ 記号 894
から 助詞 881
T 記号 863
[ 記号 862
] 記号 862
市 名詞 858
備忘録 名詞 847
→ 記号 820
R 記号 805
気象庁 名詞 768
南中 名詞 732
・ 記号 727
入 接頭詞 717
ない 助動詞 692
Wn 名詞 684
も 助詞 674
! 記号 670
確認 名詞 665
いる 動詞 647
BLOG 名詞 633
島根 名詞 627
( 記号 625
飛行 名詞 614
な 助動詞 611
N 記号 610
) 記号 600
ね 助詞 592
… 記号 584
する 動詞 567
再 接頭詞 544
以外 名詞 534
第 接頭詞 510
旅客機 名詞 509
だ 助動詞 506
物体 名詞 503
機 名詞 492
い 動詞 481
さ 動詞 469
, 記号 452
ので 助詞 446
こと 名詞 444
に関する 助詞 428
今日 名詞 427
よう 名詞 423
Shimane 名詞 423
れ 動詞 415
旧暦 名詞 413
明日 名詞 412
の 名詞 405
〜 記号 400
時 名詞 399
気象 名詞 392
や 助詞 389
正午 名詞 380
干支 名詞 375
鳥取 名詞 375
日の出 名詞 374
六 名詞 369
号 名詞 369
出 名詞 368
曜 名詞 367
月齢 名詞 367
° 名詞 352
なる 動詞 346
まで 助詞 344
検知 名詞 340
けど 助詞 338
ある 動詞 337
か 助詞 333
台風 名詞 333
で 助動詞 332
です 助動詞 327
約 接頭詞 327
こよみ 名詞 317
? 記号 312
観測 名詞 308
MLAT 名詞 306
A 記号 305
B 記号 297
地方 名詞 297
的 名詞 297
/ 記号 296
気温 名詞 281
ください 動詞 280
shimane 名詞 270
注意 名詞 259
にかけて 助詞 256
等 名詞 252
なっ 動詞 248
中国 名詞 245
う 助動詞 241
さ 名詞 241
でし 助動詞 237
西 名詞 236
J 記号 235
Debian 名詞 233
C 記号 232
発表 名詞 230
警報 名詞 230
uOKnpLH 名詞 228
gC 名詞 225
落雷 名詞 211
通過 名詞 207
という 助詞 205
震度 名詞 205
tottori 名詞 204
東 名詞 199
G 記号 198
震源 名詞 197
E 記号 191
度 名詞 191
Ruby 名詞 190
ADS 名詞 189
なるほど 感動詞 186
れる 動詞 185
以上 名詞 184
Japan 名詞 183
大雨 名詞 181
最大 名詞 180
Linux 名詞 179
中国地方 名詞 179
東部 名詞 171
3月 名詞 170
日本 名詞 170
5月 名詞 170
℃ 名詞 169
突風 名詞 169
無 接頭詞 166
4月 名詞 165
まし 助動詞 164
警戒 名詞 164
7月 名詞 164
など 助詞 162
性 名詞 160
中 名詞 160
分間 名詞 160
記号 159
最高 名詞 157
? 記号 157
分 名詞 156
でしょ 助動詞 156
回 名詞 154
ます 助動詞 154
9月 名詞 154
人 名詞 153
Stretch 名詞 153
時間 名詞 152
平成 名詞 152
Matsue 名詞 151
出雲 名詞 150
だっ 助動詞 148
不明 名詞 146
8月 名詞 146
🔶 記号 146
10月 名詞 144
前 名詞 143
M 記号 143
夜 名詞 141
について 助詞 140
サーバ 名詞 140
より 助詞 140
" 名詞 140
個人 名詞 138
可能 名詞 138
大雪 名詞 138
BKUgh 名詞 138
1 名詞 137
km 名詞 137
OO 名詞 137
1月 名詞 136
北 名詞 136
2月 名詞 136
ない 形容詞 136
へ 助詞 135
町 名詞 133
日赤 名詞 133
6月 名詞 133
もの 名詞 132
使用 名詞 131
11月 名詞 131
レジ 名詞 131
注意報 名詞 129
12月 名詞 128
計算 名詞 127
その 連体詞 127
ページ 名詞 126
ヘリ 名詞 124
さん 名詞 121
例 名詞 121
便 名詞 121
名 名詞 120
規模 名詞 120
美保 名詞 119
発生 名詞 118
強い 形容詞 118
プロペラ 名詞 118
位置 名詞 117
機体 名詞 117
旋回 名詞 116
目 名詞 115
及び 接続詞 114
ため 名詞 110
災害 名詞 110
ぶり 名詞 109
高度 名詞 109
秒 名詞 108
空港 名詞 108
空自 名詞 107
土砂 名詞 107
| 記号 106
数 名詞 105
所有 名詞 105
Rails 名詞 104
なく 助動詞 103
あり 動詞 103
化 名詞 102
山陰 名詞 102
河川 名詞 102
者 名詞 101
重 接頭詞 101
輸送 名詞 101
低音 名詞 101
: : :
: : :
: : :
[ 合 計 ] 283,925 語
MeCab の仕様による分類なので、半角コロン :
は名詞になり、全角コロン :
は記号になったりと、非常に厳密な分類となっているのがわかる。
そして、例年は助詞の「の」が最多だったが、2017年は半角の「:」や「1」の方が多かった。
単純に数を集計するだけではなく、品詞別に集計するのも面白いものです。
ブログ記事は当方Web サイトで随時検索・参照できるようにしたりしているので、あらためて集計はしていません。(但し、文字数が多すぎるので、品詞分類は行っていない)
以上。
Comments