2014年 - ツイート集計!
Updated:
2014年の Twitter でのツイート(メインで使用しているアカウントのみ)を Ruby で集計してみました。(今日気付きましたが、2013 年分の公開は失念していました)
当方は、ツイートは全て自宅サーバ(CentOS)上のデータベース(MariaDB(MySQL))に保存しています。
(実際には1時間に1回 Ruby + Twitter API で本家からデータを取得して保存)
ほとんど SQL で集計可能でした。
品詞・単語別集計は形態素解析エンジン MeCab を使用しました。
集計内容は以下のとおり。
- 月別ツイート数
- 曜日別ツイート数
- 時間別ツイート数
- 文字数別ツイート数
- 1日当たりツイート数別集計
- 品詞別出現回数
- 単語別出現回数
1. 月別ツイート数
[ 年 月 ] [件数] [ 比 率 ]
2014年01月 288 ( 6.95%)
2014年02月 306 ( 7.38%)
2014年03月 387 ( 9.33%)
2014年04月 399 ( 9.62%)
2014年05月 400 ( 9.65%)
2014年06月 284 ( 6.85%)
2014年07月 315 ( 7.60%)
2014年08月 420 ( 10.13%)
2014年09月 334 ( 8.06%)
2014年10月 344 ( 8.30%)
2014年11月 295 ( 7.12%)
2014年12月 374 ( 9.02%)
[ 合 計 ] 4,146 (100.00%)
毎月 300 〜 400 くらいツイートしているようだ。。
2. 曜日別ツイート数
[ 曜 日 ] [件数] [ 比 率 ]
日曜日 546 ( 13.17%)
月曜日 685 ( 16.52%)
火曜日 586 ( 14.13%)
水曜日 606 ( 14.62%)
木曜日 564 ( 13.60%)
金曜日 584 ( 14.09%)
土曜日 575 ( 13.87%)
[ 合 計 ] 4,146 (100.00%)
月曜日が若干多めになっているようだ。
3. 時間別ツイート数
[ 時 間 ] [件数] [ 比 率 ]
00時台 1,021 ( 24.63%)
01時台 7 ( 0.17%)
02時台 8 ( 0.19%)
03時台 9 ( 0.22%)
04時台 13 ( 0.31%)
05時台 40 ( 0.96%)
06時台 22 ( 0.53%)
07時台 12 ( 0.29%)
08時台 11 ( 0.27%)
09時台 28 ( 0.68%)
10時台 28 ( 0.68%)
11時台 26 ( 0.63%)
12時台 351 ( 8.47%)
13時台 12 ( 0.29%)
14時台 29 ( 0.70%)
15時台 20 ( 0.48%)
16時台 74 ( 1.78%)
17時台 101 ( 2.44%)
18時台 668 ( 16.11%)
19時台 832 ( 20.07%)
20時台 305 ( 7.36%)
21時台 295 ( 7.12%)
22時台 127 ( 3.06%)
23時台 107 ( 2.58%)
[ 合 計 ] 4,146 (100.00%)
通常のツイートは 18時台、19時台が多いようだ。00時台、12時台は Bot によるツイートがほとんど。
4. 文字数別ツイート数
[ 文字数 ] [件数] [ 比 率 ]
〜 10文字 1 ( 0.02%)
〜 20文字 21 ( 0.51%)
〜 30文字 54 ( 1.30%)
〜 40文字 105 ( 2.53%)
〜 50文字 213 ( 5.14%)
〜 60文字 414 ( 9.99%)
〜 70文字 462 ( 11.14%)
〜 80文字 629 ( 15.17%)
〜 90文字 459 ( 11.07%)
〜100文字 342 ( 8.25%)
〜110文字 335 ( 8.08%)
〜120文字 206 ( 4.97%)
〜130文字 223 ( 5.38%)
〜140文字 680 ( 16.40%)
〜150文字 1 ( 0.02%)
〜160文字 1 ( 0.02%)
[ 合 計 ] 4,146 (100.00%)
文字数の少なすぎるツイートはあまりなく、70〜90文字くらいのツイートが多いようだ。
(140文字を超えるツイートが存在するのは、ツイート時に BitLy 短縮の URL だったのが Twitter API で取得し直すと Twitter 標準の t.co 短縮になり文字数が変わるため)
5. 1日当たりツイート数別集計
[ Tweets ] [日数] [ 比 率 ]
4 1 ( 0.27%)
5 4 ( 1.10%)
6 14 ( 3.84%)
7 32 ( 8.77%)
8 40 ( 10.96%)
9 41 ( 11.23%)
10 42 ( 11.51%)
11 39 ( 10.68%)
12 37 ( 10.14%)
13 24 ( 6.58%)
14 23 ( 6.30%)
15 24 ( 6.58%)
16 12 ( 3.29%)
17 10 ( 2.74%)
18 4 ( 1.10%)
19 4 ( 1.10%)
20 3 ( 0.82%)
21 5 ( 1.37%)
22 1 ( 0.27%)
23 1 ( 0.27%)
24 1 ( 0.27%)
28 1 ( 0.27%)
29 1 ( 0.27%)
37 1 ( 0.27%)
[ 合 計 ] 365 (100.00%)
1日に10ツイート前後が多いようで、1回もツイートしなかった日は無いようだ。
6. 品詞別出現回数
形態素解析エンジン MeCab を使用して品詞別に集計してみた。
[ 品詞 ] [ 出現回数 ]
名詞 115,529
記号 33,004
助詞 30,877
動詞 10,683
助動詞 7,523
接頭詞 1,797
副詞 1,625
形容詞 1,490
連体詞 463
接続詞 303
感動詞 104
フィラー 9
その他 1
[ 合 計 ] 203,408 語
当然ながら、名詞が多い。フィラーとは「えーと」、「あのー」のような、文と文の間を埋めるような単語のこと。
いつもながら、全体的に「こういうものなんだ」と実感する程度。
7. 単語別出現回数
1年間に出現した単語を集計してみた。(100回以上出現した単語を掲載)
[ 単語 ] [ 品詞 ] [ 出現回数 ]
の 助詞 7,364
。 記号 6,937
: 名詞 5,258
▼ 記号 3,842
. 名詞 3,535
、 記号 3,324
「 記号 3,173
」 記号 3,141
/ 名詞 3,140
は 助詞 3,138
に 助詞 3,115
が 助詞 2,605
日 名詞 2,539
http 名詞 2,257
た 助動詞 2,236
t 名詞 2,200
:// 名詞 2,185
co 名詞 2,174
て 助詞 2,167
月 名詞 2,159
# 名詞 2,110
: 記号 1,950
で 助詞 1,937
【 記号 1,797
) 記号 1,745
( 記号 1,743
を 助詞 1,594
】 記号 1,565
し 動詞 1,446
と 助詞 1,407
matsue 名詞 1,113
今日 名詞 1,049
! 記号 1,048
も 助詞 1,035
ね 助詞 995
だ 助動詞 946
から 助詞 931
( 名詞 929
) 名詞 868
- 名詞 800
2014 名詞 777
自動 名詞 774
松江 名詞 768
市 名詞 763
@ 名詞 748
1 名詞 747
・ 記号 743
入 接頭詞 741
ない 助動詞 734
南中 名詞 731
情報 名詞 695
5 名詞 683
12 名詞 650
いる 動詞 647
です 助動詞 639
こと 名詞 627
7 名詞 621
けど 助詞 618
9 名詞 598
な 助動詞 592
年 名詞 587
BLOG 名詞 585
0 名詞 582
か 助詞 552
する 動詞 552
_ 名詞 545
1 名詞 543
気象庁 名詞 543
2 名詞 541
4 名詞 539
県 名詞 520
よう 名詞 512
10 名詞 485
3 名詞 455
6 名詞 445
11 名詞 444
? 記号 444
RT 名詞 443
れ 動詞 441
8 名詞 436
旧暦 名詞 424
い 動詞 419
さ 動詞 417
] 名詞 406
の 名詞 394
出 動詞 385
日の出 名詞 377
干支 名詞 370
こよみ 名詞 370
六 名詞 369
月齢 名詞 367
曜 名詞 366
18 名詞 365
05 名詞 361
気象 名詞 355
※ 記号 353
う 助動詞 352
17 名詞 345
ある 動詞 342
なる 動詞 340
という 助詞 329
や 助詞 328
16 名詞 326
19 名詞 323
地方 名詞 321
島根 名詞 304
wn 名詞 299
31 名詞 291
でしょ 助動詞 290
06 名詞 289
台風 名詞 284
なっ 動詞 275
21 名詞 274
ので 助詞 273
第 接頭詞 269
的 名詞 263
明日 名詞 261
まで 助詞 258
^M 記号 256
" 名詞 255
人 名詞 253
14 名詞 250
2 名詞 245
で 助動詞 245
20 名詞 243
災害 名詞 240
13 名詞 233
】[ 名詞 233
22 名詞 231
No 名詞 230
号 名詞 227
15 名詞 226
04 名詞 226
32 名詞 224
shimane 名詞 217
07 名詞 213
時 名詞 212
だっ 助動詞 212
観測 名詞 212
発表 名詞 209
防災 名詞 204
23 名詞 194
発生 名詞 188
3 名詞 188
頃 名詞 186
等 名詞 185
→ 記号 184
L 名詞 182
XnBWJ 名詞 180
hQx 名詞 180
ん 名詞 178
SNK 名詞 178
PrG 名詞 178
09 名詞 173
[ 名詞 172
ください 動詞 169
だけ 助詞 168
注意 名詞 168
て 動詞 165
中 名詞 164
25 名詞 163
30 名詞 161
選手 名詞 159
警戒 名詞 158
24 名詞 155
CentOS 名詞 155
ます 助動詞 154
00 名詞 152
より 助詞 149
ds 名詞 148
08 名詞 146
ない 形容詞 146
26 名詞 145
あっ 動詞 144
Matsue 名詞 144
かも 助詞 143
27 名詞 142
注意報 名詞 142
地震 名詞 142
なく 助動詞 141
思っ 動詞 140
01 名詞 139
警報 名詞 138
中国 名詞 138
EmWwEqgDPY 名詞 137
03 名詞 136
C 名詞 136
xkpHdQhFgf 名詞 135
な 助詞 135
Wn 名詞 135
日本 名詞 134
れる 動詞 134
今 名詞 133
28 名詞 132
サーバ 名詞 132
35 名詞 131
たら 助動詞 131
02 名詞 130
Ruby 名詞 130
何 名詞 129
29 名詞 127
まし 助動詞 127
53 名詞 127
気 名詞 127
個人 名詞 127
前 名詞 127
中国地方 名詞 123
気圧 名詞 122
お 接頭詞 121
Linux 名詞 121
鳥取 名詞 117
として 助詞 117
そう 名詞 117
でし 助動詞 116
そう 副詞 115
それ 名詞 115
XML 名詞 115
西部 名詞 113
34 名詞 113
にかけて 助詞 113
状況 名詞 111
錦織 名詞 111
, 名詞 111
度 名詞 110
土砂 名詞 109
ば 助詞 108
tennis 名詞 108
以上 名詞 108
0 名詞 106
50 名詞 105
さん 名詞 104
6 名詞 104
56 名詞 102
出雲 名詞 102
… 記号 102
一覧 名詞 102
もの 名詞 100
のに 助詞 100
: : :
: : :
: : :
[ 合 計 ] 203,408 語
MeCab の仕様による分類なので、半角コロン :
は名詞になり、全角コロン :
は記号になったりと、非常に厳密な分類となっているのがわかる。
例年どおり、今年も助詞の「の」が今年最も使われていた。
単純に数を集計するだけではなく、品詞別に集計するのも面白いものです。
ブログ記事は当方Web サイトで随時検索・参照できるようにしたりしているので、あらためて集計はしていません。
以上。
Comments