よく使うフレーズ
>via.
>丁稚な日々
>
>
>やってみた。でも値が低すぎてぜんぜんだ。1年くらいじゃそんなにカウントは溜まらないということだろうねぇ。まぁでも傾向は掴めるだろう。
>
>ちなみに、1日ごとに1つのファイルになっているので、そこを cat で結合してチェック用のファイルを作って、 sufary を実行してみた。
>
>../sufary-2.3.8/src/sang -t 10 -n 12 chk | sort -n | tail
>
>結果はこんな感じ。
>
>30 ということで
30 というわけで
31 、ということ
32 コンピュータ
33 いうわけで、
33 と思います。
34 ういうわけで
36 そういうわけ
40 かもしれない
40 インストール > >ということで、コンピュータにインストールすると思います。そういうわけかもしれない。 > >わけを説明しすぎです自分。とはいえ、12-gram が最適っぽいというところはあって、16-gram(8文字)くらいになるとこの辺の文字は消えてしまい、途端にデカレンジャーの文字が……あー感想毎週書いてたからなぁ(笑)。 > >では短くするとどうなるか。 > >10-gram > >43 のですが、
44 か、という
44 個人的には
46 てしまった
48 インストー
53 と思います
61 というのは
65 いうわけで
75 んですが、
108 ということ > >8-gram > >99 んですが
107 なかった
111 というこ
114 そういう
123 というの
127 いうこと
152 ました。
154 ちょっと
165 、という
191 ですが、 > >個人的にはちょっと、ということなんですが、インストールしてしまったと思います。 > >ちなみに旧日記の方は、HTML文書でしかデータが残っておらず、しかも「本日のツッコミ」とかのゴミを排除するのが面倒なので解析を諦めましたとさ。 >
30 というわけで
31 、ということ
32 コンピュータ
33 いうわけで、
33 と思います。
34 ういうわけで
36 そういうわけ
40 かもしれない
40 インストール > >ということで、コンピュータにインストールすると思います。そういうわけかもしれない。 > >わけを説明しすぎです自分。とはいえ、12-gram が最適っぽいというところはあって、16-gram(8文字)くらいになるとこの辺の文字は消えてしまい、途端にデカレンジャーの文字が……あー感想毎週書いてたからなぁ(笑)。 > >では短くするとどうなるか。 > >10-gram > >43 のですが、
44 か、という
44 個人的には
46 てしまった
48 インストー
53 と思います
61 というのは
65 いうわけで
75 んですが、
108 ということ > >8-gram > >99 んですが
107 なかった
111 というこ
114 そういう
123 というの
127 いうこと
152 ました。
154 ちょっと
165 、という
191 ですが、 > >個人的にはちょっと、ということなんですが、インストールしてしまったと思います。 > >ちなみに旧日記の方は、HTML文書でしかデータが残っておらず、しかも「本日のツッコミ」とかのゴミを排除するのが面倒なので解析を諦めましたとさ。 >
