単純マルコフモデルでの改良を考えてみる。
>>56で実装したモデルでは、辞書に登録した単語を等価に評価しているが
これに、重みをつけることで、より自然な文章を作成できないかを考える。

これにより、重み情報を辞書に登録する必要がでるので、辞書のフォーマット変更を行う。

ID<tab>文<tab>始終属性<tab>リンク先ID1<tab>重み<tab>リンク先ID2<tab>重み<tab>リンク先ID3<tab>重み・・・<tab>改行

というフォーマットを考えてみた。

IDはユニークなコードであること
始終属性は、先頭に使える文であればf、終端であればe、両方であればfeを設定する。
重みは任意の10進数とする。

これで、アレーの代わりにハッシュを使えば辞書に登録される数が多くなっても
ある程度の速度が期待できる。

問題点としては、辞書の作成が面倒になること。
なんかツールでもつくれば解決するかな?