遅延の話が出たので書いておきますね。

録音ソフトで、マイクからの直接録音+ミキサー(X-Fi Go!の再生リダイレクト機能)
で変換後の音を同時録音し、「あ!」などの短音で遅延を測ってみると、

sayren      約0.2秒
Morph VOX Jr. 約0.5秒
恋声       約0.9秒

という結果でした。※再生リダイレクトによる遅延分もプラスされているので注意!

VCSは試してないので、良かったら誰かお願いしますmm

X-Fi Go!のVoiceFX(女声)は、同じ方法では測れなかったけれど、たぶん約0.1秒くらい。
ハードウェアではその辺りが目安になるのかも?

じゃあMorphや恋声がダメなのかと言うとそうでもなくて、むしろsayrenの0.2秒がやや戸惑う感じ。
そこそこ近いので、前の2つみたいに「言葉を溜めて話す」ことができず、自分の声を聴かない
ように気をつけないと、無意識に「待ってしまう」のでどんどん話すのが遅くなる。

Morphはたぶんその辺を分かっているので、遅延量をお好みでコントロールできるように
ボリュームを付けているんじゃないかと。

まとめると、「リアルタイムで歌える」&「自分の声をリアルタイムで聴きながら話せる」ように
するには、今のところハードに頼るしかないのかもです。
その場合も、歌と声は1オク毎にしないと こんがらがってしまうと思うけど。