アセンブラに拘るなっつってんの。
何を持って十分なパフォーマンスとしているのか分からないけど、
mameでも十分な速度が出てるし、何より低速CPUだから
x86のマシンパワーで十分なパフォーマンスは出る。

>CPUループ=メインループ
これも可能。
CPUループの基本はfetch->executeだけだから、
ステータスを見てcpu1f->cpu1e->cpu2f->cpu2eってやれば済むし、
最悪マルチスレッドにすれば問題ない。