出来ました、CreateDeviceでD3DDEVTYPE_REFを指定するだけじゃなくて
D3DCREATE_HARDWARE_VERTEXPROCESSINGを指定しないとダメなんですね。
理屈はよくわからんけど・・・
リファレンスラスタライザの中で、ハードウェア頂点処理(のエミュレーション)を
させることにしておかないと、プログラマブルシェーダのエミュレーションも
出来ねーよ、ということかな。