生成スレッドがCPUの用意したスレッドより少なくても
余剰リソースを出さないような工夫がスカウトスレッドなんだろ。

ピクセルごとに処理が独立しているシェーダプログラミングじゃないんだから
何でもかんでも並列化なんてできるわけがない。