…アルファブレンドのテストとして作ったんですが、これ以上いじるとこありますかね?
条件はインラインアセンブラで、24bit,1Pixelごとにアンループ処理(BGR処理後,Offsetを3プラス)
BYTE *pSrc01;…元の画像その1
BYTE *pSrc02;…元の画像その2
BYTE Dest;…合成したピクセルデータを格納

(1PixelRGB中のB要素だけ)
xor eax,eax
xor ebx,ebx
mov ecx,DWORD PTR [pSrc01]
mov edx,DWORD PTR [pSrc02]
mov al,BYTE PTR [ecx]
mov bl,BYTE PTR [edx]
sub eax,ebx
mov edx,DWORD PTR Dest
imul eax,DWORD PTR Alpha
sar eax,8
add eax,ebx
mov BYTE PTR [edx],al