>>892
5種類の文字は各3bitで表現可(数学的に2.33bit
従って情報量は11.65bit
これをハフマン符号化したとき、木の表現は割愛して12bitになる。
圧縮して元より大きくなるのはよくあること。このような限られた局面では確率が正しく反映されていないからね。
シンボルABCCDに限定して確率を出して符号化してごらん?10bitにハフマン符号化できるから