情報通信システム 其の四 20170511
前回出てきた平均符号長の限界値であるエントロピー.なぜそうなるのかの証明.
命題
平均符号長は
まで短くすることができる.
補助定理2.2
を満たすとき、
が成立.等号は
証明(補助定理2.2)
指数関数のマクローリン展開から得られると低の変換公式より
よって証明.
補助定理2.3(シャノン符号の平均符号長)
情報源の生起確率がである情報源の平均符号長は次の性質を持ち、さらに平均符号長じは左辺よりも短くすることはできない.
証明(補助定理2.3)
とおく.この不等式の左側について考えると、
となり、この不等式はクラフトの不等式になることがわかる.本題の証明は子の不等式自体の変形.
次に、平均符号長は左辺よりも短くできないということを示していく.
と補助定理2.2より
であることがわかるため
よって証明.と一緒に、命題も証明できた.
補助定理2.4(拡大情報源のエントロピー)
第1式の証明は割愛
第2式の証明
で証明できた.
つまり、この第2式からいえることはにすれば、になるということ.
⇒しかし、場合によってはが大きくなりすぎて非効率
⇒比等長情報源系列の登場
比等長情報源系列
2種類の方法があるが、実質1種類みたいなもの.
①タンストール符号化
②ランレングスハフマン符号化
これらの方法は、系列数を一定に保ちながら平均符号長を短くする(平均系列長を長くする)方法.
まずタンストールから
例としてで語数4の情報源を考えていく.
step1:符号の木を確立が大きい方をつなげていく感じで書いていく
step2:平均系列長と末端の数字についてハフマン符号化を行った際の平均符号長を計算する
step3:1情報源あたりの平均符号長をより求める
お次はランレングスハフマンについて
2元、長さ4までの0のランについて考えていく.
0,1の生起確率をとしてやると次のような表を書くことができる,
この各組み合わせについてハフマン符号化をしてやる.ランレングスの形に直してからハフマン符号化をすることから「ランレングスハフマン」.
この例でやってみると、はと分けることができ、符号化するととなる.
長らくやってきましたが、ここで今回は終了.証明は覚えなくてもよさげですが
くらいは覚えておいて損はなさげです.