マエカワの備忘録的な何か

思い立ったが吉日

情報通信システム 其の三 20170427

命題「ハフマン符号化法によりコンパクト符号になる(2元)」の証明

 まず補助定理を証明して本筋に適用する

 ・コンパクト符号の符号の木の性質

  ①根から最も遠い位置にある葉は二つある

  ②この二つの葉に生起確率の小さいものから二つが割り当てられている

  ①の証明

   二つ無い場合(葉が一つの場合)を考える。この時、葉のない片方の枝は無視することができるので平均符号長を短くすることができる。つまり、これはこの符号がコンパクト符号であることであるという前提と矛盾が生じる。したがって①は真。

  ②の証明

   生起確率の小さいものが割り当てられていないと仮定する。この場合、ほかの葉にあるもっと生起確率の小さな事象と交換することによって平均符号長を短くすることができる。これは、この符号がコンパクト符号であるという前提と矛盾が生じる。したがって②は真。

 ・命題の証明

  帰納法背理法により証明する。画像で乗っけます。

 

f:id:maekawa_yoshimiki_1119:20170505232235j:plain

n次の拡大情報源s^n

 nこの情報源記号をまとめて一つの情報源記号(個数はM^n)とみなした情報源

 ・ブロック符号化:拡大情報源s^nの符号化

  例は画像で

 

f:id:maekawa_yoshimiki_1119:20170505232313j:plain

 

  これは各符号の生起確率の偏りが大きいほど威力を発揮する。

 

 しかし、nの値を増やしていけば無限に平均符号長が短くなるわけではない

  ⇒平均符号長の限界が存在する

 

情報源符号化定理

  

 ただし、エントロピー

  

 で表される値Lまで平均符号長を短くすることができる。さっきの例でいくと

  

 となり、0.72程で限界が来てしまうことがわかる。

インタラクティブシステム論 其の三 20170427

パワースペクトルについて

 フーリエ変換

  

 で表され、オイラーの公式より

  

 と変形できる。この変形をω=-ωの時もやってやると

  

 となり、F(ω)の共役複素数であることがわかる。つまり

  

  

 である。この数値こそパワースペクトルであり、上式からもパワースペクトルは角周波数ω=0の直線で線対称になっていることがわかる。

 

離散フーリエ変換について

 連続フーリエ変換と同じように離散データに関してもフーリエ変換を定義することができる。

  

  

 これに対して、F(N-k)を考えていく。

  

 加法定理とtは整数という条件よりこの式を展開すると

  

 であることがわかり、離散フーリエ変換においてもパワースペクトルが対照的な値になることがわかる。

missing fandamental と無限音階

 フーリエ変換によって各周波数の正弦波に信号を分解することができたが、これを考慮に入れると、正弦波信号は一つの周波数成分のみを持ち、それ以外の信号は異なる倍音周波数成分を持つことがわかる。この周波数成分のなかでも絶対値が一番大きい成分を基底音(基底周波数)と呼びfandamentalとも呼ぶ。missing fandamentalとはその基底音をなくしても、基底音に基づく音を倍音の間隔から認識できるというもの。無限音階とは人間が倍音成分の情報で音を認識していることを利用した無限に上昇または下降する音のこと。

 

伝達関数

 まず

  

 のフーリエ変換を考えると

  

 となり、この関数をSINC関数と呼ぶ。この応用として

  

  を考えると

  

  になることがわかる。この関数についてεを0に近づけ極限をとってやると

  

 になる。この関数のことを超関数δ関数と呼ぶ。グラフを用いて表すと次のようになる(左が超関数、右がフーリエ変換後)。

  
f:id:maekawa_yoshimiki_1119:20170505231217j:image

 

 この超関数はこの後伝達関数を求めるのに用います。

 入力側のフーリエ変換と出力側のフーリエ変換の関係を決めるものが伝達関数H(ω)。入力関数をf(t)、出力関数をg(t)として式でその関係を書くと

  

  になる(フーリエ空間内での処理なので普通の掛け算で大丈夫)。このH(ω)は実験的に求めるのが普通なのだが、入力関数として超関数を用いることによって、出力関数のフーリエ変換の形がそのまま伝達関数の形として得ることができる(超関数のフーリエ変換は1であるため)。このことから超関数のことをインパルス応答と呼ぶことがある。

  一番わかりやすいのは部屋の中で手をたたくイメージ。最初の音(入力)は単一音だが、聞こえてくる音(出力)は広がりを持った音。この広がりこそ伝達関数によるものであり、リバーブなどに用いられている。

 

 システムの導出式がわかっている場合は伝達関数を簡単に求めることができる。バネダンパ系の式の場合出力x(t)を求める式として

  

 がわかっているものとする。このシステムに角周波数ωの正弦波を入力として入れてやる

  

 すると、出力xは同じ角周波数で振幅と位相の違う正弦波が出てくるので

   

 とあらわすことができる。jω=sとして、xの1階微分と2階微分を求めると

  

  ※これは初期条件0の時のラプラス変換になっている.

 になる。これをもとのシステムの式に代入してやると伝達関数H(ω)を計算によって導出することができる。

  

 である。

  疑問:フーリエ空間でもないのに伝達関数が求まってしまって大丈夫なのか?入力と出力のフーリエ空間内での比が伝達関数ではないのだろうか?この比は実空間内でも維持されるのだろうか?

   ⇒伝達関数とは、初期条件をすべて0にした時の入出力関係.ラプラス変換をしているので、周波数領域の話にちゃんとなっている.

コミュニケーション論 其の三 20170427

外国語

 →日本人はLとRを聞き分けることが苦手

 ⇒だんだん外国語がわかるようになるのではなく、ある境から音が言葉になる瞬間がある(突発的に一気に到来)

 

辞書といわれると、3種類考えられる

 ①心的辞書:言葉を言葉として理解できるのは心の中にある辞書を参照しているから

 ②紙の辞書:そのまんまの意味

 ③電子辞書:そのまんまの意味

 

単語とは何か?

 ・聞くとわかる

   ⇒その単語を認識するような細胞が人間に備わっているのではないか?(おばあちゃん細胞)

 ・広辞苑には20万語あまり収録されている

  →国立大学の名前はすべて収録されているので、ユニークでエキサイティングなキャンパスも名前が載っている

  ⇒日常生活を送れる程度の語彙とはいったいどのくらいなのだろうか

   ⇒約8800語くらい(50語テストの結果による)

 ・言葉の特徴によって世界が違って見える??

  ⇒フランス語ははっきりとしてクリアな言語なので、フランス語圏の人たちにはクリアな世界が見えている??

 

ビデオ資料1 プロジェクトX 「広辞苑の生みの親」

 広辞苑の生みの親は新村親子

  →初版は昭和30年

 昭和12年から作り始める(日中戦争がはじまる)

 京都 新村出とその次男である

    ⇒出の夢は「日本語を網羅するような辞書を作る」こと

 猛は大学でフランス語を教えていた

  →フランスでオックスフォード大辞典に出会う

  →当時の辞書の説明書きは少々荒っぽい

   ⇒日本語を網羅してみたいという夢に

 

 じきに警察に逮捕される(治安維持法違反)

  ⇒ペンネームで警察のことを批判するコラムを投稿する

  ⇒出にかくまってもらいながら2年後に釈放される

 

 そんなこんなで廃人状態(もちろん職は失っている)になった猛だったが、出に自分の夢を手伝ってくれないかと頼まれる

  ⇒やってやろうじゃないか!!

 

 しかし、二人では単語集めも十分にできない

  ⇒湯川秀樹など専門家に単語、語彙を分けてもらう(中間子という言葉もこの時点で追加された。中間子は湯川秀樹ノーベル賞をとった時のテーマ)

  ⇒結果として50人余りの専門家から15万の単語を集めることができた

 

 ようやく出版かといったときに印刷所に空襲の攻撃が直撃

  ⇒原稿がお釈迦に。

   ⇒だがあきらめなかった

 

 再び単語集めからやり直し

  ⇒終戦後は新しい言葉や文化が生まれていた。外来語も横行する。これも収録しなければ本物とは言えない(闇市、ノルマ、輪タク、アルバイトなどなど)

  ⇒終戦後に辞書を出版しようなんて会社はどこにもいなかった

   ⇒4か月後、岩波書店が辞書出版に名乗りを上げた

 

 新しい単語、文化を編集するために男女7人が参加した

  ⇒岩波書店の一室を借りて編集が始まる

  ⇒出からの言葉の意味を書いた手紙も大量に

 言葉の集め方はとても原始的

  ⇒新聞やラジオから新しい言葉があれば記録する

 昭和27年に編集終了

  ⇒出版社に持ち込むも、専門用語の説明が難しいなどの問題点が浮上

   ⇒出版を遅らせることはできないといったら岩波書店の総力でもって再編集していった

 昭和30年刊行

 出の名前が背表紙に刻まれる

 

 猛は大学教示に復帰。フランス語を再び教える

 平成4年、87歳でこの世を去る

 

ビデオ資料② プロジェクトX 「ワープロ

 企業間の契約などが盛んになっていた時代、すべて手書きというのはサラリーマンの負担になっていた

  ⇒ワープロ開発のきっかけ

 

 しかし、変換機能に苦戦する。自然言語処理、文節、区切りの認識をし、正確に変換するのは至難の業だった。同音異義語の変換も困難を極めた。また、ビジネス用語(弊社、検収)などは当時辞書に載っていなかったのでそのデータベース作りもしなければいけなかった。

 

 結果、同音異義語については80%正しく変換できるようになった

  ⇒一文字増えるごとに予測しなおすというシステムを用いて正確に変換できるようにした

  ⇒学習機能を導入することによって一度選んだ返還後を優先的に出力させるようにする

 

 その結果、変換に要するスピードを速めることができた