マエカワの備忘録的な何か

思い立ったが吉日

認知工学 其の三 20171018

単語の意味とは何なのか

 広辞苑にはとりあえずの定義は載っているが、言葉を言葉で定義していたりする。これでは、循環論法的な無限ループに陥ってしまう可能性があり、限界がある。そこで、単語の意味を表す方法が研究されてきた。ここでは、その方法について書いていく。

事物への指示による方法

 物体そのものが意味を表している、単語が指し示している物体そのものが意味を作り出しているという考え方。しかし、この方法には

  • 抽象度の高いものには当てはまらない
  • 同じ物体でも呼び名が違うものがある

などの問題点がある。

外延表現と内包表現

 外延とは要素を列挙しているもの。内包とは条件を明示して対象を表すもの。単語の意味を表すには、外延表現だけでは不十分で、内包表現が不可欠。単語が指すものたらしめる条件(いわゆるイデア)が意味だからだ。しかし、これは難しい。もちろん、外延的な意味は具体的なものを表す際に必要になる。(cf:symbol grounding(記号接地))

関係による意味表現

 意味ネットワーク(semantic network)という考え方がある。これはノードとリンクからなるグラフ構造で、

  • 階層型
  • 活性伝播型

の二種類がある。

シソーラス

 階層ネットワーク。上下関係や類語関係をまとめたもの。日本語でいうと「類義語辞典」。ノードは単語

Word Net

 階層ネットワーク。シソーラスと似ているが、ノードが単語ではなく類義語集合であることが特徴。IS-A関係で各ノードをつなげていく。自然言語処理にも使われています。オブジェクト指向もこの考え方らしいです。言われてみればって感じですが。

 しかしながら、すべての単語を階層ネットワークに当てはめることはできない。そこで、ちょっと複雑になったのが活性伝播型ネットワーク。

活性伝播型ネットワーク

 フィードバックや共通点が重なって表現されている。なので、より複雑なネットワーク構造を持っている。is-a、has-a、doなど、多様なリンク付けが可能になっている。

意味素による表現

 80年代くらいまでが活発だった議論。最小の意味構成要素(FEMALE、HUMAN、...etc)の組み合わせで単語の意味を表現する方法。もう少し意味素の定義を広げると「意味特徴」と呼ばれるものになる。
 これまでの研究で、「動詞を12の要素で表現できる」や「すべての言語は60個くらいの意味素で表現できる」などの結果が出ているが、その真偽はわからない。
 意味素の研究は、心理学の分野というよりも単語をどのようにしてコンピュータが理解できる形にするか、という側面が強い。主に自然言語処理の分野で研究されていた

利点

 意味素を用いた意味表現の利点として、「意味素が完璧にわかったら、どのような意味なのかを考える必要がない」というものがある。また、選択制限*1を用いて意味素の共通度合いから文の意味を表現することができるといった利点もある。

欠点

 意味素の定義が難しすぎる。これに限る。また、意味素が意味を持つ必要がないというのも難しいところ。概念的なものでもいいということだ。機械学習分野の「意味素」に対応するものは、ディープラーニングを用いて得られる特徴量だ。しかし、これは概念的であり、これが何かというのは説明できないものも多い。

*1:単語どうしの結びつきを意味素で管理し、その関係に合った意味を選択していく手法。これにより、文が持つ意味を絞り込むことができる。