マエカワの備忘録的な何か

思い立ったが吉日

認知工学 其の四 20171025

プロトタイプ理論

 指示概念のプロトタイプによって意味を表現する方法。このプロトタイプは抽象的でも、実際に存在しなくても良く、最も典型的な実体である。いわゆる「イデア」がプロトタイプに該当する。これと区別がつきにくいものに事例理論がある。
 プロトタイプが表している集合の要素であるかどうかはプロトタイプとの近さで決定される。近ければ近いほど典型性が高いといえる。典型的であるほど頭に残りやすく、すぐにアクセスすることが可能になる。
 意味素と似ているが、決定的な違いは「本質的であるか、そうでないか」。あくまで、プロトタイプは抽象度の高いものという扱いになる。

基本レベル(basic level)

 ものを認識する際、基本となるレベルがある。例えば「リンゴ」や「いす」など。学習する際もこのレベルから始めると特徴を列挙しやすいのでわかりやすい。このことを基本レベルの優位性という。

確率モデルで考える

 例えば、リンゴのプロトタイプを「色」「形」などの尺度を使って定量的に表現するとする。


 色(赤:0.9 , 青:0.1)
 硬さ(硬い:0.8 , やわらかい:0.2)

などのように尺度を考えることができるのだが、この確率分散が小さいほど(エントロピーが小さいほど)固有に持っている特徴である可能性が高いので、重要な尺度になる。

 プロトタイプ理論では意味に関する多くのことを説明できる。しかし

  • 抽象概念は表現できない
  • 概念との対応を説明できない(なぜこのプロトタイプになるのか)
  • アドホック概念*1を説明できない

などの欠点もある。

事例理論

 指示したものすべてを表す集合によって意味を表現。簡単に言うと、「猫」なら「猫集合」の平均をとったもので意味を表現するということ。

ここまでのまとめ

 ここまで

  1. 事物による表現
  2. 意味ネットワークによる表現
  3. 意味素による表現
  4. プロトタイプ理論

などを見てきた。この中で分類するならば、

  • 特徴ベクトルによる表現
  • 記号間の関係による表現

の二つに分けることができる。また、この表現手法は自然言語処理人工知能分野で用いられている基本的な手法になっている。
 前者は1・3・4に適用でき、後者は2に適用できる。

特徴ベクトルによる表現

 事物がベクトルであらわされるとして、それ自身を対象とするのが「事物による表現」。意味素があるかないかを01ビット列で表したものを対象にするのが「意味素による表現」。集合の全要素のベクトルを平均したものを対象にするのが「事例理論」で、すべての要素に現れる特徴量を対象とするのが「プロトタイプ理論」。
 いずれもベクトルを対象として、そこに意味を見出そうとしている。

記号間の関係による表現

 読んで字のごとく、意味ネットワークについて言っている。しかし、ここにカテゴライズされるのは意味ネットワークぐらいしかない。


f:id:maekawa_yoshimiki_1119:20171102022810j:plain:h400

外界とのかかわり

 言葉の意味を獲得するうえで、外界とのかかわりを持つことが非常に重要になってくる。ただ単に単語を与えられてもその意味を理解できないが、実際に自分の目で見て、手で触れることで単語の意味が具体的に理解できるからだ。しかし、今の人工知能では学習時にコーパス(辞書)しか使っていない。すなわち、外界とはかかわっていない。この考え方に関する二つの言葉がある。

  • 身体性
  • 記号接地(symbol grounding)
身体性

 外界とのかかわりを重視する考え方。

記号接地

 単語の意味を外界との対応付けによってとらえること。

 これらの有名な例には「シマウマ」がある。知っての通り、シマウマは「シマ」と「ウマ」が合わさった言葉だ。人間が、数多くいる馬の中からシマウマを認知できるのは、「シマ」の意味と「ウマ」の意味を知っており、接地しているからだ。「シマウマ」というまだ聞いたことしかない単語を、「シマ」と「ウマ」というすでに知っている言葉を通して理解する。人間が未知の言葉を理解するときにはこのようなプロセスがある。
 今度は、これを機械にやらせるとどうなるだろうか。ただ単に記号の辞書的な意味だけを知っている機械には、「シマ」と「ウマ」を組み合わせて「シマウマ」を理解し、どの馬がシマウマかを判別できないだろう(symbol grounding問題)。
 ここからわかるのは、単語と外界の結びつきはとても重要ということ。しかし、単語どうしの相互関係によって、単語が接地される可能性もある。例えば、抽象度の高い単語。接地している下位概念を組み合わせることによって、抽象概念を獲得している。
 これは単語間の関係も重要なものだということを表している。

 こうした外界との関係を重視する中で、人工知能もロボットに内蔵されているカメラやにおいセンサーで外界とかかわりを持ってみてはどうか、という動きが出てきている。面白そうだが、この講義では扱わないらしい。
 また、記号接地を裏付ける研究結果も数多く存在している。この「外界とのかかわり」vs「記号間の関係」の議論は最近活発になっている。自然言語処理では今後必要になってくる要素だろう。

*1:その場その場で創造的、無意識的に生み出される概念