マエカワの備忘録的な何か

思い立ったが吉日

ユビキタスネットワーク 其の二 20171016

Ethernetについて

 Ethernetには物理層データリンク層が関係している。

データリンク層

 多重アクセス制御が大事になってくる。この方法には二種類ある。

  • メディアアクセス制御(MAC
  • 論理リンク制御(LLC)

この二種類の制御方法のことをサブレイヤと呼び、データリンク層にはMACとLLCのサブレイヤが入っている構造になっている。

MAC(メディアアクセス制御)

 多重アクセス制御を行い、無線、優先などLANの種類によって使う領分が違う。

LLC(論理リンク制御)

 作られた当初、何もしないタイプ1と、フレームの送信確認などの重装備を持ったタイプ2などのタイプがあった。しかし、今では何もしないタイプ1だけが生き残っている。

Ethernetの歴史

 1980年に開発された。それまでの通信速度が300~9600bpsだったのに対して、いきなり10Mbpsをたたき出す。ここでは、主な構造について順を追って書いていく。

同軸ケーブル

 今やTVのケーブルとして使われている同軸ケーブルが初期のEthernetに使われてた。この同軸ケーブル、内側と外側に電流がそれぞれ流れているので、互いの電流が磁場を打ち消し合います。そんな話はさておき、この同軸ケーブルを使って高周波信号を送っていたわけです。
 仕組みとしては、一本の同軸ケーブルの合間にトランシーバと呼ばれるものを針で刺して接続。各端末に電流が通るようにします。同軸ケーブルの両端は無反射終端にして、電流が跳ね返ってくるのを防ぎます(これができてないと衝突が起こってしまう)。こうすることで、どこかの端末が信号を送れば、同軸ケーブル内を信号が走り、各端末に一回ずつ信号が伝播し、無反射終端で信号が消滅する。

マンチェスター符号

 Ethernetを実現するにあたって、「信号無し」という状態を表現しなければいけなくなった。信号のオンオフだけではこの「信号無し」を表現することができないので、2パルス1ビットのマンチェスター符号が用いられた。この符号の対応は

  • 10→0
  • 01→1
  • 00→信号無し

となっている。

MACアドレス

 信号が誰宛なのかを判別するためには、各端末にユニークなアドレスが必要になってくる。そこで登場したのがMACアドレスMACアドレスは合計で6バイト。内上位3バイト(OUIという)をIEEEが管理している。大量の端末にアドレスをつけるため、各企業はこの上位3バイトの組み合わせを大量に取得している。
 数あるMACアドレスの中でもFF:FF:FF:FF:FF:FFのことをブロードキャストアドレス*1と呼ぶ。

フレームという概念

 データを一気に送信しようとすると、ほかの作業に支障が出たりとあまりうれしくない。そこでフレームという単位に分けて、そのフレームごとに送信している。フレームの構成は次の通り。

  • プリアンブル(7バイト)
  • SFD(1バイト)
  • 宛先アドレス(6バイト)
  • 送信元アドレス(6バイト)
  • データタイプ(2バイト)
  • データ(46~1500バイト)
  • SCF(4バイト)
プリアンブルとSFD

 フレームの最初の8バイトには、プリアンブルとSFDと呼ばれるビット列が格納されている。これは、どこからデータの送信が始まるのかを宛先側に教えて準備をさせる役割を担っている。いきなりデータに来てもらわれては、宛先側もたまったもんじゃない。
 具体的なビットパターンは

  • プリアンブル:10101010
  • SFD    :10101011

となっている。プリアンブルは7バイト分あるので、このビットパターンを7回繰り返すことになる。

FCS

 これは、誤り検出を可能にするものになっている。

フレームの送受信

 フレームの送受信には、CSMA/CDという手法を用いていた。この手法は通信どうしが衝突しないために必要になってくる。他の端末が信号を送信していたら送信見送り。送信が終わるまで待ち、ランダム時間待ってから自分のデータを送信する。
 プロセスは自分が流したデータと違うデータが流れていたら衝突とみなして処理中止というもの。ただ、この方法には、衝突を判断する前にフレームを送信しきってしまうという問題がある。この原因は大きく二つ。フレームが短い場合か、ケーブルが長い場合。このため、フレームの最小長は64バイトとなっており、データのサイズの最小値も46バイトと定められている。また、ケーブルの最大長も1kmと定められている。
 ケーブルの種類は長さや直径によって変わり、

  • Thick Coax:10BASE-5(500m)
  • Thin Coax:10BASE-2(200m)

のような種類が存在する。

Star型ネットワークの登場

 これまでの同時期ケーブルを使ったデータ通信はBus型と呼ばれるもの。これではすべての端末に一回一回信号が送信されてしまったりなどと無駄が多かった。そこで提案されたのが、一つのハブから各端末にケーブルが伸びるようなStar型ネットワーク。この方式が出てきてしばらくは、ハブの機能は同軸ケーブルと変わらなかった。
 しかし、次第に「別の端末に信号送るの無駄じゃん?」って感じでスイッチングハブの提案がされた。

スイッチングハブ

 MACアドレスを管理するテーブルを保持している*2。これによって、フレームの宛先アドレスと合致するポートに限定して送信できるようになった。しかし、これでは衝突を検出することができないので、フレームのキャッシュを残しておくためのフレームバッファも必要になる。
 また、ケーブルは同軸ケーブルではなく、UTPケーブルを用いている。このケーブルには送信用と受信用のケーブルが備わっていて、送受信を同時にすることができる。この通信方法を全二重通信と呼ぶ。対して、同軸ケーブルを用いていた通信は半二重通信と呼ばれるものだ。どちらの通信方式がいいかは一概に言えず、時と場合による。

Ethernetの名称

 二つ前のセクションにも出てきた「10BASE-2」「10BASE-5」とかいう表記法だが、これは三つのことを表している。

  1. 伝送レート
  2. ビット列の加工の有無
  3. メディア(ケーブル)に関係するもの

 1.はそのままの意味です。伝送レートを表している。
 2.の値が「BASEの」場合はビットの加工はしていない。他に「BROAD」という表記があるが、こちらはビットを加工しているものを表す。しかし、めったにない。
 3.は同軸ケーブルか、何メートルのケーブルなのかなど、メディア関連のことを表現している。UTPケーブルを用いているときの表記は「-T」と決まっている。
 したがって、伝送レート10Mbpsでビット加工なし、UTPケーブルを用いているEthernetの表記は「10BASE-T」ということになる。

ほかにもいろいろEthernet

 マンチェスター符号化では1ビットを2パルスで表現していた。これを1B2B符号と呼ぶのだが、これでは情報量が50%になってしまい、非常にもったいない。そこで、4ビットを5パルスで表現する4B5B符号というものが登場した。この方式のEthernetの名称には最後に「X」が付く。
 また、光ファイバを利用したEthernetの名称は、メディアを表すところが「-F」になる。例えば、4B5B符号と光ファイバを用いて構成されている伝送レート100MbpsのEthernetの名称は「100BASE-FX」と表すことができる。

*1:このアドレスは、セグメントに接続されたすべてのホストにパケットを送るために用いられる

*2:MACアドレスとポートの対応付けは、初回アクセス時に行っている

認知言語学 其の二 20171016

はじめに

 今回、上級科目でとることにしました。第一回の講義はほかの講義を見に行っていたので出ていませんので、第二回からの更新となります。あらかじめご了承ください。

図地分化現象

 フォーカスされたほうを図(Figure)、背景になっているところを地(Ground)と呼ぶ。有名な例としては、ルビンのツボ。また、文章にもこの現象が起こる。例えば

  1. The candle is on the desk.
  2. The desk is under the candle.

の二つの英文。どちらも同じことを表しているのだが、違和感なく読めるのは一つ目の例文だろう。図になりやすいものの特徴として、簡単に動かせるものというものがある。この例ではロウソクが図になりやすいため、主語に"the candle"がある分のほうがなじみやすい。

古典知覚理論

  • 恒常仮設:同じ刺激は同じものを引き起こす
  • 要素主義:部分をつなげると全体になる
  • コピー理論:

といった理論が昔あったが、これでは図地反転(ルビンのツボ、だまし絵など)の現象やプレグナンツの法則*1を説明することができない。

トップダウンボトムアップ処理

 ただの白黒斑点模様と思いきや、ダルメシアンなど意味のある物体が隠されているだまし絵などを見たことがないだろうか。ただの斑点と見るか、ダルメシアンと見るかとで頭の中で行っている処理は違うものになっている。

 ダルメシアンの例でいうと、パッと見て何が描いてあるのかわからないが、だんだんとダルメシアンに見えてくるというのがトップダウン処理先にダルメシアンが見えてそのあと全体が見えてくる処理のことをボトムアップ処理と呼んでいる。

言語ではどうなのか…

 さっきのロウソクの例などからもわかるように、言語にも図地選択現象が起こっている。起こり方も様々で、比較的小さいものが図に選択されやすいとか、時間的幅があるものが地になるとか。分詞構文の例が面白かったので載せておく。

  1. Singing an aria, her costume ripped open.
  2. Her costume ripped out, she sang an aria.

どちらも正しい文だが、1番は衣装が一気に破れている。たいして2番は時間をかけて衣装が破れていっていることを表している。これは、歌っている状態が地になるのか、破れている状態が地になるのかの違いを表している。

メンタルスキャニング

 実際は動きのないもの(山、地面)などに、心的な動きをつける方法。例えば

  • 山が東西に延びている
  • 砂がうねる

などの表現。山は実際に走っているわけではないが、この表現は山が走るように伸びている様子を表現できている。
 ちなみに、今回の身に課題はこの新しく表現を書いてみるということでした。自分は「感情がほとばしる」という文を作り、少し物議をかもしました。

付けたし

 この講義、後半は「メディア分析法」と内容がかぶるそうですが、欠席2/3で確定落単なので頑張っていきましょう。おそらくレポート評価だと思われます。

*1:単純な秩序を持つ形態を知覚する法則

心理情報学 其の二 20171013

心理検査についてもう少し

測れるものについて

 問題によって計測できる能力、傾向が異なる。用途に合った尺度で測ることができる心理テストを用いることが重要になる。例えば、就職で用いられるSPIでは、行動・意欲・情緒・ライスケール(嘘をついている可能性がないかどうか)などを尺度として実施される。
 しかし、心理検査には自分をよく見せようとするあまり「回答のテンプレート化」が問題視されているという側面もある。そもそも、テンプレートと化した回答で受験者の何が測れるのであろうか。

資格について

 臨床心理士が心理検査を行うには数年の経験が必要となる。それにもかかわらず講義内で心理検査が成立してしまうのはなぜだろうか。それは、採点方法のマニュアルがあるから。このマニュアルによって傾向を測ることができる。

四つの窓のうち三つ

 心理テストでは

  • 自分が認めている面
  • 人に開いていない面
  • 自分が意識していない面

の三つを測ることができる。これは、昔受けた「キャリアデザイン」という講義でもたびたび出てきた「四つの窓」という考え方になる(「自分が意識していなくて周りが知っている窓」と「自分も周りも知らない窓」の二つの窓がまとまっているだけ)。

 余談だが、血液型性格検査というものが一時期流行り、書籍まで出たほどだった。この検査の本質は「ヴァーナム効果」と呼ばれるものであり、誰が聞いても「あぁ、あるかも」と思ってしまうことを言っているだけだという。信頼性はない。

心理テストの特性

 心理テストには二つの種類がある。それは

  • 能力検査
  • 行動特性

の二つ。能力検査では受検者の最大パフォーマンスを測る。例えば、IQや精神運動検査*1など。行動特性検査では、典型的なパフォーマンスを測る。

心理テストの構造

  • 目的:査定なのか診断なのか
  • 対象:個別なのか集団なのか
  • 手法:質問形式なのか投影法なのか作業系なのか

など、いろいろな組み合わせがあるわけだが、このほかにも構成要素はたくさんある。

いい心理テストとは

 次の尺度で心理テストの良しあしが変わってくる

  • 妥当性
  • 信頼性
  • 客観性
  • 実施容易性
  • 採点容易性
  • 経済的安価

 まぁ、そりゃそうだよなって感じです。

心理テストのバッテリー化

 まずバッテリー化についての説明。
 一つの心理テストには測れる尺度とそうでない尺度が存在する。そこで、複数の心理テストを組み合わせることで、弱いところをカバーしていくという考え方ができた。これをバッテリー化といい、信頼性も上がっていく。大数の法則みたいな感じで認識しておけばいいかと。そして、テストに出るそうです。
 就職試験が学力・適正・面接の三段階になったのもこのバッテリー化の考え方によるもの。昔は学力試験だけでとっていたらしく、「頭がいいだけの人」が多く採用されたということだ。「それは頭のいい奴を使うだけの能力がお前になかったんだ」ってだけかもしれないですが…。

心理テストの効用について

 心理テストによって自分の知らなかった部分が浮かび上がってくることがある。自分をより知ることによるカウンセリング効果も見込むことができる。そのほか、カウンセリングや面接のときの判断基準になるなど、いろいろ。

心理テストに対しての批判

  • 人は嘘をつくので、正確な結果を得ることができない
  • 投影法などには根拠がない

 確かに、その通りだと思う。ただ絵の具をベチャっとつぶした現代アートみたいなものを見てわいてきた感情が深層心理を映し出すとも思えない。

心理テストの限界

 ここまでやってきたが、もちろん心理テストにも限界というものがある。

  • 全体の一部しか知ることができない
  • 受験者の気分に左右されてしまう

などいろいろ。前者に対しては、バッテリー化という対応策があるわけだが、後者に関しては、せいぜい「万全の状態で受験してくださいね」というくらいしかないだろう。SPIなどの自分の運命のかかった心理テストに果たして万全の状態で臨めるのかは知らないが。

付けたし

 今回で一応イントロダクション部分は終わりです。次回は内田クレペリン検査を一時間使って実施していくそうです。このクレペリン検査に関するレポートが必須課題として出されているので、受けた後のヘロヘロな状態で頑張ろうと思います。

*1:型結びをどれくらいでほどけるかなど、イライラするようなもの

メディア論 其の二 20171016

メディアとは

 情報伝達の媒体で、物理特性を持つもののことをいう

メディアの階層

  • 第一階層(情報層):声、電波などの単純なもの
  • 第二階層(物理層):第一階層のバックボーンにあるインフラ、仕組みなど
  • 第三階層(社会・経済層):すべてをまとめる、メディアのあり方、概念的なもの

 これら三つの段階がメディアには存在する。

メディアの仕組み

 ひとつのメディアだけを考慮するだけだと、実装するのはとても簡単。しかし、現在では複数のメディアを駆使してコンテンツが作られている。その結果、メディアの特性をそれぞれよく考慮していかなければならなくなった。
 ここでいう特性は「プロパティ」と呼ばれ、信頼性、リアルタイム性などいろいろある。これらが考慮されてメディアは作られるべきだろう。

GYAOYouTubeの分け目

 GYAO著作権料を払い、番組を提供することでかつての放送メディアのイメージを維持したコンテンツだった。たいして、YouTube著作権料を払わず、投稿者の自己責任という形をとることでコンテンツの多様化が図られ爆発的に普及した。これは、うまいこと人の流れに乗ったことが原因だろう。
 これまでのメディアの流れを見てみると、次第に流動的で多様性があるものがはやっている。これが今の人間が求めていることなのだろうか。マストドンではサーバでさえ多様化が図られている。

メディアを作るとは

 大きく分けて二つに分けることができる。

  • システムを作る
  • コンテンツを作る

 テレビ関係で考えると、前者は「テレビそのものや電波塔と作る」、後者は「テレビ番組を作る」ことに等しい。
 テレビのように、社会インフラが必要なメディアは作るのがかなり大変になる。その割にweb上のオープンソースを用いて作るアプリケーションやサービス(例えばYouTubeなど)は比較的簡単に作ることができる。

そもそもメディアとは

  • 情報伝達を媒介するもの
  • 媒体を制御する仕組み

のことをいう。これらをデザインするメディアデザインという学問も産業革命以降発達してきた。

メディアデザインとは何ぞや

 産業革命時に誕生。環境が変化したことにより、これまでの伝統工業を見返す運動が広がる(アーツアンドクラフツ運動)。今のチェキブームとかと似ているかもしれない。人間は進化すると懐古的になる生き物なのかもしれない。
 活版印刷が主流になった時代、オリジナルは一つで大量のコピーが出回るという構図が生まれた。こうなると、最初のデザインをよくすることで品質を向上しなければいけなくなる。これがメディアデザインの始まりになる。

バウハウス

 デザインの学校。工業デザイン*1はここで生まれた。丸いランプとか四角い椅子とか(雑)。
 画像検索すれば、いろいろ出てきます。お値段もバカ高いそうですよ。大量生産するために作ったのに。


このメディアデザインの範囲までがこの講義で扱うこと。

*1:工場で作りやすいシンプルな形、だが美しい造形をしているデザイン

知的情報処理 其の二 20171013

探索について

 電車に乗るとき「一番安い経路」を検索することがある。この時、プログラムは大量の経路情報から条件に合う経路を探索している。このように、探索なくして検索システムなし。非常に重要な技術なのである。

種類

 いろいろあるが、大きい分類では二つ。その分類それぞれに二つの小分類がある。大きい分類は

  • 状態空間探索
  • 問題分解法

の二つ。状態空間探索では、初期状態から目標の状態へ向けてオペレータ(規則、ルール)を用いて探索していく方法。問題分解法は、大きな問題を小さな問題の集合と考えていく。小さな問題を解いていくことにより、全体の問題を解決していくという方法だ。
 小分類のほうは

  • 盲目的探索
  • 発見的探索

の二種類。盲目的探索は、手当たり次第に試していく方法。発見的探索はいい経路が見つかる可能性を計算して経路を決めていく方法になっている。発見的探索のほうが、人間的なプロセスを踏む探索方法だといえるだろう。
 次から、これら合わせて4パターンの探索方法について、代表的な方法例を交えての説明を書いていく。

迷路問題

 ここでは、それぞれの方法を使って迷路問題を解いていく。そのプロセスを見て、方法ごとの特徴を観察していく。そのために、迷路問題とはいったい何なのかを書いていく。

問題

 次のような迷路があったとする。この迷路を最短で解くにはどのような経路をたどっていけばいいだろうか。


f:id:maekawa_yoshimiki_1119:20171019123504j:plain:w250

 もちろん、人間の目で見て考えれば「A→E→I→J→F→G→K→O→P」の順だと一発で分かるが、ここではコンピュータにこの問題を解かせる。

問題の簡略化

 この問題をコンピュータに解かせるためには、いくつかの前処理が必要になってくる。結論から言うと、木構造に落とし込んでいく。つまり、上の問題を


f:id:maekawa_yoshimiki_1119:20171019133838j:plain:h250

このような木構造として扱っていく。これから出てくる探索方法が解決する問題は「この木構造のAからPまでの経路を探索する」と仮定しておく(横でごめんなさい)。

状態空間探索

 初期状態から目標状態までの経路をオペレータを用いて探索していく方法。すべての状態を合わせたものの組み合わせが状態空間と呼ばれるため、状態空間探索と呼ばれる。

盲目的探索

 手当たり次第に試していく方法になる。この探索法には「深さ優先探索」と「幅優先探索」の二つの方法例がある。

深さ優先探索

 木構造の最終端までいって目的のものがなかったら一番近い分岐点まで戻って、別の経路を探索するというもの。一番近い分岐点に戻る機構のことをバックトラックと呼ぶ。この方法は「次の状態」と「一番近い分岐点」の二つの情報だけを覚えておく必要がある。そのため、必要となるメモリを抑えることができる。ただシステムを作るだけでなく、各手法がどのような特徴を持っているのかを把握し、利用者にとって最適なものを作る。これもモノづくりで重要なことだ。

幅優先探索

 木構造の同じ階層にあるものを調べていく方法。この方法では、最短で目的の状態を見つけることができる。しかし、同じ階層にある状態すべてを覚えておく必要があるので、メモリ消費は多くなってしまう。そのため、さくさく動くシステムを作るには向かない手法といえる。

 これらの方法は最適な解が木構造のどこにあるかで、その性能に幅が出て来ることにも注意しておきたい。

発見的探索

 こちらの方法は人間的に、「こっちの道に行ったらどうなるかな…?」なんてことを見積りながら経路を探索していく方法になる。この見積もりを立てる関数を発見関数と呼ぶ。発見関数を最適化することでよりいい見積もりを立てることができる。
 以下では、この迷路問題を解くために「目標につくにはJ地点を通る必要がある」といった特徴量が分かっている前提とする。この特徴を見つけ出す技術については「推論・学習」の範囲になるのでここでは割愛。

最良優先探索

 発見関数値の最も大きな(小さな)経路を選んでいく(階層は関係ない)。
 ここでは、迷路問題を解くにあたって現地点から目標地点までの最小距離 \displaystyle h(p)を発見関数として設定する(もちろん、もっといい発見関数の設定があるかもしれない)。ここでいう「最小距離」とは迷路の壁を取り去ったときの最小距離のこと。例えば、今J地点にいて、目標がP地点だったとする。このときJ地点からP地点までは横に2回、縦に1回移動するので、最小距離は3ということになる。より早くこの問題を解きたいので、ここでは発見関数値の小さな経路を優先的にたどっていく。

(発見関数) \displaystyle =h(p)

 この方法で解いていくと、盲目的探索よりも早く解ける可能性がある。しかし、見探索ノードの発見関数値をすべて記憶しておかなければならないので、メモリの消費は激しい。また、発見関数の性能によっては全く逆効果になる場合がある

A*(エースター)探索

 最良優先探索の改良版。発見関数を \displaystyle h(p)だけではなく、開始地点から現地点 \displaystyle pまでの実際の最小距離 \displaystyle g(p)を足したものに変更する。

(発見関数) \displaystyle =g(p)+h(p)

 発見関数の値が同じであれば、階層の深いほうから順に探索を行っていく
 この方法には、すべての \displaystyle pにおいて \displaystyle h(p)が実際の距離よりも小さい場合、必ず最適なものが見つかるという特徴がある。また、今回の問題では最良優先探索との違いが分からないが、経路の組み合わせが複数個ある場合はその中で最適な経路を見つけることができる。現在出回っている乗換案内などの探索システムは、ほとんどがこのA*探索を用いている。

山登り探索

 基本的な構造は最良優先探索、A*探索と変わらない。ただ、未探索経路を無視していく点で特徴的なものになっている。未探索経路を無視するので、バックトラック機構が不必要になり、メモリ消費を抑えることができる。しかし、最適解が発見できない可能性がある。この方法は、株取引などの時間制限が設けられている場合に「とりあえず答えが欲しい」というスタンスで使われる(解が出たら買う、出なかったら買わないなど)。


 こんなかんじで、状態空間探索法にはいろいろな手法がある。メモリの消費、探索完了までの時間などいろいろな要素があるため、一概に決めることができない。どれが一番有能かというよりも、用途によって使い分けることが大切になってくる。
 次回は、問題分解法についてやっていくそうです。