マエカワの備忘録的な何か

思い立ったが吉日

知的学習システム 其の一 20180409

講義について

NNの奥にあることは統計学

 このことについて書いてある記事やエントリは日本語ソースではまだ少ない。
 このほか、確率的情報処理にも通じる。この分野において、情報理論・符号理論に地検は欠かせないもの。

どこにつながっているのかわからない

 この講義のみならず、どの抗議でもいえることだが、技術分野はどこでつながっているのかが分からない。画像処理とつながったり、医療分野とつながったり。

データ科学:第4のパラダイム by Jim Gray

 第3パラダイムまでは、人や計算機が主体。また、データが付随していくものだった。
 しかし、第4パラダイムでは計算機でも解決できないような問題をどのようにして考えていくのか。このようなことが考えられている。この分野についての論文は、自然科学論文誌のNatureにも載っている。各分野が、この問題を解決しようと躍起になっているからだろう。

分析スキルがメイン

 こんな感じのことを扱っていく。DeepLearningなど応用分野に関しての講義は最後のほうになるそうです。あくまで基礎部分を中心に。その関係もあってか、前半の講義は線形代数の知識をフル活用するそうです。

学習とは

 この講義では「機械学習」に的を絞って扱っていく。簡単に言ってしまえば、「データから知識・表現・基準を抽出すること」を学習と定義できる。
 学習については、大きく3つに分類できるのでその話も。

  • 教師あり学習:正解が分かっている
  • 教師なし学習:この講義のメイン
  • 強化学習:上記二つのちょうど中間あたりの立ち位置

たとえばこんなことを

数字の認識

 これは結構有名な例。手書き文字のデータを数値化して、ヒストグラムに落とし込んで...。そのヒストグラムを見て、「この文字は”0”だな」なんてことを判断していく。そんな感じ。

回帰問題

 関数フィッティングとかの問題。最小二乗法とかを用いてやっていくなど。

この講義に必要なもの

線形代数の知識:前半の講義で使います
‐確率・統計の知識:データを扱うから当然
‐プログラミングの知識:実装して確認するのに必要

上記二つは、学部の時に終わっているものとして進めていくそうです。

この講義でやりたいこと

‐数理基礎・統計推定の基礎の理解
‐数式を低次元に落とし込んで理解

評価方法

  • レポート(小レポート・期末レポート)
  • いい質問・応答をしたら加点
  • 月曜5限がオフィスアワー

課題について

 レポート提出の遅延に関しては、正当な理由をつけて事前に知らせること。これは当然。

最後に

 たぶんとると思います。