ゼロから作るディープラーニング１

2023/2/9 1章, 2章完
2023/2/10 3章完
バッチ処理について: 機械学習ライブラリは大きな配列の計算を効率よくできるように最適化されている。なので、損失関数の計算は一つ一つのデータの組み(正解ラベルとNNの出力)に対して実行するより、データをある程度まとめて、いっきに実行する方が効率がいい。
2023/2/11 4章
2023/2/12 4章完
復習: class実装の流れ、学習の流れ行列計算の可視化をしたいバッチ処理のためのデータ処理(行列管理)
勾配の計算は完璧
☆復習ちゃんとやる!
class 内で def __init__とするとコンストラクタを生成できる。
class TwoLayerNet (init, predict(sigmoid, softmax), loss(cross_entropy_error), accuracy, gradient)
何がわからないのかわからなくなった。

静的メソッドなるものと遭遇。
静的メソッドはオブジェクトを生成しなくても実行できるらしい。使い道あるの？
逆にいえば、オブジェクトやクラスの内容状態に依存するような関数をまとめたのがクラスってこと？

2023/2/13
活性化関数の意義: 非線形な変換器を利用することで複雑な非線形表現を学習できる。
逆に活性化関数がなければ、線形表現しか学習できずDNN自体が線形な写像になってしまう。
よく考えたら、sigmoid や tanh が有効に作用してくれる引数の範囲は −2〜2 ぐらい
入力ベクトルをこの範囲に正規化する理由は活性化関数の表現力を高めるため？
じゃあほぼ線形なReLUはなんで採用されてんの? -> 正の範囲で微分値が全て１だからDNNの学習の収束時間が早くなる
逆に、sigmoidやtanhは「勾配が0に飽和して学習が進行しなくなる」ことがあるらしい。
https://cvml-expertguide.net/terms/dl/layers/activation-function/

時間がないので写径をやめる。方針 -> ゼロつく5章、6章、７章 -> pytorch 1章、2章 -> kaggle

2023/2/14
5章、６章完
数値微分の計算に対して、誤差逆伝播は事前に準備して微分係数を局所的にかけるでけで勾配を求めることができる。
交差エントロピー誤差は逆伝播が(y-t)になるように設計された

7章完全結合層に入力するデータは１次元に整形しなければならない。(flatten)
しかし一次元では、画像の形状の情報を保持することは難しい。
一方で畳み込み層は画像の形状の情報を保持できる強みがある。

hibiki333155555 / zerotuku

ゼロから作るディープラーニング１

About

Languages