Neural Network Console Challenge~Audiostockの音声(BGM)データを解析~ 8日目
Neural Network Console Challenge~Audiostockの音声(BGM)データを解析~ 8日目は
インプットの時間に当ててドキュメントを読んでます。
ニューラルネットワークの勉強
教師データの作成で精度が向上しないので、ニューラルネットの構造を変更することで精度を上げられないか検討します。音声データと、波形データでは次元の数が異なっており、(64,3)のものを、(3,64)にTransposeして(3,1,64)の次元にReshapeすれば画像データと同じようにCNNを使用できるとのこと。この形を基本にまずは、簡単なCNNを組んでみようかな。
見本では10層の畳み込みニューラルネットワークで構成していました。