Machine_learning_nursery_rhymes’s diary

仕事の種を模索するため、今まで逃げていた統計・データを勉強していく

Neural Network Console Challenge~Audiostockの音声(BGM)データを解析~ 8日目

Neural Network Console Challenge~Audiostockの音声(BGM)データを解析~ 8日目は
インプットの時間に当ててドキュメントを読んでます。

ニューラルネットワークの勉強


実践Deep Learning:波形データの分類と回帰

教師データの作成で精度が向上しないので、ニューラルネットの構造を変更することで精度を上げられないか検討します。音声データと、波形データでは次元の数が異なっており、(64,3)のものを、(3,64)にTransposeして(3,1,64)の次元にReshapeすれば画像データと同じようにCNNを使用できるとのこと。この形を基本にまずは、簡単なCNNを組んでみようかな。

見本では10層の畳み込みニューラルネットワークで構成していました。


音声認識 (機械学習プロフェッショナルシリーズ)