Machine_learning_nursery_rhymes’s diary

仕事の種を模索するため、今まで逃げていた統計・データを勉強していく

Neural Network Console Challenge~Audiostockの音声(BGM)データを解析~ 9日目

"ロック", "フュージョン","バラード","ポップス","クラシック"の分類

精度向上の取り組み①

波形の位置を考慮した認識の場合と、位置を平均化した場合とでAfine手前のプーリング処理を変える必要があるとのことでした。今回、音楽ジャンル分けということでリズムについては平均の方が良いのかと思いました。

(1)MaxPooling
f:id:Machine_learning_nursery_rhymes:20200928144727p:plain

(2)Global Average Pooling
f:id:Machine_learning_nursery_rhymes:20200928144837p:plain
*1

精度向上の取り組み②

Dropoutを入れることで、複数の異なるネットワークの多数決に近いアンサンブル学習し近いことができる。

f:id:Machine_learning_nursery_rhymes:20200928145355p:plain
*2

精度向上の取り組み③

探索箇所を限定しての探索や複雑なネットワーク全体を
探索できます。使うことで、何回もtrainingが走るのでGPUの消費が結構ありました。

今回の構造

11層のコンボリューション用いたNNWになっており、
精度取り組み①~③まで反映しています。

f:id:Machine_learning_nursery_rhymes:20200928150241p:plain

結果

精度が0.65まで向上しました。初めてやった時が0.47だったのでNNWを見直せばももう少し精度向上が望めるのではないかと思ってます。構造探索でよかったパラメータを踏襲しつつもう少し精度向上を図っていきます。

f:id:Machine_learning_nursery_rhymes:20200928150639p:plain

f:id:Machine_learning_nursery_rhymes:20200928150652p:plain


Pythonで儲かるAIをつくる