Neural Network Console Challenge~Audiostockの音声(BGM)データを解析~ 9日目
"ロック", "フュージョン","バラード","ポップス","クラシック"の分類
精度向上の取り組み①
波形の位置を考慮した認識の場合と、位置を平均化した場合とでAfine手前のプーリング処理を変える必要があるとのことでした。今回、音楽ジャンル分けということでリズムについては平均の方が良いのかと思いました。
(1)MaxPooling
(2)Global Average Pooling
*1
精度向上の取り組み③
探索箇所を限定しての探索や複雑なネットワーク全体を
探索できます。使うことで、何回もtrainingが走るのでGPUの消費が結構ありました。
今回の構造
11層のコンボリューション用いたNNWになっており、
精度取り組み①~③まで反映しています。