Neural Network Console Challenge~Audiostockの音声(BGM)データを解析~ 1日目
はじめに
企業データを用いてディープラーニングに挑むSonyとレッジが企画するAI開発コンテスト「Neural Network Console Challenge」が応募期間 2020.09.16 WED ~ 2020.10.19 MONで開催されています。
今回のテーマは、Neural Network Console を用いて、Audiostockの音声(BGM)データを解析し🅰の指定テーマまたは🅱の自由テーマを選んでご応募します。
(学習用データ提供:Audiostock)
★Aテーマ
AudiostockのBGM検索の自動分類アルゴリズムを作り出す
★Bテーマ
自由な発想で音声データを解析する
Neural Network Consoleのダウンロード
Neural Network Consoleのセットアップからサンプルプロジェクトの実行まで実施したことがなかったので、Windows版で練習、クラウド版を本番として実施しました。
【環境】
Windows版
プロセッサ:intel(R) Core(TM)i7-8750H
実装メモリ(RAM):32GB
GPU:NVIDIA GeForce RTX2070
Windows版で2点躓いたので記載しました。
①利用開始時のオンライン認証時にエラーが表示する。
Windows版Version 1.80でのエラーについて – Blog - Neural Network Console
②Visual Studio 2015 の Visual C++ 再頒布可能パッケージが上手く認識しない。最新のVisual C++ 2019を入れることで解決しました。
サンプルセットを使用し使い方の確認
今回、初めてNeural Network Consoleを使用するので、まずはサンプルセットで体験してみます。
GPUについてもドライバーが最新であれば、CUDAなど入れず使えるということで、mini_dcgan.sdcprojのプロジェクトを使用し、数字をGANで生成してみました。
★データセット
X:image、y:labelから新しい数字を生成します。
★生成結果
sigmoiで新たな数値が生成されています。6万枚のデータを100エポック、64バッチサイズで学習させて30分程度でした。GPUについても15%程度の稼働になっています。
pythonを使わずここまで手軽にできるのは便利で凄いです。もう少し触りながらテーマを考えていきます。
テーマ設定
今回の学習データはAudiostockの提供する音声(BGM)データ 約10,000点とタグ付けと説明のみ。
アノテーションすることでmy 分類機を作るのかGANを使って新しい音楽を作ってみるか