Machine_learning_nursery_rhymes’s diary

仕事の種を模索するため、今まで逃げていた統計・データを勉強していく

Neural Network Console Challenge~Audiostockの音声(BGM)データを解析~ 2日目

前回の記事はこちら

テーマ設定2

本日も引き続き、テーマ設定を試行錯誤していきます。与えられている音声データには一行説明とタグ情報が付属しています。
そこでタグ情報を使って気分が良くなる楽曲を抽出し一先ず形態素解析を実施していきます。

手順

コピペ初心者なので上記リンクサイトを参考に今回抽出した楽曲のタグについて単語感情極性対応表にそって点数を振りました。
*1参考サイト

1)結果・・・・形態素解析した結果は以下の通りになります。

シンセサイザー 名詞,一般,*,*,*,*,シンセサイザー,シンセサイザー,シンセサイザー
日常  名詞,一般,*,*,*,*,日常,ニチジョウ,ニチジョー
大人  名詞,一般,*,*,*,*,大人,オトナ,オトナ
ムード 名詞,一般,*,*,*,*,ムード,ムード,ムード
ドラマ 名詞,一般,*,*,*,*,ドラマ,ドラマ,ドラマ

形態素解析した結果を、感情極性対応表にそって点数をつけていきます。

2)結果 点数が付いたものがこんな感じ!
[シンセサイザー,日常,大人,ムード,ドラマ]
[-0.395559, -0.757641, -0.960539, -0.174015, -0.188471]


3)結果 この点数のつけ方はイマイチピンときませんね。この点数を平均化し、欠損値は0で埋めました。以下はそれをヒストグラムにし[-1.0, -0.568]、[0.0278, 1.0] をネガティブ、ポジディブとします。

f:id:Machine_learning_nursery_rhymes:20200920093115p:plain

さて、ラベリングまで出来たら次はデータセット作りたい。

ソニー開発のNeural Network Console入門【増補改訂・クラウド対応版】--数式なし、コーディングなしのディープラーニング
はじめての「SonyNNC」 (I・O BOOKS)