Machine_learning_nursery_rhymes’s diary

仕事の種を模索するため、今まで逃げていた統計・データを勉強していく

gacco 社会人のためのデータサイエンス演習 3週目

クロス集計、相関、時系列データの扱い

f:id:Machine_learning_nursery_rhymes:20190609100003j:plain

3週目の講義ではExcelのピポットテーブルを活用したクロス集計の使い方を習いました。機能としてはしていましたが、実際使ってみると便利そうです。

ピボットテーブルの使い方!Excelで簡単にクロス集計 [エクセル(Excel)の使い方] All About

行と列、値(平均、合計、偏差)など色々変化させて数値の関係を調査できます。与えられるデータは多くとも中々活用できていないので今後の検討課題です。
散布図と相関は機械学習の勉強でも馴染みになっています。今回、一番の発見は時系列データの関係が良く分かったのが一番でした。
①傾向・循環変動
②季節変動
③不規則変動
どういった、形で時系列データを分解し要因を探るのかイメージの切っ掛けになりました。

f:id:Machine_learning_nursery_rhymes:20190609100007j:plain

各算出方法をもとにExcel移動平均線を出してみました。株価で練習してみます。

現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~

現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~