gacco 社会人のためのデータサイエンス演習 3週目
クロス集計、相関、時系列データの扱い
3週目の講義ではExcelのピポットテーブルを活用したクロス集計の使い方を習いました。機能としてはしていましたが、実際使ってみると便利そうです。
ピボットテーブルの使い方!Excelで簡単にクロス集計 [エクセル(Excel)の使い方] All About
行と列、値(平均、合計、偏差)など色々変化させて数値の関係を調査できます。与えられるデータは多くとも中々活用できていないので今後の検討課題です。
散布図と相関は機械学習の勉強でも馴染みになっています。今回、一番の発見は時系列データの関係が良く分かったのが一番でした。
①傾向・循環変動
②季節変動
③不規則変動
どういった、形で時系列データを分解し要因を探るのかイメージの切っ掛けになりました。
各算出方法をもとにExcelで移動平均線を出してみました。株価で練習してみます。
現場ですぐ使える時系列データ分析 ~データサイエンティストのための基礎知識~
- 作者: 横内大介,青木義充
- 出版社/メーカー: 技術評論社
- 発売日: 2014/02/18
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (6件) を見る