Quantcast
Channel: とも よしなしごと 風の吹くままに
Viewing all articles
Browse latest Browse all 1051

時系列分析のお勉強1 時系列データの意味と種類、基本統計量、定常性

$
0
0


ともちんです。時系列分析のお勉強メモです。
ご興味のない方、スルーしちゃって下さい^^

◆時系列データとは?
 Time series data。時間の推移と共に観測されるデータ。
 観測される順序に意味がある。

◆時系列データの種類
 原系列 Yt:
   時系列データそのもの
 
 対数系列 log Yt:
   対数変換を行った系列
   値が大きくなるにつれデータのばらつきが大きくなる時、
   対数変換で改善されることも多いのでよく用いられる
 
 差分系列(階差系列) ΔYt=Yt - Yt-1:
   一時点離れたデータとの差の系列
   
 対数差分系列:Δlog Yt:
   対数系列の差分系列
   変化率の代わりに用いられることも多い
    それは変化分が小さい時、テイラー展開で以下となるから
      log Yt - log Yt-1 だいたい= (Yt - Yt-1)/(Yt-1)
      ↑ つまり、1時点の変化率と同じになるので

 季節調整済み系列
   原系列から季節変動を取り除いた系列

 ◆基本統計量
 (→基本統計量の意味へ)
 
 平均
 期待値 E (Yt)
 標準偏差
 ← ファイナンスではリスク計測の指標に用いられ、
          ボラティリティと呼ばれたりもする

 自己共分散(autocovariance)
  時系列分析に特有の統計量
  同一の時系列データにおける異時点間の共分散
   共分散(covariance)とは二組のデータ間での平均からの偏差の積の平均値
     二組のデータ間の関係性を表す一つの指標。
     一方のデータが大きい時、他方も大きければ 共分散合計は大きな正値
     逆の関係なら共分散は大きな負値。共分散ゼロなら関連性がない。

 自己相関、自己相関係数 (autocorrelation coefficient)
   自己共分散は単位によって値が大きく変化する。
   なので、自己共分散の値で変数間の関係の強弱ははかれない
   そこで、値が単位に依存しないよう、自己共分散を基準化したもの
   単に 自己相関 と言われたりする。
   関数としてみたものが 自己相関関数
   グラフが コレログラム(correlogram)

◆定常性(stationarity)
 時間や時点などで確率分布が変化しない性質
 平均や分散なども時間などによって変化しない性質
 時系列分析ではデータを定常的なものにする必要がある
 例として、ホワイトノイズなどがある
 
 弱定常性(weak stationarity)=広義定常性(WSS:wide sense stationarity)
   = 共分散定常性 (covariance stationarity)

  広義の意味での定常性(時間差のみに依存)
  過程の期待値と自己共分散が時間を通じて一定

 強定常性(strict stationarity)
  すべての依存構造が、時点に関係なく時間差のみに依存
 
◆ 
iid系列、ホワイトノイズ

 iid系列 (iid sequence) iid=independently and identically distributed
  各時点のデータが互いに独立かつ同一の分布に従う系列
  期待値0のiide系列は時系列モデルの撹乱項(innovation, disturbance term)
   (時系列モデルの確率的変動を表現する部分)として用いることが出来る

 ホワイトノイズ(white noise)
  なんの傾向もなく、ランダム(不規則)に上下に振動する波。
  すべての周波数で同じ強度となる。
  すべての時点で期待値が0、かつ分散が一定、かつ自己相関を持たない
  ホワイトノイズは弱定常過程、時系列モデル構築の重要な構成要素となる。
  正規過程を仮定するとホワイトノイズはiid系列となる(正規ホワイトノイズ)
  正規乱数をホワイトノイズとして利用できる。



☆゚・:,。*:..。?.。..☆゚・:,。*:..。?.。..☆゚・:,。*:..。?.。..
   
にほんブログ村    人気ブログランキングへ 


Viewing all articles
Browse latest Browse all 1051

Trending Articles