(2)Lagについての検討 本検証で使用しているような時系列データの性質をつかむためには,統計量の算出が重要である。統計量の指標としては,自己相関関数や偏自己相関関数がある。これらは時系列データにおける各時刻のデータが,時間差を設けてずらしたデータとどれだけ相関関係にあるかを定量化する指標である。時系列データでは観測値と観測した時間が逐次記録されており,各観測した時点の関係性(前後関係)に意味がある。本研究では時系列データのもつ時間差の度合いであるLag(ラグ)に注視し,時点をずらして算出した自己相関関数を用い検証の指標とした。 なおGP回帰に使用したソフトウェアASCMOではLagについて仮説を立てやすくするため,Fig. 3に示すように逆自己相関関数IACF (Inverse Autocorrelation Function) と呼ばれる指標を参照している(5)。横軸に時間のLag,縦軸にIACFを示しておりゼロに収束していくIACFの出力結果を参照しつつデータごとのLagを検討するのが望ましいとされている。本結果より,Lagが0,1を中心に相関を持ち2以上の場合でも影響を受けていることが示唆される。そのためLagをここでは大まかに0,2,10と仮定して後節で検証した(6)。(16) (ただし,係数ベクトルsrや基底関数の個数mはハイパーパラメーター)なる特別な形として取扱うことにし,計2m個あるar,br (r=1, 2, …, m)については互いに独立で同一の正規分布(17)(17)に従った乱数を発生させることにより定義する。実際このように取扱えばf | Xは平均ベクトルが0であり,分散共分散行列がカーネル関数(18)(18)を共分散にもつKであるような多変量正規分布に従う一例として構成することができ,上記に述べたとおり,任意の点x*におけるyの推定値をμ*として得ることができる。Table 2に計算条件を示した。Tsxrπ2sin(Tsxrπ2{cos(arμ*μ―152―brm=Σ1rmσΣ=1mrTsx(rπ220nΣi=12σ(μ*=k (x2=k (xσ***y=k*******(,⋅i+=()=−xk))j(ij rf) ) 2.3 検証内容 一般的にGPを用いた過渡モデリングは➀データ収集,➁データ前処理,➂モデル構築,➃モデル検証のプロセスで開発される。本報告では特にモデルの精度に影響が大きいと考えられる➀➁のプロセスに着目し目的関数を表現する時系列データの加工方法と,説明変数の選択方法について検証する。3.1 時系列データ解析における諸検証(1)データの分割 GPを用いた検証に当たり,Fig. 2のように合計600秒間からなる車両の走行データに対し,半分の300秒を訓練データ,残りを検証データと割り当てた。訓練データに対して分割周期の変更を行い,検証データを入力し検証を行った。Fig. 2 Conceptual Diagram of Preprocessing3. 結果αi)}2/2, 5/5, 10/10Trigonometricf |X ~ N (0, K) | x*, x*, x1), …, k (x, X)=[k(xを表す。上記の μ*が特にyのx定値を与えており,α=[α1, α2, …, αn]T=(K+σnk (xxx )∗x(),~,00mabNrxx,icosTable 2 GP Simulation ParametersNameParameter SettingKernel as subset size (m)50Number of Iteration100Minimum Time Lag Inputs/Outputs0,1Max Time Lag Inputs/OutputsKernel functionに基づき,平均ベクトル0,分散共分散行列Kなる多変量正規分布(9)式に従うことを仮定する。(9)すると,任意の点(検証用の説明変数ベクトル)x*におけるyの予測分布については式(10)(11)(12)の形でベイズ推定することができる。(10), X, y ~ N (μ*, σ*2), , X)・(K+σn(11)2I)-1y, ) (12), X)・(K+σn)-k (x2I)-1k (X, x*, X) は2は予測分散,k (x, xn)]=k (X, x)T (13)*における(平均的な)推(14)2I)-1 とおけば(15)式のように表すことができる。すなわちカーネル関数の線形結合であることを示している。(15)ここに,μ*は予測平均,σ* 以上を踏まえ,ここでは関数f (x)を具体的に
元のページ ../index.html#159