Zaman Serisi ile Getiri Tahmin Modeli Oluşturma 2-Eviews ile Uygulama

Şükrü İmre, PhD
9 min readJun 5, 2022

--

Zaman Serisi ile Getiri Tahmin Modeli Oluşturma 1-Eviews ile Uygulama” yazısının devamı olan bu yazıda, ARIMA modeli kurabilmek için gerekli testlerin nasıl yapılacağı anlatılmaktadır. Böylelikle, bir finansal varlığın getiri tahmini yapabilmek için izlenen prosedürün ikinci adımında neler yapılması gerektiği detaylandırılacaktır.

1. Unit Root Testi

Bu yazıda, çalışılan serinin unit root testinin yapılma süreci detaylandırılıyor. Unit root testi serinin stationary olup olmadığını ve stokastik veya deterministik trende sahip olup olmama durumunu kontrol etmek için yapılır.

Unit root testini yapabilmek için ilk olarak lnli veri Eviews’te açılır.

Daha sonra View → Unit Root Tests → Standart Unit Root Test yolu izlenerek test ekranı açılır.

Unit root testleri çok sayıdadır. Her test farklı bir bakış açısıyla testi gerçekleştiriyor. Tek başına bir teste bakarak unit root test sonucunu yorumlamak her bir testin kendine göre zayıf yanı olmasından kaynaklı uygun değildir. Bu yüzden, birden fazla yöntemle yapılan testlerle kararı destelemek genel bir yaklaşım olarak uygulanmaktadır. Bu yazıda, Augmented Dickey-Fuller (ADF) ile Kwiatowski, Philips, Schmidt, Shin (KPSS) testleri üzerinden ilerleniyor. ADF ile KPSS seride unit root olup olmadığını farklı yönlerden test etmektedir. Her birinin null (H0) hipotezi aşağıda gösterildiği gibi birbirine zıttır.

  • ADF → H0: Seride unit root vardır.
  • KPSS → H0: Seride unit root yoktur.

Bir test, seride unit root olduğunu sınarken diğeri ise seride unit root olmadığını sınamaktadır. İki farklı yaklaşımla test etmek daha doğru yaklaşım olacağından dolayı bu iki test yazı kapsamına alınmıştır.

İlk olarak ADF testi ile unit root testini yapalım. Unit root test yaparken dikkat edilmesi gereken bazı noktalar bulunmaktadır. Test yaparken üç opsiyon bulunmaktadır. Aşağıda bu opsiyonların test edildiği üç denklem yapısı paylaşılmıştır. ilk denklem, Eviews’teki None seçeneğine, ikinci denklem Intercept opsiyonu ve son denklem ise Trend + Intercept seçeneğini temsil etmektedir.

Kaynak: ITU Finansal Ekonometri Ders Notları, 2022

Unit root testi yapılırken ilk olarak trend+intercept ile en genel denklem ile başlanır. Burada test sonucu incelenmeden önce, üretilen denklemin trend katsayısının istatistiki olarak anlamlı olup olmadığı kontrol edilir. Eğer bu katsayı istatistiki olarak anlamlı ise test sonuçları değerlendirilir ve nihai karar alınır. Eğer trend katsayısı istatistiki olarak anlamlı değilse, denklem küçültülerek (yani interceptli denkleme geçilerek) test yinelenir. Eğer intercept katsayısının istatistiki olarak anlamlı olup olmama durumuna göre denklem küçültülür (None denklemine geçme) veya aynı denklemdeki test sonucu değerlendirilir.

Kaynak: ITU Finansal Ekonometri Ders Notları, 2022

Yukarıda tarif edilen prosedüre göre unit root test sonuçları değerlendirilirken hesaplanan t değeri ile t kritik değer karşılaştırılır. Eğer t değeri, kritik değerden büyük ise seri unit roota sahiptir, seri non-stationary’dir ve seri stokastik trende sahiptir denir. Tam tersi durumda ise unit root yoktur, seri stationary’dir ve seri stokastik trende sahip değildir çıkarımı yapılır.

Şimdi yazıya konu olan seride ADF unit root testinin nasıl yapılacağını ve sonuçların nasıl yorumlanacağını inceleyelim. Levelda (yani LNli seride) trend ve intercept modelinin ADF unit root testi yaparak verinin hangi trende sahip olduğunu tespit edebiliriz. Lnli veride ADF unit root test sonuçları aşağıda gösterilmiştir.

Unit root testini yapabilmek için yukarıda paylaşılan yolu takip ederek levelda trend and intercept için ADF testi aşağıda gösterildiği gibi seçimler yapılarak gerçekleştirilebilir.

İlk olarak, bu test sonucunda trend ve interceptin istatistiki anlamlığına bakılır. Sırasıyla, 0.0169 ve 0.019 olan olasılık değerleri 0.05’ten küçük olduğu için, trend ve intercept istatistiki olarak anlamlıdır diyebiliriz. Sonra, ADF unit root test sonuçları kontrol edilir. 0.05’te kritik değer -3.9869 olarak ortaya çıkmıştır. Bu değer ADF test istatistiği olan -2.3262 ile kıyaslandığında, ADF test istatistiği kritik değerden büyüktür. Dolayısıyla, seride unit root vardır, seri non-stationary ve seri stokastik trende sahiptir sonucuna varılır. Bir diğer deyişle, LNli seri stationary değildir.

Bir önceki yazıda, LNli verinin AC (oto korelasyon) ve PAC (kısmi oto korelasyon) correlogramın sonucunda, AC’ler ağır ağır azalırken, PAC’lar ilk değerden sonra 0 seviyelerinde idi. Bu durum, seride bir trend olduğunu ifade ediyordu. Seride iki tür trend olabilir, deterministik veya stokastik. Yukarıda yapılan ADF testi sonrası, LNli verinin stokastik trende sahip olduğu belirlendi. Eğer, ADF testinde H0 hipotezi reddedilebilseydi, seride stokastik trend olmadığı söylenebilirdi. AC ve PAC correlogramda ise trend var yaklaşımı çıktığı ve unit root testinde stokastik trend olmadığı belirlendiğinde, serinin deterministik trende sahip olduğu belirlenirdi.

Şimdi ise first difference için unit root testi yapılmalıdır. Hatırlatmak gerekirse, finansal veride modellemede kullanılacak serinin stationary olması gerekmektedir.

Yukarıda paylaşılan görseldeki gibi seçimler yapıldığında, first difference için unit root test sonuçları ortaya çıkmaktadır. Levelda yapıldığı gibi trend ve intercept ile test gerçekleştirilir. İlk olarak trend ve interceptin katsayısına bakılır ve ilgili olasılıklar 0.05’ten büyük olduğu için istatistiki anlamlı değildir. Dolayısıyla, bu test sonuçları değerlendirilemez.

Bu yüzden, unit root test denklemi interceptli aşağıdaki seçimler yapılarak sonuçlar üretilir.

Interceptli denkleme ait first difference için oluşturulan unit root test sonucu aşağıdaki gibidir. Test sonucuna bakmadan, doğrudan intercept (c) katsayısının istatistiki olarak anlamlı olup olmadığı kontrol edilir. İlgili katsayı kontrol edildiğinde, 0.40 olasılığa sahip olduğu görülür ve 0.05'ten büyük olduğu anlaşılır. Bu da, intercept’in istatistiki olarak anlamlı olmadığı sonucuna varılır. Dolayısıyla, ADF test sonucu değerlendirmeye alınmaz. Diğer denklem yapısıyla testin yapılması sonucuna varılır.

First difference seride unit root testi için None denklemi ile test üretilmesi için aşağıda paylaşılan seçenekler girilir.

Doğrudan aşağıda paylaşılan ADF test sonuçları değerlendirmeye alınır. ADF test istatistiği sonucu dikkate alındığında, 0.05’te kritik değer -1.94’ten -16.90 değeri küçük olduğu için none denkleminde first difference serisinde unit root yoktur, stationarydır ve stokastik trende sahip değildir sonucuna erişilir. Dolayısıyla, bu seriyle modellemeye devam edilir ve serinin Integration seviyesinin 1 olduğu yani I(1) olduğu bulunur. Yani, ARIMA’nın I değeri 1'dir.

Benzer adımları uygulayarak KPSS testi de yapılabilir. KPSS ile unit root testi yapmak için Eviews’te unit root için belirtilen yolu izleyerek Test type’dan KPSS’nin seçilmesi gerekir. ADF testi için uygulanan test adımları sırasıyla KPSS için de uygulanabilir.

İlk olarak levelda trend ve intercept modeli KPSS yöntemi ile test edilir. Trend ve intercept istatistiki olarak anlamlı olarak gözükmektedir. KPSS LM_stat değeri 0.3474 ile 0.146 (0.05 seviyesinde) ile kıyaslandığında yüksek olduğu görülmektedir. Bu durum, H0 hipotezinin reddedilebileceğini, yani LN’li serinin stationary olmadığını (unit roota sahip olduğunu) göstermektedir. Dolayısıyla levelda serinin, non-stationary ve stokastik trende sahip bir seri olduğu anlaşılır.

Serinin first difference için KPSS testini yinelenir ve test sonuçları (trend and intercept) aşağıdaki gibidir. Test sonuçlarını değerlendirmeden önce, trend ve intercept katsayısının istatistiki olarak anlamlı olup olmadığı kontrol edilir. Bu kontrolde trende ait katsayısının 0.05'te istatistiki olarak anlamlı olmadığı (0.3458>0.05 olduğu için) görülmektedir.

Bu yüzden intercept denkleminde test yinelenecektir. Aşağıda interceptle ile devam edilen sonuçlar gösterilmiştir. Sonuçlara göre, KPSS LM test istatiği 0.142647, kritik değer 0.4630’dan küçük olduğu için H0 hipotezi reddedilemez ve böylelikle serinin first diffrence hali stationarydir, seride unit root yoktur ve stokastik trende sahip değildir sonucu çıkarılır. Bu sonuç ise serinin I(1) olduğunu göstermektedir.

Hem ADF hem de KPSS ile yapılan unit root testi ile serinin first difference’da I(1) olduğunu — stationary — bulundu. Farklı yönlerden testler uygulandı ve benzer sonuç elde edildi. Oluşturulacak tahmin modelinde, stationary seriyle çalışılması gerektiğinden serinin first difference ile çalışılması gerektiği sonucunu unit root testi ile bulundu.

2. First Difference Serinin Modellemeye Uygunluğunun Belirlenmesi

Yazı kapsamına alınan serinin modellemeye uygun olup olmadığını için serinin stationary olmasının yanında seride kırılma olup olmama durumunun da kontrol edilmesi gerekmektedir.

ADF ve KPSS test sonuçlarına göre, first difference seri stationarydir. Bu testler seride kırılma olup olmadığını dikkate almayrak yapılan testlerdi. Şimdi, yapısal kırılma olup olmadığını unit root ile testlerin level ve first differenceda yapılması gerekmektedir.

Eviews’te yapısal kırılma ile unit root testi View →Unit Root Tests →Breakpoint Unit Root Test yolu izlenerek yapılabilir.

İlk olarak levelda breakpoint unit root testi trend + intercept ile aşağıdaki seçenekler seçilerek yapılır. Seride iki türlü kırılma olabilir.

  • Innovation Outlier → Kırılma yavaş yavaş gerçekleşir. Düşüş veya artış olabilir. Örnek olarak rampa çıkma veya inme verilebilir. Yani, seri yavaş yavaş değişime başlıyor ve artık eski seviyelerine geri dönmüyor.
  • Additive Outlier → Ani kırılma. 3–5 gözlemde gerçekleşiyor.

Innovational Outlier olup olmadığını dikkate alarak levelde test yapılır.

Breakpoint unit root test sonuçları aşağıdaki gibidir. Bu test sonucuna göre 1 Nisan 2022’de bir kırılma olabileceği sonucu ortaya çıkmıştır. Test sonuçlarına göre, trend katsayısı 0.05’te anlamlı çıkmıştır. Bu yüzden aşağıdaki sonuçlar dikkate alınır. Test olasılığı 0.05’ten büyük olduğu için H0 hipotezi reddedilmez ve dolayısıyla level seri stationary değildir.

First difference için yapısal kırılma olup olmadığını belirleyen test seçenekleri aşağıdaki gibi girilir ve sonuçlar elde edilir.

Yapılan test sonrasında 22 Ocak 2021’de bir kırılma olduğunu öngörülüyor. Kırılmayı dikkate alarak serinin stationary olup olmadığını aynı adımlar izlenerek test edilebilir. Aşağıda verilen sonuçlarda ilk olarak trend katsayısının anlamlılığı kontrol edilir.

Trend katsayısı istatistiki olarak (0.05’te) anlamlı olmadığı için interceptli modelde veri ile aynı test yinelenir ve yinelenen test sonuçları aşağıdaki gibidir. Doğrudan test istatistiği ile kritik değer karşılaştırıldığında, -17.64<-4.44 olduğundan first diference stationary diyebiliriz.

Aşağıdaki grafik dikkate alındığında ve testin vermiş olduğu 22 Ocak 2021 kırılma tahmini dikkate alındığında, kırmızı çember ile gösterilen alanda bir kırılma olduğu gözlenmektedir. Buradaki kırılma çok yüksek bir outlier değerinden kaynaklandığını göstermektedir.

Şekil 1. DLOG_PLTR grafiği

Bu test sonucuyla, first diffrence stationary olduğu bulundu. Diğer kontrol noktalarına geçilebilir.

AC ve PAC’lerin white noise olup olmadığının kontrolü

First difference’ın zamana göre grafiği

Box-plot ile outlier kontrolü

Histogram ile skewness ile kurtosis kontrolü

First difference serinin AC ve PAC değerlerinin white noise olup olmadığı kontrol edilir. Bunun için anlamak için AC ve PAC’lere ait correlogramın çizilmesi gerekmektedir. Aşağıda first difference ait correlogram paylaşılmıştır.

Correlogram sonuçlarına göre, Q-istatistiğine ait olasılık değerleri dikkate alındığında tüm gözlemlerdeki olasılık 0.05’ten büyük olduğu için first difference white noise diyebiliriz. Yani, geçmişten gelen bir sinyal bulunmamaktadır. Ancak lag 4’te Q-stat olasılık değeri 0.142 olduğundan (kikare testi zayıf bir test olduğundan), bu lag modelin tahmininde sinyal verebilir. Bu yüzden model kurulurken lag 4 lu yapı denenmelidir iç görüsü alınmaktadır.

Sırasıyla, diğer kontroller de yapılabilir. Şekil 1'e bakıldığında verinin bir ortalama etrafında dalgalandığı görülmektedir. 2021’in ilk çeyreğinde ve 2022’in birinci ve ikinci çeyreğinde dalgalanma boyutları artmaktadır. Şekil 2-b’deki box-plot verinin alt ve üst değerlerinde outlier olduğunu göstermektedir.

Şekil 2. DLOG_PLTR box plot

Şekil 3’deki histogram dikkate alındığında, sivri bir dağılım yani orta değerlerde yığılma söz konusudur. Mean -0.0019, volatility (standart sapma) 0.04198, skewness 0.42 ve kurtosis 6.56'dır. Kurtosis değeri normal dağılıma 3'e kıyasla yüksek çıkması sağ ve sol kuyruklarda olması gerekenden daha fazla gözlem bulundurduğu anlaşılmaktadır. Jarque-Bera normality sınamasındaki olasılık değeri 0.05’ten küçük olduğu için verinin normal dağılmadığı sonucuna erişebiliriz.

Şekil 3. DLOG_PLTR histogram

Sonuç olarak, return modellemesi yapmak için first diffrence ile modellemeye devam edilmesi gerektiği sonucu ortaya çıkmaktadır. Bir sonraki yazıda, ARIMA modelinin nasıl kurulması gerektiği detaylandırılacaktır.

Dr. Şükrü İMRE

--

--

Şükrü İmre, PhD
Şükrü İmre, PhD

Written by Şükrü İmre, PhD

// Head of Data Science at Yapı Kredi Bank // Guest Lecturer at MEF University // Author at Harvard Business Review Türkiye // Author at Medium

No responses yet