COMPLETING THE MISSING RAINFALL DATA IN THE EUPHRATES BASIN WITH REGRESSION ANALYSIS


Katipoğlu O. M., Acar R., Şengül S.

CUKUROVA 6TH INTERNATIONAL SCIENTIFIC RESEARCHES CONFERENCE, Adana, Turkey, 5 - 06 March 2021, pp.658-674

  • Publication Type: Conference Paper / Full Text
  • City: Adana
  • Country: Turkey
  • Page Numbers: pp.658-674
  • Erzincan Binali Yildirim University Affiliated: Yes

Abstract

For a meteorological, hydrological, or climatic study to be reliable and give accurate results, the data used in the study should be complete and cover long years. For this reason, it is of great importance to fill the gaps in the data that constitute the basic inputs of hydrological and meteorological models such as precipitation, temperature, evaporation, and flow. Regression analysis is one of the most preferred methods for filling missing data gaps and is a statistical method used to determine the relationship between two or more variables with a mathematical model. This method can be used to estimate unknown values using known variable values. In this study, simple and multiple regression analyses were used to fill the gaps in missing rainfall data.

In the study, monthly total rainfall data of 11 rainfall monitoring stations located in the Euphrates Basin (between 1966 and 2017) were used. In the selection of the independent variables used in the regression analysis, criteria such as having a high correlation coefficient (at least 0.70) with the dependent variable, having similar climatic characteristics, and having a small height difference were tested. In regression analysis, the normality assumptions of variables and estimation errors were tested through normal distribution charts, and the assumption of homoscedasticity was checked according to the Durbin-Watson (D-W) coefficient. Besides, the state of the multicollinearity was tested according to the variance inflation factor (VIF) value and the assumption of homoscedasticity was tested according to the scatter diagram drawn between residuals and predicted values. Since the regression assumptions were not met, the results were biased so all the assumptions were satisfied. As a result of the study, it was determined that the regression analysis could effectively predict the missing rainfall data in line with the high determination coefficients (R2) and small root mean square error (RMSE) values obtained, and multivariate regression analysis made more reliable predictions than simple regression analysis.

Meteorolojik, hidrolojik veya iklimsel bir çalışmanın güvenilir olması ve doğru sonuçlar vermesi için çalışmada kullanılan verilerin eksiksiz olması ve uzun yılları kapsaması gerekmektedir. Bu nedenle yağış, sıcaklık, buharlaşma, akım, vb. hidrolojik ve meteorolojik modellerin temel girdilerini oluşturan verilerdeki boşlukların doldurulması büyük öneme sahiptir. Regresyon analizi, eksik veri boşluklarının doldurulması için en çok tercih edilen metotlardan biri olup aralarında sebep-sonuç ilişkisi bulunan iki ya da daha fazla değişken arasındaki ilişkiyi matematiksel bir model ile belirlemek için kullanılan istatistiksel bir

metodudur. Bu metot bilinen değişken değerlerini kullanarak bilinmeyen değerlerin tahmin edilmesinde kullanılabilmektedir.

Bu çalışmada eksik yağış verindeki boşlukların doldurulması için tekli ve çoklu regresyon analizi kullanılmıştır. Çalışmada Fırat havzası üzerinde bulunan (1966 ile 2017 yılları arasında) 11 adet yağış gözlem istasyonuna ait aylık toplam yağış verileri kullanılmıştır. Regresyon analizlerinde kullanılan bağımsız değişkenlerin seçiminde, bağımlı değişken ile yüksek korelasyon katsayısına sahip olması (en az 0,70), benzer iklimsel özellik göstermesi ve

yükseklik farklının az olması gibi kriterler sınanmıştır. Regresyon analizde değişkenlerin ve tahmin hatalarının normallik varsayımları normal dağılım grafikleri aracılığıyla test edilmiş ve eşit varyans varsayımı Durbin-Watson (D-W) katsayısına göre kontrol edilmiştir. Ayrıca çoklu doğrusal bağlantının durumu varyans artış faktörü (VAF) değerine göre ve eşit varyans varsayımı ise artıklar ile tahmin değerleri arasında çizilen saçılma diyagramına göre de sınanmıştır. Regresyon varsayımlarının karşılanmaması, sonuçların taraflı olmasına neden olduğu için tüm varsayımlar sağlanmıştır.

Çalışmanın sonucunda elde edilen yüksek determinasyon katsayıları (R2) ve düşük hata karelerinin ortalama kökü (HKOK) değerleri doğrultusunda regresyon analizi ile eksik yağış verilerinin etkili bir şekilde tahmin edilebileceği ve çok değişkenli regresyon analizinin tek değişkenli regresyon analizinden daha güvenilir tahminler yaptığı tespit edilmiştir.