Random Forest ve K-Nearest Neighbor Yöntemleri ile Günlük Akım Modellemesi


Creative Commons License

Dalkılıç H. Y., Yeşilyurt S. N., Samuı P.

Erzincan Üniversitesi Fen Bilimleri Enstitüsü Dergisi, cilt.14, sa.3, ss.914-925, 2021 (Hakemli Dergi)

Özet

Su, canlı yaşamı için vazgeçilemez bir doğal kaynaktır. Bu nedenle su kaynaklarının korunması ve kontrolü büyük önem arz etmektedir. Nehir akımı tahmini ve modellemesi; su kaynaklarının yönetimi, sulama faaliyetleri gibi durumlarda önem arz ettiği için sürekli araştırılmaya ve geliştirilmeye ihtiyaç duyulmuş bir konu olarak literatürde yer almaktadır. Tahmin ve modelleme için çok sayıda teknik kullanılmakta, yapılan çalışmaların gelişmesi, tekniklerin kıyaslanması ve eksik yönlerin görülmesi ile tahmin sonuçları giderek iyileşmektedir. Bu çalışmada da tahmin sonuçlarını değerlendirmek ve daha iyi olan tahmin yöntemini bulabilmek, yöntemlerin avantaj ve dezavantajlarını tespit edebilmek için makine öğrenmesi yöntemlerinden Rastgele Orman ve K-En Yakın Komşu doğrusal olmayan regresyon modelleri kullanılmıştır. Ayrıca RF modeli için hiperparametre seçimi Random Search (Rastgele Arama) ve Grid Search (Grid Arama) yöntemleri kullanılarak da oluşturulup kıyaslaması yapılmıştır. Fırat havzasında yer alan iki istasyona ait 1981-2011 yılları için günlük akım verileri kullanılan çalışmada; rank analizi ile nihai sonuca ulaşılmış olup diğer modellere göre Random Forest modelinin hiperparametrelerinin belirlenebilmesi için Random Search uygulandığında daha iyi sonuç alındığı görülmüştür. 

Water is an indispensable natural resource for life. Therefore, protection and control of water resources are of great importance. Since river flow estimation and modeling are very important in cases such as the management of water resources, irrigation, it is included in the literature as an issue that needs constant research and development. A large number of techniques are being used for estimation and modeling; thus, the estimation results are gradually improving with the development of the studies carried out, the comparison of techniques, and the determination and removal of the shortcomings. In this study, Random Forest and K-Nearest Neighbors nonlinear regression models, which are two of the machine learning methods, were used to evaluating the estimation results, to find the better estimation method, and to determine the advantages and disadvantages of these methods. In addition, Random Search and Grid Search methods were used to make the hyperparameter selection and comparison for the Random Forest model. In this study, in which daily flow data of 1981-2011 of the two stations in the Euphrates were used, and, when compared to other models, it was observed that better results were obtained when Random Search was applied to determine the hyperparameters of the Random Forest model