Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Erzincan Binali Yıldırım Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye
Tezin Onay Tarihi: 2024
Tezin Dili: Türkçe
Öğrenci: OMAR RAAD MAHMOOD MAHMOOD
Danışman: Funda Akar
Özet:
Bu çalışma, sosyal medya platformu Twitter'daki yanlış bilgileri tespit etmek için bir dizi yapay zeka (AI) tekniğini incelerek yanlış bilgi ve sahte haberlerin kamusal söylem üzerindeki potansiyel etkisine ilişkin yaygın bir sorunu ele almaktadır. Aldatıcı ve güvenilir içeriği ayırt etmek için Uzun Kısa Süreli Bellek (LSTM), Destek Vektör Makinesi (SVM), Rastgele Orman (RF), Gauss Naive Bayes (GaussianNB), Gradyan Arattırma (GBoost), Karar Ağacı (DT), Lojistik Regresyon (LR), Aşırı Gradyan Arattırma (XGBoost) ve K-En Yakın Komşular (K-NN) dahil olmak üzere çeşitli modeller kullanılmıştır. Analizde doğal dil işleme (NLP), derin öğrenme (DL) ve makine öğrenimi (ML) teknikleri kullanılarak 23481 sahte tweet ve yaklaşık 21418 gerçek tweetten oluşan bir veri seti kullanılarak her bir modelin yanlış bilgi kalıplarını tespit etmedeki etkinliği gösterilmiştir. Çalışma, özellikle doğruluk, verimlilik ve ölçeklenebilirliğe odaklanarak, bu AI sistemlerinin güçlü yönlerinin ve sınırlamalarının kapsamlı bir değerlendirmesini sunmaktadır. Sonuçlar, XGBoost'un %99.82 doğruluk ve %99.81 F1 puanı ile en iyi performansı sergilediğini göstermektedir. Bunu %99.63 doğruluk ve %99.62 F1 puanı gösteren (GBoost) ve %99.61 doğruluk ve %99.59 F1 puanı ile (DT) takip etmektedir. Sonuçlar bu modellerin en etkili modeller olduğunu göstermektedir. Diğer modeller %99.31 ile %81.63 arasında değişen doğruluk gösterirken, sonuçlar ana modellerin performansına dair fikir vererek dezenformasyonla mücadeleye ve bilginin güvenilirliğine önemli katkı sağlamaktadır.