Twitter'da yanlış bilgi ve dezenformasyon tespiti için yapay zeka tekniklerinin kullanılması ve karşılaştırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Erzincan Binali Yıldırım Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2024

Tezin Dili: Türkçe

Öğrenci: OMAR RAAD MAHMOOD MAHMOOD

Danışman: Funda Akar

Özet:

Bu çalışma, sosyal medya platformu Twitter'daki yanlış bilgileri tespit etmek için bir dizi yapay zeka (AI) tekniğini incelerek yanlış bilgi ve sahte haberlerin kamusal söylem üzerindeki potansiyel etkisine ilişkin yaygın bir sorunu ele almaktadır. Aldatıcı ve güvenilir içeriği ayırt etmek için Uzun Kısa Süreli Bellek (LSTM), Destek Vektör Makinesi (SVM), Rastgele Orman (RF), Gauss Naive Bayes (GaussianNB), Gradyan Arattırma (GBoost), Karar Ağacı (DT), Lojistik Regresyon (LR), Aşırı Gradyan Arattırma (XGBoost) ve K-En Yakın Komşular (K-NN) dahil olmak üzere çeşitli modeller kullanılmıştır. Analizde doğal dil işleme (NLP), derin öğrenme (DL) ve makine öğrenimi (ML) teknikleri kullanılarak 23481 sahte tweet ve yaklaşık 21418 gerçek tweetten oluşan bir veri seti kullanılarak her bir modelin yanlış bilgi kalıplarını tespit etmedeki etkinliği gösterilmiştir. Çalışma, özellikle doğruluk, verimlilik ve ölçeklenebilirliğe odaklanarak, bu AI sistemlerinin güçlü yönlerinin ve sınırlamalarının kapsamlı bir değerlendirmesini sunmaktadır. Sonuçlar, XGBoost'un %99.82 doğruluk ve %99.81 F1 puanı ile en iyi performansı sergilediğini göstermektedir. Bunu %99.63 doğruluk ve %99.62 F1 puanı gösteren (GBoost) ve %99.61 doğruluk ve %99.59 F1 puanı ile (DT) takip etmektedir. Sonuçlar bu modellerin en etkili modeller olduğunu göstermektedir. Diğer modeller %99.31 ile %81.63 arasında değişen doğruluk gösterirken, sonuçlar ana modellerin performansına dair fikir vererek dezenformasyonla mücadeleye ve bilginin güvenilirliğine önemli katkı sağlamaktadır.