Bu proje, Google Play Store uygulamalarına yönelik kullanıcı yorumlarını analiz ederek içgörüler elde etmeyi amaçlar. Çeşitli veri işleme ve analiz teknikleri kullanılarak, kullanıcı yorumlarının nitelikleri sınıflandırılmış, önemli metrikler hesaplanmış ve geri bildirimlerin anlamlı hale getirilmesi sağlanmıştır.
- Python
- Pandas
- NumPy
- Matplotlib
- WordCloud
- NLTK
- Scikit-learn
- BERT
-Google'ın API ı kullanarak oyun yorumları,kullanıcı nicknameleri, oyuncu yorum tarihleri, yorum beğenileri, oyun oyları ve geri dönüşler gibi bir çok veri alındı.
- Veri setindeki eksik değerler, gerekli eklemeler yapılarak temizlendi.
- Kullanıcıların cinsiyet bilgileri, isimlerine göre oluşturulan ek bir Excel dosyasından (
Names.xlsx
) çekilerek veri setine eklendi. - Yorum yapan kullanıcıların benzersiz kimlikleri (ID'ler) oluşturularak, her kullanıcı için bir ID atanmıştır.
likes
değişkeni 5'li kategorilere ayrılarak standartlaştırıldı (like_std
).- Yorumların zamanına göre derecelendirilmesi yapıldı (
rec_std
). - Şirket geri bildirimi olan yorumlar için bir değişken oluşturuldu (
response_by_comp
). - Kullanıcı yorumlarının genel değerini ölçmek için bir skor sistemi tasarlandı (
score
vescore_wtho_time
).
- Yorumların duygu analizi, BERT modelinden alınan etiketler (
BERT_label
) ile değerlendirildi. - Bu etiketler, pozitif/negatif ayrımı için
LabelEncoder
kullanılarak sayısal verilere dönüştürüldü (le_BERT
). - BERT etiketleri ve puanlara dayalı olarak özel bir değişken oluşturuldu (
begeni_puanı
).
- Veri setinde en yararlı yorumlar tespit edildi.
- Erkek kullanıcıların daha fazla olumsuz yorumlar yaparken kadın kullanıcıların daha az puan verdiği gözlenmiştir.
- Yorumların ve puanlar arasındaki ilişki incelendi ve zaman serisine göre incelendi.
- Daha fazla ayrıntı için [https://public.tableau.com/app/profile/.a.an.demir/viz/GooglePlay_17367970593720/Dashboard1?publish=yes]
- Kodda kullanılan bazı işlemler, veri setine özgüdür ve farklı veri kümelerine uygulanmadan önce uyarlanması gerekebilir.
- Şirket geri bildirimleri ve yorum zamanları gibi değişkenler, analiz sonuçlarının özelleştirilmesine yardımcı olmuştur.
-BERT Türkçe modeli üzerinden daha spesifik bir model oluşturulacaktır.