Sentmon, Türkçe Twitter paylaşımlarının içeriklerinin analizini kullanıcılara sunan online bir Doğal Dil İşleme aracıdır. Sorgulanan özneyle ilgili sosyal medya kullanıcılarının tutumu hakkında bir fikir vermesi amaçlanmıştır. Kendi özel sorgunuzla arama yapabilir, duygusal puanlamanın zaman içerisindeki değişimini inceleyebilir ve belirli günlerde öne çıkan twitleri Sentmon aracılığıyla görüntüleyebilirsiniz!
Proje sunumuna ve demosuna repodan veya linklerden ulaşabilirsiniz. [ Sunum | Demo ]
Verilen bir metin için, bu metnin içerdiği duyguyu üç sınıf içerisinden (pozitif, negatif, nötr) tahmin etmeyi hedefler. Basitçe bir sınıflandırma problemidir. Bu senaryoda ise aynı zamanda verilen bir sorguyu içeren metinlerin zaman içerisindeki değişimi incelenmek istenmektedir. Ayrıca emoji içeren metinler kullanılarak problemin başarısını arttırılması hedeflenmektedir.
Veri : 67 farklı emoji ve 8 farklı duygu kategorisi için 767.197 Türkçe twit açık bir şekilde paylaşıldı. İndirme linki ve Detaylar
Kapsamlı Üst Değişken Araması : Multilingual BERT, BerTurk ve Damıtılmış (Distilled) BerTurk için 216 farklı senaryoyu dikkate alan kapsamlı bir üst değişken araması ve detaylı analizi
Emoji Tabanlı İki Farklı Ön Eğitim : Transformer modellerinin, dil modelleriyle beraber ön eğitimi için iki farklı yaklaşımın sunulması ve bunların ayrıntılı açıklaması
Hızlandırılmış Modeller : Geliştirilen modellerin ONNX formatında ekran kartsız serverlarda da hızlıca çalışmasıyla ortaya çıkan işlenmiş modellerin açık bir şekilde paylaşılması. İndirme linki ve Detaylar
Site : Geliştirdiğimiz en hızlı ve en iyi sonuç veren modellerle Türkçe, açık kaynaklı ve ücretsiz ilk duygu analizi takip sistemi sitesi: sentmon.herokuapp.com
Bu proje Açık Hackathon'a katılmak amacıyla 🍊Mandalina ekibi tarafından geliştirilmiştir.