Bu proje, cümleler arasındaki anlamsal benzerliği ölçmek için geliştirilmiş bir uygulamadır. Kullanıcılar hem manuel olarak iki cümle girerek, hem de bir CSV dosyasındaki cümle sütunları üzerinden toplu olarak benzerlik karşılaştırması yapabilir.
Karşılaştırmalar SBERT veya SimCSE modelleriyle gerçekleştirilir ve aşağıdaki metrikler sunulur:
- Cosine Similarity
- Dot Product
- Euclidean Distance
- BERTScore (F1)
- ✅ SBERT ve SimCSE model seçimi
- ✅ Cümle benzerlik ölçümü (tekli veya çoklu)
- ✅ Cosine, Dot, Euclidean ve BERTScore (F1) hesaplama
- ✅ İlk 20 sonucu tablo olarak gösterme
- ✅ Tüm sonuçları
.xlsxolarak dışa aktarma - ✅ Alternatif olarak PyQt5 masaüstü uygulaması desteği
- Flask & Jinja2
- PyTorch & HuggingFace Transformers
- Sentence-Transformers
- BERTScore (
evaluate) - scikit-learn, scipy, numpy
- PyQt5 (desktop için)
.
├── Desktop/
│ └── main.py # PyQt5 masaüstü uygulaması
├── web/
│ ├── app.py # Flask tabanlı web uygulaması
│ ├── templates/
│ │ ├── manual.html # Manuel giriş arayüzü
│ │ └── batch.html # Toplu karşılaştırma arayüzü
│ └── static/
│ └── style.css # Ortak stil dosyası
├── requirements.txt # Bağımlılık listesi
└── README.md # Proje açıklaması (bu dosya)
python -m venv venv
source venv/bin/activate # (Linux/Mac)
venv\Scripts\activate # (Windows)pip install -r requirements.txtcd web
python app.pyTarayıcıda açmak için: http://127.0.0.1:5000
/manualsayfasına gidin- İki cümle girin
- Modeli seçin
- Benzerlik sonuçlarını inceleyin
/batchsayfasına gidin- CSV dosyanızı yükleyin
- Cümle sütunlarını ve modeli seçin
- İlk 20 sonucu tablo olarak görüntüleyin
- Excel olarak çıktıyı indirin
PyQt5 tabanlı masaüstü uygulamayı başlatmak için:
cd Desktop
python main.pyCSV dosyanızı yükleyerek aynı karşılaştırma işlemlerini masaüstü arayüzle gerçekleştirebilirsiniz.
Bu proje MIT lisansı ile lisanslanmıştır.
