Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans Karşılaştırılması

Son yıllarda internete erişim imkanlarının artması ve kullanıcılardaki akıllı telefon kullanımının yaygınlaşması sebebiyle sosyal medya olarak adlandırılan ve insanların çeşitli konulardaki fikirlerini paylaştığı servisler çok yaygın olarak kullanılmaktadır. Sosyal medya verilerinin analiz edilmesiy...

Full description

Saved in:
Bibliographic Details
Main Authors: Fatih Kayaalp, Batuhan Cem Öğe
Format: Article
Language:English
Published: Düzce University 2021-12-01
Series:Düzce Üniversitesi Bilim ve Teknoloji Dergisi
Subjects:
Online Access:https://dergipark.org.tr/tr/download/article-file/2048812
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1849309427624050688
author Fatih Kayaalp
Batuhan Cem Öğe
author_facet Fatih Kayaalp
Batuhan Cem Öğe
author_sort Fatih Kayaalp
collection DOAJ
description Son yıllarda internete erişim imkanlarının artması ve kullanıcılardaki akıllı telefon kullanımının yaygınlaşması sebebiyle sosyal medya olarak adlandırılan ve insanların çeşitli konulardaki fikirlerini paylaştığı servisler çok yaygın olarak kullanılmaktadır. Sosyal medya verilerinin analiz edilmesiyle insanların farklı konulardaki duygularına dair anlamlı çıkarımlarda bulunulması anlamına gelen ve temelde bir sınıflandırma işlemi olan Duygu Analizi çalışmaları son yıllarda öne çıkan çalışma alanlarından biridir. Bu çalışmada, Python programlama dili içindeki kütüphaneler kullanılarak Naive Bayes (NB), Logistic Regression (LR), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF) ve Artificial Neural Network (ANN) gibi 6 adet sınıflandırma algoritmasının Duygu Analizi kapsamında, performans karşılaştırması yapılmıştır. Veri seti olarak, açık kaynaklı, IMDB sitesinde yer alan etiketli kullanıcı yorumları kullanılmıştır. Doğal Dil İşleme yöntemleri kullanılarak temizlenen veri setinin sayısal olarak temsil edilebilmesi için Bag of Words (BoW), TF-IDF, FastText ve Word2Vec metin temsil yöntemleri kullanılmıştır. Veri setinin eğitimi ve test edilmesi aşamasında k=5 olacak şekilde k-fold cross validation yöntemi kullanılmıştır. 6 farklı sınıflandırma yöntemi için elde edilen sonuçlar accuracy, precision, recall ve f1 score hesaplanarak ayrıntılı bir karşılaştırma yapılmış ve sonuçlar kaydedilmiştir. En yüksek accuracy değerleri olarak LR ve SVM sırasıyla BOW’da %86, TF-IDF’te %87, word2Vec’de %87 ve FastText’te %83 seviyelerinde benzer sonuçlar vermiştir.
format Article
id doaj-art-07f4a9eddad6480f92cdb61ee3e8b749
institution Kabale University
issn 2148-2446
language English
publishDate 2021-12-01
publisher Düzce University
record_format Article
series Düzce Üniversitesi Bilim ve Teknoloji Dergisi
spelling doaj-art-07f4a9eddad6480f92cdb61ee3e8b7492025-08-20T03:54:10ZengDüzce UniversityDüzce Üniversitesi Bilim ve Teknoloji Dergisi2148-24462021-12-019640641610.29130/dubited.101532097Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans KarşılaştırılmasıFatih Kayaalp0https://orcid.org/0000-0002-8752-3335Batuhan Cem Öğe1https://orcid.org/0000-0001-5347-3352DÜZCE ÜNİVERSİTESİBÜLENT ECEVİT ÜNİVERSİTESİSon yıllarda internete erişim imkanlarının artması ve kullanıcılardaki akıllı telefon kullanımının yaygınlaşması sebebiyle sosyal medya olarak adlandırılan ve insanların çeşitli konulardaki fikirlerini paylaştığı servisler çok yaygın olarak kullanılmaktadır. Sosyal medya verilerinin analiz edilmesiyle insanların farklı konulardaki duygularına dair anlamlı çıkarımlarda bulunulması anlamına gelen ve temelde bir sınıflandırma işlemi olan Duygu Analizi çalışmaları son yıllarda öne çıkan çalışma alanlarından biridir. Bu çalışmada, Python programlama dili içindeki kütüphaneler kullanılarak Naive Bayes (NB), Logistic Regression (LR), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF) ve Artificial Neural Network (ANN) gibi 6 adet sınıflandırma algoritmasının Duygu Analizi kapsamında, performans karşılaştırması yapılmıştır. Veri seti olarak, açık kaynaklı, IMDB sitesinde yer alan etiketli kullanıcı yorumları kullanılmıştır. Doğal Dil İşleme yöntemleri kullanılarak temizlenen veri setinin sayısal olarak temsil edilebilmesi için Bag of Words (BoW), TF-IDF, FastText ve Word2Vec metin temsil yöntemleri kullanılmıştır. Veri setinin eğitimi ve test edilmesi aşamasında k=5 olacak şekilde k-fold cross validation yöntemi kullanılmıştır. 6 farklı sınıflandırma yöntemi için elde edilen sonuçlar accuracy, precision, recall ve f1 score hesaplanarak ayrıntılı bir karşılaştırma yapılmış ve sonuçlar kaydedilmiştir. En yüksek accuracy değerleri olarak LR ve SVM sırasıyla BOW’da %86, TF-IDF’te %87, word2Vec’de %87 ve FastText’te %83 seviyelerinde benzer sonuçlar vermiştir.https://dergipark.org.tr/tr/download/article-file/2048812doğal dil i̇şlemeduygu analizimakine öğrenmesimetin temsilsınıflandırmaveri madenciliğinatural language processingsentiment analysismachine learningtext representationclassificationdata mining
spellingShingle Fatih Kayaalp
Batuhan Cem Öğe
Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans Karşılaştırılması
Düzce Üniversitesi Bilim ve Teknoloji Dergisi
doğal dil i̇şleme
duygu analizi
makine öğrenmesi
metin temsil
sınıflandırma
veri madenciliği
natural language processing
sentiment analysis
machine learning
text representation
classification
data mining
title Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans Karşılaştırılması
title_full Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans Karşılaştırılması
title_fullStr Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans Karşılaştırılması
title_full_unstemmed Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans Karşılaştırılması
title_short Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans Karşılaştırılması
title_sort farkli siniflandirma algoritmalari ve metin temsil yontemlerinin duygu analizinde performans karsilastirilmasi
topic doğal dil i̇şleme
duygu analizi
makine öğrenmesi
metin temsil
sınıflandırma
veri madenciliği
natural language processing
sentiment analysis
machine learning
text representation
classification
data mining
url https://dergipark.org.tr/tr/download/article-file/2048812
work_keys_str_mv AT fatihkayaalp farklısınıflandırmaalgoritmalarıvemetintemsilyontemlerininduyguanalizindeperformanskarsılastırılması
AT batuhancemoge farklısınıflandırmaalgoritmalarıvemetintemsilyontemlerininduyguanalizindeperformanskarsılastırılması