Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI

Penelitian ini mengembangkan sistem deteksi otomatis kata-kata baku dan non-baku pada data Twitter berbasis Kamus Besar Bahasa Indonesia (KBBI). Twitter merupakan platform media sosial yang populer, namun sering kali digunakan dengan kata-kata tidak baku yang mengganggu komunikasi. Normalisasi kata...

Full description

Saved in:
Bibliographic Details
Main Authors: M. Irfan Raif, Nuraisa Novia Hidayati, Tekad Matulatan
Format: Article
Language:Indonesian
Published: University of Brawijaya 2024-08-01
Series:Jurnal Teknologi Informasi dan Ilmu Komputer
Online Access:https://jtiik.ub.ac.id/index.php/jtiik/article/view/7404
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1823858639564177408
author M. Irfan Raif
Nuraisa Novia Hidayati
Tekad Matulatan
author_facet M. Irfan Raif
Nuraisa Novia Hidayati
Tekad Matulatan
author_sort M. Irfan Raif
collection DOAJ
description Penelitian ini mengembangkan sistem deteksi otomatis kata-kata baku dan non-baku pada data Twitter berbasis Kamus Besar Bahasa Indonesia (KBBI). Twitter merupakan platform media sosial yang populer, namun sering kali digunakan dengan kata-kata tidak baku yang mengganggu komunikasi. Normalisasi kata-kata tidak baku diperlukan untuk pemrosesan dan analisis tweet. Penelitian sebelumnya menggunakan metode Levenshtein Distance dan pengklasifikasi Naïve Bayes, serta Term Based Random Sampling dalam proses Stopword Removal. Preprocessing penting dalam klasifikasi teks di media sosial. Penelitian ini fokus pada preprocessing dan deteksi kata-kata baku dan non-baku pada data Twitter menggunakan KBBI. Sistem otomatis ini membantu peneliti mencari kata-kata non-baku atau slang dengan mudah, meningkatkan kualitas komunikasi, dan pemahaman pesan di data Twitter yang mencerminkan tren bahasa yang berkembang. Penelitian ini juga memperkenalkan pendekatan yang terstruktur untuk mengotomatisasi deteksi kata-kata baku dan non-baku, dengan langkah-langkah yang meliputi pengumpulan data, preprocessing data, identifikasi bahasa tidak baku, penghapusan kata berimbuhan, dan identifikasi kata slang. Metode ini mendukung analisis sentimen dalam text mining dan memastikan hasil klasifikasi sentimen yang lebih akurat dalam data Twitter. Berdasarkan pengujian, langkah-langkah preprocessing meningkatkan performa metode penentuan polarity dengan accuracy InSet sebesar 66,66% dan F1-score sebesar 61,40%.
format Article
id doaj-art-a55393b1aa43486e8f889c8893a2a7f2
institution Kabale University
issn 2355-7699
2528-6579
language Indonesian
publishDate 2024-08-01
publisher University of Brawijaya
record_format Article
series Jurnal Teknologi Informasi dan Ilmu Komputer
spelling doaj-art-a55393b1aa43486e8f889c8893a2a7f22025-02-11T10:37:42ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792024-08-0111210.25126/jtiik.20241127404Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBIM. Irfan Raif0Nuraisa Novia Hidayati1Tekad Matulatan2Universitas Maritim Raja Ali Haji, Tanjung PinangBadan Riset dan Inovasi Nasional, JakartaUniversitas Maritim Raja Ali Haji, Tanjung Pinang Penelitian ini mengembangkan sistem deteksi otomatis kata-kata baku dan non-baku pada data Twitter berbasis Kamus Besar Bahasa Indonesia (KBBI). Twitter merupakan platform media sosial yang populer, namun sering kali digunakan dengan kata-kata tidak baku yang mengganggu komunikasi. Normalisasi kata-kata tidak baku diperlukan untuk pemrosesan dan analisis tweet. Penelitian sebelumnya menggunakan metode Levenshtein Distance dan pengklasifikasi Naïve Bayes, serta Term Based Random Sampling dalam proses Stopword Removal. Preprocessing penting dalam klasifikasi teks di media sosial. Penelitian ini fokus pada preprocessing dan deteksi kata-kata baku dan non-baku pada data Twitter menggunakan KBBI. Sistem otomatis ini membantu peneliti mencari kata-kata non-baku atau slang dengan mudah, meningkatkan kualitas komunikasi, dan pemahaman pesan di data Twitter yang mencerminkan tren bahasa yang berkembang. Penelitian ini juga memperkenalkan pendekatan yang terstruktur untuk mengotomatisasi deteksi kata-kata baku dan non-baku, dengan langkah-langkah yang meliputi pengumpulan data, preprocessing data, identifikasi bahasa tidak baku, penghapusan kata berimbuhan, dan identifikasi kata slang. Metode ini mendukung analisis sentimen dalam text mining dan memastikan hasil klasifikasi sentimen yang lebih akurat dalam data Twitter. Berdasarkan pengujian, langkah-langkah preprocessing meningkatkan performa metode penentuan polarity dengan accuracy InSet sebesar 66,66% dan F1-score sebesar 61,40%. https://jtiik.ub.ac.id/index.php/jtiik/article/view/7404
spellingShingle M. Irfan Raif
Nuraisa Novia Hidayati
Tekad Matulatan
Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI
Jurnal Teknologi Informasi dan Ilmu Komputer
title Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI
title_full Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI
title_fullStr Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI
title_full_unstemmed Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI
title_short Otomatisasi Pendeteksi Kata Baku Dan Tidak Baku Pada Data Twitter Berbasis KBBI
title_sort otomatisasi pendeteksi kata baku dan tidak baku pada data twitter berbasis kbbi
url https://jtiik.ub.ac.id/index.php/jtiik/article/view/7404
work_keys_str_mv AT mirfanraif otomatisasipendeteksikatabakudantidakbakupadadatatwitterberbasiskbbi
AT nuraisanoviahidayati otomatisasipendeteksikatabakudantidakbakupadadatatwitterberbasiskbbi
AT tekadmatulatan otomatisasipendeteksikatabakudantidakbakupadadatatwitterberbasiskbbi