Search for collections on Repository Universitas Jenderal Soedirman

Implementasi Clustering Untuk Pengelompokkan Karya Ilmiah Bertema COVID19 Berdasarkan Kemiripan Abstrak Menggunakan K-Means Clustering

ISKANDAR, Muhammad Akbar (2023) Implementasi Clustering Untuk Pengelompokkan Karya Ilmiah Bertema COVID19 Berdasarkan Kemiripan Abstrak Menggunakan K-Means Clustering. Skripsi thesis, Universitas Jenderal Soedirman.

[img] PDF (Cover)
COVER-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf

Download (47kB)
[img] PDF (Legalitas)
LEGALITAS-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf
Restricted to Repository staff only

Download (2MB)
[img] PDF (Abstrak)
ABSTRAK-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf

Download (154kB)
[img] PDF (BabI)
BAB-I-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf
Restricted to Repository staff only until 31 January 2024.

Download (443kB)
[img] PDF (BabII)
BAB-II-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf
Restricted to Repository staff only until 31 January 2024.

Download (1MB)
[img] PDF (BabIII)
BAB-III-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf
Restricted to Repository staff only until 31 January 2024.

Download (452kB)
[img] PDF (BabIV)
BAB-IV-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf
Restricted to Repository staff only

Download (10MB)
[img] PDF (BabV)
BAB-V-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf

Download (217kB)
[img] PDF (DaftarPustaka)
DAFTAR-PUSTAKA-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf

Download (290kB)

Abstract

Clustering adalah salah satu proses dalam data mining yang digunakan untuk mengelompokkan data dengan data yang lain yang memiliki kemiripan berdasarkan fitur yang dimiliki setiap data untuk dapat memunculkan pola pola yang ada dalam data yang tidak dapat ditafsirkan secara langsung. Penelitian ini bertujuan untuk melakukan proses clustering terhadap abstrak dari 1000 karya ilmiah bertema COVID-19 yang ada pada situs Garuda menggunakan algoritma K-Means Clustering dan mencari jumlah cluster yang optimal. Transformasi data terhadap abstrak dari karya ilmiah dilakukan menggunakan TF-IDF dan Bag-of-words, lalu dilanjutkan dengan metode pengurangan dimensi PCA dan LDA untuk kemudian membandingkan hasil proses clustering menggunakan kedua metode pengurangan dimensi tersebut beserta variasi metode pengukuran jarak euclidean distance dan cosine distance. Hasil evaluasi menggunakan silhouette coefficient menunjukkan bahwa hasil clustering terbaik dihasilkan dari penggunaan metode pengurangan dimensi LDA dengan penggunaan metode pengukuran jarak cosine distance dengan nilai silhouette sejumlah 0.5336 untuk 15 cluster.

Item Type: Thesis (Skripsi)
Nomor Inventaris: H23017
Uncontrolled Keywords: Clustering, Karya Ilmiah, COVID-19, Data Teks, K-Means Clustering, Principle Component Analysis, Latent Dirichlet Allocation
Subjects: I > I141 Information technology
Divisions: Fakultas Teknik > S1 Teknik Informatika
Depositing User: Mr Muhammad Akbar Iskandar
Date Deposited: 31 Jan 2023 06:48
Last Modified: 31 Jan 2023 06:48
URI: http://repository.unsoed.ac.id/id/eprint/19751

Actions (login required)

View Item View Item