ISKANDAR, Muhammad Akbar (2023) Implementasi Clustering Untuk Pengelompokkan Karya Ilmiah Bertema COVID19 Berdasarkan Kemiripan Abstrak Menggunakan K-Means Clustering. Skripsi thesis, Universitas Jenderal Soedirman.
PDF (Cover)
COVER-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Download (47kB) |
|
PDF (Legalitas)
LEGALITAS-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Restricted to Repository staff only Download (2MB) |
|
PDF (Abstrak)
ABSTRAK-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Download (154kB) |
|
PDF (BabI)
BAB-I-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Restricted to Repository staff only until 31 January 2024. Download (443kB) |
|
PDF (BabII)
BAB-II-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Restricted to Repository staff only until 31 January 2024. Download (1MB) |
|
PDF (BabIII)
BAB-III-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Restricted to Repository staff only until 31 January 2024. Download (452kB) |
|
PDF (BabIV)
BAB-IV-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Restricted to Repository staff only Download (10MB) |
|
PDF (BabV)
BAB-V-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Download (217kB) |
|
PDF (DaftarPustaka)
DAFTAR-PUSTAKA-Muhammad Akbar Iskandar-H1D016022-Skripsi-2023.pdf Download (290kB) |
Abstract
Clustering adalah salah satu proses dalam data mining yang digunakan untuk mengelompokkan data dengan data yang lain yang memiliki kemiripan berdasarkan fitur yang dimiliki setiap data untuk dapat memunculkan pola pola yang ada dalam data yang tidak dapat ditafsirkan secara langsung. Penelitian ini bertujuan untuk melakukan proses clustering terhadap abstrak dari 1000 karya ilmiah bertema COVID-19 yang ada pada situs Garuda menggunakan algoritma K-Means Clustering dan mencari jumlah cluster yang optimal. Transformasi data terhadap abstrak dari karya ilmiah dilakukan menggunakan TF-IDF dan Bag-of-words, lalu dilanjutkan dengan metode pengurangan dimensi PCA dan LDA untuk kemudian membandingkan hasil proses clustering menggunakan kedua metode pengurangan dimensi tersebut beserta variasi metode pengukuran jarak euclidean distance dan cosine distance. Hasil evaluasi menggunakan silhouette coefficient menunjukkan bahwa hasil clustering terbaik dihasilkan dari penggunaan metode pengurangan dimensi LDA dengan penggunaan metode pengukuran jarak cosine distance dengan nilai silhouette sejumlah 0.5336 untuk 15 cluster.
Item Type: | Thesis (Skripsi) |
---|---|
Nomor Inventaris: | H23017 |
Uncontrolled Keywords: | Clustering, Karya Ilmiah, COVID-19, Data Teks, K-Means Clustering, Principle Component Analysis, Latent Dirichlet Allocation |
Subjects: | I > I141 Information technology |
Divisions: | Fakultas Teknik > S1 Teknik Informatika |
Depositing User: | Mr Muhammad Akbar Iskandar |
Date Deposited: | 31 Jan 2023 06:48 |
Last Modified: | 31 Jan 2023 06:48 |
URI: | http://repository.unsoed.ac.id/id/eprint/19751 |
Actions (login required)
View Item |