PENGELOMPOKAN DATA PENJUALAN PRODUK MONITOR DI AMAZON MENGGUNAKAN ALGORITMA GAUSSIAN MIXTURE MODEL

Penulis

  • Ade Rizal Effendi Saragih Universitas Negeri Medan
  • Arnita Universitas Negeri Medan
  • Mhd Zulfikar Pinem Universitas Negeri Medan
  • Dewi Putri Sagita Suhendra Universitas Negeri Medan
  • Novi Anggraini Siregar Universitas Negeri Medan

Kata Kunci:

Data Clustering, Gaussian Mixture Model, Penjualan E-Commerce

Abstrak

Penelitian ini bertujuan menganalisis dan mengelompokkan data penjualan produk monitor di Amazon menggunakan algoritma Gaussian Mixture Model (GMM) untuk mengidentifikasi pola-pola penjualan yang tidak terlihat melalui metode konvensional. Dataset dari Kaggle, berisi atribut seperti harga, merek, ukuran layar, resolusi, rasio aspek, rating, dan ulasan, digunakan setelah pra-pemrosesan untuk memastikan kualitas data optimal. Clustering dilakukan dengan GMM yang lebih fleksibel dalam mengidentifikasi struktur data kompleks dibandingkan algoritma K-Means, serta Principal Component Analysis (PCA) diterapkan untuk mereduksi dimensi data dan mempermudah visualisasi hasil clustering. Hasil penelitian menunjukkan bahwa model GMM menghasilkan pengelompokan dengan rata-rata Silhouette Coefficient sebesar 0.409, yang mengindikasikan kualitas pengelompokan cukup baik, dengan kluster yang menggambarkan segmen pasar berbeda berdasarkan variabel seperti harga, merek, dan fitur produk. Penelitian ini memberikan wawasan baru dalam segmentasi pasar monitor di Amazon serta mendukung pengambilan keputusan strategis dalam bisnis, terutama strategi pemasaran yang lebih terfokus, dan menunjukkan efektivitas GMM dalam menganalisis data penjualan kompleks, yang berpotensi diterapkan pada sektor bisnis lainnya.

This research aims to analyze and cluster the sales data of monitor products on Amazon using the Gaussian Mixture Model (GMM) algorithm to uncover sales patterns that may not be detected through conventional methods. The dataset, sourced from Kaggle, contains attributes such as price, brand, screen size, resolution, aspect ratio, ratings, and reviews, which were preprocessed to ensure data quality before analysis. Clustering was performed using GMM, which is more flexible in identifying complex data structures compared to algorithms like K-Means. Additionally, Principal Component Analysis (PCA) was applied to reduce the dimensionality of the data and facilitate the visualization of clustering results. The study's findings show that the GMM model achieved a clustering performance with an average Silhouette Coefficient of 0.409, indicating fairly good clustering quality. The resulting clusters represent different market segments based on variables such as price, brand, and product features. This research offers new insights into monitor market segmentation on Amazon and supports strategic decision-making in business, particularly in focused marketing strategies. It also demonstrates the effectiveness of GMM in analyzing complex sales data, which could be applied to other business sectors.

Unduhan

Diterbitkan

2024-11-29