Clustering with Python in Power BI

Clustering bisa dilakukan dengan bantuan a.l Excel (phyton atau manual saja dengan metode Grid-based), GIS (k-means dsb) atau Power BI (python dan scatterchart - yang setahun terakhir ini fiturnya tidak tersedia lagi).

Jika saya lebih memilih menggunakan Power BI itu karena cespleng sekalian bisa maenin hasilnya langsung dengan bermacam visual di dashboard.

Berikut ini file Clustering di awal2 dulu sebelum digunakan sbg template di 'dashboard PJP'. Jika teman2 lihat di tabel nampak ada 16 Clusters (0-15). Sedangkan di template PJP - dengan beberapa pertimbangan, akhirnya hanya digunakan 12 Clusters saja. Walau sebenarnya 16 Clusters lebih nampol karena disesuaikan dengan jumlah Salesman yang ada (dulu awalmya memang assignment untuk 12 Cluster tetapi secara workload terlalu berat).

Kerennya clustering ini menghasilkan pembagian 'Outlet' dan 'Revenue' yang hampir sama secara persentase sehingga kita akan lebih mudah membaginya ke team. Perhatikan % total antara 'Jumlah Outlet' dan 'Jumlah Revenue' semuanya mirip2. Karena dengan 'metode' yang lain bisa saja menghasilkan jumlah Outlet yg besar namun secara revenue lebih kecil atau sebaliknya. Cek beberapa postingan yg lama. Padahal sebenarnya algoritma k-means hanya peduli soal jarak terdekat, dan sama sekali tidak tahu menahu urusan 'Revenue' atau 'Jumlah Toko' - IMHO.

Ada tiga Cluster dengan jumlah Toko dan Omzet terbesar yakni Cluster 0, 8 dan 13. Cluster 0 dan 8 berada di Kodya Semarang yang sangat padat.
Semoga bermanfaat, selamat berhari Sabtu...

#clustering #python #paitun #kmeans #gis #qgis #arcgis #excel #powerbi #fmcg #densitybias #geoeconomicbalance





Home