2
PENGELOMPOKAN DATA JUMLAH PENDUDUK BERDASARKAN KELOMPOK UMUR TAHUN 2017 DI KOTA BANDUNG MENGGUNAKAN METODE CLUSTERING DAN METODE K-MEANS
Henrian Adjie Wicaksono, M. Asbahu Nizar, Wahyu Adi Setiawan
Program Studi Teknik Elektro Jurusan Teknik Informatika
Sekolah Tinggi Teknik Malang
Abstrak
Asumsi dasar untuk memahami bonus demografi adalah kondisi komposisi penduduk usia produktif (15-64 tahun) lebih besar dibandingkan dengan penduduk usia non produktif (0-14 tahun) dalam rentang waktu tertentu. Idealnya masyarakat dapat memahami posisi mereka dalam bermasyarakat, begitupun dengan pemangku kebijakan dengan menyadari pentingnya mengeluarkan kebijakan yang dapat mensupport agar potensi yang dimiliki oleh penduduk usia produktif tersebut bisa optimal dan maksimal.
Menggunakan data mining merupakan salah satu gagasan informasi untuk mengelompokan kependudukan yang ada di Kota Bandung, dengan menggunakan metode clustering data kependudukan Kota Bandung akan dikumpulkan berdasarkan rentan usia yaitu usia produktif (15-64 tahun), usia non produktif (0-14 tahun) dan usia manula (>65 tahun). Dengan menggunakan clustering dan algoritma K-means diharapkan akan mendapat sebuah data yang akurat dan terpercaya.
Kata kunci: (Data mining, Clustering, K-means)
PENDAHULUAN
Latar Belakang
Aspek kependudukan merupakan hal paling sangat mendasar dalam pembangunan. Dalam nilai universal, penduduk merupakan pelaku dan sasaran pembangunan sekaligus yang menikmati hasil pembangunan. Dalam kaitan peran penduduk tersebut, kualitas mereka perlu ditingkatkan melalui berbagai sumber daya yang melekat, dan pewujudan keluarga kecil yang berkualitas, serta upaya untuk menskenario kuantitas penduduk dan juga persebaran kependudukan.
Bandung merupakan salah satu di antara sejumlah daftar Kota-Kota besar di Indonesia. Hal yang paling mendasar yang umum dijumpai dalam suatu Kota besar adalah jumlah penduduk yang sangat banyak. Kota Bandung merupakan salah satu Kota dengan jumlah penduduk yang terbanyak di Indonesia. Hal ini dapat dilihat dari hasil sensus penduduk yang semakin tahun semakin meningkat. Dalam pengetahuan tentang kependudukan dikenal sebagai istilah karakteristik penduduk yang berpengaruh penting terhadap proses demografi dan tingkah laku sosial ekonomi penduduk.
Kota Bandung mempunyai luas wilayah sekitar 16.730 ha, maka kepadatan penduduk kota Bandung pada tahun 2011 adalah 145 jiwa/ha dan terus meningkat menjadi 148 jiwa/ha pada tahun 2016. Jumlah penduduk Kota Bandung dari tahun ke tahun terus mengalami peningkatan. Pada Tahun 2011 jumlah penduduk Kota Bandung sebesar 2.429.176 jiwa (BPS, April 2018). Dari tahun 2011-2016 rata-rata pertumbuhan penduduk adalah 0,53 %. Menurut BPS Jumlah penduduk Kota Bandung pada 5 tahun selanjutnya terus mengalami peningkatan yaitu dari tahun 2011 berjumlah 2.429.176 jiwa meningkat 2.490.622 jiwa pada tahun 2016. Pada tahun tersebut terjadi perubahan struktur umur penduduk yaitu jumlah penduduk usia produktif (15-64 tahun) terus meningkat, sementara jumlah penduduk usia non produktif (0-14 tahun) semakin menurun, namun usia manula (>65 tahun) juga meningkat.
Struktur usia penduduk Kota Bandung yang tergolong menonjol adalah usia pendidikan tinggi (20-24 tahun) atau awal usia kerja, artinya jumlah masyarakat usia produktif relatif besar yang merupakan modal dasar bagi pembangunan.
Dengan latar belakang diatas, dapat diperoleh suatu kesimpulan kependudukan Kota Bandung berdasarkan usia. Untuk mendapatkan suatu informasi yang terpercaya kami menyusun suatu data konkret untuk menghitung jumlah penduduk Kota Bandung berdasarkan usia dengan judul "Perhitungan kependudukan Kota Bandung menggunakan metode clustering dan algoritma K-Means".
Rumusan Masalah
Bagaimana cara Mengetahui daerah kelurahan mana saja terdapat banyak usia produktifnya ?
Bagaimana cara menghitung data menggunakan metode clustering dan algoritma k-Means ?
Tujuan
Untuk mengetahui daerah mana saja yang banyak terdapat usia produktifnya.
Untuk mengetahui cara perhitungan data dengan menggunakan metode Clustering dan algoritma K-Means.
Manfaat
Secara teoritis penulisan jurnal ini bermanfaat bagi Ilmu Pengetahuan khususnya bidang Sosial dalam pelaksanaan pendataan jumlah penduduk suatu wilayah dan pengelompokan penduduk berdasarkan usia, khususnya Kota Bandung.
Secara praktis penulisan jurnal ini bermanfaat bagi masyarakat untuk lebih mengetahui jumlah kependudukan berdasarkan usia, khususnya di Kota Bandung.
Tinjauan Pustaka
Pendahuluan
Landasan Teori
Metode Penelitian
Implementasi dan Pengujian
Kesimpulan dan saran
Daftar Pustaka
2. LANDASAN TEORI
2.1. Pengertian Data Mining
Data mining adalah sebuah proses percarian secara otomatis informasi yang berguna dalam tempat penyimpanan data berukuran besar. Istilah lain yang sering digunakan diantaranya knowledge discovery (mining) in databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, dan business intelligence. Teknik data mining digunakan untuk memeriksa basis data berukuran besar sebagai cara untuk menemukan pola yang baru dan berguna. Tidak semua pekerjaan pencarian informasi dinyatakan sebagai data mining. Sebagai contoh, pencarian record individual menggunakan database management system atau pencarian halaman web tertentu melalui query ke semua search engine adalah pekerjaan pencarian informasi yang erat kaitannya dengan information retrieval. Teknik-teknik data mining dapat digunakan untuk meningkatkan kemampuan sistem-sistem information retrieval.
Data mining adalah bagian integral dari knowledge discovery in databases (KDD). Keseluruhan proses KDD untuk konversi raw data ke dalam informasi yang berguna ditunjukkan dalam Gambar 1.1.
Gambar 1.1 Proses dalam KDD (Tan et al, 2005)
Data input dapat disimpan dalam berbagai format seperti flat file,spreadsheet , atau tabel-tabel relasional, dan dapat menempati tempat penyimpanan data terpusat atau terdistribusi pada banyak tempat. Tujuan dari preprocessing adalah mentransformasikan data input mentah ke dalam format yang sesuai untuk analisis selanjutnya. Langkah-langkah yang terlibat dalam preprocessing data meliputi mengabungkan data dari berbagai sumber, membersihkan (cleaning) data untuk membuang noise dan observasi duplikat, dan menyeleksi record dan fitur yang relevan untuk pekerjaan data mining. Karena terdapat banyak cara mengumpulkan dan menyimpan data, tahapan preprocessing data merupakan langkat yang banyak menghabiskan waktu dalam KDD.
Hasil dari data mining sering kali diintegrasikan dengan decision support system (DSS). Sebagai contoh, dalam aplikasi bisnis informasi yang dihasilkan oleh data mining dapat diintegrasikan dengan tool manajemen kampanye produk sehingga promosi pemasaran yang efektif yang dilaksanakan dan dapat diuji. Integrasi demikian memerlukan langkah postprocessing yang menjamin bahwa hanya hasil yang valid dan berguna yang akan digabungkan dengan DSS. Salah satu pekerjaan dan postprocessing adalah visualisasi yang memungkinkan analyst untuk mengeksplore data dan hasil data mining dari berbagai sudur pandang. Ukuran-ukuran statistik dan metode pengujian hipotesis dapat digunakan selama postprocessing untuk membuang hasil data mining yang palsu.
Secara khusus,data mining menggunakan ide-ide seperti (1) pengambilan contoh, estimasi, dan pengujian hipotesis, dari statistika dan (2) algoritma pencarian, teknik pemodelan, dan teori pembelajaran dari kecerdasan buatan, pengenalan pola, dan machine learning. Data mining juga telah mengadopsi ide-ide dari area lain meliputi optimisasi, evolutionary computing, teori informasi, pemrosesan sinyal, visualisasi dan information retrieval. Sejumlah area lain juga memberikan peran pendukung dalam data mining, seperti sistem basis data yang dibutuhkan untuk menyediakan tempat penyimpanan yang efisien, indexing dan pemrosesan queri. Gambar 1.2 menunjukkan hubungan data mining dengan area-area lain.
Gambar 1.2 Data mining sebagai pertemuan dari banyak disiplin ilmu (Tan et al, 2005)
2.2. Metode Clustering
Clustering atau klasterisasi adalah metode pengelompokan data. Menurut Tan, 2006 clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum.
Clustering merupakan proses partisi satu set objek data ke dalam himpunan bagian yang disebut dengan cluster. Objek yang di dalam cluster memiliki kemiripan karakteristik antar satu sama lainnya dan berbeda dengan cluster yang lain. Partisi tidak dilakukan secara manual melainkan dengan suatu algoritma clustering. Oleh karena itu, clustering sangat berguna dan bisa menemukan group atau kelompok yang tidak dikenal dalam data. Clustering banyak digunakan dalam berbagai aplikasi seperti misalnya pada business inteligence, pengenalan pola citra, web search, bidang ilmu biologi, dan untuk keamanan (security). Di dalam business inteligence, clustering bisa mengatur banyak customer ke dalam banyaknya kelompok. Contohnya mengelompokan customer ke dalam beberapa cluster dengan kesamaan karakteristik yang kuat. Clustering juga dikenal sebagai data segmentasi karena clustering mempartisi banyak data set ke dalam banyak group berdasarkan kesamaannya. Selain itu clustering juga bisa sebagai outlier detection.
Manfaat Clustering
Clustering merupakan metode segmentasi data yang sangat berguna dalam prediksi dan analisa masalah bisnis tertentu. Misalnya Segmentasi pasar, marketing dan pemetaan zonasi wilayah.
Identifikasi obyek dalam bidang berbagai bidang seperti computer vision dan image processing.
Konsep dasar Clustering
Hasil clustering yang baik akan menghasilkan tingkat kesamaan yang tinggi dalam satu kelas dan tingkat kesamaan yang rendah antar kelas. Kesamaan yang dimaksud merupakan pengukuran secara numeric terhadap dua buah objek. Nilai kesamaan antar kedua objek akan semakin tinggi jika kedua objek yang dibandingkan memiliki kemiripan yang tinggi. Begitu juga dengan sebaliknya. Kualitas hasil clustering sangat bergantung pada metode yang dipakai. Dalam clustering dikenal empat tipe data. Keempat tipe data pada tersebut ialah:
Variabel berskala interval
Variabel biner
Variabel nominal, ordinal, dan rasio
Variabel dengan tipe lainnya.
Metode clustering juga harus dapat mengukur kemampuannya sendiri dalam usaha untuk menemukan suatu pola tersembunyi pada data yang sedang diteliti. Terdapat berbagai metode yang dapat digunakan untuk mengukur nilai kesamaan antar objek-objek yang dibandingkan. Salah satunya ialah dengan weighted Euclidean Distance. Euclidean distance menghitung jarak dua buah point dengan mengetahui nilai dari masing-masing atribut pada kedua poin tersebut.
2.3. Algoritma K-Means
K-means merupakan salah satu metode clustering non hirarki yang berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai karateristik yang berbeda di kelompokan ke dalam cluster yang lain.
Ada beberapa kelebihan pada algoritma k-means, yaitu :
Mudah untuk di implementasi kan dan dijalankan.
Waktu yang dibutuhkan untuk menjalankan pembelajaran ini relatif cepat.
Mudah untuk diadaptasi.
Umum digunakan.
Kekurangan dari algoritma K-Means yaitu :
Sebelum algoritma dijalankan, k buah titik diinisialisasi secara random sehingga pengelompokkan data yang dihasilkan dapat berbeda-beda. Jika nilai random untuk inisialisasi kurang baik, maka pengelompokkan yang dihasilkan pun menjadi kurang optimal.
Dapat terjebak dalam masalah yang disebut curse of dimensionality. Hal ini dapat terjadi jika data pelatihan memiliki dimensi yang sangat tinggi (Contoh jika data pelatihan terdiri dari 2 atribut maka dimensinya adalah 2 dimensi. Namun jika ada 20 atribut, maka akan ada 20 dimensi). Salah satu cara kerja algoritma ini adalah mencari jarak terdekat antara k buah titik dengan titik lainnya. Jika mencari jarak antar titik pada 2 dimensi, masih mudah dilakukan. Namun bagaimana mencari jarak antar titik jika terdapat 20 dimensi. Hal ini akan menjadi sulit.
Jika hanya terdapat beberapa titik sampel data, maka cukup mudah untuk menghitung dan mencari titik terdekat dengan k titik yang diinisialisasi secara random.Namun jika terdapat banyak sekali titik data (misalnya satu milyar buah data), maka perhitungan dan pencarian titik terdekat akan membutuhkan waktu yang lama. Proses tersebut dapat dipercepat, namun dibutuhkan struktur data yang lebih rumit seperti kD-Tree atau hashing.
Variasi
K-means++
Algoritma untuk memilih nilai awal untuk algoritma k-means. Algoritma ini digunakan untuk mengurangi dampak buruk algoritma k-means yang sangat tergantung dari nilai awalnya.
K-medoids
Algoritma clustering yang berbasiskan prototype/model dari cluster. K-means menggunakan centroid (rata-rata) sebagai model dari cluster, sedangkan K-medoids menggunakan medoid (median).
Bisecting K-means
Ide dasarnya adalah menggunakan K-means untuk membagi dua suatu cluster. Awalnya setiap objek tergabung dalam satu cluster. Pada tiap iterasi, pilih satu cluster untuk dibagi dua menggunakan K-means. Hal ini dilakukan hingga terbentuk K cluster. Algoritma bisecting K-means bekerja lebih cepat dari K-means karena mengurangi jumlah objek yang diperbandingkan pada setiap iterasi.
Data MiningData Mining3. METODE PENELITIAN
Data Mining
Data Mining
InterpretationInterpretation 3.1. Objek Penelitian
Interpretation
Interpretation
Objek yang kami gunakan ini adalah data penduduk dari Kota Bandung.
3.2. Metode Pengumpulan Data
Metode yang digunakan dalam mengumpulkan data ini yaitu dengan observasi. Dimana kami mendapatkan data ini dari pihak yang terpecaya.
3.3 Jenis Data
Pada penelitian ini jenis data yang digunakan ada dua macam yaitu data primer dan data sekunder. Dimana dalam data primer didapatkan dari data yang didapatkan dari sumber terpecaya dan data sekunder yaitu data yang didapatkan secara tidak langsung dari objek penelitian melainkan mencari data dari sumber lain yang dapat mendukung penelitian ini dan juga digunakan sebagai referensi.
3.4 Alur Penelitian
TranformationTranformationPre-ProcessingPre-ProcessingData SelectionData Selection
Tranformation
Tranformation
Pre-Processing
Pre-Processing
Data Selection
Data Selection
Penjelasan dari alur penelitian tersebut :
1. Data Selection
Langkah dimana kita mencari sebuah dataset yang akan digunakan dari seperkian banyaknya data yang ada.
2. Pre-Processing
Dari dataset yang telah dipilih pada langkah ini kita perlu memilah dan membersihkan data-data apa saja yang dirasa tidak peting. Pada langkah ini pula kita bisa menambahkan beberapa informasi lain untuk memperkaya dataset yang kita gunakan.
3. Transformation
Pencarian fitur-fitur yang berguna untuk mempresentasikan data bergantung pada goal yang ingin dicapai.
4. Data Mining
Proses dimana untuk mencari pola dalam data kita menggunakan metode dan algoritma yang telah ditentukan.
5. Interpretation
Penerjemahan pola-pola yang dihasilkan dari data mining.
4. IMPLEMENTASI DAN PENGUJIAN
4.1 Perhitungan Manual
4.1.1 Data
4.1.2 Cara perhitungan manual
1. Menentukan jumlah cluster yang diinginkan (kami menggunkan cluster berjumlah 3)
2. Memilih centroid awal secara acak
Dengan data sebagai berikut :
{Cibaduyut, Dago, Cipedes}
M1 =Cibaduyut (3280, 8465, 383)
M2 = Dago (7729, 22518, 2098)
M3 = Cipedes (7088, 20230, 1516)
3. Hitung dengan centroid
Pada langkah ini setiap data akan ditentukan centroid terdekatnya dan data tersebut akan ditetapkan sebagai anggota kelompok yang terdekat dengan centroid.
Sebagai contoh untuk menghitung jarak ke centroid masing-masing cluster pada kelurahan Kebon Jeruk sebagai berikut :
DM1 = (2469 - 3280)2 + (8815 - 8465) 2 + (1326 - 383) 2 = 1292,08
DM2 = (2469 - 7729)2 + (8815 - 22518) 2 + (1326 - 2098) 2 = 14698
DM3 = (2469 - 7088)2 + (8815 - 20230) 2 + (1326 - 1516) 2 = 12316
Contoh sebagian data hasil perhitungan jarak antara masing – masing centroid
Cluster1
Cluster2
Cluster3
Jarak dekat
1292.08
14698
12316
C1
4031.23
10819
8404
C1
1485.88
16115
13712
C1
4973.72
9893
7491
C1
5134.47
9717
7305
C1
Dari table tersebut didapat keanggotaan masing-masing cluster. Setelah itu dihitung pula rasio antar besaran BCV (Between Cluster Variation) dengan WCV (Within Cluster Variation) :
Karena centroid
M1=(3280,8465,383)
M2=(7729,22518,2098)
M3=(7088,20230,1516)
d(m1,m2) = (3280 - 7729) 2 + (8465 - 22518) 2 + (383 - 2098) 2 = 14839.86
d(m1,m3) = (3280 - 7088) 2 + (8465 - 20230) 2 + (383 - 1516) 2 = 12417.720
d(m2,m3) = (7729 - 7088) 2 + (22518 - 20230) 2 + (2098 - 1516) 2 = 2446.33
BCV = 14839.86 + 12417.720 + 2446.33 = 29703.91
WCV dihitung dari memilih jarak terkecil antara data dengan centroid pada masing-masing cluster
Contohnya
Nama Kelurahan
Jarak centroid terkecil
Kebon Jeruk
1292.08
Campaka
4031.23
Garuda
1486.88
Dungus Cariang
4974.72
Ciroyom
5134.47
WCV=1292.082+4031.232+1486.882+4974.722+5134.472+dst = 1.855.379.567
Sehingga besar ratio dalam iterasi 1 adalah :
BCV/WCV =
29703.91/1.855.379.567
= 0,0000160096
Karena langkah ini merupakan iterasi1 maka dilanjutkan ke langkah berikutnya
4. Pembaruan centroid dengan menghitung rata-rata nilai pada masing-masing cluster.
CLUSTER 1
Nama Kelurahan
Usia 0-14
Usia 15-64
Usia >65 thn
KEBON JERUK
2469
8815
1326
CAMPAKA
4253
12434
898
GARUDA
2350
7383
798
DUNGUS CARIANG
4456
13222
1235
CIROYOM
4995
13240
1171
Mean
2965
8880
834
CLUSTER 2
Nama Kelurahan
Usia 0-14
Usia 15-64
Usia >65 thn
BABAKAN CIPARAY
7940
21439
1241
CIGADUNG
7247
21538
1755
DAGO
7729
22518
2098
BABAKANSARI
9088
25945
1984
Mean
8001
22860
1769.5
CLUSTER 3
Nama Kelurahan
Usia 0-14
Usia 15-64
Usia >65 thn
MARGAHAYU UTARA
5402
14702
989
BABAKAN
7631
20244
1211
SUKAHAJI
7543
20221
1485
GEMPOLSARI
4874
15000
794
CIJERAH
5817
16802
1223
Mean
6888.8
16699.19
1351.7
Sehingga didapat Centroid baru
m1=(2965, 8880, 834)
m2=(8001, 22860, 1769.5)
m3=(6888.80769, 16699.19231, 1351.769231)
(Iterasi 2) Kembali lagi ke langkah 3
Jika masih ada data yang berpindah cluster atau jika nilai centroid diatas nilai ambang.
Sehingga didapat besar rasio pada Iterasi 2 adalah :
BCV/WCV =
29926.613620633/1384931665
= 0.0000216087
Jika dibandingkan maka rasio sekarang lebih besar daripada sebelumnya oleh karena itu algoritma dilanjutkan kelangkah berikutnya.
(Iterasi 3)
Sehingga didapat besar rasio pada Iterasi 3 adalah :
BCV/WCV =
28779.722052823/1194352601
= 0.0000240965
Jika dibandingkan maka rasio sekarang lebih besar daripada sebelumnya oleh karena itu algoritma dilanjutkan kelangkah berikutnya.
(Iterasi 4)
Sehingga didapat besar rasio pada Iterasi 4 adalah :
BCV/WCV =
28706.023435527/1194534255
= 0.0000240311
Pada Iterasi 4 didapat hasil Rasio lebih kecil daripada daripada Iterasi 3 jadi perhitungan algoritma dihentikan.
4.2 Hasil Pada Weka
Berikut ini adalah langkah – langkah untuk mendapatkan hasil pada aplikasi Weka :
1. Pertama buka terlebih dahulu aplikasi Weka
2. Lalu pilih menu Explorer hingga muncul tampilan dibawah ini
3. Masukkan file .CSV atau .ARFF pada menu Open file lalu pilih dataset yang akan digunakan
4. Setelah dataset telah dimasukkan, lalu filter data tersebut dengan cara tandai semua Attributes yang digunakan lalu pilih filter dengan cara Choose>filters>unsupervised > attributes>NumericToNominal lalu Apply
5. Pilih menu Cluster lalu pilih algoritma yang digunakan yaitu SimpleKMeans.
6. Tetukan jumlah cluster dengan cara double klik pada nama algoritma lalu isi kolom numClusters sesuai acuan.
7. Jika semua langkah telah dilakukan klik tombol Start untuk menampilkan hasilnya.
5. PENUTUP
5.1 Kesimpulan
Dari uraian diatas dapat disimpulkan bahwa :
Bandung merupakan salah satu Kota besar di Indonesia. Jumlah kependudukan di Kota Bandung setiap tahunnya terus mengalami peningkatan hingga rasio 0,53% per tahunnya yaitu pada tahun 2011 jumlah penduduk Kota Bandung sebesar 2.429.176 jiwa dan 2.490.622 jiwa pada tahun 2016. Struktur usia penduduk Kota Bandung tergolong menjadi tiga yaitu penduduk usia non produktif (0-14 tahun), usia produktif (15-64 tahun), dan usia manula (>65 tahun).
Data mining merupakan sebuah proses pencarian informasi secara otomatis yang ada pada tempat penyimpanan data berukuran besar. Istilah lain yang sering digunakan diantaranya knowledge discovery (mining) in database (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, dan bussiness intelligence.
Metode Clustering merupakan suatu metode yang digunakan untuk mengelompokkan data kedalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki yang minimum.
K-means merupakan salah satu algoritma clustering non hirarki yang berusaha mempartisi data yang ada kedalam bentuk satu atau lebih cluster.
5.2 Saran
Dari penelitian yang kami lakukan terdapat beberapa hal yang kami rasa masih perlu diperbaiki dan dikembangkan. Ada beberapa catatan yang ingin kami sampaikan, diantaranya:
Untuk peneliti selanjutnya, kami berharap peneliti dapat menguasai software yang digunakan dengan baik sehingga tidak adanya kesalahan atau error yang terjadi. Output yang dihasilkan diharapkan bisa sama dengan hasil penghitungan secara manual, karena sebenarnya pada aplikasi hanya sebagai visualisasi dari hasil perhitungan secara manual.
Apabila dalam penelitian perhitungan jumlah kependudukan Kota Bandung berdasarkan usia ini masih belum mendapat informasi yang akurat, kami siap menerima saran dan kritikan dari pembaca sekalian.
6. DAFTAR PUSTAKA
- Atmajaya, dedi. 2017. Apa itu k-means algorithm. http://lecturer.fikom.umi.ac.id/dedyatmajaya/k-means-algorithm/ (Diakses pada 21 Mei 2018)
- Binus university. 2017. Clustering. https://socs.binus.ac.id/2017/03/09/clustering/ . (DIkases pada 22 Mei 2018)
- Pemkot bandung. (2017). Dataset kependudukan berdasarkan umur.http://data.bandung.go.id/service/index.php/datapreview/load/2ee698e5-b352-4960-ad4b-b60dd094d092 (Diakses pada 21 Mei 2018).
- Prabowo,sigit. 2013. Tahapan-tahapan KDD. http://www.sigitprabowo.id/2013/04/data-mining-tahap-tahapan-knowladge.html. (Diakses pada 3 juni 2018).
- Tjiptoherijanto prijono. 2000. Proyeksi Penduduk, angkatan kerja, tenaga kerja, dan peran serikat pekerja dalam peningkatan kesejahteraan. https://www.bappenas.go.id/files/3513/.../prijono__20091015125259__2356__0.pdf (Diakses pada 21 Mei 2018).