BIG DATA
PENJELASAN BIG DATA
Big data adalah suatu kumpulan informasi yang besar baik secara terstruktu, semi terstruktur dan Unstructured data. Big data memilik 3 unsur yaitu:
* Volume : Data set dapat disimpan dalam jumlah yang besar
* Velocity : ada kenbutuhan mengakses dengan cepat
* Variety : format data bervariasi
jenis jenis format data yaitu
1. Data terstruktur,seperti : DBMS
2. Data Semi-Terstruktur,seperti : XML, JSON
3. Data Unstructured, seperti : Dokumen, video, gambar, audio
Data tersebut di analisis menjadi proses analisis big data. analisis big data adalah proses pengolahan data set besar untuk mencari informasi tersebunyi dan suatu preferensi dari dari suatu data tersebut. Analisis big dta juga penting untuk mengidetifikasikan peluang.
Manfaat dari Big data adalah
1. Penghematan Biaya karena teknologi analisis big data seperti analisis berbasis cloud mengurangi biaya dalam hal penyimpanan data set dalam jumlah besar.
2. Lebih cepat dan lebih baik dalam mengambil keputusan
3. Melahirkan produk dan pelayanan baru
ALGORITMA K-MEANS UNTUK BIG DATA
Seperti kita ketahui machine learning adalah inti dari Big Data. Dengan mengaplikasikan machine learning maka pola-pola dari data yang tersimpan akan terlihat. Pola-pola tersebut yang sebenernya hasil yang ingin didapatkan dengan mengaplikasikan Big Data. dalam big data ini digunakan algoritma K-Means yang termasuk dalam jenis algoritma clustering atau pengelompokan. jadi algoritma ini bekerja untuk meneglompokan atau mengklasifikasikan data. Algoritma K-Means ini mengelompokkan data berdasarkan kemiripan dari fitur-nya. Ciri khas dari algoritma ini adalah kita mendefinisikan terlebih dahulu berapa jumlah cluster yang akan kita dapatkan dan berapa jumlah iterasi untuk algoritma ini.
Prinsip umum dari algoritma K-Means clustering adalah sebagai berikut:
CONTOH STUDI KASUS BIG DATA
1. Lembaga keuangan dapat menggunakan analisis big data agar cepat mengidentifikasi potensi penipuan sebelum menjadi besar efeknya, sehingga meminimalkan resiko kerugian secara finansial.
2. Marketing dapat menggunakan big data untuk melakukan analisis sentimen untuk mengetahui tingkat kepuasan pelanggan terhadap produk dan layanan yang dipasarkan.
3. Perusahaan ritel dapat menggunakan informasi dari social media seperti Facebook, Twitter, Google+ yang disimpan dengan teknologi big data, yang selanjutnya digunakan untuk menganalisis bagaimana perilaku, persepsi pelanggan terhadap suatu produk atau brand dari perusahan.
Big data adalah suatu kumpulan informasi yang besar baik secara terstruktu, semi terstruktur dan Unstructured data. Big data memilik 3 unsur yaitu:
* Volume : Data set dapat disimpan dalam jumlah yang besar
* Velocity : ada kenbutuhan mengakses dengan cepat
* Variety : format data bervariasi
jenis jenis format data yaitu
1. Data terstruktur,seperti : DBMS
2. Data Semi-Terstruktur,seperti : XML, JSON
3. Data Unstructured, seperti : Dokumen, video, gambar, audio
Data tersebut di analisis menjadi proses analisis big data. analisis big data adalah proses pengolahan data set besar untuk mencari informasi tersebunyi dan suatu preferensi dari dari suatu data tersebut. Analisis big dta juga penting untuk mengidetifikasikan peluang.
Manfaat dari Big data adalah
1. Penghematan Biaya karena teknologi analisis big data seperti analisis berbasis cloud mengurangi biaya dalam hal penyimpanan data set dalam jumlah besar.
2. Lebih cepat dan lebih baik dalam mengambil keputusan
3. Melahirkan produk dan pelayanan baru
ALGORITMA K-MEANS UNTUK BIG DATA
Seperti kita ketahui machine learning adalah inti dari Big Data. Dengan mengaplikasikan machine learning maka pola-pola dari data yang tersimpan akan terlihat. Pola-pola tersebut yang sebenernya hasil yang ingin didapatkan dengan mengaplikasikan Big Data. dalam big data ini digunakan algoritma K-Means yang termasuk dalam jenis algoritma clustering atau pengelompokan. jadi algoritma ini bekerja untuk meneglompokan atau mengklasifikasikan data. Algoritma K-Means ini mengelompokkan data berdasarkan kemiripan dari fitur-nya. Ciri khas dari algoritma ini adalah kita mendefinisikan terlebih dahulu berapa jumlah cluster yang akan kita dapatkan dan berapa jumlah iterasi untuk algoritma ini.
Prinsip umum dari algoritma K-Means clustering adalah sebagai berikut:
- Pilih data secara random dengan jumlah sama dengan jumlah cluster yang kita inginkan. Misal jika kita ingin mendapatkan 10 cluster maka kita ambil 10 data secara random dari kumpulan data yang kita miliki. Data ini berikutnya menjadi pusat sementara dari cluster kita.
- Kita kelompokkan sisa data (dataset dikurangi dari data yang sebelumnya diambil secara random) berdasarkan kedekatannya dengan data yang telah dipilih secara random sebelumnya. Kita kelompokkan data ke pusat cluster yang jaraknya paling dekat (minimal). Akhir dari langkah ini adalah semua data terbagi menjadi cluster/kelompok sesuai dengan jumlah cluster yang kita inginkan.
- Selanjutnya untuk setiap cluster kita cari rata-rata dari seluruh data anggota cluster tersebut. Rata-rata ini akan menjadi pusat cluster berikutnya. Akan ada cluster yang pusatnya berubah ada yang tidak. Biasanya pada saat iterasi awal kebanyakan cluster akan berubah pusatnya.
- Setelah kita mempunyai pusat cluster yang baru, kita kelompokkan lagi semua data yang kita miliki berdasarkan pusat cluster yang baru. Sama seperti langkah kedua.
- Kita ulangi lagi langkah 3 dan langkah 4 sampai sejumlah iterasi yang sebelumnya kita definisikan.
- Setelah iterasi berakhir diharapkan nanti akan didapatkan cluster yang mewakili dari semua data yang kita miliki.
CONTOH STUDI KASUS BIG DATA
1. Lembaga keuangan dapat menggunakan analisis big data agar cepat mengidentifikasi potensi penipuan sebelum menjadi besar efeknya, sehingga meminimalkan resiko kerugian secara finansial.
2. Marketing dapat menggunakan big data untuk melakukan analisis sentimen untuk mengetahui tingkat kepuasan pelanggan terhadap produk dan layanan yang dipasarkan.
3. Perusahaan ritel dapat menggunakan informasi dari social media seperti Facebook, Twitter, Google+ yang disimpan dengan teknologi big data, yang selanjutnya digunakan untuk menganalisis bagaimana perilaku, persepsi pelanggan terhadap suatu produk atau brand dari perusahan.
Komentar
Posting Komentar