Istilah 'data' bukanlah hal baru bagi kami. Ini adalah salah satu hal utama yang diajarkan ketika Anda memilih Teknologi Informasi dan komputer. Jika Anda ingat, data dianggap sebagai bentuk mentah dari informasi. Padahal sudah ada selama satu dekade, istilah itu Data besar adalah gebrakan akhir-akhir ini. Sebagaimana terlihat dari istilah, beban, dan banyak data, adalah Data Besar dan dapat diproses dengan cara yang berbeda menggunakan metode dan alat yang berbeda untuk mendapatkan informasi yang diperlukan. Artikel ini berbicara tentang konsep Big Data, menggunakan 3 V yang disebutkan oleh Doug Laney, pelopor dalam bidang pergudangan data yang dianggap telah memulai bidang Infonomika (Ekonomi Informasi).
Data Besar 3 Vs
Data, dalam bentuknya yang sangat besar, terakumulasi melalui cara yang berbeda telah diarsipkan dengan benar dalam database yang berbeda sebelumnya dan dibuang setelah beberapa waktu. Ketika konsep muncul bahwa semakin banyak data, semakin mudah untuk mencari tahu - informasi yang berbeda dan relevan - menggunakan alat yang tepat, perusahaan mulai menyimpan data untuk periode yang lebih lama. Ini seperti menambahkan perangkat penyimpanan baru atau menggunakan cloud untuk menyimpan data dalam bentuk apa pun yang disediakan data: dokumen, spreadsheet, basis data, dan HTML, dll. Kemudian diatur ke dalam format yang tepat menggunakan alat yang mampu memproses potongan besar Data.
CATATAN: Ruang lingkup Big Data tidak terbatas pada data yang Anda kumpulkan dan simpan di tempat dan cloud Anda. Ini dapat mencakup data dari berbagai sumber lain, termasuk tetapi tidak terbatas pada item dalam domain publik.
Model 3D Data Besar didasarkan pada V berikut ini:
- Volume: mengacu pada manajemen penyimpanan data
- Kecepatan: mengacu pada kecepatan pemrosesan data
- Ragam: mengacu pada pengelompokan data dari kumpulan data yang berbeda, yang tampaknya tidak terkait
Paragraf berikut menjelaskan pemodelan Big Data dengan membicarakan setiap dimensi (masing-masing V) secara detail.
A] Volume Data Besar
Berbicara tentang Big Data, orang mungkin memahami volume sebagai kumpulan besar informasi mentah. Meskipun itu benar, itu juga tentang biaya penyimpanan data. Data penting dapat disimpan di tempat maupun di awan, yang terakhir menjadi opsi fleksibel. Tetapi apakah Anda perlu menyimpan masing-masing dan semuanya?
Menurut sebuah buku putih yang dirilis oleh Meta Group, ketika volume data meningkat, bagian data mulai terlihat tidak perlu. Lebih lanjut, ia menyatakan bahwa hanya volume data yang harus dipertahankan yang ingin digunakan oleh bisnis. Data lain dapat dibuang atau jika bisnis enggan melepaskan "data yang dianggap tidak penting", data tersebut dapat dibuang pada perangkat komputer yang tidak digunakan dan bahkan pada kaset sehingga bisnis tidak perlu membayar untuk menyimpan data tersebut.
Saya menggunakan "data yang dianggap tidak penting" karena saya juga percaya bahwa data jenis apa pun dapat diperlukan oleh bisnis apa pun di masa mendatang - cepat atau lambat - dan karenanya perlu disimpan untuk waktu yang cukup sebelum Anda tahu bahwa data tersebut memang benar. tidak penting. Secara pribadi, saya membuang data lama ke hard disk dari yesteryears dan kadang-kadang pada DVD. Komputer utama dan penyimpanan cloud berisi data yang saya anggap penting dan tahu bahwa saya akan menggunakannya. Di antara data ini juga, ada jenis data sekali pakai yang mungkin berakhir di HDD lama setelah beberapa tahun. Contoh di atas hanya untuk pengertian Anda. Ini tidak akan sesuai dengan uraian Big Data karena jumlahnya cukup kurang dibandingkan dengan apa yang perusahaan anggap sebagai Big Data.
B ] Kecepatan dalam Big Data
Kecepatan pemrosesan data merupakan faktor penting ketika berbicara tentang konsep Big Data. Ada banyak situs web, terutama e-commerce. Google telah mengakui bahwa kecepatan pemuatan halaman sangat penting untuk peringkat yang lebih baik. Terlepas dari peringkat, kecepatan juga memberikan kenyamanan kepada pengguna saat mereka berbelanja. Hal yang sama berlaku untuk data yang sedang diproses untuk informasi lainnya.
Ketika berbicara tentang kecepatan, penting untuk mengetahui bahwa itu hanya di luar bandwidth yang lebih tinggi. Ini menggabungkan data yang mudah digunakan dengan alat analisis yang berbeda. Data yang dapat digunakan dengan mudah berarti beberapa pekerjaan rumah untuk membuat struktur data yang mudah untuk diproses. Dimensi berikutnya - Variety, menyebarkan cahaya lebih lanjut tentang ini.
C] Ragam Data Besar
Ketika ada banyak dan banyak data, menjadi penting untuk mengaturnya sedemikian rupa sehingga alat analisis dapat dengan mudah memproses data. Ada alat untuk mengatur data juga. Saat menyimpan, data bisa tidak terstruktur dan dalam bentuk apa pun. Terserah Anda untuk mencari tahu hubungan apa yang ada dengan data lain dengan Anda. Setelah Anda mengetahui relasinya, Anda dapat mengambil alat yang sesuai dan mengonversi data ke bentuk yang diinginkan untuk penyimpanan terstruktur dan diurutkan.
Ringkasan
Dengan kata lain, Model 3D Big Data didasarkan pada tiga dimensi: data yang dapat DIGUNAKAN yang Anda miliki; penandaan data yang tepat; dan pengolahan lebih cepat. Jika ketiganya dirawat, data Anda dapat segera diproses atau dianalisis untuk mencari tahu apa pun yang Anda inginkan.
Di atas menjelaskan kedua konsep dan model 3D Big Data. Artikel-artikel yang terkait dalam para kedua akan membuktikan dukungan tambahan jika Anda baru mengenal konsep tersebut.
Jika Anda ingin menambahkan sesuatu, silakan komentar.