Data Cleaning and Preparation Techniques (DA008)
Deskripsi Training
Training ini membahas teknik membersihkan dan menyiapkan data sebelum proses analisis.
Peserta akan mempelajari cara mengidentifikasi data yang tidak konsisten, hilang, atau duplikat,
serta teknik untuk memformat, mengubah, dan menggabungkan data dari berbagai sumber agar siap digunakan dalam analisis.
Cocok untuk: Data Analyst, Data Preparer, ETL Specialist.
Daftar Sekarang
Silabus Training
- Modul 1: Pengenalan Data Cleaning
Memahami pentingnya data cleaning dalam proses analisis dan tantangan yang sering dihadapi dalam kualitas data.
- Modul 2: Identifikasi dan Penanganan Data Hilang
Teknik menemukan data yang hilang dan metode untuk mengisinya atau mengatasinya.
- Modul 3: Deteksi dan Penanganan Data Duplikat
Cara menemukan data yang ganda dan teknik untuk menghapus atau mengonsolidasikannya.
- Modul 4: Standarisasi Format Data
Mengubah format data menjadi bentuk yang konsisten, termasuk tanggal, angka, dan teks.
- Modul 5: Transformasi Data
Teknik mengubah struktur data agar sesuai dengan kebutuhan analisis.
- Modul 6: Integrasi Data dari Berbagai Sumber
Menggabungkan data dari berbagai sistem atau file dengan format yang berbeda.
- Modul 7: Tools untuk Data Cleaning
Pengenalan tools populer untuk data cleaning seperti Excel, Python (pandas), dan OpenRefine.
Contoh Kasus
Studi kasus membersihkan dataset pelanggan yang berasal dari berbagai sumber dengan format berbeda,
termasuk menghapus duplikat, mengisi data yang hilang, dan menstandarkan format untuk analisis pemasaran.