Statistik adalah data-data yang dikumpulkan guna memperoleh informasi mengenai suatu masalah.
Statistika adalah ilmu mengumpulkan, menata, menyajikan, menganalisis, dan menginterpretasikan data menjadi informasi untuk mengambil keputusan yang efektif.
Data Sains adalah ilmu yang khusus mempelajari suatu data. Data sains menggunakan statistik untuk mengumpulkan, meninjau, menganalisa, dan menarik kesimpulan dari data, serta menerapkan model matematika yang diukur ke variabel yang sesuai.
A. Analisis Deskriptif
Jenis analisis data yang digunakan untuk menggambarkan, menampilkan, dan meringkas sekumpulan data.
Jenis-jenis data yang dapat dianalisis menggunakan analisis deskriptif antara lain:
- Data Numerik: Analisis deskriptif dapat digunakan untuk memahami distribusi data numerik seperti rata-rata, median, dan deviasi standar.
- Data Kualitatif: Analisis deskriptif dapat digunakan untuk memahami data kualitatif.
- Data Historis: Analisis deskriptif dapat digunakan untuk memahami tren dan pola dalam data historis.
- Data Visual: Analisis deskriptif dapat digunakan untuk memahami pola dalam data visual seperti grafik dan diagram.
Contoh: Layanan keuangan menggunakan analisis deskriptif untuk memeriksa data transaksi masa lalu untuk menganalisis pola pengeluaran pelanggan dan mengidentifikasi area potensial untuk pengurangan biaya atau perolehan pendapatan.
B. Analisis Prediktif
Teknik analisis menggunakan pola data saat ini dan di masa lalu untuk memprediksi suatu kejadian di masa mendatang.
3 teknik analisis prediktif yang paling banyak digunakan yaitu:
- Desicion trees: Teknik ini menggunakan machine learning dengan proses data mining, yaitu pemilihan informasi berguna yang tersimpan dalam big data secara otomatis. Sesuai namanya, desicion trees terlihat seperti pohon dengan banyak cabang yang mewakili pilihan alternatif, dan daun mewakili klasifikasi atau keputusan.
- Regression: Teknik regresi memperkirakan hubungan antar variabel yang ditunjukkan dengan angka, yang disebut respons atau variabel y. Metode regresi sangat penting untuk memperkirakan angka numerik.
- Neural Network: Sekumpulan algoritma yang didesain dapat mengenali pola secara otomatis. Neural network dapat menerima banyak data, mengidentifikasi hubungan rumit yang tersembunyi pada setiap data untuk menemukan pola data, dan akhirnya menghasilkan prediksi data tunggal.
Contoh: Bisnis tempat penginapan menggunakan analisis prediktif untuk memperkirakan berapa banyak customer yang akan melakukan check in di hari tersebut, sehingga mereka bisa menjamin karyawan dan sumber daya memadai untuk memenuhi permintaan tersebut.
C. Analisis Preskriptif
Proses menganalisis data menggunakan algoritma dan machine learning untuk menentukan langkah selanjutnya yang perlu diambil. Analisis ini merekomendasikan aksi atau keputusan berdasarkan target, batasan, dan pilihan yang kompleks.
Manfaat analisis preskriptif:
- Membantu membuat keputusan secara otomatis, sehingga analyst tidak perlu mengolah data mentah secara manual untuk mengambil keputusan.
- Dapat memberi rekomendasi keputusan sesuai dengan perubahan situasi dan kondisi.
- Bisa diimplementasikan dalam berbagai bidang untuk membantu mencegah penipuan, mencegah risiko, meningkatkan efiensi, mencapai tujuan bisnis, dan meningkatkan pelanggan.
Putri Aprilia, (IF-8). Tugas Pengantar Sains Data.