Penelitian

Penelitian Dosen Program Studi Sains Data meliputi bidang-bidang berikut:


Forecasting and Time Series Analysis

Membuat model prediksi berbasis indeks deret waktu (time-series), domain area penelitian ini misalnya prediksi saham, kurs mata uang, harga emas, dan jika dihubungkan dengan kejadian kasus COVID-19 di Indonesia yakni untuk memprediksi jumlah pasien yang akan terkonfirmasi positif, kasus meninggal, kasus sembuh dan kasus pasien dalam perawatan.


Metode-metode yang dapat digunakan antara lain Linear Regression, Multiple Linear Regression, Polynomial Regression, Exponential Smoothing, Double Exponential Smoothing, Triple Exponential Smoothing, ARIMA, SARIMA, SARIMAX, VAR, VARIMA, VARIMAX, dan lainnya.

Machine Learning: Supervised Learning, Unsupervised Learning dan Reinforcement Learning

Membuat model prediksi berbasis dataset berbentuk tabular yang terdiri dari fitur dan label maupun tidak berlabel, domain area penelitian ini misalnya klasifikasi hewan dan tumbuhan berdasarkan morfologinya, klasifikasi pasien berdasarkan stadium kanker payudara, klasifikasi persetujuan kredit nasabah, klasterisasi komentar pengguna sosial media berdasarkan suatu isu, klasterisasi UMKM potensial berdasarkan indeks kota, klasterisasi pemilihan kebun bibit dan lahan produktif, dan permasalahan lainnya yang dapat diselesaikan dengan machine learning.


Metode-metode yang dapat digunakan antara lain Supervised Learning: Naive Bayes Classifier, K-Nearest Neighbor Classifier, Decision Tree Classifier, Multi-perceptron, Backpropagation. Unsupervised Learning: Kohonen Self Organizing Map, K-Means Clustering, Hierarchical Clustering, K-Medoids, Expectation-Maximization Clustering. Reinforcement learning: Q-learning.

Deep Learning: Supervised Learning dan Unsupervised Learning

Membuat model prediksi untuk kasus-kasus kompleks terutama berkaitan data-data yang tidak terstruktur seperti data gambar, audio video, teks, social media sources, dan lainnya yang memerlukan teknik pembelajaran mendalam. Domain area penelitian ini misalnya deteksi buah segar dan yang sudah membusuk, deteksi plat nomor kendaraan secara real time, counting cells (sel darah merah, sel sperma, mikroba, dan lain-lain), deteksi emosi berdasarkan ekspresi wajah manusia, deteksi berbagai objek sekitar, konservasi lahan dengan dukungan computer vision, generating artificial face untuk membuat tiruan wajah dengan berbagai bentuk, speech-to-text recognition untuk translasi bahasa, dan machine-multiple-translation untuk mesin penerjemah multi-bahasa.

Metode-metode yang dapat digunakan antara lain Supervised Learning: Convolutional Neural Network (CNN), Deep Belief Network (DBN), Deep Neural Network (DNN), Recurrent Neural Network (RNN): LSTM (Long Short Term Memory), Bi-RNN, dan Gated Recurrent Unit (GRU). Sedangkan Unsupervised Learning: Generative Adversarial Network (GAN), Restricted Boltzmann Machine (RBM), dan Autoencoder.

Big Data Analytics

Menyiapkan arsitektur beserta infrastruktur Big Data untuk kebutuhan pengolahan data besar, dimana database relasional belum mampu untuk menangani load data bervariasi dalam jumlah besar dan Query secara cepat. Konsep Big Data ini dikenal dengan 3V yakni Volume, Velocity dan variety. Domain area penelitian ini misalnya kebutuhan analisis visualisasi data dengan melibatkan data dalam jumlah besar dan lokasi sumber data berada pada banyak node, Kebutuhan analisis data perusahaan bulanan/kuartal/tahunan secara batch processing, kebutuhan tempat penyimpanan dan monitoring data sensor, dan mengimplementasikan pembuatan model prediktif untuk kasus-kasus perusahaan keuangan, retail, telekomunikasi, customer service guna memberikan peningkatan pelayanan bagi customer.

Modul-modul yang dapat disiapkan untuk mengimplementasikan big data antara lain: Data Storage: Hadoop, HBase, Data Processing: Map Reduce, Data Accessing: Hive, Pig, Data Management: Zookeeper, Chukwa, dan Data Visualization: Business Intelligence, Data Mining, dan lainnya.
EnglishIndonesian