Mengenal Lebih dekat Prodi Sains Data

Disampaikan oleh Koorprodi Sains Data

Dr.Eng.Ir.Dwi Arman Prasetya.,ST.,MT.,IPU., Asean. Eng

Pengenalan Sains Data Secara Umum
Sains Data merupakan ilmu terapan yang secara khusus mempelajari dan menganalisis data. Fungsi ilmu Sains Data dalam era digital dan big data saat ini cukup penting karena begitu melimpahnya data yang tersedia. Data menyediakan informasi yang dapat menentukan keputusan penting dalam berbagai sektor industri.

Sains Data adalah ilmu multidisipliner yang dapat diterapkan di berbagai bidang. Sains Data dapat diterapkan di bidang kesehatan, pemerintahan, bisnis, perbankan, keuangan, manufaktur, pemasaran, dan lain-lain.

Seorang Data Scientist atau Ilmuwan Data biasanya tidak hanya memiliki ilmu Sains Data, tapi juga ilmu Teknik, Kesehatan, Jurnalistik, Hukum, Ekonomi, Sosiologi, Kimia, Farmasi, dan lain-lain. Dengan alasan yang sama bahwa Sains Data sebelumnya hanya dipelajari pada jenjang Magister atau S2, dengan latarbelakang pendidikan S1 yang beragam.

Konsentrasi bidang Keilmuan Sains Data
Sebelum adanya Jurusan atau Prodi Sains Data pada jenjang S1, orang-orang yang saat ini bekerja dengan big data memiliki latarbelakang pendidikan yang beragam. Karena sifatnya yang multidisipliner atau transdisiplin, Sains Data dapat dipelajari melalui beberapa jurusan atau prodi seperti Teknik Informatika, Matematika, atau Statistika.

Pada dasarnya, Sains Data mempelajari data yang terstruktur dan tidak terstruktur. Contoh data yang terstruktur yaitu data demografi dan data keungan. Sementara data yang tidak terstruktur seperti video, foto, email, media sosial, dan seterusnya. Data yang dianalisis dalam Sains Data khususnya bersifat kuantitatif atau numerik, yang dipelajari juga pada Jurusan atau Prodi Statistika, Aktuaria, dan Matematika.

Prodi S1 Sains Data skill yang harus dikuasai, yang menjadi pembeda dengan Teknik Informatika, Matematika, Aktuaria atau Statistika, antara lain:

Pemrograman
Di perusahaan manapun seorang data scientist bekerja, kemampuan akanprogramming sudah menjadi suatu keharusan. Seorang Data Scientist harus memahami tools of trade yang digunakan secara mendalam. Ini berarti Data Scientist paling tidak harus menguasai bahasa pemrograman seperti R ataupun Python serta bahasa database querying seperti SQL.

Statistika
Pemahaman yang menyeluruh mengenai statistika merupakan hal yang paling mendasar bagi seorang Data Scientist. Selain untuk menentukan algoritma yang akan digunakan, ilmu statistika diperlukan untuk mengembangkan software machine learning yang berfungsi sebagai pusaka seorang data scientist.

Machine Learning
Bagi seorang Data Scientist yang bekerja di perusahaan dimana produknya bersifat data driven seperti Google Maps, Netflix, atau Uber pasti sangat membutuhkan machine learning. Mereka tidak mungkin menentukan algoritma dari data yang tak terstruktur dengan jumlah yang sangat besar satu per satu. Maka dari itulah para Data Scientist harus bisa mengembangkan machine learning untuk mengolah banyaknya data tak terstruktur tadi dan bukannya tak mungkin apabila machine learning yang dikembangkan oleh para Data Scientist ini dipakai untuk sebuah konsep artificial intelligence.

Kalkulus & Aljabar
Menguasai kalkulus dengan fungsi yang dapat diterapkan di banyak variabel dan aljabar linear merupakan sesuatu yang tak kalah penting bagi seorang Data Scientist. Kalkulus dan aljabar merupakan konsep yang paling dasar dan sederhana bagi data science. Oleh karena itu, tidak mengherankan jika pada saat wawancara kerja, pencari kerja biasanya menanyakan soal-soal kalkulus dan aljabar.

Pemetaan Data
Terkadang data yang didapatkan tidaklah sempurna seperti penulisan kata ‘Yogyakarta’ dan ‘Jogja’ berbeda tapi secara konsep memiliki makna yang sama. Dan perlu di ingat, komputer itu tidak sepintar manusia. Sebagai seorang Data Scientist harus membuat data tersebut dikenali oleh komputer. Untuk itulah pemilahan data diperlukan untuk menjaga ‘kebersihan’ data.

Komunikasi dan Visualisasi Data
Bagi manajemen yang data-driven terutama di perusahaan yang masih tergolong baru, Data Scientist di perusahaan mereka sering dimintai bantuan dalam menentukan arah kebijakan suatu perusahaan. Maka tak heran jika Data Scientist harus pandai memvisualisasikan dan mempresentasikan data hasil olahannya sendiri.

Software Engineering
Di perusahaan start-up teknologi biasanya melibatkan langsung Data Scientist mereka ke dalam pengembangan software. Untuk itu pada data sains diberikan pengetahuan tentang software engineering.

Intuisi
Skill ini sebenarnya lebih dibutuhkan bagi seorang Data Analyst yang harus memecahkan masalah dari data yang sudah diolah. Untuk itu pada data sains diberikan pengetahuan tentang model peramalan

Dari skill yang harus dikuasai oleh lulusan S1 Prodi Data sains, berikut 4 jenis tugas Data Scientist antara lain:

Melakukan Analisis Data Perusahaan
Analisis data merupakan sesuatu yang pasti dilakukan Data Scientist. Untuk perusahaan skala menengah Data Scientist melakukan hal-hal seperti mengambil data dari database menggunakan query SQL, membuat tabel pivot dengan Microsoft Excel atau menggunakan software lainnya seperti SPSS, melakukan visualisasi data dalam bentuk grafik dan kadang kala menggunakan bantuan bahasa pemrograman untuk melakukan analisis data seperti R dan MATLAB. Beberapa perusahaan memberikan tugas untuk melakukan analisis akun Google Analytic perusahaan atau platform lain seperti PIWIK yang terkoneksi langsung dengan data penjualan perusahaan. Tugas-tugas seperti ini sangat cocok untuk seseorang yang mulai berkecimpung di profesi data scientist.

Penanggung Jawab Kualitas Data Perusahaan
Perusahaan yang mempunyai trafik data yang tinggi baik data konsumen, penjualan, maupun statistik website membutuhkan seseorang yang mampu menyiapkan infrastruktur data. Dalam hal ini banyak perusahaan yang akan mencari “Data Scientist” dan “Data Engineer” untuk melakukan tanggung jawab ini. Dalam konteks ini, seseorang dengan latar belakang software engineer mempunyai peluang lebih untuk diterima sebagai kandidat yang dicari perusahaan. Infrastruktur data yang diinginkan tentu dengan struktur data yang baik, kemudahan akses serta kemudahan untuk melakukan analisis data.

Penelitian Terkait Data
Untuk tugas jenis ini biasanya sering dilakukan oleh Data Scientist yang bergerak di perusahaan dengan produk berupa jasa analisis data atau analytical platform. Misalnya: Google Analytic dan PIWIK. Untuk hal jasa analisis data, data scientist dengan latar belakang ilmu matematika, statistika, dan fisika akan lebih mudah melakukan hal ini. Latar belakang seperti ini mempunyai dasar yang kuat terhadap keilmuan tersebut yang erat kaitannya dengan penelitian. Sebagaimana diketahui produk yang dihasilkan ilmuan mempunyai nilai yang sangat tinggi untuk pengembangan selanjutnya oleh praktisi terkait. Hasil penelitian tersebut dapat digunakan sebagai metode penentuan keputusan konsumen pengguna jasa analisis data atau dapat diterapkan lebih lanjut pada produk analytical platform perusahaan.

Big Data
Perusahaan yang berurusan dengan big data sebagian besar merupakan perusahaan non-data. Tugas ini berkaitan dengan melakukan analisis data perusahaan tersendiri dalam jumlah yang besar. Perusahaan jenis ini akan mencari tenaga Data Scientist yang lebih banyak dari perusahaan biasanya. Data Scientist di bidang ini dituntut untuk mahir menggunakan platform big data seperti Hadoop, Hive dan Pig serta pemahaman menggunakan SAS dan R untuk mengurangi beban komputer melakukan analisis data. Pemahaman yang matang terhadap machine learning menjadi pertimbangan yang luar biasa penting di perusahaan jenis ini. Perusahaan jenis ini mempunyai trafik yang sangat tinggi seperti perusahaan telekomunikasi, perusahaan marketplace, dan lain-lain.

Salam
Koorprodi Sains Data
Fakultas Ilmu Komputer
Dr.Eng.Ir.Dwi Arman Prasetya.,ST.,MT.,IPU., Asean. Eng

EnglishIndonesian