Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 8

TALKING POINT

SESI UBRS WALKTHROUGH


WITH TOP MANAGEMENT
PROJEK StatsDW 2.0
18 MAC 2020
(RABU)

YBRS. PUAN SITI HASLINDA BINTI MOHD. DIN


PENGARAH PROJEK STATSDW FASA II
Assalamualaikum Warahmatullahi Wabarakatuh dan Salam
Sejahtera.

Yang Berusaha
YBhg. Dato' Sri Dr. Mohd Uzir Mahidin
Ketua Perangkawan Malaysia

Yang Berusaha
Puan Hajah Nazaria binti Baharudin
Timbalan Ketua Perangkawan Program Sosial dan Pembangunan
Teknikal

Yang Dihormati
Pengarah-Pengarah Kanan
Pengarah-Pengarah Bahagian
Pengarah JP Selangor
Pengarah JP WPKL
Pengarah JP Negeri Sembilan

Tuan-tuan dan puan-puan

PEMBANGUNAN STATSDW FASA II

Umum mengetahui bahawa StatsDW diwujudkan untuk


menyatukan keseluruhan data iaitu data mikro, agregat dan
historical dalam Enterprise Data Warehouse (EDW). StatsDW
Fasa II atau StatsDW 2.0 merupakan penjenamaan semula
(rebranding/re-engineering) daripada StatsDW Fasa I. Data
diperluaskan kepada data banci / penyiasatan bulanan dan
suku tahunan. Meliputi 39 subjek data daripada 77 (data tahun

2
2005-2018) dan melibatkan integrasi data dengan sistem lain di
DOSM serta Agensi lain yang terpilih.

Skop StatsDW Fasa II merangkumi pembangunan sistem,


perolehan perkakasan, perisian, rangkaian dan perkhidmatan yang
meliputi:

i. Dokumen Blueprint yang mengandungi perancangan strategik


lima (5) tahun StatsDW;
ii. Akses data mikro diperluaskan kepada pengguna public
(virtual myLab);
iii. Merekayasa Insightful Business Intelligence (BI) supaya
memudahkan pengguna menerokai data;
iv. Memperkasa pengurusan data yang efisien dan efektif;
v. Berdasarkan kepada keperluan pemintaan data semasa, skop
data StatsDW Fasa II diperluaskan kepada data banci/
penyiasatan bulanan dan suku tahunan;
vi. Integrasi data menerusi Smart Data Partnership;
vii. Metadata yang komprehensif; dan
viii. Penghasilan storyboard yang interaktif.

PERBEZAAN STATSDW FASA I DAN FASA II

Perbezaan antara StatsDW Fasa I dan StatsDW Fasa II adalah


pembangunan StatsDW Fasa I lebih bertumpu kepada back
end berbanding front end.

Di dalam Fasa 1, 30% pembangunan projek adalah back end


yang melibatkan setting up Netezza environment, DB2 dan
kesemua structured component. Manakala 70% pembangunan
projek adalah front end yang merujuk kepada tujuh (7) modul
3
yang ada iaitu eDataBank, Visualisation, Location Intelligence,
MyLAB, Analytics, Time Series dan Mobile Apps.

Di dalam Fasa II, pembangunan projek bertumpu kepada 70%


back end dan 30% front end. 70% back end akan melibatkan
setting up Hadoop environment, metadata management, API
dan lain-lain. Manakala, 30% front end adalah melibatkan re-
engineer komponen Business Intelligence (BI).

AKTIVITI-AKTIVITI YANG TELAH DILAKSANAKAN

Secara rasminya Projek StatsDW Fasa II telah bermula pada


September 2019 dan dijadualkan akan tamat pada
September 2021. Projek ini telah dianugerahkan kepada DNeX
Solution Sdn. Bhd. dan beberapa aktiviti telah dijalankan iaitu:

i. Pra-UBRS pada 24 Oktober 2019

Tujuan sesi ini diadakan adalah untuk mendapatkan input-


input penting daripada wakil-wakil SMD yang terlibat. Salah
satu input yang diperoleh adalah subjek yang dicadangkan
peserta untuk dijadikan Data Hub utama. Antara data hub
yang telah dicadangkan adalah ekonomi, sosial, alam
sekitar dan tenaga buruh.

ii. Bengkel UBRS 1 pada 12 - 14 November 2019

Rentetan daripada sesi Pra-UBRS, Bengkel UBRS 1, telah


diadakan pada 12 hingga 14 November 2019 yang melibatkan
hampir 80 peserta.

4
Dalam sesi ini, lebih banyak input berjaya dikumpul daripada
wakil bahagian yang terlibat. Antaranya penyeragaman kod,
cadangan penambahbaikan untuk proses penghantaran
data ke StatsDW, user friendly website dan banyak lagi
yang mana akan diterjemahkan ke dalam dokumen UBRS.

iii. Bengkel UBRS 2 pada 10 - 11 Disember 2019

Dalam sesi ini, selain perbincangan mengenai data hub dan


data mart secara terperinci, input lain yang dikumpul
daripada peserta adalah wishlist daripada setiap SMD,
mendapatkan kepercayaan SMD untuk menyimpan dan
memaparkan data di dalam StatsDW dan kebenaran SMD
untuk StatsDW memaparkan data mereka kepada
kegunaan awam.

KOMPONEN UTAMA STATSDW FASA II

Tiga komponen utama bagi projek StatsDW Fasa II adalah


Smart Data Partnership (SDP), Smart Data Lake Management
(SDLM) dan Smart Data Communication (SDC) disokong oleh
infrastruktur dan user management yang bagus.

SDP membolehkan perkongsian data dengan sistem lain di


DOSM serta Agensi lain. Untuk perkongsian data dengan sistem
lain di DOSM, SMD akan mempunyai antara muka pengguna
untuk memuat naik data mereka ke repositori StatsDW. SMD
adalah pembekal data utama dan mempunyai akses kepada data
yang mereka masukkan ke dalam platform. SMD juga boleh
mengambil data untuk keperluan rujukan atau analisis statistik
pada masa depan. Perkongsian data dengan agensi terpilih akan
5
diberi akses yang selamat sebelum memasuki platform StatsDW.
Integrasi data antara sistem ke sistem boleh dilakukan melalui API
REST.

SDLM bertanggungjawab untuk data ingestion aktiviti daripada


SDP. Di sinilah platform ini akan menyediakan aktiviti utama
seperti pengurusan metadata, pengurusan repositori, active data
management dan monitoring dashboard. Pengurusan metadata
adalah pentadbiran data set masuk ke platform StatsDW.
Pengurusan repositori mengendalikan proses penyimpanan data
ke dalam repositori Hadoop termasuk proses penapisan pada
Data Profiling Data Quality (DPDQ). Monitoring dashboard akan
memaparkan status data dalam platform StatsDW.

SDC akan memanfaatkan set data yang telah berpusat di


repositori StatsDW, membolehkan pengguna untuk melakukan
analisis data dan self service analytics. SDC dilengkapi lima (5)
saluran untuk menyebarkan analisis iaitu Insightful BI, Virtual
MyLab, Actionable Analytics Platform, Mobile Discovery dan
Intelligent Data Lounge.

INFRASTRUKTUR STATSDW FASA II

Dalam memantapkan penyampaian perkhidmatan statistik DOSM


melalui Power of Digital Technology, data warehouse yang
dibangunkan mestilah dapat berfungsi dengan efektif.

Untuk memastikan data warehouse yang dibangunkan adalah


efektif, infrastruktur StatsDW Fasa II menggunakan Hadoop
Ecosystem kerana ia berkeupayaan untuk menyokong big data
dan bersifat expandability. Sebagai permulaan, Hadoop
6
Ecosystem ini dibangunkan dengan menggunakan
tujuh (7) physical server dan setiap physical server ini
dikonfigurasi berdasarkan fungsinya.

Cabaran terbesar yang perlu ditangani adalah kelajuan sistem


melaksanakan proses kerja terutamanya di dalam komponen
SDLM. Untuk mengatasi isu ini, pendekatan elastic cluster dan
load balancer digunakan.

Bagi menjamin capaian sistem yang berterusan, melindungi tahap


kerahsiaan dan mengekalkan integriti data pemantapan
keselamatan ICT dalam StatsDW Fasa II diperlukan. Antara ciri-
ciri keselamatan yang dilaksanakan adalah blockchain, VPN,
pendekatan reverse proxy, firewall dan AES 256 Encryption.

PENUTUP

Pasukan StatsDW mencuba sedaya upaya untuk memenuhi


segala keperluan tuan/puan dalam fasa pembangunan projek
StatsDW Fasa II ini. Oleh itu, kerjasama yang berterusan sangat
diharapkan daripada pihak tuan/puan dalam memberikan maklum
balas dan sokongan bagi menjayakan projek ini dan seterusnya
menjadikan DOSM sebagai “National Intelligence Statistical
Data Hub” di Malaysia.

Akhir kata, saya mewakili ahli pasukan StatsDW Fasa II, sekali lagi
mengucapkan ribuan terima kasih di atas sokongan YBhg. Dato'
Sri Dr./Datin/Tuan/Puan selama ini dan di masa akan datang
dalam bersama-sama membangunkan serta menjayakan projek
StatsDW Fasa II.

7
Sekian, Wabillahitaufiq Walhidayah Wassalamualaikum
Warahmatullahi Wabarakatuh.

You might also like