Dữ liệu đã và đang trở thành một loại tài nguyên mới. Thống kê của MIT cho thấy, đến năm 2025 sẽ có 175 Zettabytes dữ liệu được sinh ra. Nếu mỗi USB là 1GB dữ liệu, cần có 175 nghìn tỷ USB mới lưu trữ hết được dữ liệu của thế giới. Lượng USB khổng lồ này có thể xếp vòng quanh 222 lần đường xích đạo. VietNamNet giới thiệu tuyến bài “Dữ liệu số” nhằm cung cấp cho bạn đọc những thông tin, kiến thức về “mỏ vàng” thời kỹ thuật số này.
Bài 1: Trung Quốc loay hoay mục tiêu kép cân bằng bảo mật với thúc đẩy kinh tế dữ liệu
Bài 2: Mỹ siết chặt quản lý hoạt động môi giới, mua bán dữ liệu cá nhân
Xây dựng kho dữ liệu dùng chung từ rất sớm, tập trung vào nhóm dữ liệu chiến lược
Theo bà Võ Thị Trung Trinh, Phó Giám đốc Sở TT&TT TP.HCM, thành phố bắt đầu triển khai tạo lập kho dữ liệu dùng chung từ rất sớm, ngay khi triển khai đề án xây dựng đô thị thông minh, bắt đầu từ năm 2018.
Và việc thành lập kho dữ liệu dùng chung nằm trong 4 trụ cột của đề án xây dựng đô thị thông minh.
Bắt đầu thực hiện từ năm 2018, tuy nhiên, bà Võ Thị Trung Trinh cho biết, thực tế thành phố đã có một lộ trình dài chuẩn bị từ trước, trong khoảng từ năm 2014-2015, TP.HCM đã đầu tư các nền tảng tích hợp dữ liệu để làm tiền đề tạo ra dữ liệu cho kho dữ liệu dùng chung của thành phố.
Sở dĩ thành phố tiến hành một cách bài bản, bước nào chắc bước đó là do TP.HCM tập trung vào nền tảng số phục vụ công tác tích hợp và chia sẻ dữ liệu từ trước và thực tế đây là hướng đi đúng, phù hợp với công tác chuyển đổi số và phát triển đô thị thông minh.
Để làm giàu kho dữ liệu và khai phá tiềm năng của dữ liệu phục vụ tốt hơn nữa cho hoạt động của các cơ quan chính quyền thành phố, cung cấp dịch vụ thân thiện và hiệu quả hơn cho người dân, tăng năng suất lao động, đổi mới sáng tạo, hướng đến phát triển kinh tế số một cách toàn diện và bền vững.
TP.HCM đã ban hành chiến lược quản trị dữ liệu, để thành phố tập trung nguồn lực tạo lập những dữ liệu chính của kho dữ liệu trong khoảng thời gian từ nay đến năm 2025.
Trong chiến lược quản trị dữ liệu, TP.HCM tập trung vào 3 nhóm dữ liệu chính, đó là Nhóm dữ liệu về người dân: dữ liệu hành chính, hộ tịch, y tế, giáo dục, an sinh; Nhóm dữ liệu tài chính – doanh nghiệp: dữ liệu tổng hợp và thống kê thu chi ngân sách, quản lý đầu tư công, doanh nghiệp – hộ kinh doanh cá thể; Nhóm dữ liệu về đất đai – đô thị: dữ liệu đất đai, dữ liệu nền thông tin địa lý, dữ liệu ngành xây dựng, giao thông, quy hoạch – kiến trúc.
Theo bà Võ Thị Trung Trinh, việc tạo lập 3 nhóm dữ liệu này sẽ được tiến hành xuyên suốt. Tuy nhiên, trước mắt ưu tiên chính của thành phố sẽ tập trung vào Nhóm dữ liệu về đất đai – đô thị, bởi đây là dữ liệu phải làm trước nhằm tạo ra nền tảng dữ liệu phục vụ các ứng dụng phát triển đô thị thông minh.
“Tất cả các ứng dụng trong đô thị thông minh muốn chạy được thì buộc phải có nền tảng dữ liệu nhóm này”, bà Võ Thị Trung Trinh nhấn mạnh.
Hạ tầng số đóng vai trò quan trọng
Đi cùng với việc xây dựng kho dữ liệu dùng chung là phát triển hạ tầng số. Bà Võ Thị Trung Trinh chia sẻ, để có hạ tầng số như hiện nay, thành phố đã thực hiện bước đi dài.
Trong nhiều năm triển khai, thành phố có một trung tâm dữ liệu theo mô hình điện toán đám mây phục vụ cho công tác ứng dụng công nghệ thông tin của chính quyền và cấp phát tài nguyên theo nhu cầu của thành phố.
Thành phố đã tổ chức triển khai lưu trữ tập trung các ứng dụng của các sở, ngành, quận, huyện trên 1034 máy chủ tại trung tâm này và tăng cường an toàn an ninh thông tin cho toàn hệ thống.
Bên cạnh đó, thành phố còn có hạ tầng mạng đô thị băng rộng (MetroNet) với hơn 800 điểm kết nối. Hạ tầng cáp quang băng rộng được triển khai cấp xã, đảm bảo 100% xã, phường trên địa bàn có mạng lưới và dịch vụ truy cập Internet băng rộng.
Chính sách và thực thi đóng vai trò quyết định
Về kinh nghiệm xây dựng kho dữ liệu dùng chung của TP.HCM, bà Võ Thị Trung Trinh cho biết, điều đầu tiên mà TP.HCM thực hiện là quy hoạch lại hệ thống lưu trữ dữ liệu và đưa lên điện toán đám mây.
Đây không thể nói bằng ý chí mà phải thực hiện, thành phố lần lượt chuyển các dữ liệu từ các hệ thống ứng dụng của các đơn vị về trung tâm dữ liệu.
Bước tiếp theo đóng vai trò quyết định, đó là tất cả những quy chế của TP.HCM liên quan đến dữ liệu dùng chung đều được ban hành từ rất sớm, tạo ra khung pháp lý để quy định việc chia sẻ dữ liệu.
Trong đó, Sở TT&TT xác định rất rõ tầm quan trọng để thực hiện chương trình chuyển đổi số và phát triển đô thị thông minh chính là phát triển dữ liệu dùng chung.
Để làm được điều đó, Sở TT&TT đã tham mưu cho UBND TP.HCM ra quy chế tuyên bố dữ liệu là tài sản chung của thành phố, bởi dữ liệu được tạo ra từ các ứng dụng công nghệ thông tin của các cơ quan nhà nước là tài sản chung và quyết định sử dụng tài sản này như thế nào là do Chủ tịch UBND thành phố đưa ra.
Tiếp theo là xử lý câu chuyện dùng chung, TP.HCM đã đưa ra các quy định để yêu cầu các đơn vị thực hiện việc chia sẻ dữ liệu. Thành phố ban hành những danh mục nào phải dùng chung trước như tên đường, địa giới hành chính...
Sau đó sẽ tiến hành chuẩn hoá dần những dữ liệu thống nhất dùng chung, phân ra đơn vị nào cập nhật và cập nhật tần suất như thế nào. Những quy định đó đều là quyết định của UBND TP.HCM.
Một điều nữa là vai trò của Sở TT&TT TP.HCM trong việc tham mưu ban hành các chính sách và thực thi, đặc biệt trong việc ban hành và thực thi nghiêm kiến trúc chính quyền điện tử của thành phố.
Trong kiến trúc chính quyền điện tử phiên bản 2.0 của TP.HCM đã có đề cập kho dữ liệu dùng chung, có nghĩa là trong tất cả các khởi tạo khi thành phố ban hành kiến trúc chính quyền điện tử đều hướng tới các đơn vị, là phải xây dựng làm sao để kết nối qua nền tảng tích hợp chia sẻ dữ liệu để tạo ra dữ liệu dùng chung của thành phố.
Sau đó, bằng các quy định của thành phố rất rõ như xây dựng như thế nào, những nền tảng dùng chung sẽ làm như thế nào, bắt buộc các ứng dụng của các đơn vị phải triển khai như thế nào từ khởi tạo, kết nối với chia sẻ.
Bởi hệ thống dữ liệu dùng chung không phải tự nhiên nó có mà từ các dữ liệu chuyên ngành từ ứng dụng của các đơn vị cập nhật lên, nếu các ứng dụng không tạo theo chuẩn kiến trúc sẽ không kết nối được.
Khó khăn xuất phát từ bộ ngành và thiếu nguồn nhân lực
Trong việc xây dựng cơ sở dữ liệu dùng chung của TP.HCM, khó khăn lớn nhất hiện nay không phải là câu chuyện của thành phố, mà đó là câu chuyện của bộ, ngành.
Cụ thể, hiện nay các hệ thống bộ, ngành triển khai tại TP.HCM rất nhiều nhưng không thực hiện và chia sẻ kết nối dữ liệu đúng nghĩa.
Về vấn đề này, theo bà Võ Thị Trung Trinh, Bộ TT&TT cần đứng ra làm vai trò đầu mối để giải quyết và hỗ trợ địa phương.
Bên cạnh đó, việc thiếu các nhân lực chuyên sâu về khoa học dữ liệu và khai thác dữ liệu, thực tế hiện nay thành phố đang phải giải quyết bằng bài toán đi thuê dịch vụ bên ngoài.
Và thách thức chung nhất là làm sao giải được bài toán triệt để của 3 việc đó là: số hoá, tạo lập dữ liệu và vận hành hệ thống thông tin để đảm bảo dữ liệu được cập nhật.
Bởi các việc này phải làm đồng bộ với nhau mới tạo ra các ứng dụng phục vụ hiệu quả công tác chuyển đổi số của chính quyền thành phố.