Quản trị dữ liệu là gì? Theo Hiệp hội Quản lý dữ liệu quốc tế (Data Management Association - DAMA) thì Quản trị dữ liệu được định nghĩa: "là hoạt động thực thi các quyền và điều khiển (lên kế hoạch, giám sát và thúc đẩy) bao trùm hoạt động quản lý tài sản dữ liệu. Tất cả các tổ chức đều ra quyết định dựa trên dữ liệu theo một cách nào đó, không phụ thuộc vào việc họ có chính thức thành lập các chức năng của Quản trị dữ liệu hay không. Có một số tổ chức thành lập Chương trình Quản trị dữ liệu chính thức với sự tham gia sâu sát hơn của người lãnh đạo tổ chức, những tổ chức này sẽ khai thác tốt hơn giá trị của dữ liệu cho hoạt động kinh doanh".
Theo DAMA, Khung Quản lý dữ liệu sẽ bao gồm 11 yếu tố cấu thành, trong đó Quản trị dữ liệu đóng vai trò cốt lõi của các hoạt động: Quản trị dữ liệu; Kiến trúc dữ liệu; Thiết kế và duy trì mô hình dữ liệu; Lưu trữ và vận hành dữ liệu; Bảo mật dữ liệu; Tích hợp dữ liệu; Quản lý tài liệu và nội dung; Dữ liệu chủ và dữ liệu tham chiếu; Kho dữ liệu và Hệ thống báo cáo thông minh; Siêu dữ liệu; Chất lượng dữ liệu.
Chức năng của Quản trị dữ liệu bao trùm lên hoạt động quản lý dữ liệu tại các tổ chức. Các ngân hàng tại Việt Nam mới chỉ đang thực hiện một vài chức năng này và đang hoàn toàn nằm ở phía Khối Công nghệ thông tin.
Hình 1. Khung Quản lý dữ liệu của DAMA
Lịch sử dữ liệu bắt đầu từ việc xây dựng các hệ thống, các phần mềm. Bản thân các phần mềm này sản sinh ra dữ liệu, từ đó nảy sinh ra việc quản lý dữ liệu; và hoạt động quản lý dữ liệu gắn liền với các hoạt động của công nghệ thông tin. Khi khối lượng và mức độ phức tạp của dữ liệu tăng, vượt ra khỏi những thói quen đã hình thành trong nhiều năm về quản lý dữ liệu, thì hoạt động quản trị dữ liệu mới hình thành. Quản trị dữ liệu sẽ đưa ra các quy tắc, các tiêu chuẩn để quản lý dữ liệu hiệu quả, đảm bảo các hoạt động quản lý dữ liệu được diễn ra và tuân thủ các quy tắc, tiêu chuẩn đã đề ra. Tuy nhiên, để các tổ chức có thể thực sự khai thác hết tiềm năng của dữ liệu, thì hoạt động Quản trị dữ liệu và Quản lý dữ liệu phải song hành và không thể tách rời.
Hình 2. Quản trị dữ liệu và Quản lý dữ liệu
Trên thế giới phổ biến 3 mô hình Quản trị dữ liệu, tuy nhiên việc áp dụng mô hình nào và việc sử dụng đề án kinh doanh (bussiness case) nào để bắt đầu Quản trị dữ liệu còn phụ thuộc vào rất nhiều yếu tố như văn hóa doanh nghiệp, mô hình tổ chức của doanh nghiệp, ý thức của các lãnh đạo cao cấp... Trong bài viết, tác giả đề cập tới 3 mô hình Quản trị dữ liệu dưới đây.
Mô hình tập trung: Chỉ có duy nhất một đơn vị Quản trị dữ liệu thực hiện toàn bộ các hoạt động quản trị dữ liệu cho tất cả các chủ đề/nghiệp vụ dữ liệu.
Mô hình phân tán: Có nhiều đơn vị Quản trị dữ liệu nằm tại các đơn vị nghiệp vụ cùng thực hiện các hoạt động quản trị dữ liệu cho các chủ đề/ nghiệp vụ mà đơn vị nghiệp vụ đó phụ trách.
Mô hình hỗn hợp: Có một đơn vị Quản trị dữ liệu phối hợp với các đơn vị nghiệp vụ cùng thực hiện các hoạt động quản trị dữ liệu.
Do tính chất phức tạp của Quản trị dữ liệu, khi mà cần có sự phối hợp giữa đơn vị tác nghiệp và Công nghệ thông tin, và mức độ ảnh hưởng tới toàn bộ các hoạt động của ngân hàng, nên việc triển khai Quản trị dữ liệu cần phải bắt đầu từ các lãnh đạo cấp cao, cụ thể ở đây là Chủ tịch Hội đồng Quản trị hoặc Tổng Giám đốc. Khi những lãnh đạo cấp cao này nhìn thấy giá trị của dữ liệu, thì mới có thể bắt đầu Chương trình Quản trị dữ liệu. Vị trí Giám đốc dữ liệu (CDO) để quản lý toàn bộ dữ liệu trong ngân hàng ngày càng quan trọng, đây là vị trí quan trọng nhất để có thể triển khai thành công Chương trình Quản trị dữ liệu, cùng với sự tin tưởng và hỗ trợ của Tổng Giám đốc hoặc Chủ tịch Hội đồng quản trị.
Với việc hình thành vị trí CDO, ngân hàng cần thành lập đơn vị chuyên trách Quản trị dữ liệu và các ủy ban để liên kết các đơn vị trong ngân hàng cùng tham gia vào hoạt động Quản trị dữ liệu như Hình 3.
Việc thành lập một đơn vị chuyên trách quản trị dữ liệu cần hội tụ đủ các chức năng cơ bản sau: Quản trị dữ liệu; Kiến trúc dữ liệu; Quản lý siêu dữ liệu; Quản lý chất lượng dữ liệu; Quản lý dữ liệu chủ; Vận hành hệ thống Kho lưu trữ dữ liệu hoạt động (ODS) và Kho dữ liệu.
Với các chức năng như bên trên và với thực trạng hiện tại của các ngân hàng, các ngân hàng không nên triển khai Quản trị dữ liệu theo hướng “big bang” mà nên triển khai dần dần theo lộ trình. Lộ trình triển khai tại các ngân hàng sẽ khác nhau phụ thuộc vào chiến lược kinh doanh và mức độ quan tâm của các lãnh đạo ngân hàng. Tuy nhiên, các đơn vị có thể tham khảo lộ trình như sau:
Giai đoạn 1: Thành lập Ủy ban Điều hành dữ liệu và đơn vị chuyên trách quản trị dữ liệu bao gồm các chức năng: Giám đốc Dữ liệu, Quản trị dữ liệu, quản lý siêu dữ liệu, kiến trúc dữ liệu và quản lý chất lượng dữ liệu.
Giai đoạn 2: Triển khai dự án ODS tích hợp dữ liệu từ các nguồn dữ liệu phục vụ báo cáo vận hành và báo cáo tuân thủ. Cùng với đó triển khai hệ thống quản lý Siêu dữ liệu.
Giai đoạn 3: Triển khai dự án Kho dữ liệu, hệ thống báo cáo thông minh và phân tích nâng cao.
Việc triển khai theo 3 giai đoạn này đảm bảo ngân hàng có một nền tảng dữ liệu tốt, chuẩn bị cho hoạt động số hóa và khai thác dữ liệu lâu dài. Tất nhiên, trong quá trình triển khai, ngân hàng có thể cân nhắc việc đưa một số hoạt động phân tích nâng cao theo từng giai đoạn để đáp ứng nhu cầu của đơn vị kinh doanh trong việc áp dụng dữ liệu vào hoạt động kinh doanh, cũng như hình thành văn hóa sử dụng dữ liệu tại ngân hàng.
Hình 3. Mô hình tổ chức Quản trị dữ liệu và sự tương tác giữa CDO với CIO và CRO
Với kinh nghiệm triển khai Khung Quản trị dữ liệu tại các ngân hàng và nhiều năm làm việc với dữ liệu tại các ngân hàng Việt Nam, tác giả chia sẻ một số kinh nghiệm triển khai Quản trị dữ liệu như sau:
Phần lớn các lãnh đạo trong ngân hàng chưa thực sự coi dữ liệu là “tài sản chiến lược”, dẫn đến chưa hình thành văn hóa sử dụng dữ liệu trong hoạt động kinh doanh. Trong quá trình làm việc, chi nhánh của các ngân hàng hầu như không sử dụng dữ liệu cho mục đích ra quyết định kinh doanh, mà hoàn toàn dựa vào kinh nghiệm và mối quan hệ cá nhân. Điều này không phải là không hiệu quả, tuy nhiên khi thị trường ngày càng bão hòa, khách hàng sử dụng nhiều tài khoản của các ngân hàng khác nhau, thì việc sử dụng dữ liệu phân tích hành vi khách hàng và có chiến lược lôi kéo khách hàng hợp lý sẽ hỗ trợ cho hoạt động kinh doanh của chi nhánh, ngân hàng tốt hơn.
Quản trị dữ liệu là một chương trình, không phải là một dự án. Quản trị dữ liệu có tính liên tục theo vòng đời của dữ liệu, được thực hiện khi dữ liệu được sinh ra cho đến khi kết thúc vòng đời của dữ liệu. Việc coi Quản trị dữ liệu là một dự án sẽ dẫn đến việc không quản lý được dữ liệu đầy đủ theo vòng đời của dữ liệu, khi dự án kết thúc thì việc quản trị dữ liệu cũng sẽ kết thúc, dẫn đến không đem lại được giá trị cho ngân hàng.
Về vấn đề chất lượng dữ liệu, từ những năm 2010, các ngân hàng Việt Nam đã bắt đầu để ý đến chất lượng dữ liệu và triển khai nhiều dự án nhỏ nhằm làm sạch dữ liệu. Tuy nhiên, quan điểm của các ngân hàng từ thời điểm đó đến hiện tại vẫn cho rằng để làm sạch dữ liệu, ngân hàng cần có hệ thống công nghệ dữ liệu và đây là công việc của khối Công nghệ thông tin. Tuy nhiên, thực tế để làm sạch dữ liệu, trước tiên phải phân loại được dữ liệu nào cần làm sạch, dữ liệu nào sẽ cần làm sạch sau, dữ liệu nào đã tốt không cần làm sạch nữa và việc này cần có đơn vị chuyên trách về chất lượng dữ liệu phối hợp với đơn vị nghiệp vụ để xác định chất lượng dữ liệu. Sau khi xác định được vấn đề về dữ liệu, đơn vị chuyên trách về dữ liệu, đơn vị nghiệp vụ và khối Công nghệ thông tin sẽ trao đổi phương án để làm sạch dữ liệu, trong đó công cụ sẽ đóng vai trò hỗ trợ hoạt động nâng cao chất lượng dữ liệu nhanh hơn.
Nguyễn Minh Đức (Giám đốc Dữ liệu - Ngân hàng MB)
07:00 | 07/06/2018
13:00 | 07/01/2020
08:00 | 15/03/2024
Bảo mật công nghệ trí tuệ nhân tạo (AI) đặt ra nhiều thách thức và luôn thay đổi trong bối cảnh chuyển đổi số hiện nay. Khi công nghệ AI phát triển, rủi ro và bề mặt tấn công cùng các mối đe dọa mới ngày càng tăng cao. Điều này đặt ra yêu cầu đối với các nhà phát triển, tổ chức và doanh nghiệp phải có cách tiếp cận chủ động, thường xuyên đánh giá và cập nhật các biện pháp bảo mật.
14:00 | 23/02/2024
SSH (Secure Socket Shell) là giao thức mạng để đăng nhập vào một máy tính từ xa trên một kênh truyền an toàn. Trong đó, OpenSSH là một chuẩn SSH được sử dụng ở hầu hết các bản phân phối của Linux/BSD như Ubuntu, Debian, Centos, FreeBSD, mã hóa tất cả các thông tin trên đường truyền để chống lại các mối đe dọa như nghe lén, dò mật khẩu và các hình thức tấn công mạng khác. Trong bài viết này sẽ hướng dẫn độc giả cách thức tăng cường bảo mật cho OpenSSH với một số thiết lập bảo mật và cấu hình tùy chọn cần thiết nhằm đảm bảo truy cập từ xa vào máy chủ Linux được an toàn.
08:00 | 10/02/2024
Hệ thống mật mã RSA là một trong các hệ mật mã khóa công khai đang được sử dụng rất phổ biến trong hệ thống mạng máy tính hiện nay. Việc lựa chọn tham số an toàn cho hệ mật RSA là vấn đề rất quan trọng trong cài đặt ứng dụng hệ mật này. Bài báo này trình bày chi tiết về khuyến nghị độ dài các tham số sử dụng cho hệ thống mật mã RSA như thừa số modulo, số mũ bí mật, số mũ công khai và các thừa số nguyên tố trong một số tiêu chuẩn mật mã của châu Âu, Đức và Mỹ.
09:00 | 05/06/2023
Tấn công tiêm lỗi (Fault Injection Attack - FIA) là loại tấn công chủ động, giúp tin tặc xâm nhập vào các thiết bị điện tử, mạch tích hợp cũng như các thiết bị mật mã nhằm thu được khóa bí mật và đánh cắp thông tin. Tiêm lỗi có thể được thực hiện trong cả phần cứng và phần mềm. Bài báo này nhóm tác giả sẽ trình bày về các kỹ thuật, công cụ được thực hiện trong FIA.
Lược đồ chữ ký số dựa trên hàm băm là một trong những lược đồ chữ ký số kháng lượng tử đã được Viện Tiêu chuẩn và Công nghệ Quốc gia Mỹ (NIST) chuẩn hóa trong tiêu chuẩn đề cử FIPS 205 (Stateless Hash Based Digital Signature Standard) vào tháng 8/2023. Bài báo này sẽ trình bày tổng quan về sự phát triển của của lược đồ chữ ký số dựa trên hàm băm thông qua việc phân tích đặc trưng của các phiên bản điển hình của dòng lược đồ chữ ký số này.
09:00 | 01/04/2024
Những ngày gần đây, liên tục các kênh YouTube với lượng người theo dõi lớn như Mixigaming với 7,32 triệu người theo dõi của streamer nổi tiếng Phùng Thanh Độ (Độ Mixi) hay Quang Linh Vlogs - Cuộc sống ở Châu Phi với 3,83 triệu người theo dõi của YouTuber Quang Linh đã bị tin tặc tấn công và chiếm quyền kiểm soát.
10:00 | 22/04/2024