Học máy: Sức mạnh lớn ẩn chứa nhiều lỗ hổng mới

08:00 | 26/06/2020 | GIẢI PHÁP KHÁC

Học máy đã mang đến cho con người rất nhiều ứng dụng vượt trội như ô tô tự lái, phần mềm xử lý hình ảnh, nhận diện giọng nói, xác thực sinh trắc học và khả năng giải mã hệ gen di truyền của con người. Song song, nó cũng có thể cung cấp cho tin tặc nhiều phương diện tấn công và phương thức phá hoại.

Học máy: Sức mạnh lớn ẩn chứa nhiều lỗ hổng mới

Những ứng dụng của học máy không giống như của các công nghệ trước đó, nên việc hiểu rõ các nguy cơ khi ứng dụng trở thành một điều thiết yếu. Những hậu quả có thể xảy ra sau một tấn công vào mô hình kiểm soát mạng của các phương tiện tự hành được kết nối, hay điều phối điều khiển truy cập của nhân viên bệnh viện sẽ rất khó lường. Cần phải xem xét các mối đe dọa thông thường hơn, như gian lận hệ thống điều khiển sinh trắc học để xâm nhập trái phép.

Học máy vẫn đang trong giai đoạn đầu của sự phát triển và hướng tấn công vào học máy vẫn còn chưa rõ nét. Vì vậy, chiến lược bảo vệ không gian mạng cũng đang ở những giai đoạn đầu. Mặc dù không thể ngăn chặn mọi hình thức tấn công, nhưng việc hiểu rõ cách thức chúng xảy ra giúp chúng ta giới hạn được và đưa ra chiến lược ứng phó.

Sự tiếp cận có cấu trúc của an toàn thông tin sử dụng học máy

Mô hình phát hiện mối đe dọa là tiến trình tối ưu hóa bảo mật áp dụng sự tiếp cận có cấu trúc nhằm nhận diện và giải quyết mối đe dọa. Mô hình phát hiện đe dọa bảo mật bằng học máy làm nhiệm vụ tương tự những mô hình học máy khác. Nó được sử dụng trong giai đoạn đầu của việc xây dựng và phát triển các mô hình học máy để phát hiện mọi mối đe dọa và hướng tấn công có thể có.

Có 4 câu hỏi cơ bản cần trả lời đối với sự tiếp cận có cấu trúc này.

Đối tượng gây ra mối đe dọa là ai?

Đối tượng gây ra mối đe dọa có thể là một quốc gia, tin tặc hay nhân viên lừa đảo. Mỗi loại đối thủ có những đặc điểm khác nhau, từ đó yêu cầu những biện pháp phòng chống, ứng phó khác nhau. Lý do để tấn công rất đa dạng, đó là vì sao mà câu hỏi "tại sao" và "là gì" được mô tả phía dưới là rất quan trọng.

Tại sao tấn công và động cơ tấn công là gì?

Có rất nhiều yếu tố có thể ảnh hưởng đến kẻ tấn công nhắm vào hệ thống học máy. Các chiến lược phòng thủ nên bắt nguồn từ CIA - 3 mặt của mô hình quản lý bảo mật thông tin, bao gồm: bảo mật (confidentiality), toàn vẹn (integrity) và sẵn sàng (availability). Cụ thể:

- Tính bảo mật đảm bảo rằng chỉ những người có quyền hợp pháp thì mới có thể truy cập thông tin. Sự bảo vệ này có thể ngăn chặn đối tượng muốn truy xuất dữ liệu nhạy cảm bằng cách xâm phạm dữ liệu huấn luyện.

- Một cuộc tấn công nhắm đến tính toàn vẹn sẽ cố gắng ảnh hưởng đến hành vi của mô hình, ví dụ: như trả về trạng thái dương tính giả trong hệ thống nhận diện khuôn mặt. Những cách bảo vệ như sao lưu thường xuyên, chữ ký điện tử, kiểm toán sẽ đảm bảo rằng thông tin không bị thay đổi hay giả mạo.

- Một tấn công vào tính sẵn sàng có thể nhắm đến việc giảm tính đồng nhất, hiệu suất hoặc quyền truy cập tới mô hình học máy. Những biện pháp hiệu quả trong thực tế để bảo vệ tính sẵn sàng, ví dụ: duy trì máy chủ dự phòng và áp dụng các công cụ chống mất mát dữ liệu, khiến thông tin luôn sẵn sàng khi cần thiết.

Phương thức tấn công là gì?

Các hệ thống học máy mở ra những con đường mới cho những cuộc tấn công mà không xuất hiện trong những chương trình thủ tục truyền thống. Một trong số đó là tấn công lẩn tránh hoặc tấn công đối kháng, trong đó tin tặc cố gắng chèn các dữ liệu đầu vào vào các mô hình học máy để cố ý gây ra các sai sót. Dữ liệu đó có thể trông vô hại với con người, nhưng những thay đổi nhỏ đó có thể khiến các thuật toán học máy đi lệch hướng.

Những kỹ thuật tấn công đó có thể xảy ra tại thời điểm suy luận (inference) bằng cách khai thác thông tin trong mô hình, thông thường theo một trong hai cách sau: Trong cuộc tấn công hộp trắng, kẻ tấn công có một vài thông tin về mô hình, thu được một cách trực tiếp hoặc thông qua các tác nhân không tin cậy trong đường xử lý dữ liệu. Nếu trong tình huống hộp đen, kẻ tấn công không biết gì về các hoạt động bên trong của hệ thống, nhưng phát hiện các lỗ hổng bằng cách liên tục thăm dò và tìm các mẫu cho kết quả trái với mô hình học.

Các hướng tấn công dữ liệu mới

Dựa vào thời điểm tấn công, có thể phân ra 2 loại phương thức của một cuộc tấn công học máy: tấn công trong giai đoạn suy luận và tấn công trong giai đoạn huấn luyện. Trong một cuộc tấn công tại giai đoạn suy luận, tin tặc có thông tin cụ thể về mô hình và/hoặc dữ liệu huấn luyện. Không cần thiết phải truy cập trực tiếp tới hệ thống để thu thập thông tin. Các kỹ thuật thăm dò, chẳng hạn như các cuộc tấn công kênh kề và từ xa, có thể cho phép kẻ thù xâm nhập các hệ thống học máy đã được triển khai bằng cách suy luận ra lôgic của hệ thống thông qua các phản hồi từ dữ liệu vào, hoặc bằng cách sử dụng kỹ thuật đầu độc dữ liệu (data poisoning). Từ đó, kể tấn công có thể nhắm trực tiếp vào phần cứng.

Tấn công tại giai đoạn huấn luyện là cố gắng học và phá hỏng mô hình. Dựa trên tính có sẵn của dữ liệu, tin tặc có thể sử dụng những mô hình thay thế để kiểm tra đầu vào trước khi tấn công nạn nhân.

Cũng có hai cách để thay thế mô hình. Phương pháp nhiễm độc sẽ sửa đổi các dữ liệu sẵn có bằng cách chèn các thành phần không tin cậy, dẫn đến kết quả của mô hình cũng trở nên không chính xác. Phương pháp thay thế nguy hiểm hơn là phá hoại tính lôgic của mô hình, mà kẻ tấn công thay đổi chính thuật toán học máy. Kỹ thuật này đặc biệt nguy hiểm bởi vì kẻ tấn công có thể chiếm quyền điều khiển hệ thống một cách hiệu quả và chỉ định bất cứ đầu ra nào mà chúng muốn.

Các tấn công mô hình học máy

Khi liên kết tất cả các yếu tố với nhau, có thể xác định 3 phương thức tấn công riêng biệt nhắm vào các giai đoạn khác nhau của quá trình học máy:

Tấn công lẩn tránh (Evasion attacks): Đây là loại tấn công phổ biến nhất. Thường xảy ra trong thời điểm suy luận. Tấn công né tránh cố gắng thay đổi dữ liệu đầu vào khiến cho mô hình đưa ra kết quả không chính xác.

Tấn công nhiễm độc (Poisoning attacks): Kiểu tấn công này được thực hiện trong giai đoạn suy luận, nhằm vào tính toàn vẹn và sẵn sàng của hệ thống học máy. Tấn công nhiễm độc thay đổi các tập dữ liệu huấn luyện bằng chèn, xóa bỏ, hoặc sửa đổi những điểm có tính quyết định để thay đổi các đường biên (boundary) của mô hình đích.

Tấn công quyền riêng tư (Privacy attacks): Loại tấn công này thường xảy ra trong quá trình huấn luyện. Mục đích không phải phá hủy mô hình huấn luyện mà để thu thập thông tin nhạy cảm.

Thêm vào đó, có nhiều loại tấn công xảy ra trong một hoặc cả hai giai đoạn huấn luyện và suy luận. Chúng bao gồm tấn công điểm neo, tấn công mô phỏng, trích xuất mô hình, tìm đường dẫn....

Mặc dù, các kiểu tấn công mới có thể xuất hiện khi học máy đang trở nên phổ biến, nhưng việc hiểu những lỗ hổng và các chiến thuật phòng chống cơ bản là bước đầu để chống lại các kiểu tấn công này.

Quang Minh

(Theo Security Intelligence)

‹ › ×

Tin liên quan

“Bố già” của Al được vinh danh với giải thưởng Turing, giải Nobel về khoa học máy tính

08:00 | 04/04/2019

Giải thưởng Turing 2018 được gọi là Giải thưởng Nobel về khoa học máy tính đã được trao cho ba nhà khoa học gồm Yoshua Bengio, Geoffrey Hinton và Yann LeCun là những người đã đặt nền móng cho AI hiện đại. Họ được ví như những ông “bố già” của thế giới AI.

Các ứng dụng của học máy trong an toàn mạng

08:00 | 04/12/2020

Ngày nay, việc triển khai các công nghệ an toàn mạng sẽ hiệu quả hơn nếu sử dụng học máy (machine learning). Tuy nhiên, khó có thể triển khai học máy một cách hiệu quả mà không có cách tiếp cận toàn diện, phong phú và đầy đủ đối với dữ liệu nền tảng. Bài viết sẽ cung cấp cho độc giả cái nhìn bao quát về ứng dụng của học máy đối với an toàn mạng.

Hội nghị “Kết nối An ninh mạng và AI” bàn luận về những thách thức đạo đức của công nghệ mới

15:00 | 28/07/2020

Hội nghị CyberSec&AI Connected năm 2020 hứa hẹn mang lại những giải pháp khả quan khi hội tụ những chuyên gia hàng đầu thế giới về trí tuệ nhân tạo, an ninh mạng và những lĩnh vực liên quan.

Ma trận các mối đe dọa chỉ ra các tấn công hệ thống học máy

17:00 | 19/11/2020

Gầy đây, các nhà nghiên cứu bảo mật đã tạo ra phiên bản đầu tiên của “Ma trận các mối đe dọa tấn công hệ thống ML”, giúp các nhà phân tích bảo mật phát hiện và ứng phó với các mối đe dọa tấn công hệ thống học máy mới nổi.

Phát hiện lỗ hổng Starbleed gây ảnh hưởng đến vi mạch FPGA

17:00 | 02/07/2020

Vi mạch FPGA Xilinx dòng 7 và một số sản phẩm dòng 6 được đánh giá là bị ảnh hưởng bởi lỗ hổng Starbleed mới.

Chuyển đổi an ninh mạng với trí tuệ nhân tạo và học máy

09:00 | 14/08/2020

Khi cuộc sống trở nên gắn kết hơn với thế giới số, thì nhu cầu đảm bảo an ninh mạng càng trở lên cần thiết. Công nghệ trí tuệ nhân tạo và học máy sẽ là một trong những đồng minh mạnh nhất trong cuộc chiến chống lại tấn công mạng, mang lại quy mô và tốc độ quản lý dữ liệu.

Học máy tự động sẽ là xu hướng phát triển mạnh nhất của trí tuệ nhân tạo

09:00 | 02/02/2018

Tháng 10/2015, trong buổi hội thảo về chức năng lái tự động của xe ô tô điện Tesla Model S, Giám đốc điều hành (CEO) của hãng Tesla (Mỹ) – Elon Musk đã nói rằng, mỗi người lái sẽ trở thành “chuyên gia huấn luyện” cho các Model S. Mỗi xe có thể học được từ người lái, nhưng quan trọng hơn, những kiến thức tự học này sẽ được chia sẻ với những chiếc xe khác của Tesla.

Giới thiệu một số nền tảng thư viện cho việc nghiên cứu ứng dụng học máy và khoa học dữ liệu

14:00 | 23/11/2017

Bài báo này giới thiệu về một số nền tảng thư viện cần biết cho việc nghiên cứu ứng dụng học máy và khoa học dữ liệu.

Tin cùng chuyên mục

Tăng cường bảo mật tệp lưu trữ trên Google Drive

10:00 | 28/03/2024

Google Drive là một trong những nền tảng lưu trữ đám mây được sử dụng nhiều nhất hiện nay, cùng với một số dịch vụ khác như Microsoft OneDrive và Dropbox. Tuy nhiên, chính sự phổ biến này là mục tiêu để những kẻ tấn công tìm cách khai thác bởi mục tiêu ảnh hưởng lớn đến nhiều đối tượng. Bài báo này sẽ cung cấp những giải pháp cần thiết nhằm tăng cường bảo mật khi lưu trữ tệp trên Google Drive để bảo vệ an toàn dữ liệu của người dùng trước các mối đe dọa truy cập trái phép và những rủi ro tiềm ẩn khác.

Ứng dụng cây Merkle và công nghệ blockchain cho cơ sở dữ liệu phân tán

18:00 | 22/09/2023

Do lưu giữ những thông tin quan trọng nên cơ sở dữ liệu thường nằm trong tầm ngắm của nhiều tin tặc. Ngày nay, các cuộc tấn công liên quan đến cơ sở dữ liệu để đánh cắp hay sửa đổi thông tin càng trở nên khó lường và tinh vi hơn, vì vậy việc quản lý cơ sở dữ liệu đặt ra những yêu cầu mới với các tổ chức, doanh nghiệp. Trong hệ thống phân tán, khi dữ liệu được phân mảnh và phân phối trên các vị trí khác nhau có thể dẫn đến khả năng mất toàn vẹn của dữ liệu. Thông qua sử dụng cây Merkle và công nghệ Blockchain ta có thể xác minh tính toàn vẹn của dữ liệu. Trong bài viết này, nhóm tác giả sẽ trình bày các nghiên cứu về ứng dụng cây Merkle và công nghệ Blockchain để bảo đảm tính toàn vẹn dữ liệu cho cơ sở dữ liệu phân tán, đồng thời đảm bảo hiệu năng của hệ thống.

Một phương pháp mã hóa phân vùng dữ liệu trên máy tính nhúng (Phần II)

16:00 | 27/07/2023

Trong phần I của bài báo, nhóm tác giả đã trình bày về các phương pháp mã hóa dữ liệu lưu trữ, trong đó tập trung về giải pháp mã hóa phân vùng bằng dm-crypt và LUKS trên máy tính nhúng, cụ thể là Raspberry Pi. Với những ưu điểm của việc thiết kế module dưới dạng tách rời, trong phần II này, nhóm tác giả sẽ trình bày cách xây dựng module Kuznyechik trong chuẩn mật mã GOST R34.12-2015 trên Raspberry Pi, từ đó xây dựng một phần mềm mã hóa phân vùng lưu trữ video từ camera sử dụng thuật toán mật mã mới tích hợp.

Trình quản lý mật khẩu Google Chrome có các biện pháp bảo vệ mới cho thông tin đăng nhập của người dùng

14:00 | 22/06/2023

Google cho biết đã cung cấp các tính năng tăng cường bảo mật mới cho Trình Quản lý mật khẩu tích hợp sẵn trên trình duyệt Chrome, giúp người dùng quản lý mật khẩu của họ dễ dàng hơn và giữ an toàn trước mối đe dọa từ các cuộc tấn công chiếm đoạt tài khoản.

Tin được quan tâm

Bảo đảm an ninh thông tin cơ sở hạ tầng quan trọng của Hoa Kỳ

08:00 | 11/01/2024 | Chính sách - Chiến lược
Giải pháp phân loại tương tác giữa 2 người trong chuỗi ảnh rời rạc (Phần I)

09:00 | 10/01/2024 | Giải pháp khác

Giải pháp tăng cường an ninh mạng ở Italia

09:00 | 05/01/2024|Chính sách - Chiến lược
Cạnh tranh Mỹ - Trung về cáp quang biển toàn cầu (phần 1)

09:00 | 05/01/2024|An ninh – Quốc Phòng

CISA cung cấp dịch vụ an ninh mạng cho các tổ chức trọng yếu không thuộc Chính quyền

09:00 | 21/12/2023|CA Công cộng
5 lưu ý giúp tăng cường bảo mật công nghệ vận hành cho các doanh nghiệp sản xuất

14:00 | 14/08/2023|Giải pháp khác

GP Mật mã

Sự phát triển của lược đồ chữ ký số kháng lượng tử dựa trên hàm băm

Lược đồ chữ ký số dựa trên hàm băm là một trong những lược đồ chữ ký số kháng lượng tử đã được Viện Tiêu chuẩn và Công nghệ Quốc gia Mỹ (NIST) chuẩn hóa trong tiêu chuẩn đề cử FIPS 205 (Stateless Hash Based Digital Signature Standard) vào tháng 8/2023. Bài báo này sẽ trình bày tổng quan về sự phát triển của của lược đồ chữ ký số dựa trên hàm băm thông qua việc phân tích đặc trưng của các phiên bản điển hình của dòng lược đồ chữ ký số này.

09:00 | 01/04/2024
Về một phương pháp tấn công kênh kề lên mã khối Kalyna
Khuyến nghị độ dài các tham số sử dụng cho hệ thống mật mã RSA trong một số tiêu chuẩn mật mã
Một số khuyến nghị về độ an toàn của hệ mật RSA (Phần I)

GP ATM

CISA phát hành phiên bản mới của hệ thống phân tích mã độc Malware Next-Gen

Mới đây, Cơ quan An ninh mạng và Cơ sở hạ tầng Hoa Kỳ (CISA) đã phát hành phiên bản mới của hệ thống Malware Next-Gen có khả năng tự động phân tích các tệp độc hại tiềm ẩn, địa chỉ URL đáng ngờ và truy tìm mối đe dọa an ninh mạng. Phiên bản mới này cho phép người dùng gửi các mẫu phần mềm độc hại để CISA phân tích.

13:00 | 17/04/2024
Giải pháp Datadiode cho phép ứng dụng giữa hai vùng mạng kết nối sử dụng API
Tấn công các ứng dụng VPN sử dụng lỗ hổng TunnelCrack
Vai trò quan trọng của sự ngẫu nhiên thực trong Blockchain và Web3

Chuyên đề

Học máy: Sức mạnh lớn ẩn chứa nhiều lỗ hổng mới

Tin liên quan

“Bố già” của Al được vinh danh với giải thưởng Turing, giải Nobel về khoa học máy tính

Các ứng dụng của học máy trong an toàn mạng

Hội nghị “Kết nối An ninh mạng và AI” bàn luận về những thách thức đạo đức của công nghệ mới

Ma trận các mối đe dọa chỉ ra các tấn công hệ thống học máy

Phát hiện lỗ hổng Starbleed gây ảnh hưởng đến vi mạch FPGA

Chuyển đổi an ninh mạng với trí tuệ nhân tạo và học máy

Học máy tự động sẽ là xu hướng phát triển mạnh nhất của trí tuệ nhân tạo

Giới thiệu một số nền tảng thư viện cho việc nghiên cứu ứng dụng học máy và khoa học dữ liệu

Tin cùng chuyên mục

Tăng cường bảo mật tệp lưu trữ trên Google Drive

Ứng dụng cây Merkle và công nghệ blockchain cho cơ sở dữ liệu phân tán

Một phương pháp mã hóa phân vùng dữ liệu trên máy tính nhúng (Phần II)

Trình quản lý mật khẩu Google Chrome có các biện pháp bảo vệ mới cho thông tin đăng nhập của người dùng

Tin được quan tâm

Bảo đảm an ninh thông tin cơ sở hạ tầng quan trọng của Hoa Kỳ

Giải pháp phân loại tương tác giữa 2 người trong chuỗi ảnh rời rạc (Phần I)

Tấn công lừa đảo qua email về tiền điện tử: Đánh cắp từ ví nóng và ví lạnh

Rủi ro từ các mối đe dọa nội bộ: Gia tăng các sự cố trong lĩnh vực khoa học đời sống

Giải pháp tăng cường an ninh mạng ở Italia

Cạnh tranh Mỹ - Trung về cáp quang biển toàn cầu (phần 1)

CISA cung cấp dịch vụ an ninh mạng cho các tổ chức trọng yếu không thuộc Chính quyền

5 lưu ý giúp tăng cường bảo mật công nghệ vận hành cho các doanh nghiệp sản xuất

Sự phát triển của lược đồ chữ ký số kháng lượng tử dựa trên hàm băm

Về một phương pháp tấn công kênh kề lên mã khối Kalyna

Khuyến nghị độ dài các tham số sử dụng cho hệ thống mật mã RSA trong một số tiêu chuẩn mật mã

Một số khuyến nghị về độ an toàn của hệ mật RSA (Phần I)

CISA phát hành phiên bản mới của hệ thống phân tích mã độc Malware Next-Gen

Giải pháp Datadiode cho phép ứng dụng giữa hai vùng mạng kết nối sử dụng API

Tấn công các ứng dụng VPN sử dụng lỗ hổng TunnelCrack

Vai trò quan trọng của sự ngẫu nhiên thực trong Blockchain và Web3