Theo đó, nhóm nghiên cứu đã sử dụng cơ sở dữ liệu là âm thanh gõ phím để huấn luyện AI. Bằng cách này, AI có thể dự đoán nội dung được gõ trên bàn phím với độ chính xác lên tới 95%. Độ chính xác này chỉ giảm xuống 93% khi sử dụng Zoom để huấn luyện hệ thống.
Tuy nhiên, cách huấn luyện AI của nhóm nghiên cứu từ Đại học Cornell vẫn còn nhiều nhược điểm. Chẳng hạn, khả năng suy đoán của AI không thể áp dụng ngay lập tức với bất kỳ loại bàn phím ngẫu nhiên nào đó.
Nói cách khác, AI cần mất một khoảng thời gian để 'làm quen' với riêng từng loại bàn phím, khi mỗi tiếng gõ phím sẽ được sử dụng để làm tham chiếu cho AI đoán ký tự trong quá trình huấn luyện. Bản thân việc huấn luyện mô hình AI có thể thực hiện ngay tại chỗ bằng cách dùng micro, hoặc thậm chí thực hiện từ xa bằng ứng dụng như Zoom để ghi lại âm thanh gõ phím.
Được biết, nhóm nghiên cứu đã sử dụng MacBook Pro để trình diễn khả năng của AI trong việc dự đoán nội dung. Họ đã nhấn 36 phím khác nhau, với mỗi phím được nhấn 25 lần. Đây là cơ sở để mô hình AI nhận diện ký tự nào đang được gõ tương ứng với âm thanh gõ phím phát ra. Mặc dù phần sóng âm tạo ra cho mỗi tiếng gõ phím có sự khác biệt nhỏ, AI vẫn nhận ra từng phím với độ chính xác đáng kinh ngạc.
Tất nhiên, việc sử dụng mô hinh AI trên cho mục đích xấu (như đánh cắp dữ liệu) không thực sự là một ý kiến hay, khi nó vẫn tồn tại rất nhiều điểm yếu.
Tất nhiên, đã có một vài lo ngại về việc mô hình AI trên có thể được sử dụng cho mục đích xấu (như đánh cắp dữ liệu). Mặc dù vậy, kiểu tấn công này không phải là không có điểm yếu, theo nhóm nghiên cứu.
Chẳng hạn, chỉ cần thay đổi kiểu gõ phím cũng đủ để giảm thiểu độ chính xác trong việc suy đoán nội dung được gõ của AI. Với kiểu gõ phím bằng cách chạm thật nhẹ, độ chính xác của AI trong việc nhận dạng nội dung giảm từ 64% xuống 40%. Ngoài ra, người dùng có thể sử dụng phần mềm để tạo ra tiếng ồn làm nhiễu đầu vào (bằng tiếng ồn trắng) hoặc các lần nhấn phím bổ sung khiến AI 'rối loạn'.
Bản thân mỗi loại bàn phím cũng mang tới nguy cơ khác nhau trong việc bị AI đánh cắp dữ liệu. Đơn cử, độ chính xác của AI khi suy đoán dữ liệu thường cao hơn khi người dùng sử dụng bàn phím cơ, vốn tạo ra âm thanh khi gõ lớn hơn so với bàn phím bình thường. Mặc dù vậy, việc sử dụng bàn phím màng ( membrane, chỉ sử dụng dãy đệm cao su thay vì switch dưới từng phím) vẫn tạo ra đủ âm thanh để huấn luyện mô hình AI.
Do vậy, cách tốt nhất để hạn chế kiểu tấn công này là triển khai giải pháp bằng phần mềm, thay vì thực hiện đổi một bàn phím 'ồn ào' sang một bàn phím 'yên tĩnh' hơn.
Tham khảo Tomshardware
Lấy link