Bài viết này chỉ ra một mạng nơron sâu sử dụng kiến trúc Transformer để nhận diện từ tiếng Việt, cho ra các kết quả khả quan. Hiệu quả của phương pháp này được đánh giá bằng cách hiệu chỉnh mô hình Transformer với kết quả chính xác đạt khoảng 95%. Kết quả này khá tốt so với các phương pháp trước đó. Điều này nhấn mạnh tiềm năng của các phương pháp dựa trên Transformer đối với OCR tiếng Việt.
Nhận diện ký tự quang học (Optical Character Recognition - OCR) là một công nghệ tự động nhận diện văn bản trong các hình ảnh tài liệu, sau đó chuyển nó thành văn bản để có thể tìm kiếm và chỉnh sửa được trên máy tính. Các phần mềm OCR có rất nhiều ứng dụng, bao gồm nhận diện biển số xe, đọc séc ngân hàng, xác minh chữ ký và giải mã CAPTCHA. Việc triển khai hệ thống OCR có thể gặp nhiều thách thức do sự khác biệt về phong cách viết, kích thước phông chữ, chất lượng tài liệu, bao gồm tài liệu viết tay, in hoặc quét. Những hệ thống này có thể đơn ngữ hoặc đa ngữ, hoạt động offline hoặc online. Các hệ thống OCR offline chấp nhận đầu vào ở dạng tài liệu đã được quét, in ấn hoặc viết tay, trong khi hệ thống OCR online xử lý và phân tích hình ảnh theo thời gian thực. Các ứng dụng offline bao gồm việc đọc địa chỉ bưu điện, kiểm tra séc và xử lý biểu mẫu, trong khi các bút kỹ thuật số hỗ trợ người khiếm thị hoặc người không biết chữ sử dụng hệ thống online.
Tiếng Việt là một ngôn ngữ Latinh với bảng chữ cái gồm 29 chữ cái và 5 dấu thanh, mỗi dấu có thể xuất hiện ở trên hoặc dưới các chữ cái, thay đổi hoàn toàn cách phát âm của từ. Sự phức tạp của các dấu thanh này cùng với việc một số dấu thanh và chữ cái có hình dáng tương tự, tạo ra thách thức lớn khi thiết kế hệ thống OCR cho tiếng Việt. Thêm vào đó, tiếng Việt cũng có những ký tự và dấu câu riêng biệt, làm tăng thêm mức độ khó cho các hệ thống OCR.
Phương pháp nhận diện ký tự dựa trên mô hình Transformer là một giải pháp tiên tiến cho bài toán nhận dạng ký tự quang học. Trong đó, mô hình Transformer được sử dụng cho cả hai nhiệm vụ phân tích hình ảnh và sinh chuỗi ký tự. Phương pháp này tận dụng kiến trúc Transformer để thay thế các phương pháp truyền thống sử dụng mạng nơron tích chập (Convolutional Neural Network - CNN) và mạng nơron hồi quy (Recurrent Neural Network - RNN), nhằm xử lý đồng thời cả hình ảnh và ngôn ngữ.
Cấu trúc của mô hình gồm hai phần chính: bộ mã hóa (encoder) và bộ giải mã (decoder). Bộ mã hóa có nhiệm vụ xử lý và trích xuất đặc trưng từ hình ảnh văn bản, trong khi bộ giải mã sẽ dựa trên các đặc trưng này để tạo ra chuỗi từ tương ứng.
Xem toàn bộ bài báo tại đây.
Lê Bá Cường, Học viện Kỹ thuật mật mã
09:00 | 14/10/2019
09:07 | 27/08/2014
14:08 | 26/12/2014
16:00 | 04/08/2024
Với sự phát triển mạnh mẽ của công nghệ số, số lượng các phần mềm chương trình được công bố ngày càng lớn. Song hành với đó là việc tin tặc luôn tìm cách phân tích, dịch ngược các chương trình nhằm lấy cắp ý tưởng, bẻ khóa phần mềm thương mại gây tổn hại tới các tổ chức, cá nhân phát triển phần mềm. Đặc biệt, trong ngành Cơ yếu có những chương trình có tích hợp các thuật toán mật mã ở mức mật và tối mật thì việc chống phân tích, dịch ngược có vai trò hết sức quan trọng. Do đó, việc phát triển một giải pháp bảo vệ các chương trình phần mềm chống lại nguy cơ phân tích, dịch ngược là rất cấp thiết.
09:00 | 18/07/2024
Mới đây, Bộ Công an đã thông tin về tình trạng tin nhắn tin nhắn thương hiệu (SMS Brandname) giả mạo phần lớn xuất phát từ việc các đối tượng sử dụng trạm phát sóng BTS giả mạo để gửi hàng loạt tin nhắn lừa đảo tới người dùng với mục đích nhằm chiếm đoạt tài sản.
13:00 | 17/06/2024
Để tăng cường tính bảo mật và khắc phục các lỗ hổng, Microsoft thường phát hành định kỳ những bản cập nhật dành cho Windows, trong đó có các bản vá Patch Tuesday hàng tháng. Việc nắm bắt các bản vá này rất quan trọng để chủ động phòng tránh trước các mối đe dọa mạng. Bài viết này đưa ra quy trình cập nhật bản vá bảo mật Windows trên các máy trạm dành cho người dùng cuối, việc thực hiện cập nhật trên máy chủ Windows Server thực hiện tương tự.
10:00 | 07/06/2024
Bảo đảm an ninh mạng rất đóng vai trò quan trọng, giúp bảo vệ dữ liệu, hệ thống và mạng của tổ chức, doanh nghiệp khỏi các cuộc tấn công của tội phạm mạng. Các cuộc tấn công này có thể làm gián đoạn, gây tổn thất về dữ liệu và chi phí cho doanh nghiệp. Các chuyên gia bảo mật thuộc Công ty An ninh mạng Viettel đã đưa ra khuyến nghị về năm cách bảo vệ hệ thống dành cho doanh nghiệp, nếu áp dụng chính xác có thể giảm thiểu tới 90% các cuộc tấn công mạng.
Trong bối cảnh chuyển đổi số và ứng dụng rộng rãi của công nghệ thông tin (CNTT) thì xu hướng kết nối liên mạng để chia sẻ cơ sở dữ liệu (CSDL) trở nên tất yếu. Các hệ thống công nghệ vận hành (Operational Technology - OT) cũng không nằm ngoài xu hướng này, quá trình đó được gọi là Hội tụ IT/OT. Do vậy, nhu cầu truyền dữ liệu một chiều giữa các mạng độc lập ngày càng tăng để phục vụ cho mục đích khai thác dữ liệu. Bài viết này giới thiệu một giải pháp mới dựa trên công nghệ vi mạch tích hợp khả trình (Field-Programmable Gate Array - FPGA), sử dụng cơ chế xử lý đa luồng tốc độ cao, giúp duy trì băng thông hệ thống mà không gây ra tình trạng treo hoặc nghẽn mạng, cho phép các kết nối yêu cầu thời gian thực. Đồng thời, bài viết cũng sẽ trình bày giải pháp giả lập giao thức TCP/IP hỗ trợ cho các giao thức truyền thông trong các hệ thống mạng điều khiển IT/OT.
09:00 | 06/01/2025
Trong kỷ nguyên số hóa, việc ứng dụng các công nghệ hiện đại đóng vai trò rất quan trọng trong bảo vệ dữ liệu, hệ thống máy tính, ngăn chặn chúng khỏi sự tấn công hoặc truy cập trái phép. Blockchain và trí tuệ nhân tạo (AI) là hai trong số những công nghệ mạnh mẽ đã được ứng dụng và phát huy hiệu quả trong nhiều lĩnh vực của đời sống. Với những ưu thế vượt trội của từng công nghệ, việc kết hợp AI và Blockchain có thể đem lại nhiều giải pháp hiệu quả nhằm đảm bảo an ninh mạng (ANM), an toàn thông tin (ATTT). Bài viết sẽ giới thiệu về ứng dụng của công nghệ AI và Blockchain trong bảo đảm ANM, ATTT cũng như phân tích khả năng tích hợp hai công nghệ này trong phát hiện, ngăn chặn các mối đe dọa hiện nay.
10:00 | 06/02/2025