Xu hướng Cách mạng công nghiệp 4.0 cho thấy việc sử dụng chatbot ngày càng trở nên cần thiết bởi rất nhiều doanh nghiệp hiện đang lựa chọn chatbot để cung cấp các thông tin có sẵn cho khách hàng, loại bớt sức người trong công đoạn này. Tuy nhiên một điểm vướng hiện nay chính là nhiều chabot chưa hoàn toàn thuyết phục khi thường xuyên đưa ra những phản hồi vô tri hoặc chung chung.
Trong bài báo công bố trên arXiv, Google đã nêu rõ sự cần thiết của một bộ công cụ hay cách nào đó để đánh giá chatbot. Theo đó, SSA (Độ nhạy và Độ đặc hiệu trung bình) đã ra đời.
Để lượng hóa SSA, Google đã thử nghiệm yêu cầu những công nhân tham gia 100 cuộc hội thoại tự do với Meena và một vài chatbot khác trên các lĩnh vực không giới hạn. Với mỗi phản hồi của chatbot, họ sẽ trả lời 2 câu hỏi về phản hồi đó.
Thứ nhất, nội dung của hội thoại có logic và phù hợp ngữ cảnh? Nếu có, họ sẽ phải trả lời tiếp: “Câu trả lời có đặc trưng cho cuộc hội thoại?” Điều này nhằm để loại bỏ những phản hồi mang tính chung chung. Chẳng hạn, nếu người gõ họ thích tennis, còn chatbot trả lời: “Tốt” thì câu trả lời đó sẽ bị liệt vào dạng “không cụ thể".
Google cho biết, chatbot Meena vượt trội hơn tất cả các chatbot hiện nay bởi đánh giá về SSA cho thấy, Meena điểm cao đến 79% khiến nó giao tiếp giống người hơn hẳn tất cả các hệ thống chatbot từng được thử nghiệm. Trong khi đó theo nghiên cứu, những chatbot khác hiện có số điểm dao động chỉ từ 31 - 56%.
Google sẽ không phát hành bản demo của Meena cho cộng đồng trước khi đảm bảo độ an toàn và tiềm năng của nó trong các cuộc thử nghiệm. Nếu tất cả các kiểm tra đều được thực hiện, công ty có thể phát hành bản demo trong thời gian tới để giúp nghiên cứu về các mô hình hội thoại thần kinh và chatbot nói chung.
Ngoài ra, Google cũng lưu ý rằng công ty chỉ tập trung vào tính nhạy cảm và tính cụ thể trong công việc này, nhưng các thuộc tính quan trọng khác như tính cách và thực tế có thể là mục tiêu của các dự án tiếp theo.
Tuệ Minh
10:00 | 16/01/2020
10:00 | 06/11/2023
13:00 | 03/12/2024
10:00 | 10/02/2023
15:00 | 09/09/2019
15:00 | 27/03/2019
10:00 | 31/12/2024
Apache đã phát hành bản cập nhật bảo mật để giải quyết lỗ hổng quan trọng trong máy chủ web Tomcat có thể khiến kẻ tấn công thực thi mã từ xa.
10:00 | 11/12/2024
Lô hàng chip AI tiên tiến của Mỹ đã được cấp phép xuất khẩu sang UAE. Cơ sở tiếp nhận do Microsoft điều hành hứa hẹn sẽ thúc đẩy mạnh mẽ ứng dụng công nghệ AI tại quốc gia này.
13:00 | 03/12/2024
Một công ty viễn thông Anh vừa tung ra "vũ khí bí mật" chống lừa đảo mang tên "bà lão AI" khiến cho kẻ lừa đảo bị cuốn vào những câu chuyện dài vô tận.
10:00 | 20/11/2024
Theo tài liệu thực thi pháp luật gửi đến lãnh đạo các cơ quan hành pháp, cảnh sát và các chuyên gia pháp y trên khắp nước Mỹ do 404Media thu thập được, những chiếc iPhone được bảo quản an toàn vẫn có thể tự khởi động lại, gây khó khăn cho việc điều tra và thu thập chứng cứ.
Vào tháng 11/2024, Mi2 chính thức trở thành nhà phân phối độc quyền các sản phẩm của Blancco tại Việt Nam. Là công ty dẫn đầu toàn cầu về giải pháp xóa dữ liệu an toàn, Blancco mang đến cho các tổ chức/doanh nghiệp giải pháp bảo mật vượt trội, đáp ứng mọi tiêu chuẩn quốc tế về tẩy xoá dữ liệu.
13:00 | 13/01/2025