OpenAI ra mắt mô hình mã nguồn mở giá rẻ

Mới đây, OpenAI đã đã ra mắt 2 mô hình trí tuệ nhân tạo (AI) mới cho phép người dùng tải về miễn phí và tùy chỉnh công nghệ. Các mô hình mới này chỉ xử lý văn bản, có hiệu suất cao và chi phí thấp. Động thái này được xem là một bước đi chiến lược nhằm cạnh tranh trực tiếp với các đối thủ như Meta và DeepSeek.

Hai mô hình chỉ xử lý văn bản này có tên là gpt-oss-120b và gpt-oss-20b. Theo OpenAI, chúng được thiết kế như những lựa chọn có chi phí thấp hơn, giúp các nhà phát triển, nhà nghiên cứu và các công ty dễ dàng chạy và tùy chỉnh. Theo OpenAI, gpt-oss-120b và gpt-oss-20b được thiết kế để dễ dàng hoạt động trên các hệ thống máy tính cục bộ và được cho là phù hợp với những công việc AI như tìm kiếm trên Internet hoặc vận hành chương trình máy tính. Các mô hình mã nguồn mở cũng được điều chỉnh để ngăn chặn việc sử dụng cho các mục đích xấu.

Lãnh đạo công ty công nghệ này hy vọng mô hình vừa phát hành sẽ hỗ trợ quá trình tiến hành các loại nghiên cứu mới và tạo ra những sản phẩm mới.

Trong những năm gần đây, một số công ty công nghệ khác, bao gồm Meta, Mistral AI và startup DeepSeek của Trung Quốc, cũng đã phát hành các mô hình nguồn mở.

Công ty cũng đã hợp tác với các đối tác phần cứng lớn như Nvidia, Advanced Micro Devices (AMD), Cerebras và Groq để đảm bảo các mô hình này hoạt động tốt trên nhiều loại chip khác nhau. Ngoài ra, OpenAI cũng cho biết đang làm việc với các đối tác, trong đó có "đại gia" viễn thông Orange (Pháp) và nền tảng dữ liệu dựa trên đám mây Snowflake (Mỹ), để ứng dụng mô hình mới vào thực tế.

Việc phát hành các mô hình nguồn mở của OpenAI được cộng đồng công nghệ mong đợi từ lâu, một phần vì công ty đã nhiều lần trì hoãn việc ra mắt.

OpenAI cho biết họ đã thực hiện quá trình đào tạo và kiểm tra an toàn mở rộng trên các mô hình nguồn mở của mình. Công ty đã lọc bỏ các dữ liệu độc hại liên quan đến hóa học, sinh học, phóng xạ và hạt nhân trong giai đoạn pre-training.

Đồng thời, họ cũng mô phỏng cách các đối tượng xấu có thể cố gắng tinh chỉnh các mô hình cho mục đích độc hại.

Thông qua quá trình thử nghiệm này, OpenAI cho biết họ đã xác định các mô hình được tinh chỉnh một cách độc hại không thể đạt được ngưỡng "khả năng cao" trong Preparedness Framework – phương pháp đo lường và chống lại các mối nguy hại.

Công ty cũng đã làm việc với ba nhóm chuyên gia độc lập để đưa ra phản hồi về đánh giá tinh chỉnh độc hại của họ.

OpenAI cho biết người dùng có thể tải xuống các mô hình gpt-oss-120b và gpt-oss-20b trên các nền tảng như Hugging Face và GitHub với giấy phép Apache 2.0.

Các mô hình này sẽ có sẵn để chạy trên máy tính cá nhân thông qua các chương trình như LM Studio và Ollama. Các nhà cung cấp dịch vụ đám mây lớn như Amazon, Baseten và Microsoft cũng đang tích hợp chúng.

Cả hai mô hình đều có khả năng xử lý các tác vụ suy luận nâng cao, sử dụng công cụ và xử lý chain of thought. Chúng được thiết kế để hoạt động ở mọi nơi – từ phần cứng cá nhân đến đám mây và các ứng dụng trên thiết bị.

OpenAI cho biết, người dùng có thể chạy gpt-oss-20b trên một chiếc laptop và sử dụng nó như một trợ lý cá nhân để tìm kiếm tệp tin và viết.