AI Fable của Anthropic được đánh giá khó có thể là hiểm họa

Ý kiến

AI Fable của Anthropic được đánh giá khó có thể là hiểm họa

BBWV - Một lệnh hạn chế AI của chính quyền ông Trump bị chỉ trích làm giảm năng lực phòng thủ mạng, gây bất lợi cho lợi thế công nghệ của Mỹ trước Trung Quốc.

Tác giả: Gautam Mukunda

18 tháng 06, 2026 lúc 8:05 PM

Tóm tắt bài viết bởi

Chính quyền Tổng thống Donald Trump yêu cầu Anthropic chặn quyền truy cập nước ngoài đối với hai mô hình AI mạnh nhất, khiến công ty phải gỡ bỏ chúng trên toàn cầu.
Bà Katie Moussouris từ Luta Security nhận định mô hình Fable 5 của Anthropic không hề nguy hiểm, trái lại rất có giá trị cho hoạt động phòng thủ an ninh mạng Mỹ.
Lệnh cấm gây ảnh hưởng tới nhân sự đồng minh, đe dọa vị thế Mỹ khi quốc gia này đang sử dụng gần 60% nhân tài AI hàng đầu thế giới.
Dù Mỹ bán chip Nvidia H200 cho Trung Quốc, phòng thí nghiệm Zhipu AI vẫn phát triển thành công mô hình tiên tiến hoàn toàn bằng chip nội địa.
Quyết định bị chỉ trích là hằn học cá nhân khi Bộ trưởng Pete Hegseth cấm Anthropic sau khi hãng từ chối cấp quyền truy cập cho Lầu Năm Góc.

Chính quyền Tổng thống Donald Trump hôm thứ Sáu đã khiến Mỹ dễ bị tổn thương hơn trước các mối đe dọa mạng trong khi tuyên bố đang bảo vệ đất nước. Bộ Thương mại yêu cầu Anthropic, một trong những công ty AI hàng đầu của Mỹ, chặn quyền truy cập từ nước ngoài đối với hai mô hình mạnh nhất của hãng trong khoảng 90 phút. Thay vào đó, công ty đã gỡ chúng khỏi hệ thống đối với tất cả người dùng, từ San Francisco đến Thượng Hải.

Mệnh lệnh của chính phủ sẽ làm suy yếu năng lực phòng thủ mạng của Mỹ và cả ngành AI mà các hệ thống phòng thủ đó đang phụ thuộc.

Hãy bắt đầu với mối đe dọa mà chính quyền nêu ra. Theo Wall Street Journal, các nhà nghiên cứu tại Amazon đã yêu cầu Fable 5, phiên bản AI được áp dụng các biện pháp bảo vệ của Mythos, mô hình mạnh nhất và cũng nguy hiểm nhất của Anthropic, đọc một kho mã nguồn và tìm ra các lỗ hổng bảo mật. Đó là điều mà bất kỳ tác nhân AI nào chuyên về lập trình và đủ năng lực đều có thể thực hiện.

Anthropic cho biết phương pháp này chỉ phát hiện một vài điểm yếu nhỏ đã được biết đến từ trước. Những lỗ hổng đó cũng có thể được các mô hình công khai khác tìm thấy dễ dàng mà không cần bất kỳ thủ thuật đặc biệt nào.

Katie Moussouris, giám đốc điều hành Luta Security, người xây dựng chương trình săn lỗi bảo mật của Microsoft và tham gia thiết kế chương trình đầu tiên của Lầu Năm Góc, đã xem xét báo cáo theo đề nghị của Anthropic. Trong một bài viết đăng trên trang web của Luta, bà cho rằng hành động của Fable không hề nguy hiểm. Theo bà, đó là “điều giá trị nhất mà một mô hình AI có thể làm cho hoạt động phòng thủ an ninh mạng.”

Bà viết trên LinkedIn: “Nếu mục tiêu là bảo vệ quốc gia thì đây là một pha phản lưới nhà.”

Mythos có thể thực sự nguy hiểm như Anthropic thừa nhận. Tuy nhiên, Fable 5 được thiết kế để an toàn và vụ vượt rào bảo vệ bị cáo buộc này không đưa ra bất kỳ bằng chứng nào cho thấy điều ngược lại.

Thực tế, Fable thậm chí còn không làm điều gì đặc biệt. Anthropic lưu ý rằng nhiều mô hình phổ biến khác, bao gồm GPT-5.5 của OpenAI, cũng có thể thực hiện nhiệm vụ tương tự. Vì vậy, việc chặn mô hình của một công ty sẽ không thay đổi được điều gì.

Mệnh lệnh của chính quyền ông Trump cũng không được xây dựng theo hướng hạn chế tối đa thiệt hại. Jimmy Goodrich, nghiên cứu viên cấp cao tại Viện Xung đột Toàn cầu và Hợp tác thuộc Đại học California, lưu ý rằng lệnh này ngăn cả công dân Canada, Anh và các nước đồng minh khác đang làm việc tại các phòng thí nghiệm của Mỹ sử dụng chính những mô hình do nơi họ làm việc phát triển.

Nếu có vấn đề gì với Fable thì đó là việc nó quá thận trọng để trở thành một mối đe dọa. Các hàng rào bảo vệ nghiêm ngặt đến mức chính người dùng của nó đã phản đối.

The Verge ghi nhận trường hợp mô hình từ chối hoặc hạ cấp các câu hỏi liên quan đến ti thể, thuốc điều trị hen suyễn và màng tế bào. Các nhà phát triển gửi báo cáo lỗi vì công cụ này ngừng thực hiện những nhiệm vụ an ninh mạng thông thường.

Bản thân tôi cũng nhiều lần mất quyền truy cập khi nghiên cứu các chủ đề mà ngay cả sau khi lời nhắc bị đánh dấu, tôi vẫn không hiểu hệ thống bảo vệ đang phản đối điều gì.

Một công cụ bị coi là quá nguy hiểm để người nước ngoài sử dụng khó có thể đồng thời quá dè dặt để phục vụ người dùng.

Và Fable thực sự hữu ích cho phòng thủ mạng. Một nhà phát triển cho biết ông đã đưa cho nó một chương trình dài 90.000 dòng mã và mô hình này phát hiện được những lỗi mà GPT-5.5 cũng như mô hình thế hệ trước của Anthropic đều bỏ sót.

Nhân danh an ninh quốc gia, chính quyền đã tước khỏi tay các chuyên gia phòng thủ một trong những công cụ an ninh mạng hiệu quả hơn của đất nước.

Lịch sử ghi nhận nhiều trường hợp các quốc gia dẫn đầu công nghệ tìm cách dựng rào chắn để ngăn đối thủ tiếp cận thành quả đổi mới.

Cuối thế kỷ 18, Anh dẫn đầu thế giới về máy móc dệt may. Nước này cấm xuất khẩu thiết bị và coi việc các thợ cơ khí lành nghề di cư ra nước ngoài là hành vi phạm pháp.

Chính sách đó làm chậm quá trình công nghiệp hóa của Mỹ trong nhiều năm nhưng không thể ngăn cản nó, bởi tri thức nằm trong con người.

Năm 1789, một học việc trẻ tên Samuel Slater rời Anh dưới vỏ bọc lao động nông trại và tái tạo toàn bộ hệ thống máy móc từ trí nhớ tại một nhà máy ở Rhode Island.

Người Anh nhớ đến ông như “Slater kẻ phản bội”. Người Mỹ nhớ đến ông như cha đẻ của cuộc Cách mạng Công nghiệp tại Mỹ.

Bức tường bảo vệ đã giúp Anh mua thêm thời gian nhưng cuối cùng vẫn xuất hiện vết nứt.

Mã nguồn AI dễ sao chép hơn máy dệt rất nhiều.

Các biện pháp kiểm soát xuất khẩu có thể giúp Mỹ kéo dài lợi thế, nhưng chỉ khi nước này tận dụng khoảng thời gian đó để nới rộng khoảng cách dẫn đầu về AI.

Lợi thế ấy giờ đây cũng là một vấn đề an ninh. Mô hình phát hiện được những lỗi mà đối thủ bỏ sót chính là loại công cụ bảo vệ mạng lưới của một quốc gia. Quốc gia dẫn đầu AI sẽ dẫn đầu cả trong phòng thủ lẫn tấn công mạng.

Vị thế đó phụ thuộc vào các phòng thí nghiệm và những con người xây dựng mô hình.

Phần lớn những con người ấy không phải người Mỹ.

Theo Global AI Talent Tracker của Viện Paulson, các tổ chức tại Mỹ sử dụng gần 60% số nhà nghiên cứu AI hàng đầu thế giới. Lợi thế này chủ yếu được xây dựng nhờ những người sinh ra ở nước ngoài, trong đó có rất nhiều người đến từ Trung Quốc.

Mỹ từng là điểm đến hấp dẫn nhất đối với nhân tài hàng đầu.

Điều đó ngày càng khó khăn hơn sau một năm chính quyền thu hồi thị thực sinh viên trong các lĩnh vực nhạy cảm và xem các nhà khoa học sinh ra ở nước ngoài là gánh nặng thay vì tài sản.

Lệnh hạn chế xuất khẩu đã phơi bày sự phi lý của cách tiếp cận này khi cấm chính một số người tham gia xây dựng các mô hình được sử dụng chúng.

Tuy nhiên, quyền lực của chính quyền không thể ngăn con người tiếp cận những gì nằm trong bộ não của họ. Các nhà nghiên cứu bị từ chối cơ hội tại Mỹ sẽ mang kiến thức đó đến với đối thủ cạnh tranh.

Thế giới giờ đây biết rằng một mô hình AI của Mỹ có thể bị vô hiệu hóa chỉ sau thông báo trước 90 phút. Trong khi đó, một mô hình mã nguồn mở từ Trung Quốc, một khi đã được tải xuống, sẽ thuộc về người dùng mãi mãi.

Một đối tác tại quỹ đầu tư mạo hiểm Andreessen Horowitz ước tính khoảng 80% startup Mỹ xây dựng trên nền tảng mô hình mở hiện nay bắt đầu từ một mô hình của Trung Quốc.

Trong lúc dòng chảy đó đang hướng về Trung Quốc, chính quyền Mỹ lại đẩy nhanh đà tiến của đối thủ. Đầu năm nay, họ cho phép Trung Quốc mua chip H200 của Nvidia Corp., loại chip có sức mạnh xử lý cao gấp khoảng sáu lần sản phẩm tiên tiến nhất mà Washington trước đó từng cho phép Bắc Kinh tiếp cận. Đổi lại, Mỹ nhận được 25% doanh thu từ thương vụ.

Các biện pháp kiểm soát mà chính phủ Mỹ vẫn duy trì cũng đang thất bại.

Bị cắt nguồn cung chip Nvidia, phòng thí nghiệm AI Trung Quốc Zhipu AI, đơn vị bị Washington đưa vào danh sách đen đầu năm 2025, đã phát hành một mô hình đa phương thức tiên tiến được huấn luyện hoàn toàn bằng chip Trung Quốc và công khai toàn bộ trọng số mô hình.

Theo chỉ số mới nhất của Đại học Stanford, các mô hình tốt nhất của Trung Quốc hiện chỉ còn kém nhóm dẫn đầu của Mỹ vài điểm. Hai nước đã nhiều lần thay nhau giữ vị trí dẫn đầu.

Hoặc chính quyền Trump thiếu năng lực đến mức một mệnh lệnh duy nhất vô tình làm suy yếu năng lực phòng thủ mạng của Mỹ, làm giảm lợi thế AI mà năng lực phòng thủ đó phụ thuộc vào, đồng thời làm suy giảm vị thế cạnh tranh với Trung Quốc. Hoặc tất cả đều không phải là sự vô tình.

Đây là diễn biến mới nhất trong cuộc đối đầu kéo dài giữa chính quyền và Anthropic.

Mâu thuẫn bắt đầu từ tháng 2 khi công ty từ chối cấp cho Lầu Năm Góc quyền truy cập không giới hạn vào các mô hình của mình, với lý do lo ngại nguy cơ giám sát trong nước và vũ khí tự hành.

Chính quyền sau đó yêu cầu các cơ quan liên bang ngừng sử dụng công nghệ của Anthropic và gắn cho công ty nhãn “rủi ro chuỗi cung ứng”, thuật ngữ thường chỉ dùng với các nhà cung cấp nước ngoài bị xem là thù địch.

Bộ trưởng Quốc phòng Pete Hegseth đã bộc lộ rõ động cơ trên mạng xã hội X: “Ba tháng trước, @DeptofWar đã đá @AnthropicAI ra khỏi tòa nhà của chúng tôi mãi mãi. Mỗi ngày trôi qua đều chứng minh đó là quyết định đúng đắn.”

Đó không phải ngôn ngữ của một cuộc đánh giá an ninh. Đó là ngôn ngữ của một mối hằn học.

Để xây dựng một chính sách tự gây tổn hại cho chính mình đến mức tinh vi như vậy đòi hỏi một dạng năng lực rất đặc biệt.

Nhưng những mối đe dọa mà chính quyền tuyên bố đang lo ngại sẽ không chờ đợi trong lúc họ giải quyết ân oán cá nhân.

Theo Bloomberg

Theo phattrienxanh.baotainguyenmoitruong.vn

https://phattrienxanh.baotainguyenmoitruong.vn/ai-fable-cua-anthropic-duoc-danh-gia-kho-co-the-la-hiem-hoa-58675.html

BÀI LIÊN QUAN