Mô hình AI mới của Anthropic khiến nhiều khách hàng lo ngại

BBWV - Anthropic thúc đẩy mô hình AI Mythos và kế hoạch IPO trong lúc cố duy trì hình ảnh một công ty AI vừa an toàn, vừa có trách nhiệm với xã hội.

Tác giả: Parmy Olson

28 tháng 05, 2026 lúc 2:15 PM

Tóm tắt bài viết bởi

logo
  • CEO Anthropic, Ông Dario Amodei đã hé lộ về mô hình AI Mythos, được đánh giá là quá nguy hiểm để phát hành rộng rãi, dù có tính "người" hơn các phiên bản trước và có thể bị lợi dụng cho các cuộc tấn công mạng.
  • Anthropic đang làm việc với các tổ chức toàn cầu, bao gồm hội đồng Ổn định Tài chính tại Thụy Sĩ và Vatican, để giúp họ "hấp thụ cú sốc" từ công nghệ của mình, đồng thời kiện Lầu Năm Góc liên quan đến việc sử dụng công nghệ trong chiến tranh.
  • Anthropic xây dựng hình ảnh là doanh nghiệp AI an toàn nhất, đồng thời chuẩn bị cho kế hoạch IPO có thể tiềm ẩn rủi ro, trong bối cảnh công ty tái cấu trúc thành công ty phục vụ lợi ích cộng đồng.
  • Giám đốc sản phẩm của Claude Code, Bà Cat Wu cho biết hệ thống này "cực kỳ an toàn", nhưng Anthropic chưa giải thích đầy đủ cách tích hợp bảo mật vào sản phẩm, trong bối cảnh các mô hình của Anthropic ngày càng độc lập và chủ động hơn.
  • Một nhà phát triển từ ngân hàng lớn ở Wall Street lo ngại về việc AI ngày càng được trao nhiều quyền tự chủ, gây khó khăn trong việc truy vết trách nhiệm nếu có sự cố xảy ra, đồng thời muốn có thêm công cụ để kiểm soát công nghệ này.

Bắt gặp Dario Amodei lúc này khó khăn chẳng kém gì bắt gặp một con bướm quý hiếm. CEO Anthropic dự kiến gặp khoảng 50 lãnh đạo từ các tập đoàn lớn nhất châu Âu tại Oxfordshire tuần trước trong cuộc họp kín do công ty tổ chức tại một dinh thự mang phong cách Jacobean. Cựu Thủ tướng Anh Rishi Sunak, hiện là cố vấn của Anthropic, cũng có mặt. Amodei ban đầu dự kiến tiếp tục tới một nơi khác ở châu Âu sau đó, nhưng chuyến đi bị rút ngắn xuống chỉ còn một hoặc hai ngày ở Anh.

Vì sao ông lại khó gặp đến vậy? Câu trả lời nằm ở Mythos, mô hình AI mà Amodei hé lộ tháng trước và cho rằng quá nguy hiểm để phát hành. Nhân viên Anthropic đã được tiếp cận công nghệ này và cho biết nó mang tính “người” hơn các phiên bản trước. Tuy nhiên, mô hình cũng có thể bị lợi dụng cho các cuộc tấn công mạng, nên công ty mới chỉ cho vài chục tổ chức thử nghiệm và xem trước. Sức mạnh cùng tiềm năng của Mythos sẽ hỗ trợ Amodei trong nỗ lực cải thiện quan hệ với chính quyền ông Trump, và ông cũng muốn mô hình này sớm được đến tay công chúng. Điều đó đòi hỏi khả năng xoay xở giữa nhiều mục tiêu cùng một lúc và hiện tại Amodei vẫn đang kiểm soát được tình hình.

Trong lúc công ty chạy đua để đưa Mythos ra thị trường và chuẩn bị cho kế hoạch IPO, Anthropic cũng xây dựng hình ảnh như một doanh nghiệp có trách nhiệm với xã hội. Theo một người trong công ty, hãng đang làm việc với các tổ chức toàn cầu để giúp họ “hấp thụ cú sốc” từ công nghệ của mình. Công việc này bao gồm các cuộc họp kín với hội đồng Ổn định Tài chính tại Thụy Sĩ nhằm thảo luận rủi ro an ninh mạng từ Mythos, cũng như tham gia cùng Giáo hoàng tuần này khi Vatican công bố lập trường của Giáo hội Công giáo về AI, trong đó cảnh báo việc sử dụng công nghệ này trong chiến tranh.

Việc Anthropic cử đồng sáng lập Christopher Olah tham gia cùng Giáo hoàng Leo trong lúc đồng thời kiện Lầu Năm Góc liên quan đến cách công nghệ của hãng được sử dụng trong chiến tranh cho thấy khả năng cùng lúc theo đuổi hai vai trò rất khác nhau.

Anthropic từ lâu đã mang trong mình nhiều mâu thuẫn. Công ty tự xây dựng hình ảnh là doanh nghiệp AI an toàn nhất, trong khi vẫn lao vào cuộc đua phát triển các cỗ máy siêu trí tuệ gây tranh cãi và chưa được kiểm chứng. Việc tái cấu trúc thành công ty phục vụ lợi ích cộng đồng giúp Anthropic xây dựng hình ảnh một doanh nghiệp có nguyên tắc. Cùng với đó, hãng cũng chuẩn bị tận dụng cơn sốt AI bằng kế hoạch IPO có thể tiềm ẩn rủi ro với nhà đầu tư cá nhân.

Anthropic cũng xây dựng cho chatbot Claude một “hiến pháp đạo đức” để định hướng hành vi, nhưng đồng thời khiến nó trở nên quá ấm áp và xu nịnh, dễ tạo cảm giác lệ thuộc ở người dùng.

Sự đối lập đó tiếp tục xuất hiện tại hội nghị dành cho nhà phát triển ở London tuần trước. Hàng trăm kỹ sư trong các lĩnh vực như tài chính, năng lượng cùng nhiều startup chen kín một địa điểm kiểu nhà kho để cập nhật về Claude Code, công cụ lập trình rất được ưa chuộng của Anthropic. Một số buổi giới thiệu cho thấy mức độ tự động hóa ngày càng cao của công nghệ này, bao gồm khả năng để hàng chục hoặc hàng trăm tác nhân AI liên tục thực hiện nhiệm vụ trong nhiều giờ mà không cần nhắc lệnh.

Một nhà phát triển đến từ ngân hàng lớn ở Wall Street nói với tôi rằng điều đó khiến ông lo ngại. Theo ông, AI càng được trao nhiều quyền tự chủ thì càng khó truy vết trách nhiệm nếu có sự cố xảy ra. Ông muốn có thêm công cụ để kiểm soát công nghệ này.

Khi tôi nêu những lo ngại đó với Cat Wu, giám đốc sản phẩm của Claude Code, bà nói hệ thống này “cực kỳ an toàn” và vấn đề nằm ở chỗ “chúng tôi chưa giải thích đầy đủ cách tích hợp bảo mật vào sản phẩm”. Nói cách khác, theo bà, đây chủ yếu là vấn đề truyền thông chứ chưa hẳn là thiếu cơ chế kiểm soát.

Wu cho biết các mô hình của Anthropic được định hướng ngày càng độc lập và chủ động hơn theo thời gian. “Mythos là một mô hình thể hiện rõ điều này”, bà nói thêm. Điều đó đồng nghĩa trong khi các ngành được quản lý chặt và có vai trò hệ thống như tài chính muốn giữ nhiều quyền kiểm soát từ con người hơn, Anthropic lại đang thúc đẩy công nghệ theo hướng giảm dần sự can thiệp của con người.

Dù nhiều nhà phát triển tại hội nghị nói rằng họ thích lập trình cùng AI, một số người cũng cảm thấy bất an khi ngày càng bị tách khỏi quá trình làm việc và công cụ này dần trở thành một “hộp đen” khó hiểu.

Một người cho biết cách đây một năm, Claude Code tự động hiển thị luồng văn bản mô tả cách nó xử lý từng bước của nhiệm vụ. Hiện nay tính năng đó bị ẩn mặc định và người dùng phải chủ động tìm mới thấy. Cách hiển thị thiếu minh bạch hơn này cũng từng khiến nhiều nhà phát triển khác phàn nàn. Các lập trình viên tại hội nghị của Anthropic dường như không quá bận tâm. Tuy nhiên, đây tiếp tục là dấu hiệu cho thấy con người đang dần buông tay khỏi hệ thống điều khiển. Họ đã tin Claude đến mức không còn kiểm tra cách nó đưa ra kết quả.

Các hoạt động công khai của Anthropic nhằm xây dựng quan hệ với những tổ chức như hội đồng Ổn định Tài chính và Vatican, cùng việc tuyển nhân sự để hợp tác với các ngân hàng phát triển và cơ quan của Liên hợp quốc, có lẽ sẽ ngày càng cần thiết khi các công cụ của hãng được trao thêm quyền tự chủ.

Công nghệ càng tiến xa, thế giới càng được yêu cầu phải đặt niềm tin vào công ty này nhiều hơn. Trong lúc Amodei chạy đua với các đối thủ để đưa Mythos vượt qua vạch đích một cách an toàn, việc duy trì thế cân bằng đó có thể sẽ ngày càng khó khăn hơn.

Theo Bloomberg

Theo phattrienxanh.baotainguyenmoitruong.vn

https://phattrienxanh.baotainguyenmoitruong.vn/mo-hinh-ai-moi-cua-anthropic-khien-nhieu-khach-hang-lo-ngai-58177.html

#AI
#AI Mythos
#Anthropic
#công nghệ
#Dario Amodei
#mô hình AI
#Claude
#chatbot
#lập trình
#ngân hàng