Kỹ thuật “chưng cất” AI là gì và tại sao nó đang là nỗi lo của ngành công nghệ?

AI & Dữ liệu lớn

Kỹ thuật “chưng cất” AI là gì và tại sao nó đang là nỗi lo của ngành công nghệ?

BBWV - Các công ty AI của Mỹ lo ngại đối thủ Trung Quốc đang sử dụng kỹ thuật 'chưng cất' để sao chép các mô hình tiên tiến với chi phí thấp, đe dọa khoản đầu tư hàng trăm tỉ USD và gây ra rủi ro an ninh.

Tác giả: Lorelei Smillie

03 tháng 07, 2026 lúc 5:25 PM

Tóm tắt bài viết bởi

Nhiều công ty AI Mỹ cáo buộc đối thủ Trung Quốc dùng kỹ thuật "chưng cất" để sao chép trái phép mô hình tiên tiến, đe dọa khoản đầu tư hàng trăm tỉ USD.
Vào tháng 6, Công ty Anthropic cáo buộc Tập đoàn Alibaba Group Holding Ltd. sử dụng bất hợp pháp kỹ thuật này để trích xuất dữ liệu từ mô hình Claude.
Anthropic cho biết Alibaba đã thực hiện 28,8 triệu lượt trao đổi với Claude từ tháng 4 đến tháng 6 thông qua gần 25.000 tài khoản gian lận để chưng cất.
Giới chức Mỹ ước tính việc chưng cất trái phép gây thiệt hại hàng tỉ USD doanh thu hàng năm, đồng thời tạo ra rủi ro an ninh khi gỡ bỏ hàng rào bảo vệ.
Nhà Trắng và các nhà lập pháp Mỹ đang lên kế hoạch kiềm chế kỹ thuật chưng cất trái phép, đồng thời kêu gọi trừng phạt các thực thể Trung Quốc.

Các công ty trí tuệ nhân tạo ở Mỹ đã chi hàng trăm tỉ USD để phát triển các chatbot tiên tiến hơn, đặt cược rằng họ có thể kiếm đủ tiền từ khách hàng để bù đắp cho khoản đầu tư. Cách tiếp cận này có nguy cơ bị các đối thủ xây dựng hệ thống AI cạnh tranh với chi phí thấp hơn nhiều làm suy yếu.

Ngày càng có nhiều công ty Mỹ cáo buộc các đối thủ cạnh tranh Trung Quốc sử dụng một kỹ thuật được gọi là 'chưng cất' (distillation) để sao chép trái phép kết quả từ các mô hình AI hàng đầu của Mỹ, nhằm tạo ra một thế hệ chatbot đối thủ với chi phí chỉ bằng một phần nhỏ và ít hàng rào an toàn hơn nhiều.

Vào tháng 6, Anthropic PBC cho biết Alibaba Group Holding Ltd. đã sử dụng "bất hợp pháp" kỹ thuật chưng cất để trích xuất kết quả từ mô hình Claude của mình trên quy mô công nghiệp, nhằm giúp gã khổng lồ công nghệ Trung Quốc sản xuất hệ thống AI của riêng mình. Những cáo buộc tương tự đã được Anthropic và OpenAI đưa ra đối với các phòng thí nghiệm AI khác của Trung Quốc, bao gồm DeepSeek và MiniMax. Cho đến nay, không có công ty Trung Quốc nào, kể cả Alibaba, phản hồi về các cáo buộc này.

Chưng cất là một phương pháp thường được các phòng thí nghiệm AI sử dụng để huấn luyện một mô hình ngôn ngữ lớn bằng cách sử dụng kết quả đầu ra của một mô hình khác. Một nhà phát triển gửi một loạt câu lệnh (prompt) đến một mô hình "giáo viên" lớn hơn, có năng lực hơn, và các câu trả lời của nó được dùng để huấn luyện một mô hình "học sinh" nhỏ hơn nhằm sao chép nhiều khả năng của mô hình giáo viên.

Mô hình thu được có thể thực hiện nhiều chức năng tương tự như mô hình gốc nhưng chỉ tốn một phần nhỏ chi phí và sức mạnh tính toán cần thiết để phát triển - và vận hành - một hệ thống tương đương từ đầu. Kiến thức không được chuyển giao trực tiếp từ mô hình này sang mô hình khác, nhưng mô hình học sinh học cách bắt chước hành vi của giáo viên dựa trên kết quả từ các truy vấn của nó.

Chưng cất được xem là chấp nhận được khi các công ty sử dụng nó trên chính các mô hình của mình hoặc khi các nhà phát triển bên ngoài dùng nó để xây dựng các công nghệ không cạnh tranh. Được biết đến với tên gọi chưng cất được cấp phép, phương pháp này cho phép các công ty và nhà nghiên cứu nén các mô hình lớn thành những mô hình nhỏ hơn, hiệu quả hơn và được tối ưu hóa cho các tác vụ cụ thể. Các mô hình phái sinh thường không có đầy đủ khả năng của mô hình gốc nhưng hoạt động nhanh hơn và tốn ít chi phí phát triển và vận hành hơn.

Kỹ thuật chưng cất có thể bị các bên thứ ba sử dụng để sao chép khả năng của một mô hình AI độc quyền mà không có sự cho phép của chủ sở hữu mô hình tham chiếu. Hành vi này đã làm dấy lên những lo ngại về pháp lý, kinh tế và an ninh.

Các công ty AI hàng đầu của Mỹ cho rằng việc chưng cất trái phép đang đe dọa hoạt động kinh doanh của họ. Nhiều phòng thí nghiệm Trung Quốc bao gồm DeepSeek đã phát triển các mô hình trọng số mở, nghĩa là một phần của hệ thống AI cơ bản được công khai để người dùng tự do tải về và chạy trên nền tảng của riêng họ.

Ngược lại, các công ty AI lớn nhất của Mỹ đã giữ các mô hình của họ ở dạng độc quyền, đặt cược rằng khách hàng sẽ trả tiền để truy cập sản phẩm của họ, qua đó giúp họ thu hồi hàng trăm tỉ USD đã chi cho các trung tâm dữ liệu và cơ sở hạ tầng khác. Họ lập luận rằng nếu các đối thủ có thể sao chép mô hình của họ với chi phí chỉ bằng một phần nhỏ và cung cấp chúng với giá rẻ - hoặc miễn phí - điều đó có nguy cơ làm xói mòn doanh số của họ. Các quan chức Mỹ ước tính rằng việc chưng cất trái phép đang khiến các doanh nghiệp Mỹ thiệt hại hàng tỉ USD thu nhập hàng năm.

Các công ty AI của Mỹ cũng cho biết có những rủi ro an ninh trong việc chưng cất trái phép. Họ cảnh báo rằng các đối thủ nước ngoài có thể sử dụng kỹ thuật này để phát triển các mô hình AI đã bị loại bỏ các hàng rào bảo vệ, vốn dùng để ngăn chặn mọi người sử dụng nền tảng cho các mục đích bất hợp pháp hoặc nguy hiểm, chẳng hạn như tạo ra mầm bệnh chết người hoặc thực hiện các cuộc tấn công máy tính tự động quy mô lớn.

Bằng chứng thường chỉ mang tính tình huống, và hiện tại rất khó để chứng minh một cách chắc chắn rằng mô hình của đối thủ được phát triển thông qua kỹ thuật chưng cất.

Vào tháng 2, Anthropic cho biết ba nhà phát triển AI hàng đầu ở Trung Quốc đã tìm cách "trích xuất bất hợp pháp" kết quả từ các mô hình của họ. Công ty cho biết các công ty này đã tạo ra hơn 16 triệu lượt trao đổi bằng các tài khoản gian lận, và họ đã có thể xác định được chúng dựa trên thông tin từ địa chỉ giao thức internet và siêu dữ liệu. Các đối tác trong ngành cũng đã "quan sát thấy các tác nhân và hành vi tương tự trên nền tảng của họ," công ty cho biết thêm.

Trong một lá thư gửi một số thượng nghị sĩ Mỹ và quan chức Nhà Trắng vào tháng 6, Anthropic cho biết nỗ lực chưng cất bị cáo buộc của Alibaba liên quan đến 28,8 triệu lượt trao đổi với chatbot Claude của họ trong khoảng thời gian từ tháng 4 đến tháng 6 thông qua gần 25.000 tài khoản gian lận, theo những người quen thuộc với tài liệu và một bản sao mà Bloomberg News đã xem được.

Các công ty AI hàng đầu của Mỹ đang thực hiện các bước để chống lại cái mà họ gọi là "các cuộc tấn công chưng cất," bao gồm việc chia sẻ thông tin rộng rãi hơn về việc trích xuất trái phép đầu ra từ mô hình của họ và nỗ lực chặn những người dùng đáng ngờ truy cập vào hệ thống của họ.

Các nhà lập pháp ở Washington và chính quyền Trump đang chú ý đến những lo ngại của Thung lũng Silicon. Vào tháng 4, Nhà Trắng cho biết sẽ hợp tác với ngành công nghiệp để xác định cách kiềm chế kỹ thuật chưng cất và buộc các tác nhân xấu phải chịu trách nhiệm. Các nhà lập pháp Đảng Cộng hòa tại Hạ viện cũng đã kêu gọi Mỹ trừng phạt các thực thể Trung Quốc tham gia vào hoạt động này trên quy mô công nghiệp để xây dựng các hệ thống đối thủ.

- Với sự hỗ trợ từ Maggie Eastland

Theo Bloomberg

Theo phattrienxanh.baotainguyenmoitruong.vn

https://phattrienxanh.baotainguyenmoitruong.vn/ky-thuat-chung-cat-ai-la-gi-va-tai-sao-no-dang-la-noi-lo-cua-nganh-cong-nghe-59007.html

#AI

#Chưng cất AI

#Kỹ thuật chưng cất AI

#Alibaba Group Holding

#OpenAI

BÀI LIÊN QUAN