DeepSeek tung mô hình V4 với 1,6 nghìn tỷ tham số thách thức trực tiếp OpenAI

BBWV - Sự xuất hiện của mô hình trí tuệ nhân tạo (AI) thế hệ mới từ Trung Quốc đang định hình lại mặt bằng chi phí của ngành công nghệ toàn cầu, chứng minh rằng năng lực xử lý cấp cao không nhất thiết đi kèm với mức giá đắt đỏ.

Hình ảnh: Bloomberg

Hình ảnh: Bloomberg

Tác giả: Hoàng Hải

25 tháng 04, 2026 lúc 7:49 AM

Sức mạnh từ 1,6 nghìn tỷ tham số

Vào ngày 24/4, startup DeepSeek đã chính thức giới thiệu phiên bản thử nghiệm của mô hình ngôn ngữ lớn V4 trên nền tảng WeChat, theo Reuters. Đợt phát hành này bao gồm hai phiên bản chính là V4-Pro và V4-Flash, được xây dựng theo kiến trúc chuyên gia hỗn hợp (MoE). Trong đó, bản Pro sở hữu tổng cộng 1,6 nghìn tỷ tham số với 49 tỷ tham số hoạt động, trở thành mô hình nguồn mở lớn nhất hiện nay. Bản Flash nhỏ gọn hơn với 284 tỷ tham số. Cả hai đều hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token, cho phép xử lý khối lượng tài liệu hoặc mã nguồn khổng lồ trong một lần nhập liệu.

Hiệu năng đối đầu trực tiếp các ông lớn Mỹ

Về mặt kỹ thuật, DeepSeek khẳng định phiên bản V4-Pro-Max đã thu hẹp đáng kể khoảng cách với các hệ thống khép kín hàng đầu. Trong các bài kiểm tra về khả năng suy luận, mô hình này vượt qua GPT-5.2 của OpenAI và Gemini 3.0 Pro của Google. Đối với các tác vụ lập trình, hiệu suất của V4 được đánh giá ngang ngửa với GPT-5.4. Đáng chú ý, hệ thống mới được tối ưu hóa riêng cho các công cụ hoạt động độc lập (agent) như Claude Code của Anthropic và OpenClaw. Dù vậy, mô hình này vẫn xếp sau các đối thủ Mỹ ở một số bài kiểm tra về kiến thức tổng hợp.

SWE-bench
Bản xếp hạng SWE-Bench, dùng để đánh giá các mô hình ngôn ngữ trên các nhiệm vụ kỹ thuật phần mềm phức tạp, thực tế, đòi hỏi suy luận mở rộng và giải quyết vấn đề nhiều bước. Nguồn: LLM-Stats

Chiến lược giá và rào cản địa chính trị

Điểm khác biệt lớn nhất của V4 nằm ở cấu trúc chi phí. DeepSeek cung cấp quyền truy cập thông qua giao diện lập trình ứng dụng (API) trả tiền theo mức sử dụng thực tế trên mỗi 1 triệu token, thay vì áp dụng gói thuê bao cố định hàng tháng. Cách tiếp cận này giúp chi phí vận hành chỉ bằng khoảng một phần sáu so với các mô hình tiên tiến nhất hiện nay. Bên cạnh yếu tố kinh tế, đợt phát hành này cũng phản ánh sức nóng của cuộc chiến công nghệ Mỹ - Trung. Công ty đã ưu tiên cấp quyền truy cập sớm cho các doanh nghiệp nội địa Trung Quốc và hạn chế chia sẻ hệ thống ban đầu với các kỹ sư Mỹ.

pricevseff
Giá cả so với hiệu năng: Chi phí kết hợp (đầu vào/đầu ra 5:1) so với điểm chuẩn trung bình · DeepSeek-V4-Pro-Max và 4 mẫu tương tự. Nguồn: LLM-Stats

Tái cấu trúc hệ sinh thái sản phẩm

Để tập trung nguồn lực cho thế hệ mới, DeepSeek sẽ dần loại bỏ các mô hình cũ như deepseek-chat và deepseek-reasoner, chuyển hướng người dùng sang các chế độ tương ứng của bản V4-Flash. Mô hình V4 hiện đã được phát hành dưới giấy phép nguồn mở MIT thân thiện với thương mại. Động thái này có khả năng buộc các nhà phát triển phần mềm và khách hàng doanh nghiệp phải đánh giá lại bài toán chi phí, tạo áp lực cạnh tranh về giá lên toàn bộ thị trường AI toàn cầu trong thời gian tới.

Theo phattrienxanh.baotainguyenmoitruong.vn

https://phattrienxanh.baotainguyenmoitruong.vn/deepseek-tung-mo-hinh-v4-voi-16-nghin-ty-tham-so-thach-thuc-truc-tiep-openai-57530.html

#DeepSeek V4
#mô hình ngôn ngữ lớn
#OpenAI
#DeepSeek
#trí tuệ nhân tạo