Một sản phẩm của BEACON MEDIA
Chuyên mục
Media
Báo cáo đặc biệt
Một sản phẩm của BEACON MEDIA
Khám phá nhiều hơn với tài khoản
Đăng nhập để lưu trữ và dễ dàng truy cập những bài viết bạn yêu thích trên Bloomberg Businessweek Việt Nam.
BBWV - Dspark của DeepSeek được giới thiệu tăng tốc đến 85% nhưng lại tiết kiệm được chip và năng lượng.
Hình ảnh: Shutterstock
Tác giả: Thục Quân
30 tháng 06, 2026 lúc 1:16 PM
Cuộc cạnh tranh trong lĩnh vực trí tuệ nhân tạo (AI) đang chuyển từ việc phát triển các mô hình ngày càng lớn sang tối ưu hiệu quả vận hành. DeepSeek vừa công bố DSpark – công nghệ mới giúp tăng đáng kể tốc độ phản hồi của các mô hình AI mà không cần nâng cấp đáng kể hạ tầng phần cứng.
Theo DeepSeek, DSpark được tích hợp vào mô hình V4 và sử dụng kiến trúc giải mã suy đoán (speculative decoding). Thay vì tạo từng token theo cách truyền thống, hệ thống sử dụng một mô hình nhỏ để tạo trước các phản hồi dự kiến, sau đó mô hình lớn sẽ xác minh theo từng cụm dữ liệu. Cách tiếp cận này giúp rút ngắn thời gian xử lý và tăng hiệu quả sử dụng GPU.
Công ty cho biết tốc độ phản hồi có thể cải thiện tới 85%. Điều này đồng nghĩa một GPU trước đây xử lý khoảng 100 truy vấn có thể phục vụ gần 185 truy vấn trong cùng khoảng thời gian, giúp giảm đáng kể chi phí vận hành trung tâm dữ liệu.
Ngoài ra, DSpark còn áp dụng cơ chế tạo nhiều token trong một lần xử lý thay vì từng token riêng lẻ, kết hợp hệ thống điều phối dựa trên mức độ tin cậy để tự động cân bằng giữa tốc độ và độ chính xác tùy theo tải tính toán của hệ thống.
Các chuyên gia nhận định cải tiến này không làm tăng khả năng suy luận của mô hình AI, nhưng có thể giảm đáng kể nhu cầu đầu tư GPU – yếu tố đang trở thành chi phí lớn nhất của các doanh nghiệp AI.
DeepSeek cũng cho biết công nghệ mới đã được thử nghiệm trên nhiều mô hình mã nguồn mở như Gemma của Google DeepMind và Qwen của Alibaba, cho thấy khả năng ứng dụng rộng rãi. Công ty đã công bố mã nguồn nghiên cứu trên GitHub và Hugging Face nhằm thúc đẩy cộng đồng phát triển.
Động thái này diễn ra trong bối cảnh các doanh nghiệp AI chịu áp lực ngày càng lớn từ nhà đầu tư trong việc cung cấp các mô hình mạnh hơn với chi phí thấp hơn và tốc độ xử lý nhanh hơn.
Theo phattrienxanh.baotainguyenmoitruong.vn
https://phattrienxanh.baotainguyenmoitruong.vn/deepseek-tung-cong-nghe-moi-tang-toc-ai-toi-85-va-giam-ap-luc-phan-cung-58910.html
Tặng bài viết
Đối với thành viên đã trả phí, bạn có 5 bài viết mỗi tháng để gửi tặng. Người nhận quà tặng có thể đọc bài viết đầy đủ miễn phí và không cần đăng ký gói sản phẩm.
Bạn còn 5 bài viết có thể tặng
Liên kết quà tặng có giá trị trong vòng 7 ngày.
BÀI LIÊN QUAN