DeepSeek tung công nghệ mới, tăng tốc AI tới 85% và giảm áp lực phần cứng

AI & Dữ liệu lớn

DeepSeek tung công nghệ mới, tăng tốc AI tới 85% và giảm áp lực phần cứng

BBWV - Dspark của DeepSeek được giới thiệu tăng tốc đến 85% nhưng lại tiết kiệm được chip và năng lượng.

Hình ảnh: Shutterstock

Tác giả: Thục Quân

30 tháng 06, 2026 lúc 1:16 PM

Cuộc cạnh tranh trong lĩnh vực trí tuệ nhân tạo (AI) đang chuyển từ việc phát triển các mô hình ngày càng lớn sang tối ưu hiệu quả vận hành. DeepSeek vừa công bố DSpark – công nghệ mới giúp tăng đáng kể tốc độ phản hồi của các mô hình AI mà không cần nâng cấp đáng kể hạ tầng phần cứng.

Theo DeepSeek, DSpark được tích hợp vào mô hình V4 và sử dụng kiến trúc giải mã suy đoán (speculative decoding). Thay vì tạo từng token theo cách truyền thống, hệ thống sử dụng một mô hình nhỏ để tạo trước các phản hồi dự kiến, sau đó mô hình lớn sẽ xác minh theo từng cụm dữ liệu. Cách tiếp cận này giúp rút ngắn thời gian xử lý và tăng hiệu quả sử dụng GPU.

Công ty cho biết tốc độ phản hồi có thể cải thiện tới 85%. Điều này đồng nghĩa một GPU trước đây xử lý khoảng 100 truy vấn có thể phục vụ gần 185 truy vấn trong cùng khoảng thời gian, giúp giảm đáng kể chi phí vận hành trung tâm dữ liệu.

Ngoài ra, DSpark còn áp dụng cơ chế tạo nhiều token trong một lần xử lý thay vì từng token riêng lẻ, kết hợp hệ thống điều phối dựa trên mức độ tin cậy để tự động cân bằng giữa tốc độ và độ chính xác tùy theo tải tính toán của hệ thống.

Các chuyên gia nhận định cải tiến này không làm tăng khả năng suy luận của mô hình AI, nhưng có thể giảm đáng kể nhu cầu đầu tư GPU – yếu tố đang trở thành chi phí lớn nhất của các doanh nghiệp AI.

DeepSeek cũng cho biết công nghệ mới đã được thử nghiệm trên nhiều mô hình mã nguồn mở như Gemma của Google DeepMind và Qwen của Alibaba, cho thấy khả năng ứng dụng rộng rãi. Công ty đã công bố mã nguồn nghiên cứu trên GitHub và Hugging Face nhằm thúc đẩy cộng đồng phát triển.

Động thái này diễn ra trong bối cảnh các doanh nghiệp AI chịu áp lực ngày càng lớn từ nhà đầu tư trong việc cung cấp các mô hình mạnh hơn với chi phí thấp hơn và tốc độ xử lý nhanh hơn.

Theo phattrienxanh.baotainguyenmoitruong.vn

https://phattrienxanh.baotainguyenmoitruong.vn/deepseek-tung-cong-nghe-moi-tang-toc-ai-toi-85-va-giam-ap-luc-phan-cung-58910.html

BÀI LIÊN QUAN