Kỷ nguyên dùng AI giá rẻ đang dần đi đến hồi kết

BBWV - Khi các công ty AI chuyển từ mô hình thuê bao cố định sang tính phí theo mức sử dụng, các doanh nghiệp bắt đầu phải đối mặt với tờ hóa đơn ngày càng dài.

Hình ảnh: Bloomberg

Tác giả: Seth Fiegerman

27 tháng 06, 2026 lúc 12:35 AM

Tóm tắt bài viết bởi

logo
  • Các nhà phát triển AI như OpenAI và Anthropic đang chuyển từ thuê bao cố định sang tính phí theo mức sử dụng thực tế do chi phí vận hành hạ tầng quá lớn.
  • Từ tháng 4, Anthropic tính phí doanh nghiệp vượt hạn mức, ước tính 1.000 lượt tìm kiếm trên Claude giá 10 USD, trong khi GitHub của Microsoft cũng áp dụng hệ thống tương tự.
  • Để kiểm soát chi phí, Walmart giới hạn nhân viên dùng tác tử AI, còn Uber khống chế ngân sách công cụ lập trình ở mức 1.500 USD mỗi tháng cho mỗi nhân sự.
  • Đối mặt áp lực IPO, Giám đốc điều hành OpenAI Ông Sam Altman nhận định việc người dùng trả tiền AI theo lượng tiêu thụ thực tế tương tự điện nước là tất yếu.
  • Việc tăng giá có thể đẩy khách hàng sang các mô hình mã nguồn mở giá rẻ của Trung Quốc như DeepSeek hay Qwen của Alibaba nhờ ưu thế tiêu tốn ít tài nguyên.

Trong nhiều năm qua, thung lũng Silicon đã ráo riết thúc đẩy người tiêu dùng và doanh nghiệp đưa trí tuệ nhân tạo (AI) vào mọi ngóc ngách trong cuộc sống. Giờ đây, các nhà phát triển AI muốn khách hàng trả nhiều tiền hơn cho lượng công nghệ mà họ thực sự sử dụng.

Ngày càng nhiều công ty công nghệ bắt đầu áp dụng mô hình tính phí theo mức độ sử dụng đối với các dịch vụ AI, thay vì chỉ thu một khoản phí thuê bao cố định. Điều đó đồng nghĩa những người dùng nhiều nhất sẽ phải trả thêm chi phí mỗi khi yêu cầu chatbot hoặc tác tử AI (AI agent) tạo một bộ slide thuyết trình, soạn thảo email hay gỡ lỗi một đoạn mã phức tạp.

Các phòng thí nghiệm AI hàng đầu đã chi hàng chục, thậm chí hàng trăm tỉ USD cho chip, trung tâm dữ liệu và nhân tài để phát triển cũng như vận hành các mô hình của mình. Việc chuyển sang mô hình tính phí theo mức sử dụng, vốn phổ biến với dịch vụ điện theo công tơ hoặc các gói cước điện thoại trả theo nhu cầu, có thể khiến người dùng cân nhắc kỹ hơn khi sử dụng một công nghệ tiêu tốn lượng điện năng và tài nguyên khổng lồ.

Tuy nhiên, động thái này đang gây không ít khó chịu cho giới doanh nghiệp Mỹ, buộc các công ty phải đối mặt với chi phí AI ngày càng tăng và đánh giá lại hiệu quả đầu tư của mình. Sự thay đổi này gợi nhớ đến thời điểm các dịch vụ theo yêu cầu như Uber bắt đầu cắt giảm các chương trình trợ giá để hướng tới lợi nhuận.

Nguy cơ là một “cú sốc giá” trên diện rộng có thể khiến nhiều khách hàng và doanh nghiệp phải xem xét lại giá trị thực sự của AI đối với họ, đúng vào lúc một số startup AI hàng đầu đang chạy đua để niêm yết trên thị trường chứng khoán.

Mô hình kinh doanh của AI tạo sinh là gì?

Mô hình kinh doanh dành cho chatbot và tác tử AI vẫn còn khá mới mẻ và đang trong quá trình định hình.

Năm 2023, chỉ vài tháng sau khi ChatGPT khởi phát cơn sốt AI tạo sinh, OpenAI và đối thủ Anthropic bắt đầu triển khai các gói thuê bao trả phí nhằm kiếm tiền từ các chatbot của mình.

Ban đầu, cả hai công ty đều cung cấp các gói cao cấp dành cho người dùng với mức giá 20 USD mỗi tháng. Sau đó, họ tiếp tục bổ sung các cấp độ dịch vụ đắt đỏ hơn, có giá lên tới 200 USD mỗi tháng, đổi lại người dùng được quyền truy cập lớn hơn vào các mô hình AI của họ.

OpenAI, Anthropic và nhiều công ty AI khác cũng cung cấp các gói dành cho doanh nghiệp, hướng tới các nhóm làm việc với những tính năng bảo mật cao hơn, khả năng kiểm soát dữ liệu chặt chẽ hơn và dịch vụ hỗ trợ khách hàng chuyên biệt.

Mức giá của các gói này khác nhau tùy nhà cung cấp, nhưng thông thường được tính theo mô hình thu phí cố định hằng tháng cho mỗi nhân viên, hay còn gọi là mỗi “seat” (tài khoản người dùng), được cấp quyền truy cập thông qua gói dịch vụ đó.

Đặc biệt, OpenAI cũng đã bắt đầu triển khai lựa chọn hỗ trợ bằng quảng cáo cho người dùng, áp dụng mô hình kinh doanh mà các công ty internet như Meta và Alphabet (công ty mẹ của Google) từ lâu đã sử dụng để cung cấp dịch vụ miễn phí cho hàng tỉ người dùng.

Chiến lược giá đã thay đổi như thế nào?

Trong khi các nhà phát triển AI vẫn duy trì các gói thuê bao theo nhiều cấp độ, một số công ty đang xem xét lại việc cho phép người dùng gần như truy cập không giới hạn vào các mô hình AI với một mức phí cố định.

Theo The Information, Anthropic đã chuyển sang tính phí khách hàng doanh nghiệp dựa trên mức sử dụng AI thực tế từ tháng 4, trong bối cảnh nhu cầu đối với các dịch vụ của hãng tăng mạnh. Anthropic cung cấp một lượng tín dụng sử dụng nhất định cho từng cấp độ thuê bao trả phí. Sau khi vượt ngưỡng này, cá nhân hoặc doanh nghiệp sẽ phải trả phí theo mức sử dụng phát sinh.

Chi phí phụ thuộc vào loại tác vụ, thời lượng sử dụng và mô hình AI được chọn. Trên website của mình, Anthropic ước tính việc thực hiện 1.000 lượt tìm kiếm web thông qua chatbot Claude có giá khoảng 10 USD. Hãng cũng cho biết các tác nhân AI được quản lý có chi phí 8 xu Mỹ cho mỗi giờ hoạt động. Khoản phí này có thể tăng đáng kể nếu hàng trăm nhân viên cùng lúc triển khai và vận hành các đội ngũ tác nhân AI liên tục.

Gemini_Generated_Image_rk5vo2rk5vo2rk5v

Khách hàng của OpenAI cũng bày tỏ sự bối rối trước các giới hạn sử dụng mới đối với tác nhân lập trình AI của công ty. Trong khi đó, công cụ hỗ trợ viết mã GitHub của Microsoft gần đây đã khiến nhiều người dùng không hài lòng khi áp dụng hệ thống tính phí theo mức sử dụng sau khi vượt quá hạn mức hằng tháng. Một số người cho biết họ đã dùng hết hạn ngạch cả tháng chỉ trong vòng một ngày.

Vì sao các công ty AI thay đổi này vào lúc này?

Mô hình thu phí cố định từng được xem là phù hợp trong giai đoạn đầu, khi các doanh nghiệp mới bắt đầu thử nghiệm AI. Cách tiếp cận này giúp đơn giản hóa cấu trúc chi phí và giảm rào cản tiếp cận đối với nhiều công ty vẫn chưa chắc chắn nên tích hợp chatbot vào quy trình làm việc hằng ngày ở mức độ nào, cũng như sẵn sàng chi bao nhiêu tiền cho một công nghệ còn chưa được kiểm chứng đầy đủ.

Cuối năm 2025 và đầu năm 2026, AI đã bước sang một giai đoạn phát triển mới. Anthropic, OpenAI và nhiều công ty khác đạt được những tiến bộ đáng kể trong việc xây dựng các tác tử AI có thể viết và sửa lỗi mã nguồn cho kỹ sư phần mềm, thậm chí làm việc liên tục trong nhiều giờ.

Từ nền tảng đó, các startup AI bắt đầu đẩy mạnh việc phát triển những tác nhân có khả năng tự động hóa ngày càng nhiều công việc ở các lĩnh vực khác, bao gồm cả tài chính.

Cùng thời điểm, OpenClaw trở nên phổ biến trong giới công nghệ khi phô bày cả tiềm năng lẫn rủi ro của một trợ lý số AI có thể trực tiếp điều khiển máy tính cá nhân để đặt vé máy bay, xử lý email và quản lý lịch làm việc thay cho người dùng.

OpenClaw-1
Hình ảnh:  Raul Ariano/Bloomberg

Đột nhiên, một số người dùng AI tích cực nhất bắt đầu vận hành cả "đàn" tác tử AI trong nhiều giờ liên tục. Các doanh nghiệp cũng khuyến khích nhân viên sử dụng càng nhiều token càng tốt (Token là đơn vị dữ liệu được các mô hình AI xử lý) Thậm chí, một số công ty còn lập bảng xếp hạng nội bộ dựa trên chỉ số này.

Xu hướng này thường được gọi là "tokenmaxxing", về bản chất là thưởng cho nhân viên vì tối đa hóa mức sử dụng AI, bất kể hoạt động đó có thực sự cải thiện năng suất hay mang lại giá trị kinh doanh hay không.

Về mặt kỹ thuật, việc sử dụng một tác tử AI để tự động hóa công việc đòi hỏi năng lực tính toán lớn hơn nhiều so với việc chỉ yêu cầu chatbot tạo ra vài đoạn văn bản. Nếu để một tác tử AI hoạt động liên tục trong nhiều giờ, chi phí tính toán còn tăng cao hơn nữa.

Các nhà phát triển AI có thể tiếp tục trợ giá cho phần chi phí phát sinh này nhằm thúc đẩy việc công nghệ của họ được tích hợp sâu hơn vào hoạt động của doanh nghiệp. Tuy nhiên, chiến lược đó cũng đi kèm không ít rủi ro.

Anthropic và OpenAI, hai trong số những nhà phát triển AI hàng đầu thế giới, đều đang chạy đua để niêm yết cổ phiếu sớm nhất ngay trong năm nay. Điều đó khiến giới đầu tư và thị trường chú ý nhiều hơn đến chi phí hoạt động cũng như con đường tiến tới lợi nhuận của các công ty này.

Các doanh nghiệp AI đã chứng minh rằng công nghệ của họ có thể mang lại giá trị trong một số tác vụ quan trọng, chẳng hạn như lập trình. Giờ đây, thách thức là chứng minh họ có thể tạo ra đủ doanh thu từ khách hàng để bù đắp khoản chi khổng lồ cho chip, trung tâm dữ liệu và nhân sự.

Các công ty AI nói gì về những thay đổi này?

Lãnh đạo OpenAI thừa nhận mô hình định giá của ngành sẽ phải thay đổi khi công nghệ tiếp tục phát triển, đồng thời cho rằng trong tương lai khách hàng có thể trả tiền cho AI theo cách tương tự như điện hoặc nước.

Nick Turley, phụ trách ChatGPT tại OpenAI, nhận định trong một cuộc phỏng vấn podcast đầu năm nay rằng việc cung cấp các gói sử dụng không giới hạn có thể không còn hợp lý. "Có thể trong giai đoạn hiện nay, một gói AI không giới hạn cũng giống như một gói sử dụng điện không giới hạn. Điều đó đơn giản là không hợp lý."

Tương tự, Sam Altman cho biết OpenAI hình dung một tương lai mà AI trở thành một loại tiện ích giống như điện hoặc nước, và người dùng sẽ trả tiền theo lượng tiêu thụ thực tế.

Trong khi đó, GitHub cho biết việc chuyển sang mô hình tính phí mới nhằm "điều chỉnh giá cả phù hợp hơn với mức sử dụng thực tế". Theo một bài đăng trên blog của công ty, "hiện nay, một câu hỏi ngắn trong khung chat và một phiên lập trình tự động kéo dài nhiều giờ có thể khiến người dùng trả cùng một mức phí."

GitHub cho biết họ đã gánh phần lớn chi phí suy luận AI ngày càng tăng phía sau các tác vụ này, nhưng mô hình tính phí hiện tại dựa trên số lượng yêu cầu cao cấp đã không còn bền vững.

“Tính phí theo mức sử dụng sẽ giải quyết được vấn đề đó,” GitHub nói thêm.

Khách hàng doanh nghiệp phản ứng ra sao?

Sự kết hợp giữa việc AI ngày càng được ứng dụng rộng rãi, các sáng kiến kiểu "tokenmaxxing" và những thay đổi trong chính sách giá đã tạo nên một cú tát tỉnh ngộ đối với không ít doanh nghiệp.

Walmart đã áp dụng giới hạn đối với việc sử dụng một tác tử AI nội bộ hỗ trợ các công việc văn phòng của nhân viên. Trong khi đó, Uber giới hạn chi tiêu cho một số công cụ lập trình AI ở mức 1.500 USD mỗi nhân viên mỗi tháng cho từng công cụ.

Đồng thời, ngày càng có nhiều chỉ trích nhắm vào phong trào "tokenmaxxing", khi nhiều người cho rằng đây là một biểu tượng địa vị tốn kém và thiếu thực chất của ngành AI, khuyến khích việc sử dụng công nghệ nhiều nhất có thể thay vì tập trung vào hiệu quả hay giá trị kinh doanh thực sự mà nó mang lại.

“Các công ty đã đúng khi thúc đẩy nhân viên đón nhận AI, và chi phí token gia tăng là một đặc tính của công nghệ này, chứ không phải lỗi,” ông Matt Kropp, giám đốc công nghệ của bộ phận BCG X thuộc Boston Consulting Group, đơn vị hỗ trợ khách hàng triển khai AI, cho biết.

“Tuy nhiên, hiện vẫn có rất ít doanh nghiệp biết cách lập ngân sách cho AI. Đồng thời, nhân viên cũng đang trong quá trình học cách sử dụng các công cụ này một cách hiệu quả, vì vậy chắc chắn đang tồn tại không ít sự lãng phí.”

Trong giới công nghệ, ngày càng nhiều người thảo luận về sự cần thiết của các hệ thống định tuyến mô hình (model routing) tốt hơn. Các hệ thống này sẽ tự động ghép người dùng với mô hình AI phù hợp nhất cho từng nhiệm vụ cụ thể.

Lý do là với nhiều tác vụ, người dùng không nhất thiết phải sử dụng những mô hình mạnh nhất và đắt đỏ nhất trên thị trường. Việc lựa chọn đúng mô hình cho từng nhu cầu có thể giúp giảm đáng kể chi phí mà vẫn đảm bảo hiệu quả công việc.

“ Khi chi phí token ngày càng chiếm tỉ trọng lớn trong chi phí vận hành, việc định tuyến mô hình sẽ trở thành kết quả tất yếu,” ông Aaron Levie, đồng sáng lập và giám đốc điều hành Box, nhận định. “Sắp tới, doanh nghiệp sẽ có thể tách từng trường hợp sử dụng riêng lẻ và chuyển chúng sang các mô hình có chi phí thấp hơn, miễn là chất lượng đầu ra đủ đáp ứng yêu cầu công việc.”

Những rủi ro là gì?

Khách hàng có thể cắt giảm tổng chi tiêu cho AI hoặc chuyển một phần ngân sách sang các dịch vụ có chi phí thấp hơn, buộc các công ty AI phải xem xét lại mức giá mà họ thực sự có thể áp dụng trên thị trường.

Đã xuất hiện dấu hiệu cho thấy áp lực cạnh tranh đang gia tăng đối với các nhà cung cấp AI hàng đầu của Mỹ. OpenAI được cho là đang cân nhắc cắt giảm đáng kể giá token trong bối cảnh dự đoán Anthropic cũng sẽ hạ chi phí dịch vụ.

Việc chuyển sang mô hình thuê bao dựa trên token, khiến khách hàng nhạy cảm hơn với giá cả, cũng có thể tạo lợi thế cho các nền tảng AI mã nguồn mở của Trung Quốc như DeepSeek và chatbot Qwen của Alibaba.

Các mô hình này thường tiêu tốn ít tài nguyên tính toán hơn so với các đối thủ Mỹ vì chỉ kích hoạt một phần nhỏ hơn trong "mạng nơ-ron" của hệ thống AI để tạo phản hồi. Đây cũng là một trong những lý do giúp các công ty Trung Quốc có thể cung cấp dịch vụ với mức giá thấp hơn.

Hiện tại, các mô hình Trung Quốc vẫn chưa đạt tới chất lượng của những sản phẩm AI hàng đầu từ Mỹ. Tuy nhiên, đối với nhiều tác vụ thông thường, chúng có khả năng đã đủ tốt để thu hút một phần nhu cầu từ người dùng chuyên nghiệp nếu những khách hàng này bắt đầu tìm kiếm các lựa chọn có chi phí hợp lý hơn.

Theo Bloomberg

Theo phattrienxanh.baotainguyenmoitruong.vn

https://phattrienxanh.baotainguyenmoitruong.vn/ky-nguyen-ai-gia-re-dang-dan-di-den-hoi-ket-58814.html

#AI
#trí tuệ nhân tạo
#Mô hình kinh doanh AI
#Tính phí theo sử dụng
#Chi phí AI
#OpenAI
#Anthropic
#ChatGPT
#AI tạo sinh