OpenAI đang chậm chân mảng làm phim?

Công nghệ

OpenAI đang chậm chân mảng làm phim?

Những công cụ tạo phim (video) từ những câu lệnh (prompt) bằng văn bản đang phát triển nhanh, gây nhiều quan ngại về nguy cơ sai lạc thông tin cùng tính kinh tế học của trí tuệ nhân tạo (AI).

MINH HỌA: NICK LITTLE CHO BLOOMBERG BUSINESSWEEK

Tác giả: Rachel Metz

09 tháng 05, 2024 lúc 9:31 AM

Trên mạng đang lưu truyền đoạn video về ba con quái vật khổng lồ có ngà bước đi trong tuyết trắng xóa vào một ngày giá rét nhìn không khác gì một cuốn phim tài liệu trên kênh National Geographic — dù voi ma mút đã tuyệt chủng hàng nghìn năm trước khi máy quay ra đời.

OpenAI công bố đoạn clip 10 giây đó vào tháng Hai để giới thiệu Sora, phần mềm AI mới có thể biến văn bản thành những đoạn video trông như thật dài khoảng một phút. Tính năng mới này, và những ồn ào lập tức xuất hiện xung quanh, gợi lại giai đoạn cuối năm 2022, khi OpenAI công bố ChatGPT, làm đảo lộn ngành công nghệ chỉ sau một đêm và khiến đại chúng bắt đầu biết tới AI.

Tuy nhiên lần này, OpenAI không hề khai phá điều gì mới mà chỉ là đang cố gắng bắt kịp các công ty khởi nghiệp khác vốn đã ra mắt những công cụ tương tự. Đoạn video của OpenAI cũng không kèm theo sản phẩm ra mắt hay tuyên bố rõ ràng nào về thời điểm ra mắt. Công ty nói với Bloomberg News rằng họ chưa xác định thời gian cụ thể cho Sora, dù một lãnh đạo công ty gần đây bình luận dịch vụ này sẽ ra mắt năm nay.

Một năm rưỡi trước, Meta Platforms và Google đã giới thiệu các dự án nghiên cứu chuyển văn bản thành video bao gồm những clip đơn giản, dài vài giây, độ phân giải thấp thể hiện một chiếc kem ốc quế đang chảy ra, một con chó siêu nhân biết bay, và những đồ vật khác. Runway AI, vốn đã huy động được 237 triệu đô la Mỹ tính tới nay, đã khởi đầu những ồn ào mới xoay quanh các AI tạo video vào tháng 2.2023 khi ra mắt Gen-2. Dịch vụ này có thể tạo những clip dài ba giây nhìn còn sơ sài dựa trên các câu lệnh như “hình ảnh quang cảnh sa mạc từ máy bay không người lái.” Giờ thì Runway AI đã làm được hình ảnh chất lượng cao hơn đáng kể, dài khoảng 20 giây, theo lời đồng sáng lập và CEO của công ty Cristóbal Valenzuela.

Những công ty khởi nghiệp AI khác, bao gồm Haiper, Pika và Stability AI, cũng đang phát triển những công cụ có thể cho ra các clip ngắn phức tạp hơn với hình ảnh động và hiệu ứng âm thanh (như miếng thịt xông khói phát ra tiếng xèo xèo trên chảo rán). Những công ty khởi nghiệp này đang công bố các phần mềm tạo video mà ai cũng dùng được, rẻ tiền hoặc miễn phí. Những công cụ này đã phát triển nhanh hơn nhiều so với dự báo của ngay cả một số người làm trong lĩnh vực công nghệ — đủ nhanh để gây ra lo ngại về tính kinh tế của nghề làm video hay nguy cơ lan truyền thông tin sai lạc tinh vi.

Mẫu thử của Sora, ngay cả nếu không phải là một sản phẩm được công bố, cho thấy sự hứa hẹn của công nghệ này, theo Demi Guo, đồng sáng lập và CEO của Pika, vốn đã huy động được 55 triệu đô la Mỹ và đã ra mắt phần mềm AI tạo video vào cuối năm ngoái. “Nó cho thấy những phần mềm nào đang đi trước và chúng ta đang ở gần với video chất lượng thật sự tốt ra sao, cũng như chúng ta sắp sửa có thể thương mại hóa quyết liệt như thế nào,” Guo nói, và bổ sung rằng những ồn ào xoay quanh Sora lúc này đang giúp công ty của cô thu hút nhiều nhân sự triển vọng hơn.

Valenzuela cho biết Gen-2 đang được hàng triệu người sử dụng, bao gồm những chuyên gia ở các xưởng phim và đồ họa, vốn dựa vào phần mềm để mường tượng trước hoặc làm kịch bản phân cảnh. Những biên tập phim đang tạo ra các video bằng Runway và kết hợp chúng với các đoạn video khác để làm các cảnh quay bổ trợ hay tạo hiệu ứng hình ảnh, theo lời Valenzuela. Ca sĩ Madonna cũng sử dụng phần mềm này cho một số hình ảnh được chiếu trên sân khấu trong các nhạc hội. Khi Sora ra mắt, theo Valenzuela, các nền tảng AI tạo video, dù còn non trẻ, đã “bước qua ranh giới” để xuất hiện trong ý thức của đại chúng.

Sáng lập của Runway (từ trái sang): Alejandro Matamala-Ortiz, Cristóbal Valenzuela và Anastasis Germanidis trong văn phòng của họ tại Manhattan
HÌNH ẢNH: JUSTIN J WEE/THE NEW YORK TIMES/REDUX

Paul Trillo, đạo diễn từng làm phim quảng cáo cho xe F-150 của Ford, video ca nhạc và phim thể nghiệm, nói ông đã tích hợp hình ảnh và video do AI tạo ra vào quá trình sáng tạo của mình được một thời gian. Là một người dùng sớm của Runway, ông thấy phần mềm cho phép ông khám phá nhiều ý tưởng và hiệu ứng đặc biệt hơn. Ông không nghĩ rằng AI sẽ thay thế được các nhà làm phim, vì nó không thể tái hiện tính đa sắc thái hay sự ngẫu hứng trong sáng tạo của con người. Dẫu vậy, “có những điều AI mang lại thật sự thú vị hơn so với việc tự mình cầm camera lên và quay,” ông nói. “Ta như thể được bơi xuyên qua đại dương mờ mịt để khám phá những báu vật lạ lùng ở dưới đáy.”

Giada Pistilli, giám đốc về đạo đức của công ty khởi nghiệp AI Hugging Face, nói công nghệ này có triển vọng tạo ra hiệu ứng đặc biệt rẻ hơn và dễ dàng hơn cho phim ảnh, điều có thể đặc biệt hữu ích với những nhà làm phim ngân sách thấp. Nhưng theo quan điểm của cô, những vấn đề bất lợi, như việc lan truyền thông tin sai lạc và hình ảnh khiêu dâm do AI tạo ra dễ dàng hơn, lớn hơn những điểm tích cực. “Sẽ có người nói nó cũng như Photoshop thôi, cũng như bất kỳ công cụ khác từng tồn tại trước đó,” cô nói. “Tôi không đồng ý. Tôi cho rằng đặc điểm đầu tiên của AI là rất dễ mở rộng quy mô.”

Hiện giờ, công nghệ này còn những hạn chế rõ ràng. Các thử nghiệm do Bloomberg Businessweek thực hiện với phần mềm chuyển văn bản thành video từ Pika và Haiper, cũng như Gen-2 và Stable Video (của Stability AI) cho thấy các hệ thống này có thể thường xuyên không tạo ra được những video theo các lời gợi ý bằng văn bản đơn giản. Sora thì chưa cho đại chúng thử nghiệm, nhưng ngay cả một số clip do OpenAI lựa chọn kỹ càng để quảng cáo cũng cho thấy việc đảm bảo hình ảnh trên video tuân thủ chặt chẽ các định luật vật lý vẫn là chuyện không dễ dàng với phần mềm tạo video.

Tạo video bằng AI đòi hỏi về năng lực điện toán lớn hơn nhiều so với vận hành những con chatbot hay nền tảng tạo hình ảnh tĩnh, khiến quá trình vừa đắt đỏ, vừa chậm chạp hơn. Những thách thức công nghệ này có thể ảnh hưởng lên mô hình kinh doanh của hoạt động tạo video bằng AI, khi chi phí sau cùng sẽ phải chuyển sang cho khách hàng. Người dùng Runway sẽ phải trả tiền để sử dụng phần mềm và Valenzuela nói chi phí là một đô la Mỹ để tạo ra 20 giây video. Mức giá nhiều khả năng sẽ giảm xuống; thường các công nghệ trở nên rẻ hơn tương đối theo thời gian khi phần cứng và phần mềm được cải thiện. Valenzuela nói các xưởng làm hình ảnh và hiệu ứng hình ảnh chuyên nghiệp có thể thu mức phí 8 ngàn tới 25 ngàn đô la Mỹ — hay còn hơn thế — cho đoạn phim hoạt hình hoặc phim dài một phút. Người ta tiên đoán rằng tới cuối năm nay, sẽ có người tạo ra một bộ phim dài ít nhất 60 phút, trong đó mọi cảnh đều sử dụng một video do AI tạo ra.

Guo nói trong vòng một năm, Pika có thể có phần mềm tạo ra những clip chất lượng cao dài khoảng một phút, và trong hai năm có thể dùng phần mềm này để làm một bộ phim hoàn chỉnh. Nhưng những tác động lớn có thể xảy đến thậm chí còn trước các mốc thời gian đó: Hiện giờ nhiều clip mà mọi người xem trong các đoạn phim, video quảng cáo hay trên mạng xã hội đều dài dưới 10 giây.

Đọc nhiều

30 doanh nghiệp trong nước đáng theo dõi năm 2025

iKame đưa game Việt ra thế giới bằng công thức mới

Thuế quan của Trump: Hỗn loạn ở một hãng giao nhận

Techcombank đặt mục tiêu tăng trưởng tín dụng 16,4%, tiếp tục hướng tới nhóm đối tượng thu nhập khá

VPBank đặt mục tiêu tăng trưởng tín dụng 25%, nợ xấu xuống dưới 3% năm 2025

Thuế quan của Trump giáng đòn mạnh vào ngành sản xuất châu Á

Những bộ pin khổng lồ đang thay đổi lưới điện toàn cầu

Không dễ cứu thị trường bất động sản Trung Quốc

Mỹ và Trung Quốc nối lại đàm phán thương mại giữa căng thẳng thuế quan

Câu chuyện đầu tư của ba thế hệ

Lý do khó đo lường tác động của AI đối với năng suất lao động