Vào một đêm Hè mất ngủ, Andy Kosovskiy bắt đầu nghịch thử công cụ tạo video Veo 3 vừa ra mắt của Google. Kết quả là một video chỉ dài 8 giây nhưng có thể đã mở ra một kỷ nguyên mới cho mạng xã hội, và có lẽ cả ngành giải trí toàn cầu.
Kosovskiy, một chuyên viên marketing 22 tuổi đến từ New York, muốn kiểm tra khả năng sáng tạo của bản thân với các công cụ AI có thể biến vài dòng mô tả thành đoạn video ngắn nhìn như thật. Tận dụng sức hút khó cưỡng của những con vật lông xù đáng yêu cùng niềm đam mê của thế hệ Gen Z với các khoảnh khắc “vô tình bắt được qua camera”, Kosovskiy nhập câu lệnh: “Tạo video ban đêm từ camera an ninh, hình ảnh nhiễu, quay một bầy thỏ hoang đang nhảy trên tấm bạt lò xo sau nhà giữa rừng cây.” Để tăng phần kịch tính và tò mò, anh thêm chi tiết: “một con thỏ biến mất khi đang nhảy.”
Tối ngày 26.7, anh đăng đoạn video dài 8 giây này lên TikTok qua tài khoản “rachelthecatlovers” với dòng chú thích: “Vừa kiểm tra camera an ninh ở nhà… Hình như có tiết mục biểu diễn ở sân sau!” Phần còn lại do mạng xã hội tự lo. Chỉ trong vài tuần, video đã thu hút 237 triệu lượt xem, gần gấp đôi lượng khán giả xem trực tiếp trận Super Bowl. Hàng ngàn người đổ vào phần bình luận để tranh luận xem video này có thật không và chuyện gì đã xảy ra với con thỏ thứ sáu.
Chứng kiến phản ứng bùng nổ trên mạng, Kosovskiy nhận ra rằng Hollywood có thể đang bước vào một kỷ nguyên hoàn toàn mới. “Đây chỉ mới là khởi đầu,” anh nói. “Tôi nghĩ nó giống như cuộc Cách mạng Công nghiệp. Nó dân chủ hóa việc sáng tạo.”
Thỏ nhảy nhót, khỉ biết nói, trẻ sơ sinh được phỏng vấn… nếu từng lướt Instagram, TikTok, X hay YouTube gần đây, bạn hẳn đã bắt gặp những clip AI tương tự. Giới phê bình gọi đây là “rác AI”, một loại nội dung lười biếng, thường dùng động vật nói tiếng người hoặc những trò đùa cũ rít. Nhưng họ đang bỏ qua thực tế rằng các video này trông khá ổn, thường thu hút hàng triệu lượt xem và chia sẻ, trong khi chi phí gần như bằng 0.
“Không thể phủ nhận đây là một công nghệ tuyệt vời,” Hany Farid, giáo sư ngành kỹ thuật điện và khoa học máy tính tại Đại học California, Berkeley và là người sáng lập công ty phát hiện deepfake GetReal Security, nhận định. “Nghĩ mà xem, một thiếu niên bình thường giờ có thể làm những gì? Không cần ngân sách hàng triệu USD, không cần phim trường, không cần diễn viên. Chỉ cần trí tưởng tượng là đủ.”
Mọi chuyện diễn ra nhanh đến chóng mặt. Những tiến bộ trong thuật toán học máy, sức mạnh xử lý và mô hình ngôn ngữ lớn từ Google, OpenAI và các công ty khác đã giúp biến những cảm hứng bất chợt thành video chỉ trong vài phút. Google ra mắt Veo 3 vào tháng 5, cho phép tạo video 8 giây với giá 6 USD. Công cụ này giờ còn có thể thêm hiệu ứng âm thanh và biến kịch bản thành lời thoại khớp với khẩu hình nhân vật. So với năm 2023, thời điểm video AI nổi tiếng mô phỏng Will Smith ăn mì spaghetti vẫn còn lỗi và giả tạo, thì nay, một phiên bản tương tự đã nhìn chân thực đến mức khiến người xem cảm thấy… đói bụng.
Những người sáng tạo nội dung đang tận dụng các công cụ mới này. Jonathan Punski, anh cả trong gia đình có bốn anh em trai sống tại Montreal, là người điều hành trang mạng xã hội DogPack dành cho người nuôi thú cưng. Tháng 7 vừa rồi, lấy cảm hứng từ trào lưu kỳ lạ là video AI về… người tuyết biết nói, nhóm của anh bắt đầu đăng các đoạn video chó ngồi trong phòng thu podcast, “tám chuyện” về chủ của mình rồi phá lên cười.
Những câu đùa không quá sáng tạo, nhưng chỉ trong thời gian ngắn, tài khoản của nhóm đã thu hút hàng trăm ngàn người theo dõi trên TikTok và Instagram. Giờ đây, họ thậm chí nhận yêu cầu từ chủ nhân của những chú chó nổi tiếng trên mạng như Walter Geoffrey (chú bulldog Pháp) để đưa hình ảnh thú cưng của họ vào podcast mang tên “Pawdcast”.
“Mọi người đã chán ngấy những chiếc xe đẹp, đồng hồ đắt tiền, hay những lời khoe mẽ về việc ‘Ồ tôi kiếm nhiêu đây tiền,’” Punski chia sẻ. “Họ muốn được giải trí. Và giờ, bạn có thể khiến chó biết nói.”
Nhiều video AI hiện nay được thiết kế để thu hút người xem và lan truyền rộng rãi, như những cảnh tái hiện Pompeii trước thảm họa núi lửa phun trào dù không chính xác về mặt lịch sử, hay hình ảnh người La Mã cổ đại du hành giữa các vì sao trên tàu vũ trụ. Đa số nội dung khá ngớ ngẩn và lặp đi lặp lại, từ người nhảy trên giường làm bằng phô mai hoặc sôcôla, cho đến các hành tinh được phết lên bánh mì như mứt.
Một số nhà sáng tạo nội dung thừa nhận họ làm video chủ yếu để “chiều lòng” thuật toán mạng xã hội và kiếm tiền từ Instagram, YouTube hoặc TikTok, những nền tảng trả tiền cho video gốc có khả năng giữ chân người xem lâu hơn vài giây. “Bạn phải chơi đùa với tâm lý người xem,” Ali Sultan, 27 tuổi đến từ Lahore (Pakistan), người đứng sau loạt video giường làm từ đồ ăn trên TikTok, chia sẻ. “Clickbait là vậy.”
Số khác lại nghịch ngợm hơn khi đụng chạm đến các tài sản trí tuệ quý giá của Hollywood. Kabir Rajdev, một cậu bé 13 tuổi sống tại New York, bắt đầu dùng AI trong thời gian rảnh mùa Hè để tạo video về các stormtrooper trong Star Wars, những nhân vật vừa gọi nhau là “bro” vừa kể lại những tình huống dở khóc dở cười. Kabir dùng ChatGPT để viết kịch bản và gợi ý hashtag, sau đó dùng Veo 3 dựng video, rồi cắt ghép thành các clip dài hơn và chọn lọc bản hay nhất để đăng tải lên mạng. Mỗi video như vậy đều thu hút hàng ngàn lượt xem cùng vô số lời bình luận phấn khích (kiểu “hay hơn hẳn phim Disney”). Cha của Kabir, ông Rohit, cho biết con trai đã có ba hợp đồng tài trợ và kiếm được khoảng 1.500 USD. Tính đến nay, họ chưa nhận được thư cảnh cáo nào từ Lucasfilm thuộc Walt Disney (hãng này từ chối bình luận).
Từng có thời điểm Hollywood gần như nắm độc quyền lĩnh vực giải trí đại chúng. David Ellison, một thế hệ kế thừa của giới công nghệ Thung lũng Silicon, muốn tiếp nối truyền thống đó khi vừa sáp nhập Skydance Media với Paramount Global trong một thương vụ trị giá 8 tỉ USD khiến cả ngành rung chuyển. Trong khi đó, các YouTuber như Jimmy Donaldson (MrBeast) hay nhà sáng tạo nội dung dành cho thiếu nhi Ms. Rachel đang bắt đầu làm suy yếu sự thống trị của các hãng phim lớn.
Tuy nhiên, một số nhà làm phim khôn ngoan lại chọn cách đón nhận AI. Có công ty được Amazon hậu thuẫn cho biết họ đang lên kế hoạch sử dụng AI để tái dựng các đoạn phim bị thất lạc trong The Magnificent Ambersons, từng bị cắt bỏ khi hãng phim giành lại quyền dựng phim từ tay đạo diễn Orson Welles.
Các nền tảng mạng xã hội cũng có trách nhiệm kiểm soát lĩnh vực mới này. Dù phần lớn video AI chỉ mang tính giải trí, deepfake lại nhắm đến mục đích đánh lừa người xem. “Chẳng hạn như đoạn video xuất hiện hồi mùa Xuân, cho thấy Tổng thống Ukraine Volodymyr Zelenskiy kêu gọi binh sĩ đầu hàng. Không khó để hình dung về một làn sóng video giả mạo bằng AI có thể thao túng bầu cử, gian lận cá cược thể thao hoặc gây ra hỗn loạn xã hội.”
Hiện nay, Instagram, TikTok và các nền tảng khác chỉ yêu cầu người sáng tạo tự nguyện đánh dấu video của mình là do AI tạo ra. Kosovskiy, người làm video những chú thỏ nhảy trên bạt lò xo, thừa nhận anh quên đánh dấu lúc đầu và chỉ thêm vào sau đó. Các nền tảng này cần phải có “trách nhiệm tối thiểu” là tự động phát hiện và gắn nhãn cho các video AI, đồng thời điều tra và cấm người dùng tạo deepfake, theo giáo sư Sahana Udupa, chuyên ngành nhân học truyền thông tại Đại học LMU Munich.
“Video do AI tạo ra có thể chứa đựng thông tin sai lệch trắng trợn và ngôn từ kích động gây thù ghét, giống như những gì văn bản hay hình ảnh từng làm từ trước cả sự xuất hiện của các công cụ tạo ảnh bằng AI,” bà nói.
Tại Mỹ, các công ty công nghệ và giới quản lý dường như chưa thực sự quan tâm đến việc gắn nhãn hay kiểm soát nội dung. Điều họ thực sự quan tâm là mức độ tương tác cao và doanh thu quảng cáo đi kèm. Vì vậy, có lẽ chúng ta chỉ còn biết nín thở, hy vọng điều tốt đẹp sẽ đến… và tận hưởng những chú thỏ nhảy trên tấm bạt lò xo.