Ai sở hữu nội dung do AI tạo ra?

BBWV - Những ứng dụng AI (trí tuệ nhân tạo) như GitHub Copilot và ChatGPT “ngấu nghiến” một khối lượng khổng lồ nội dung do người tạo ra, để chúng tự tạo ra những nội dung mới. Câu hỏi lúc này là: Ai sở hữu những “nội dung mới” này?

Title

Tác giả: Dina Bass

12 tháng 01, 2023 lúc 2:26 PM

Tháng 11.2022 vừa qua, một luật sư cùng một nhà lập trình tên Matthew Butterick đâm đơn kiện các hãng công nghệ GitHub, Microsoft, và OpenAI, với lý do công cụ GitHub Copilot (một AI chuyên lập trình) thật ra đang “đạo văn” với nạn nhân là vô số nhà lập trình con người. Cụ thể, theo lập luận của Butterick, những nhà lập trình được nhắc đến cùng những dự án lập trình mã nguồn mở của họ chưa từng chủ động cấp phép cho bất cứ công cụ AI nào sử dụng lại những đoạn mã do họ viết ra.

butterick
Butterick. Ảnh: Tag Christof / The New York Times / Redux

Đây có lẽ là phát súng đầu tiên trong cuộc chiến pháp lý giữa AI và những ý niệm về quyền sở hữu, quyền tác giả, và tính xác thực, đặc biệt trên môi trường mạng. Những công cụ AI này đã có một năm 2022 rực rỡ, nhưng 2023 có thể là năm mà người ta thật sự nghiền ngẫm một cách nghiêm túc về những xung đột mang tính pháp lý như vậy.

Cách thức hoạt động của Copilot và những công cụ cùng loại “ngốn” một lượng lớn nội dung kỹ thuật số có sẵn trên mạng để “dạy” chính nó học cách làm ra một sản phẩm tương tự. Vì lý do này, giới công nghệ ở Thung lũng Silicon gọi đây là “AI sinh dữ liệu” (generative AI), vì nó tạo ra được nội dung mới không chỉ giới hạn ở những dòng mã lập trình, mà còn là những đoạn phim hoặc hình ảnh. Suốt nhiều năm qua, người ta luôn tiên đoán những công cụ AI này chính là tương lai, và với sự ra mắt của công cụ tự tạo hình ảnh DALL-E 2 và chatbot ChatGPT (đều của OpenAI), có vẻ như tương lai đã đứng ngay trước cửa.

Những nội dung được các công cụ này tạo ra không phải lúc nào cũng “chuẩn chỉnh,” chẳng hạn hình vẽ người của DALL-E đôi khi mang những gương mặt méo mó hoặc tay thừa ngón, nhưng so với những thế hệ AI trước, chúng đã tốt hơn rất nhiều.

Trong lúc đó, Copilot cho phép lập trình viên làm việc nhanh hơn bằng cách đề xuất trước những đoạn mã họ định gõ. Tất cả những gì Copilot hiểu về lập trình đến từ việc nghiên cứu vô số đoạn mã viết bởi con người, và vụ kiện đầu bài nói rằng hành vi này đang vi phạm bản quyền phần mềm mã nguồn mở, vốn cho phép các đoạn mã được sử dụng vào mục đích phi thương mại.

Một số lập trình viên thì khẳng định công khai rằng những đoạn mã do Copilot đề xuất đôi khi là sao chép y hệt chính sản phẩm của họ. Về phần mình, GitHub thừa nhận công cụ AI của họ có thể “copy” ý tưởng của người khác trong vài trường hợp hãn hữu, và cho biết đang bắt đầu áp dụng các bộ lọc để hạn chế tình trạng này.

Xung đột nêu ra một hướng mới cho câu hỏi lâu nay về bản chất của khái niệm “sử dụng hợp lý” (fair use) khi ai nấy dựa vào các tác phẩm sáng tạo làm nguồn tài liệu cho tác phẩm của chính họ, chẳng hạn như một mẩu nhạc và những loại nghệ thuật thị giác. Câu chuyện giống như khi nhóm nhạc Vanilla Ice lấy mẫu nhạc của David Bowie và Under Pressure của Queen (vốn dẫn đến một vụ kiện và sau đó đã được dàn xếp).

Nhưng nếu “nhóm nhạc Vanilla Ice” trong trường hợp này là một cỗ máy thì sao?

"Tôi chắc chắn rằng sẽ có những vụ kiện tụng… Nhưng vẫn còn đó câu hỏi ‘Bản chất của điều luật này là gì?’”

Zahrr Said, một giảng viên luật tại ĐH Washington, cho biết công nghệ mới sẽ thử thách khung pháp lý của những điều luật hiện có. “Sẽ đầy người nói rằng, về cơ bản, khi bạn sử dụng nội dung có bản quyền hoặc quyền tác giả để dạy AI học, điều đó hoàn toàn nằm trong phạm trù ‘sử dụng hợp lý,’ đúng không?” bà nói. “Nhưng nếu xét từng ca một, thì không có gì chắc chắn đúng.”

Oge de Moor, phó giám đốc GitHub Next, vườn ươm của công cụ Copilot, bình luận rằng lập trình viên con người xưa giờ vẫn luôn tham khảo công trình của người khác để dùng vào tác phẩm của mình. “Những mô hình (AI) này cũng không khác gì,” ông nói. “Chúng đọc rất nhiều đoạn mã nguồn để tự tạo ra mã nguồn của riêng mình, nên chúng tôi cho rằng đây là cái cớ đúng đắn và xứng đáng.” Phản hồi yêu cầu bình luận về vụ kiện, GitHub nói họ “luôn cam kết sáng tạo một cách có trách nhiệm.” Microsoft và OpenAI từ chối đưa ra bình luận về vụ việc.

Margaret Mitchell, một nhà đạo đức học về AI, cho rằng các công ty AI có trách nhiệm cân nhắc liệu họ có đang xây dựng các công cụ AI một cách đúng đắn hay không, không chỉ về mặt pháp lý. “Tôi tin chắc sẽ có những vụ kiện, và tôi cũng chắc Microsoft cùng nhiều công ty công nghệ khác sẽ sử dụng luật sư để xem xét khía cạnh pháp lý và nói rằng chuyện này hợp pháp,” bà nói. “Nhưng vẫn còn đó câu hỏi ‘Bản chất của điều luật này là gì?’”

Bên ngoài phòng xử, các ý kiến trái chiều đang nổi lên xung quanh câu hỏi ai (nếu có) nên được xem là tác giả của sản phẩm do AI tạo ra. Hãng bán hình ảnh Getty Images cho biết trang của họ sẽ không đăng ảnh do AI tạo ra, và đầu năm nay, Văn phòng bản quyền Mỹ (US Copyright Office) đã từ chối một nghệ sĩ khi người này yêu cầu được cấp bản quyền cho một tấm ảnh tạo ra bởi AI, với lập luận mình là đại diện cho thuật toán tạo ra bức ảnh. Văn phòng cho biết tác phẩm “thiếu quyền tác giả con người.”

Hiện chúng ta vẫn chưa rõ hành vi gõ các ký tự vào DALL-E có được tính là “nỗ lực con người” hay không, nhưng giới nghệ sĩ đã và đang sử dụng trí tuệ nhân tạo vào công việc sáng tác của mình. Năm 2019, một cặp đôi nghệ sĩ là Holly Herndon và Mat Dryhurst cho ra mắt album mang tên Proto sử dụng giọng hát tạo bởi AI. Họ còn tạo ra một “nhạc cụ giọng hát” AI mang tên Holly+, cho phép người dùng tải lên một file nhạc bất kỳ và nghe nó được hát bằng giọng của Herndon.

Do lo ngại về yếu tố đạo đức khi sử dụng giọng người khác mà không được sự đồng ý của họ, hai nghệ sĩ này đã “dạy” cho công cụ AI hát bằng giọng của chính mình, và thuyết phục hàng trăm người khác làm theo, và gọi đó là “những buổi lễ huấn luyện lớn tại Berlin.”

Herndon và Dryhurst còn tạo ra một công cụ mang tên Have I Been Trained? (tạm dịch: Tôi đã được dạy sao?) cho bất cứ ai muốn kiểm tra xem liệu tác phẩm của họ đã được dùng để dạy học cho Stable Diffusion hay chưa (đây là một AI tự tạo hình ảnh). Công cụ này cho phép các nghệ sĩ được lựa chọn xem họ có muốn đưa tác phẩm của mình vào cơ sở dữ liệu AI hay không. Những câu trả lời được gửi đến Stability.ai, rồi sau được dùng để chạy Stable Diffusion.

Tháng 12.2022, Dryhurst cho biết phiên bản tiếp theo của Stability.ai chấp nhận tôn trọng nguyện vọng của 75% người được khảo sát rằng họ không muốn đưa tác phẩm của mình vào cơ sở dữ liệu của AI này. Còn OpenAI cũng cho biết họ đang hợp tác cùng giới nghệ sĩ để phát triển “những giải pháp thực tế và giàu tiềm năng phát triển.” Tuy nhiên, công cụ của Dryhurst không làm việc với mô hình của OpenAI, vì công ty này (OpenAI) không tiết lộ họ dùng loại dữ liệu gì để dạy AI của mình.

Theo Bloomberg

Theo phattrienxanh.baotainguyenmoitruong.vn

https://phattrienxanh.baotainguyenmoitruong.vn/ai-so-huu-noi-dung-do-ai-tao-ra-50207.html

#AI
#OpenAI
#GitHub
#GitHub Copilot
#trí tuệ nhân tạo