Meta đã xác nhận rằng họ sẽ tạm dừng kế hoạch bắt đầu huấn luyện các hệ thống trí tuệ nhân tạo của mình bằng cách sử dụng dữ liệu từ người dùng của họ tại Liên minh Châu Âu và Vương quốc Anh.
Động thái này đến từ sự chống đối của Cục Bảo vệ Dữ liệu Ireland (DPC), cơ quan quản lý dẫn đầu của Meta tại Liên minh Châu Âu, đang hành động thay mặt cho một số cơ quan bảo vệ dữ liệu trên toàn liên minh. Cục Bảo vệ Dữ liệu của Vương quốc Anh (ICO) cũng đã yêu cầu Meta tạm dừng kế hoạch cho đến khi họ có thể làm hài lòng các mối quan tâm mà họ đã đặt ra.
'DPC hoan nghênh quyết định của Meta tạm dừng kế hoạch huấn luyện mô hình ngôn ngữ lớn của mình bằng cách sử dụng nội dung công khai do người lớn chia sẻ trên Facebook và Instagram trên khắp Liên minh Châu Âu/Việu Á', DPC cho biết trong một tuyên bố vào thứ Sáu. 'Quyết định này đến sau sự hợp tác chặt chẽ giữa DPC và Meta. DPC, phối hợp với các cơ quan bảo vệ dữ liệu Liên minh Châu Âu khác, sẽ tiếp tục tương tác với Meta về vấn đề này.'
Mặc dù Meta đã bắt đầu tận dụng nội dung do người dùng tạo ra để huấn luyện trí tuệ nhân tạo ở các thị trường như Hoa Kỳ, nhưng các quy định nghiêm ngặt của GDPR châu Âu đã tạo ra trở ngại cho Meta - và các công ty khác - đang tìm cách cải thiện hệ thống trí tuệ nhân tạo của họ, bao gồm các mô hình ngôn ngữ lớn với tư liệu huấn luyện được tạo ra bởi người dùng.
Tuy nhiên, vào tháng trước, Meta bắt đầu thông báo cho người dùng về một thay đổi sắp tới trong chính sách bảo mật của họ, một thay đổi mà họ nói rằng sẽ cho phép họ sử dụng nội dung công khai trên Facebook và Instagram để huấn luyện trí tuệ nhân tạo, bao gồm nội dung từ các bình luận, tương tác với công ty, cập nhật trạng thái, ảnh và các phần mô tả liên quan. Công ty lập luận rằng họ cần phải làm điều này để phản ánh 'các ngôn ngữ đa dạng, địa lý và tham chiếu văn hóa của những người ở châu Âu'.
Các thay đổi này dự kiến sẽ có hiệu lực vào ngày 26 tháng 6 - cách đây 12 ngày. Nhưng kế hoạch này đã khơi dậy tổ chức không vụ lợi hoạt động bảo vệ quyền riêng tư NOYB (‘none of your business’) để nộp 11 khiếu nại với các quốc gia thành viên của Liên minh Châu Âu, lập luận rằng Meta đang vi phạm các khía cạnh khác nhau của GDPR. Một trong số đó liên quan đến vấn đề về chế độ chấp nhận so với từ chối, nơi mà việc xử lý dữ liệu cá nhân diễn ra, người dùng nên được hỏi ý kiến của họ trước thay vì yêu cầu họ phải từ chối.
Về phần của mình, Meta đang phụ thuộc vào một quy định GDPR gọi là 'lợi ích chính đáng' để lập luận rằng các hành động của họ tuân thủ với các quy định. Đây không phải lần đầu tiên Meta đã sử dụng cơ sở pháp lý này để tự biện hộ, khi trước đây họ đã làm như vậy để chứng minh việc xử lý của người dùng châu Âu cho quảng cáo có mục tiêu.
Luôn có vẻ như các cơ quan quản lý sẽ ít nhất đặt một sự hoãn việc thay đổi của Meta, đặc biệt khi công ty đã làm cho người dùng khó có thể 'từ chối' việc sử dụng dữ liệu của họ. Công ty nói rằng họ đã gửi hơn 2 tỷ thông báo thông báo cho người dùng về các thay đổi sắp tới, nhưng khác với những thông báo quan trọng khác mà được đặt ở đầu trang của người dùng, như gợi ý đi bỏ phiếu, các thông báo này xuất hiện cùng với các thông báo thông thường của người dùng: sinh nhật bạn bè, thông báo gắn thẻ ảnh, thông báo nhóm và nhiều hơn nữa. Vì vậy, nếu ai đó không thường xuyên kiểm tra thông báo của mình, rất dễ bỏ lỡ điều này.
Và những người đã thấy thông báo không tự động biết rằng có một cách để phản đối hoặc từ chối, vì nó đơn giản mời người dùng nhấp vào để tìm hiểu cách Meta sẽ sử dụng thông tin của họ. Không có gì cho thấy rằng có một lựa chọn ở đây.
Hơn nữa, người dùng kĩ thuật số không thể 'từ chối' việc sử dụng dữ liệu của họ. Thay vào đó, họ phải điền vào một biểu mẫu phản đối nơi họ đưa ra lập luận của mình vì sao họ không muốn dữ liệu của mình được xử lý - nó hoàn toàn do sự quyết định của Meta liệu yêu cầu này có được tuân theo không, mặc dù công ty nói rằng họ sẽ tuân theo mỗi yêu cầu.
Mặc dù biểu mẫu phản đối liên kết từ thông báo, nhưng bất kỳ ai tự chủ muốn tìm kiếm biểu mẫu phản đối trong cài đặt tài khoản của họ cũng phải rất nỗ lực.
Trên trang web của Facebook, họ phải trước hết nhấp vào ảnh hồ sơ của mình ở phía trên bên phải; nhấn vào 'cài đặt & quyền riêng tư'; chạm vào 'trung tâm quyền riêng tư'; cuộn xuống và nhấp vào phần 'AI tạo sinh tại Meta'; cuộn xuống tiếp tục qua một loạt liên kết đến một phần có tiêu đề 'tài nguyên khác'. Liên kết đầu tiên trong phần này được gọi là 'Meta sử dụng thông tin cho mô hình AI tạo sinh' và họ cần đọc qua khoảng 1.100 từ trước khi đến một liên kết rõ ràng đến biểu mẫu 'quyền phản đối' của công ty. Tương tự đối với ứng dụng di động Facebook.
Trong tuần trước, khi được hỏi vì sao quy trình này yêu cầu người dùng phải điền biểu mẫu phản đối thay vì chọn vào, quản lý truyền thông chính sách của Meta Matt Pollard đã đưa TechCrunch đến bài đăng blog hiện tại của họ, trong đó nói: 'Chúng tôi tin rằng cơ sở pháp lý này ['lợi ích chính đáng'] là sự cân đối phù hợp nhất cho việc xử lý dữ liệu công cộng ở quy mô cần thiết để huấn luyện các mô hình trí tuệ nhân tạo, đồng thời tôn trọng quyền của mọi người.'
Để dịch điều này, việc chuyển đổi này thành lựa chọn có thể không tạo ra đủ 'quy mô' theo cách mọi người sẵn lòng cung cấp dữ liệu của họ. Vì vậy, cách tốt nhất để vượt qua điều này là phát triển một thông báo đơn lẻ trong số các thông báo khác của người dùng; ẩn biểu mẫu phản đối sau nhiều nhấp chuột cho những ai tìm kiếm 'tự chủ' mà không phụ thuộc vào việc từ chối độc lập; và sau đó buộc họ phải chứng minh quyền phản đối của họ, thay vì cho họ một quyền từ chối rõ ràng.
Trong bài đăng blog cập nhật vào thứ Sáu, Giám đốc cấp cao mối quan hệ toàn cầu của Meta về chính sách bảo mật Stefano Fratta cho biết rằng họ 'thất vọng' với yêu cầu họ đã nhận được từ DPC.
'Đây là một bước lùi cho sự sáng tạo châu Âu, cạnh tranh trong phát triển trí tuệ nhân tạo và trì hoãn thêm mang lại những lợi ích của trí tuệ nhân tạo cho người dân châu Âu,' Fratta viết. 'Chúng tôi vẫn rất tự tin rằng cách tiếp cận của chúng tôi tuân thủ với luật và quy định châu Âu. Huấn luyện trí tuệ nhân tạo không phải là riêng của dịch vụ của chúng tôi, và chúng tôi thông thoáng hơn so với nhiều đối thủ trong ngành của chúng tôi.'
Cuộc đua vũ khí AI
Không có gì mới, và Meta đang tham gia vào một cuộc đua vũ khí trí tuệ nhân tạo đã đưa ra ánh sáng cho kho tàng dữ liệu lớn mà Công nghệ lớn nắm giữ về chúng ta.
D earlier this year, Reddit tiết lộ rằng họ đã ký hợp đồng để kiếm hơn 200 triệu đô la trong những năm tới cho việc cấp phép dữ liệu của họ cho các công ty như OpenAI - nhà sản xuất ChatGPT và Google. Và công ty của sau đang phải đối diện với các mức phạt lớn vì lợi dụng nội dung tin tức bản quyền để huấn luyện các mô hình trí tuệ nhân tạo của mình.
Nhưng những nỗ lực này cũng đã làm nổi bật những cách mà các công ty sẽ tiếp tục để đảm bảo rằng họ có thể tận dụng dữ liệu này trong phạm vi của pháp lệnh hiện có; 'tự chủ' ít khi nằm trong kế hoạch và quá trình từ chối thường rất khó khăn. Chỉ trong tháng trước, có người phát hiện một số từ ngữ đáng ngờ trong chính sách bảo mật Slack hiện tại mà ngụ ý rằng họ sẽ có khả năng tận dụng dữ liệu người dùng để huấn luyện các hệ thống trí tuệ nhân tạo của họ, với người dùng chỉ có thể từ chối bằng cách gửi email đến công ty.
Và năm ngoái, Google cuối cùng cung cấp cho các nhà xuất bản trực tuyến cách để từ chối việc huấn luyện các mô hình của họ bằng cách cho phép họ chèn một đoạn mã vào các trang web của họ. Còn OpenAI, họ đang xây dựng một công cụ dành riêng để cho phép nhà sản xuất nội dung từ chối huấn luyện các trí tuệ nhân tạo sáng tạo của họ; điều này dự kiến sẽ sẵn sàng vào năm 2025.
Mặc dù Meta đã tạm dừng việc huấn luyện trí tuệ nhân tạo của mình trên nội dung công khai của người dùng tại châu Âu hiện đang ở trạng thái đóng băng, có lẽ nó sẽ xuất hiện trở lại dưới một hình thức khác sau khi tham