Google AI đang ăn mọi thứ! Thu thập tất cả nội dung công khai để đào tạo AI, chính sách quyền riêng tư đã được cập nhật

2023-07-10 09:52:10

Nguồn gốc: Qubit

Nguồn hình ảnh: Được tạo bởi Unbounded AI‌

Từ giờ trở đi, mỗi từ bạn nói công khai trên Internet có thể được Google sử dụng để đào tạo AI!

Đúng vậy, sau khi sơn, tác phẩm viết cũng sẽ được dùng để nuôi các mô hình lớn——

Cho dù đó là blog công nghệ, mã, bài báo hay bất kỳ thứ gì bạn đăng công khai trực tuyến, nó đều có thể được đưa vào "Google Big Model Blender", ngay cả khi có bản quyền.

Chỉ trong tuần này, Google đã cập nhật chính sách bảo mật của mình để làm rõ rằng họ có quyền thu thập tất cả nội dung công khai trực tuyến để xây dựng các công cụ AI của mình.

Cư dân mạng bùng nổ ngay lập tức. Ai đó cảnh báo rằng "Google đang thu thập dữ liệu mọi thứ":

Một khi Google đọc được những gì bạn viết thì có nghĩa đó là "tài sản" của họ.

Một số cư dân mạng có ý kiến bi quan hơn:

Chẳng bao lâu nữa, tất cả các nhà sản xuất nội dung sẽ là AI.

Vì vậy, điều gì xảy ra với phiên bản Chính sách quyền riêng tư này?

Dành cho các sản phẩm AI đào tạo như Bard

Mọi thứ phải bắt đầu với chính sách bảo mật được cập nhật của Google những ngày này.

Trong chính sách bảo mật mới nhất của mình, Google đã thêm một điều khoản mô hình AI về "nghiên cứu và phát triển":

Google sử dụng thông tin để cải thiện các dịch vụ của chúng tôi và phát triển các sản phẩm, tính năng và công nghệ mới nhằm mang lại lợi ích cho người dùng của chúng tôi và công chúng. Ví dụ: chúng tôi sử dụng thông tin công khai để giúp đào tạo các mô hình AI của Google cũng như xây dựng các sản phẩm và tính năng hữu ích (chẳng hạn như các tính năng của Google Dịch, Bard và Cloud AI).

Nói cách khác, đó là sử dụng tất cả thông tin công khai có thể được thu thập trong quá trình đào tạo các sản phẩm hoặc chức năng liên quan đến AI, chẳng hạn như Google Dịch, Bard và Cloud AI.

Vì vậy, chính xác thông tin công khai này bao gồm những gì?

Chẳng hạn như thông tin về Internet, mạng và các hoạt động khác, bao gồm thông tin về cụm từ tìm kiếm, ứng dụng và tương tác của trình duyệt với các dịch vụ của Google cũng như việc sử dụng các dịch vụ của Google trên các trang web và ứng dụng của bên thứ ba.

Nói cách khác, không chỉ các blog và nội dung khác đã được công khai trước đây mà cả Google Tài liệu được xuất bản trực tuyến hoặc một số bài đăng có chứa thông tin cá nhân, cũng có thể được Google thu thập để đào tạo người mẫu lớn.

Tất nhiên, những nội dung này hiện nay vẫn chỉ giới hạn ở mức "thông tin đại chúng".

Các dịch vụ email như Gmail do Google cung cấp vẫn không được thu thập thông tin vào dữ liệu.

Hơn nữa, Google cũng đã nêu rõ trong chính sách bảo mật của mình rằng họ cũng có thể sử dụng thông tin cá nhân hoặc thông tin công khai đó vì các lý do khác, chẳng hạn như ngăn chặn các mối đe dọa bảo mật, đánh giá thông tin, bảo trì dịch vụ, quảng cáo được cá nhân hóa hoặc luật pháp.

Nhưng tại sao Google lại cập nhật chính sách này vào thời điểm này?

"AI thách thức bản quyền văn bản"

Có lẽ nó cũng liên quan đến hoạt động "giới hạn hiện tại" của các công ty như Reddit và Twitter.

Đầu tiên, vào tháng 4 năm nay, Reddit đã thông báo rằng họ sẽ thu phí đối với các công ty truy cập vào API.

Giám đốc điều hành công ty tin rằng cơ sở dữ liệu của Reddit rất có giá trị, nhưng họ không muốn cung cấp miễn phí những nội dung có giá trị này cho các công ty công nghệ lớn.

Sau đó, Twitter cũng bắt đầu hạn chế luồng Twitter với lý do "Tôi không muốn các công ty AI bán dâm dữ liệu".

Loạt chính sách này có ảnh hưởng nghiêm trọng đến người dùng và các công cụ của bên thứ ba. Ví dụ, Reddit đã gây ra một cuộc phản đối trên diễn đàn thảo luận quy mô lớn. Nhiều người điều hành đã trực tiếp đóng cửa diễn đàn của chính họ để phản đối hoạt động của Reddit. Nhiều người đang lên án, và một số cư dân mạng thậm chí còn nói rằng "Twitter đã bị giết."

Nhưng dù thế nào đi nữa, việc để AI cung cấp dữ liệu gái mại dâm miễn phí hiện nay là một mâu thuẫn không thể bỏ qua.

Về vấn đề Google AI thu thập dữ liệu, một số cư dân mạng tỏ ra nghi ngờ:

Tại sao trước khi có Internet, chẳng hạn như công cụ tìm kiếm, cũng có các thao tác như thu thập dữ liệu, nhưng mọi người lại chống lại "AI thu thập thông tin".

Một số cư dân mạng phản hồi:

Đó thực chất là vấn đề bản quyền. Nếu bạn chỉ trích dẫn tài liệu có bản quyền, thì bạn không nhất thiết vi phạm bản quyền, nhưng nếu bạn sử dụng AI để "khuấy động và dọn dẹp" nội dung có bản quyền và việc này được hợp pháp hóa, thì về bản chất bản quyền đã chết.

Chính vì điều này mà anh ấy bi quan về vấn đề này:

Nếu ai đó sao chép blog của bạn mà không ghi rõ nguồn, hoặc sử dụng mã nguồn mở của bạn cho các dịch vụ trả phí hoặc sử dụng câu trả lời của bạn trên StackOverflow làm phương thức trả lời câu hỏi, bạn có thể chấp nhận rằng điều này sẽ xảy ra không? Mọi thứ tôi làm đều miễn phí. Nhưng bây giờ nếu AI muốn tôi biến mất, thì tôi sẽ biến mất.

Tất nhiên, cũng có cư dân mạng tiếp nhận việc đưa ra chính sách này, và không thể thiếu sự cảnh giác với ý thức phòng ngừa của chính mỗi người:

Xem kỹ chính sách mới và để ý xem chúng tôi đang rò rỉ trực tuyến bao nhiêu thông tin.

Vậy, bạn nghĩ gì về điều này?

Liên kết tham khảo: [1] [2]

Xem bản gốc

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

1 thích

Phần thưởng
1
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
GT 2025 Q2 Burn Completed
13k Phổ biến
Michael Saylor Hints at Buying BTC
10k Phổ biến
BTC
30453k Phổ biến
4contentstar
10720k Phổ biến
5NADA
11186k Phổ biến
6BOME
11565k Phổ biến
7BTC
30453k Phổ biến
8SMILE
9062k Phổ biến
9比特币
13442k Phổ biến

Ghim

sơ đồ trang web