“Bước lớn” của Google sẽ giết chết bao nhiêu công ty dán nhãn AI?

Nguồn gốc: AI New Intelligence

Nguồn hình ảnh: Được tạo bởi AI‌ không giới hạn

Nếu AI thế hệ hiện tại giống như một đứa trẻ đang lớn lên mạnh mẽ, thì dữ liệu liên tục chính là thức ăn nuôi dưỡng nó phát triển.

Chú thích dữ liệu là quá trình tạo ra “món ăn” này.

Tuy nhiên, quá trình này thực sự tốn nhiều công sức và mệt mỏi.

"Người chú thích" thực hiện chú thích không chỉ cần liên tục xác định các đối tượng, màu sắc, hình dạng, v.v. khác nhau trong ảnh mà đôi khi còn cần phải làm sạch và xử lý trước dữ liệu.

Với sự tiến bộ không ngừng của công nghệ AI, những hạn chế của việc chú thích dữ liệu thủ công ngày càng trở nên rõ ràng. Chú thích dữ liệu thủ công không chỉ tốn thời gian, công sức mà chất lượng đôi khi khó đảm bảo.

Để giải quyết những vấn đề này, Google gần đây đã đề xuất một phương pháp sử dụng các mô hình lớn để thay thế con người trong việc chú thích tùy chọn, được gọi là Học tăng cường phản hồi AI (RLAIF).

Kết quả nghiên cứu cho thấy RLAIF có thể tạo ra những cải tiến tương đương với học tăng cường bằng phản hồi của con người (RLHF) mà không cần dựa vào chú thích của con người, với tỷ lệ chiến thắng của cả hai đều là 50%. Trong khi đó, cả RLAIF và RLHF đều vượt trội hơn chiến lược cơ bản về tinh chỉnh có giám sát (SFT).

Những kết quả này cho thấy RLAIF không cần phải dựa vào chú thích thủ công và là giải pháp thay thế khả thi cho RLHF. **

Vậy, nếu công nghệ này thực sự được quảng bá và phổ biến trong tương lai, liệu nhiều công ty vẫn dựa vào “hộp kéo” thủ công để chú thích dữ liệu có thực sự bị đẩy vào ngõ cụt từ nay trở đi?

1 Trạng thái hiện tại của chú thích dữ liệu

Nếu muốn tóm tắt đơn giản hiện trạng của ngành chú thích trong nước thì đó là: **Khối lượng công việc lớn nhưng hiệu quả không cao, lại còn tình trạng bạc bẽo. **

Các công ty dán nhãn được mệnh danh là nhà máy dữ liệu trong lĩnh vực AI và thường tập trung ở những khu vực có nguồn nhân lực dồi dào như Đông Nam Á, Châu Phi hay Hà Nam, Sơn Tây, Sơn Đông của Trung Quốc.

Để kiểm soát chi phí, các ông chủ công ty dán nhãn sẽ thuê mặt bằng trong quận, lắp đặt máy tính, khi có đơn hàng sẽ tuyển người ở gần đó làm bán thời gian, không có đơn hàng sẽ giải tán. và nghỉ ngơi.

Nói một cách đơn giản, loại công việc này hơi giống với công việc trang trí tạm thời bên lề đường.

Tại trạm làm việc, hệ thống sẽ ngẫu nhiên cung cấp cho "người chú thích" một bộ dữ liệu, thường bao gồm một số câu hỏi và một số câu trả lời.

Sau đó, “người chú thích” trước tiên cần đánh dấu loại câu hỏi thuộc loại nào, sau đó chấm điểm và xếp hạng các câu trả lời.

Trước đây, khi nói về khoảng cách giữa các mẫu lớn trong nước và các mẫu lớn tiên tiến như GPT-4, họ đã tóm tắt nguyên nhân dẫn đến chất lượng dữ liệu trong nước thấp.

Nhưng tại sao chất lượng dữ liệu lại không cao? Một phần nguyên nhân nằm ở “dây chuyền lắp ráp” chú thích dữ liệu.

Hiện tại, có hai loại nguồn dữ liệu cho các mô hình lớn của Trung Quốc: một là bộ dữ liệu nguồn mở; hai là dữ liệu Internet Trung Quốc được thu thập thông qua trình thu thập dữ liệu.

**Một trong những lý do chính khiến hiệu suất của các mô hình lớn của Trung Quốc không đủ tốt là do chất lượng dữ liệu Internet **Ví dụ: các chuyên gia thường không sử dụng Baidu khi tìm kiếm thông tin.

Do đó, khi gặp một số vấn đề về dữ liệu chuyên nghiệp và theo chiều dọc hơn, chẳng hạn như chăm sóc y tế, tài chính, v.v., cần phải hợp tác với đội ngũ chuyên nghiệp.

Nhưng lúc này, vấn đề lại nảy sinh: đối với các đội chuyên nghiệp, không chỉ thời gian quay lại dữ liệu kéo dài mà những người đi đầu cũng có khả năng bị thua lỗ.

Ví dụ: nếu một nhóm chú thích nào đó dành rất nhiều tiền và thời gian để tạo ra nhiều dữ liệu thì những người khác có thể chỉ đóng gói và mua nó với số tiền nhỏ.

Đối mặt với tình trạng “tiến thoái lưỡng nan về người lái tự do” như vậy, các mẫu xe lớn trong nước đã rơi vào tình thế khó xử kỳ lạ là có nhiều dữ liệu nhưng chất lượng lại thấp.

Trong trường hợp đó, một số công ty AI hàng đầu của nước ngoài, chẳng hạn như OpenAI, giải quyết vấn đề này như thế nào?

Trên thực tế, về mặt chú thích dữ liệu, OpenAI vẫn chưa từ bỏ việc sử dụng lao động giá rẻ và cường độ cao để giảm chi phí.

Ví dụ, trước đây có thông tin tiết lộ rằng họ đã thuê một số lượng lớn công nhân Kenya để dán nhãn thông tin độc hại với mức giá 2 USD/giờ.

**Nhưng điểm khác biệt chính nằm ở cách giải quyết các vấn đề về chất lượng dữ liệu và hiệu quả chú thích. **

Cụ thể, khác biệt lớn nhất giữa OpenAI và các công ty trong nước ở vấn đề này là làm thế nào để giảm thiểu tác động “chủ quan” và “bất ổn” của chú thích thủ công.

2 Cách tiếp cận của OpenAI

Để giảm bớt tính “chủ quan” và “không ổn định” của những người chú thích con người như vậy, OpenAI áp dụng gần như hai chiến lược chính:

1. Kết hợp phản hồi nhân tạo và học tăng cường;

Trước tiên hãy nói về điểm đầu tiên. Về phương pháp gắn nhãn, điểm khác biệt lớn nhất giữa phản hồi thủ công của OpenAI và phản hồi trong nước là nó chủ yếu sắp xếp hoặc chấm điểm hành vi của hệ thống thông minh, thay vì sửa đổi hoặc gắn nhãn đầu ra của nó.

Hành vi của một hệ thống thông minh đề cập đến việc hệ thống thông minh thực hiện một loạt hành động hoặc quyết định dựa trên các mục tiêu và chiến lược của chính nó trong một môi trường phức tạp.

Ví dụ: chơi trò chơi, điều khiển robot, nói chuyện với một người, v.v.

Đầu ra của một hệ thống thông minh đề cập đến việc tạo ra kết quả hoặc câu trả lời dựa trên dữ liệu đầu vào trong một tác vụ đơn giản, chẳng hạn như viết một bài báo hoặc vẽ một bức tranh.

Nói chung, hành vi của các hệ thống thông minh khó đánh giá về mặt “đúng” hay “sai” hơn so với đầu ra và cần được đánh giá về mặt ưu tiên hoặc mức độ hài lòng.

Loại hệ thống đánh giá này dựa trên “sở thích” hoặc “sự hài lòng” không yêu cầu sửa đổi hoặc chú thích nội dung cụ thể, do đó làm giảm tác động của tính chủ quan của con người, trình độ hiểu biết và các yếu tố khác đến chất lượng và độ chính xác của chú thích dữ liệu.

Đúng là các doanh nghiệp trong nước cũng sẽ sử dụng các hệ thống tương tự như “sắp xếp” và “chấm điểm” khi dán nhãn, nhưng do thiếu “mô hình khen thưởng” như OpenAI làm chức năng khen thưởng nhằm tối ưu hóa chiến lược của hệ thống thông minh, chẳng hạn như " sắp xếp" và "chấm điểm" "Cho điểm" về cơ bản vẫn là một phương pháp sửa đổi hoặc chú thích đầu ra.

2. Kênh nguồn dữ liệu đa dạng và quy mô lớn;

Nguồn chú thích dữ liệu chính ở Trung Quốc là các công ty chú thích bên thứ ba hoặc nhóm công ty công nghệ tự xây dựng. Các nhóm này chủ yếu bao gồm sinh viên đại học và thiếu tính chuyên nghiệp cũng như kinh nghiệm để cung cấp phản hồi hiệu quả và chất lượng cao.

Ngược lại, phản hồi thủ công của OpenAI đến từ nhiều kênh và nhóm.

OpenAI không chỉ sử dụng các bộ dữ liệu nguồn mở và trình thu thập thông tin Internet để lấy dữ liệu mà còn hợp tác với nhiều công ty và tổ chức dữ liệu, như Scal AI, Appen, Lionbridge AI, v.v., để có được dữ liệu chất lượng cao và đa dạng hơn.

So với các đối tác trong nước, phương pháp gắn nhãn của các công ty và tổ chức dữ liệu này “tự động” và “thông minh” hơn nhiều.

Ví dụ: Scal AI sử dụng một kỹ thuật có tên là Snorkel, một phương pháp ghi nhãn dữ liệu dựa trên quá trình học tập được giám sát yếu, có thể tạo ra các nhãn chất lượng cao từ nhiều nguồn dữ liệu không chính xác.

Đồng thời, Snorkel cũng có thể sử dụng nhiều tín hiệu khác nhau như quy tắc, mô hình và cơ sở kiến thức để thêm nhãn vào dữ liệu mà không cần gắn nhãn trực tiếp cho từng điểm dữ liệu theo cách thủ công. Điều này có thể làm giảm đáng kể chi phí và thời gian của việc chú thích thủ công.

Khi chi phí và chu kỳ chú thích dữ liệu được rút ngắn, các công ty dữ liệu có lợi thế cạnh tranh này có thể chọn các phân mục có giá trị cao, độ khó cao và ngưỡng cao, chẳng hạn như lái xe tự động, mô hình ngôn ngữ lớn, dữ liệu tổng hợp, v.v. năng lực cạnh tranh cốt lõi và lợi thế khác biệt của nó.

Bằng cách này, tình thế tiến thoái lưỡng nan về việc “người đi đầu sẽ phải gánh chịu” cũng đã được loại bỏ bởi các rào cản mạnh mẽ về công nghệ và ngành.

3 Tiêu chuẩn hóa VS xưởng nhỏ

Có thể thấy, **Công nghệ dán nhãn tự động AI sẽ thực sự loại bỏ chỉ những công ty dán nhãn vẫn đang sử dụng cách dán nhãn hoàn toàn thủ công. **

Mặc dù chú thích dữ liệu nghe có vẻ là một ngành “sử dụng nhiều lao động”, nhưng khi đi sâu vào chi tiết, bạn sẽ thấy rằng việc theo đuổi dữ liệu chất lượng cao không phải là một nhiệm vụ dễ dàng.

Được đại diện bởi Scal AI, một kỳ lân chú thích dữ liệu ở nước ngoài, Scal AI không chỉ sử dụng nguồn nhân lực giá rẻ từ Châu Phi và các nơi khác mà còn tuyển dụng hàng chục tiến sĩ để xử lý dữ liệu chuyên nghiệp trong nhiều ngành khác nhau.

Chất lượng chú thích dữ liệu là giá trị lớn nhất mà AI quy mô cung cấp cho các công ty mô hình lớn như OpenAI.

Để đảm bảo chất lượng dữ liệu ở mức độ lớn nhất, ngoài việc sử dụng chú thích có sự hỗ trợ của AI nêu trên, một cải tiến lớn khác của **Scale AI là nền tảng dữ liệu hợp nhất. **

Các nền tảng này bao gồm Kiểm tra quy mô, Phân tích quy mô, Chất lượng dữ liệu quy mô, v.v. Thông qua các nền tảng này, khách hàng có thể theo dõi và phân tích các chỉ báo khác nhau trong quy trình chú thích, xác minh và tối ưu hóa dữ liệu chú thích, đồng thời đánh giá tính chính xác, nhất quán và đầy đủ của chú thích.

Có thể nói, những công cụ và quy trình được tiêu chuẩn hóa và thống nhất như vậy đã trở thành yếu tố then chốt giúp phân biệt giữa "nhà máy dây chuyền lắp ráp""xưởng thủ công" trong các công ty dán nhãn.

Về vấn đề này, hầu hết các công ty chú thích trong nước vẫn đang sử dụng "đánh giá thủ công" để xem xét chất lượng chú thích dữ liệu, chỉ một số gã khổng lồ như Baidu đã giới thiệu các công cụ quản lý và đánh giá tiên tiến hơn, chẳng hạn như nền tảng dịch vụ dữ liệu thông minh EasyData.

Nếu không có công cụ chuyên dụng để theo dõi và phân tích các kết quả, chỉ số chú thích ở khía cạnh xem xét dữ liệu chính thì việc kiểm soát chất lượng dữ liệu sẽ vẫn bị giảm xuống mức giống như một xưởng dựa vào tầm nhìn của một “bậc thầy”.

Do đó, ngày càng nhiều công ty trong nước, chẳng hạn như Baidu và My Neighbor Totoro Data, bắt đầu sử dụng công nghệ học máy và trí tuệ nhân tạo để cải thiện hiệu quả và chất lượng chú thích dữ liệu cũng như triển khai các mô hình cộng tác giữa người và máy.

Có thể thấy, sự xuất hiện của AI dán nhãn không phải là dấu chấm hết cho các công ty dán nhãn trong nước mà là dấu chấm hết cho một phương pháp dán nhãn kém hiệu quả, rẻ tiền, tốn nhiều công sức, thiếu nội dung kỹ thuật.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)