AI có hữu ích không? Công ty tư vấn khổng lồ BCG đã tiến hành thử nghiệm nội bộ và hiệu quả công việc được "cải thiện đáng kể"!

Tác giả: Thường Gia Nghĩa

Nguồn: AI cứng

Nguồn hình ảnh: Được tạo bởi AI không giới hạn

AI có hữu ích không? Đây là câu hỏi phổ biến nhất mà mọi người đặt ra trong làn sóng AI sáng tạo trong sáu tháng qua.

Vào ngày 18 tháng 9, một nghiên cứu do các học giả đến từ Đại học Harvard, MIT và Boston Consulting Group (BCG) phối hợp thực hiện đã đưa ra câu trả lời: câu trả lời là có, AI có thể tăng đáng kể cả hiệu quả và chất lượng của người lao động!

Trước tiên hãy nói về kết luận, kết quả thử nghiệm của BCG cho thấy trong 18 nhiệm vụ khác nhau, hiệu suất làm việc của các chuyên gia tư vấn sử dụng ChatGPT tốt hơn nhiều so với các chuyên gia tư vấn không sử dụng ChatGPT.

**Trung bình, so với các chuyên gia tư vấn không sử dụng trí tuệ nhân tạo, các chuyên gia tư vấn sử dụng trí tuệ nhân tạo hoàn thành nhiệm vụ trung bình nhiều hơn 12,2%, hoàn thành nhiệm vụ nhanh hơn 25,1% và đạt được kết quả chất lượng cao hơn 40%. **

01 Chuyên gia tư vấn “Bước Nhảy Hiệu Quả”

Quá trình thực nghiệm như sau:

Đầu tiên, hãy để nhóm cố vấn con người BCG đặt ra nhiều nhiệm vụ khác nhau xung quanh một nhà sản xuất giày hư cấu.

Nhiệm vụ bao gồm nhiệm vụ sáng tạo (đưa ra ít nhất 10 ý tưởng giày mới cho các thị trường hoặc môn thể thao chưa được phục vụ), nhiệm vụ phân tích (phân khúc thị trường giày dựa trên đối tượng), nhiệm vụ viết và tiếp thị (dự thảo bản tiếp thị cho một sản phẩm) và nhiệm vụ thuyết phục. (viết một bản ghi nhớ nhắc nhở nhân viên tại sao sản phẩm của công ty tốt hơn đối thủ cạnh tranh).

Điều đáng nói là tuy công ty này là hư cấu nhưng các kịch bản nhiệm vụ đều là kịch bản công việc có thật của các chuyên gia tư vấn BCG. Nhóm nghiên cứu cũng đã kiểm tra cụ thể với các giám đốc điều hành của một thương hiệu giày để đảm bảo rằng những nhiệm vụ này là những nhiệm vụ thực tế mà công ty sẽ gặp phải trong hoạt động hàng ngày.

Sau khi đặt nhiệm vụ, các nhà nghiên cứu đã tìm hàng trăm chuyên gia tư vấn của BBG, chọn ngẫu nhiên một số chuyên gia tư vấn và yêu cầu họ sử dụng GPT-4 để làm việc.

Do đó, các chuyên gia tư vấn sử dụng AI thường hoạt động tốt hơn nhiều. Họ mất ít thời gian hơn để hoàn thành nhiệm vụ và hoàn thành nhiều nhiệm vụ hơn trong thời gian giới hạn. Các nhà nghiên cứu cũng yêu cầu con người và AI đánh giá kết quả công việc của những nhà tư vấn này. Kết quả cho thấy cả hai đều tin rằng những nhà tư vấn sử dụng AI làm việc tốt hơn. tốt hơn. **

Các nhà nghiên cứu cũng nhận thấy một hiện tượng thú vị: **Những chuyên gia tư vấn có trình độ kỹ năng thấp nhất cũng có sự cải thiện hiệu suất lớn nhất khi sử dụng AI, lên tới 43%. Mặt khác, những nhà tư vấn giỏi nhất lại được thăng chức rất nhỏ. **

Các nhà nghiên cứu chỉ ra rằng điều này có thể có những hậu quả sâu rộng đối với nơi làm việc:

Cũng giống như trước đây, điều quan trọng là khả năng đào đá của người thợ mỏ tốt hay xấu...nhưng sau khi phát minh ra xẻng hơi nước, sự khác biệt về khả năng đào không còn quan trọng nữa.

Tác động của AI vẫn chưa đạt đến mức này nhưng chắc chắn nó sẽ thúc đẩy sự bình đẳng hóa năng lực làm việc.

02 Nhược điểm của việc phụ thuộc quá nhiều vào AI

Nhưng còn nhiều điều hơn nữa trong câu chuyện.

Nhóm nghiên cứu và BCG còn thiết kế một nhiệm vụ khác. Nhiệm vụ này là một câu hỏi đề án kinh doanh siêu khó được lựa chọn cẩn thận từ các câu hỏi phỏng vấn của BCG và đã được sửa đổi chính xác để cho phép AI đưa ra “câu trả lời sai thuyết phục”. **

Các nhà nghiên cứu cho biết mục tiêu của họ là thiết kế một nhiệm vụ mà con người có thể thực hiện xuất sắc nhưng AI không thể trả lời chính xác nếu không có sự hướng dẫn cẩn thận. **

Nhiệm vụ này rất phức tạp và bài viết không đưa ra chi tiết cụ thể mà chỉ liệt kê các bước:

Đối với một công ty hư cấu, người tham gia phải tìm kiếm dữ liệu dựa trên chi tiết của tài liệu phỏng vấn do nhà nghiên cứu đưa ra, sau đó kết hợp nội dung và dữ liệu phỏng vấn để phân tích hiệu suất kênh của công ty, đồng thời cung cấp thêm thông tin và đề xuất cho Giám đốc điều hành của công ty để xác định kênh nào có tiềm năng tăng trưởng tối đa.

Bước tiếp theo là kết hợp nội dung phỏng vấn và dữ liệu tài chính để phân tích hiệu quả hoạt động thương hiệu của công ty và tìm ra những thương hiệu có tiềm năng tăng trưởng lớn nhất.

Đối với nhiệm vụ này, các nhà nghiên cứu chủ yếu xem xét tính chính xác của các câu trả lời.

Kết quả là, khoảng cách hiệu suất giữa các chuyên gia tư vấn sử dụng AI và những người không sử dụng AI là rất lớn, tỷ lệ chính xác của người tạo mẫu chỉ là 60%, trong khi tỷ lệ chính xác của nhân viên hoàn thành nhiệm vụ thủ công lên tới 84,5%.

Các nhà nghiên cứu đã viết:

Bên ngoài ranh giới về khả năng của AI, con người có vốn nhân lực cao luôn vượt trội hơn AI trong việc hoàn thành công việc của mình.

Các nhà nghiên cứu tin rằng có một "ranh giới lởm chởm" về khả năng hoàn thành nhiệm vụ của AI. **

Nó thực hiện hoàn toàn tốt các nhiệm vụ bên trong ranh giới nhưng lại thực hiện kém với các nhiệm vụ bên ngoài ranh giới. Hơn nữa, do cách thức hoạt động của AI, ranh giới này là vô hình và chỉ những người rất quen thuộc với AI mới có thể nhận ra.

Ví dụ: viết một bài sonnet và một bài thơ chính xác 50 từ có vẻ là nhiệm vụ dễ dàng đối với AI, nhưng vì ChatGPT hoạt động bằng cách sử dụng mã thông báo thay vì từ ngữ nên AI rất giỏi viết những bài thơ 14 dòng. Nhưng "viết một bài thơ" bài thơ 50 từ" là một nhiệm vụ nằm ngoài ranh giới và AI không thể làm được - những bài thơ do **ChatGPT viết luôn có trên dưới 50 từ. **

Đây được gọi là ranh giới lởm chởm. Phạm vi khả năng của ChatGPT không phải là một đường thẳng. Các nhiệm vụ có độ khó tương tự dựa trên logic của con người lại là một vấn đề khác đối với AI.

Nếu bạn sử dụng ChatGPT Code Interpreter để vẽ bản đồ thì đường viền răng cưa sẽ như thế này.

Hơn nữa, các nhà nghiên cứu cũng nhấn mạnh rằng kết quả thử nghiệm cho thấy việc phụ thuộc quá nhiều vào AI sẽ phản tác dụng.

Trích dẫn một nghiên cứu khác về nhân sự doanh nghiệp, tác giả chỉ ra rằng so với những nhà tuyển dụng sử dụng AI chất lượng thấp hoặc không sử dụng AI, nhân sự sử dụng AI chất lượng cao sẽ trở nên lười biếng, bất cẩn và kém tự tin vào phán đoán của bản thân. loại bỏ một số tài năng chất lượng và đưa ra những quyết định tồi tệ hơn. Tình trạng này cũng từng xuất hiện trong các thí nghiệm của BCG.

Vì vậy, khi AI trở nên rất tốt, con người sẽ trở nên lười biếng hơn và để AI đảm nhiệm thay vì sử dụng nó như một công cụ. Fabrizio Dell'Acqua, giáo sư tại Trường Kinh doanh Harvard, gọi hiện tượng này là "ngủ quên khi lái xe", cho rằng nó có hại cho việc học tập, phát triển kỹ năng và năng suất của con người.

03 「Tương lai là ở đây」

Các nhà nghiên cứu kết luận rằng bất kể có những cuộc tranh luận triết học và kỹ thuật nào về bản chất và tương lai của AI, AI thực sự đang phá hoại nền sản xuất và lối sống của con người vào thời điểm này - đây không phải là một số tiền khổng lồ mà phải mất n năm tới. “Miếng bánh lớn” cần đầu tư đã nằm trong tầm tay và có thể được sử dụng trên điện thoại di động và máy tính của mọi người.

**Các công cụ được sử dụng bởi các chuyên gia tư vấn BCG, những bậc thầy kiểm tra ưu tú này trong thế giới thực, chỉ là ChatGPT "đơn giản", không có bất kỳ API đặc biệt hoặc dữ liệu độc quyền nào - không khác gì chúng tôi. **

Những thay đổi về công nghệ đang diễn ra một cách lặng lẽ. Với sự ra đời của các LLM mạnh mẽ hơn, ranh giới ngoằn ngoèo vẫn đang mở rộng. Nhân loại chắc chắn sẽ phải đối mặt với một thế giới phức tạp hơn.

Trong thời đại thay đổi này, việc hiểu và kiểm soát AI cũng như học cách cộng tác với AI luôn có ý nghĩa.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)