Với ChatGPT, việc đọc có còn hữu ích không?

Tác giả: Li Zi, Tiến sĩ Xã hội học Công nghệ, Nghiên cứu sinh sau Tiến sĩ, Khoa Nhân văn và Đạo đức Y khoa, Đại học Columbia

Nguồn hình ảnh: Được tạo bởi Unbounded AI‌

Trong nửa đầu năm, ChatGPT ra đời và tiềm năng của trí tuệ nhân tạo được bộc lộ, khiến nhiều ngành công nghiệp phải thảo luận về cuộc khủng hoảng sinh tồn. GPT có thể vượt qua các kỳ thi đủ điều kiện thanh và kỹ sư, viết bài luận đại học mà không bị điểm kém và thậm chí "hiểu" những câu chuyện cười. Nó có thể trả lời câu hỏi của mọi người, tổ chức các cấu trúc ngôn ngữ sống động và bắt chước nhiều phong cách ngôn ngữ khác nhau; và sự kết hợp giữa các mô hình ngôn ngữ lớn và công nghệ AI tạo hình ảnh, chẳng hạn như Midjourney, có thể cho phép những người chưa được đào tạo về nghệ thuật sử dụng một số từ "Tạo" hình ảnh nghệ thuật tuyệt đẹp.

Bản chất của ChatGPT thực sự là một mô hình ngôn ngữ lớn (Large Language Model, LLM) được xếp chồng lên trí tuệ nhân tạo tổng quát. Một mô hình ngôn ngữ lớn, như tên cho thấy, là lớn, sử dụng một số lượng lớn các hình vị để đào tạo một mô hình máy tính bằng các phương pháp học máy. Công thức tổng quát sử dụng một phương pháp dự đoán để hiển thị các kết nối hình vị có khả năng xảy ra nhất trong cuộc đối thoại.

Đối với "bộ xử lý" và "người tiêu dùng" kiến thức, khả năng của các mô hình ngôn ngữ lớn cộng với trí tuệ nhân tạo tổng quát là rất lớn. Dữ liệu hình thái khổng lồ, mạng lưới thần kinh sâu và sức mạnh tính toán khổng lồ tương đương với việc "làm phẳng" toàn bộ kiến thức từ Internet, sau đó "lắp ráp" nó thông qua tương tác giữa người và máy tính.

**Về logic tính toán, ChatGPT tương đương với một công cụ tìm kiếm mạnh mẽ hơn. ** Các công cụ tìm kiếm thông thường như Google và Baidu "thu thập" thông tin của toàn bộ Internet thông qua chế độ trình thu thập thông tin và sắp xếp thông qua các thuật toán phức tạp. Phương pháp trí tuệ nhân tạo sử dụng học máy tương đương với việc sắp xếp thông tin theo cách dự đoán phù hợp với logic ngôn ngữ. Việc xử lý kiến thức trở nên thuận tiện hơn và nhanh hơn, và việc sử dụng trở nên ngắn gọn và rõ ràng hơn—thậm chí đôi khi quá đơn giản, tạo cơ hội cho gian lận trong bài thi.

Theo quan điểm này, những người lạc quan về công nghệ tin rằng kể từ bây giờ, nội dung mà máy móc có thể tạo ra, nó có thể không yêu cầu hầu hết con người sử dụng bộ não của họ để nhận ra nó, giống như các công cụ tìm kiếm thay thế thẻ thư viện và máy tính thay thế bàn tính. Thật vậy, ngay cả khi AI không can thiệp vào quá trình ra quyết định cuối cùng, những nhiệm vụ đòi hỏi phải viết lặp đi lặp lại nhiều lần, hoặc liệt kê và sắp xếp máy móc, thực sự có thể mang lại năng suất đáng kể và hỗ trợ con người trong quá trình xử lý và tiêu thụ kiến thức.

Vì vậy, đọc là hữu ích? Nhân sự của các trường đại học lớn và viện nghiên cứu cũng có thể nghỉ việc?

Máy có thể "học" gì

Các mô hình ngôn ngữ lớn và trí tuệ nhân tạo tổng quát đã mang đến một chủ đề không thể tránh khỏi cho các “nhà sản xuất” tri thức trong tương lai: tri thức là gì? Làm thế nào để tạo ra tri thức đa dạng, vô tư và xác thực?

Khả năng "học" của trí tuệ nhân tạo thật đáng kinh ngạc. Mô hình ngôn ngữ lớn hiện có và ứng dụng trí tuệ nhân tạo không thể tách rời nền tảng của học máy. Từ "learning" về cơ bản là sử dụng một lượng lớn dữ liệu để huấn luyện mô hình dự đoán và tìm sự cân bằng giữa tính chính xác và tính phổ quát của dự đoán. Loại dự đoán này thực sự dựa trên kiến thức hiện có và dự đoán mô hình ngôn ngữ cũng dựa trên sự kết nối giữa các ngôn ngữ hiện có. Ví dụ, nhập "bò kho" và máy dự đoán "thịt", sau đó, dựa trên nhiều thông tin đầu vào hơn, chẳng hạn như vị trí, con người, thói quen, v.v., nó sẽ đưa ra dự đoán chính xác hơn, chẳng hạn như "bò kho của bà" và sớm.

Làm thế nào mà dự đoán này trở thành sự thật? Hệ tọa độ mà chúng ta quen thuộc là hai chiều. Ví dụ: trong toàn bộ dân số, chiều cao và cân nặng có sự tương ứng gần như tương ứng. Với chiều cao, máy dự đoán cân nặng trung bình, đây là dự đoán dựa trên dữ liệu hiện có. Thêm một chiều khác, chẳng hạn như giới tính, sau đó nó trở thành tọa độ ba chiều và dự đoán của nam và nữ sẽ khác nhau. Nếu điều này tiếp tục, kích thước của dữ liệu có thể là vô hạn và mô hình học máy là tìm các kết nối như vậy trong không gian đa chiều mà bộ não con người không thể tưởng tượng được và liên tục điều chỉnh trọng số giữa các kích thước khác nhau. Ví dụ: "mức độ quan trọng" là dự đoán về chiều cao so với cân nặng, có thể được điều chỉnh sau một số lượng lớn dữ liệu đầu vào.

** Do đó, trí tuệ nhân tạo dựa trên học máy sẽ kết nối dữ liệu có nhiều chiều khác nhau trong không gian nhiều chiều hơn, có khả năng khám phá các kết nối tiềm ẩn giữa dữ liệu và cũng sẽ "học" một số thứ không tồn tại trong thực tế, nhưng rất khả năng liên kết. **Được sử dụng trong mô hình ngôn ngữ, trí tuệ nhân tạo cũng có thể học các phong cách ngôn ngữ khác nhau và tìm ra "bản chất" và "vấn đề" trong văn bản hiện có.

**Dữ liệu càng lớn, mô hình càng hoàn thiện và khả năng tính toán cũng như khai thác của nó càng cao. ** Tương tự như AI như BERT và GPT, được sinh ra trong các tổ chức lớn, nhiều người cho rằng họ đã đạt đến "điểm uốn" của công nghệ và việc thay đổi lượng sẽ tạo ra thay đổi về chất không phải là vô lý - đây là một điều tốt điều dành cho các nhà sản xuất tri thức. Tuy nhiên, các mô hình lớn cũng có những vấn đề cố hữu và mô hình càng lớn thì các vấn đề càng gay gắt, đặc biệt là liên quan đến các khía cạnh kiến thức đa dạng, công bằng và trung thực.

Cách sản xuất thật

** và kiến thức khách quan? **

Kiến thức mới có thể được tạo ra từ các kết nối và mô hình mới của kiến thức hiện có, điều này đúng cho dù ở cấp độ con người hay máy móc. Tuy nhiên, kiến thức hiện có đã đủ chưa? Là nó đủ? Có công bằng không? Nếu cơ sở của kiến thức hiện tại không đầy đủ hoặc thậm chí sai lệch, thì kiến thức mới được xây dựng trên đó cũng sẽ bị sai lệch.

Kể từ khi AI học máy được đưa vào ứng dụng quy mô lớn, các học giả đã liên tục tiết lộ những thành kiến vốn có trong các mô hình này: phân biệt giới tính, phân biệt chủng tộc, đầu ra phi đạo đức, v.v. Các nhà phát triển sử dụng nhiều bản vá và phương pháp chỉnh sửa khác nhau để bù đắp, nhưng hầu hết các vấn đề đều ẩn chứa trong quá trình sản xuất và đào tạo dữ liệu, và sự thiên vị của AI cũng là sự phản ánh và khuếch đại định kiến xã hội.

Một vấn đề khác là chất lượng của dữ liệu. Học máy không chỉ liên quan đến khả năng đào tạo các mô hình mà còn liên quan đến số lượng và chất lượng của dữ liệu. Quá trình phát triển hiện tại nhấn mạnh hơn vào hiệu suất của mô hình và thậm chí là mê tín dị đoan, nhưng lại bỏ qua vấn đề cơ bản về nguồn dữ liệu. Hầu hết dữ liệu ngày nay phụ thuộc vào việc làm sạch và định dạng thủ công, phân loại, ghi nhãn, v.v. Nhiều lần, quá trình sản xuất dữ liệu này không rõ ràng, thậm chí viết nguệch ngoạc. Ví dụ, đằng sau sự phát triển AI của các công ty lớn, một lượng lớn lao động "bẩn thỉu và bừa bộn" được thuê ngoài cho các "nhà máy AI" ở các khu vực kém phát triển. Một mặt, quy trình này có vấn đề về đạo đức lao động, mặt khác, nó cũng đặt ra những thách thức về chất lượng dữ liệu.

Trong thời đại của các mô hình lớn, vấn đề này có thể tiềm ẩn sâu hơn: không phải nhà nghiên cứu hoặc nhóm nào cũng có khả năng phát triển các mô hình AI từ đầu, đặc biệt là các mô hình ngôn ngữ lớn và hình ảnh lớn, hầu hết đều dựa trên các mô hình hiện có đã được tinh chỉnh. Các vấn đề và sai lệch của chính mô hình lớn sẽ được chuyển sang nhiều mô hình ứng dụng hơn. Và độ lệch càng thấp thì càng khó xử lý thông qua tinh chỉnh và hiệu chỉnh độ lệch.

Chế độ tạo dự đoán của mô hình ngôn ngữ hiện có thậm chí sẽ khuếch đại độ lệch dữ liệu hiện có, dẫn đến hiệu ứng "phù hợp quá mức": ví dụ: một căn bệnh nào đó có tỷ lệ dữ liệu thống kê cao ở một nhóm dân tộc nhất định, khoảng 60%. ; Nhưng nếu mô hình ngôn ngữ được sử dụng để tạo chân dung bệnh nhân, thì có hơn 90% khả năng mô tả bệnh nhân được tạo sẽ thuộc nhóm này.

Giờ đây, một số đào tạo mô hình AI áp dụng chế độ "chiến đấu lẫn nhau" - cái gọi là "mạng đối nghịch chung" (generative adversarial network), cho phép hai mô hình liên tục tạo và sửa lẫn nhau. Phương pháp này cải thiện hiệu quả của việc đào tạo mô hình, nhưng bất kỳ sai lệch nhỏ nào cũng sẽ được phóng đại trong "sự tương tác" này. Theo nguyên tắc tương tự, nếu một nhà sản xuất tri thức làm việc chặt chẽ với máy móc dựa vào loại "thế hệ" này, thì một số sai lệch từ mô hình sẽ được đưa vào nhiều tri thức mới hơn và tri thức mới sẽ được hấp thụ dưới dạng dữ liệu, nó sẽ tiếp tục tăng cường độ chệch của mô hình. **Các nhà sản xuất tri thức phải luôn thận trọng trong quá trình này.

**Kiến thức mới là gì? "Thế hệ" AI có thể đại diện cho tri thức mới không? **

Cái gọi là kiến thức mới là gì? Nếu AI được sử dụng triệt để để tạo ra tri thức, thì những người tạo ra tri thức phải suy nghĩ về vấn đề này từ quan điểm kết hợp giữa con người và máy móc. Mọi thông tin, cũng như kiến thức mà con người tiếp thu từ thế giới thực đều cần được "làm sạch" và "định dạng" thành dữ liệu. Ngoài chất lượng dữ liệu đã đề cập ở trên, quá trình tạo dữ liệu cũng rất quan trọng. Tóm lại, vấn đề người ta muốn nghiên cứu là gì? Câu hỏi này được dịch sang loại dữ liệu nào? Những dữ liệu này được tạo ra như thế nào và chúng có thể hiện đầy đủ và công bằng những vấn đề mà những người sản xuất tri thức muốn nghiên cứu không?

Vấn đề này cũng đúng với những người sản xuất tri thức "truyền thống". Lấy lịch sử làm ví dụ, mặc dù lịch sử nghiên cứu các sự kiện trong quá khứ, nhưng không có sự kiện nào trong quá khứ có thể kết luận 100%. Các học giả thường không ngừng tìm kiếm những tư liệu lịch sử mới để bổ sung cho sự hiểu biết của họ về các vấn đề lịch sử, đồng thời khai quật những quan điểm và tiếng nói bị lãng quên trong quá khứ. Thật thú vị, lịch sử hiện tại thường sử dụng một lượng lớn dữ liệu, đặc biệt là dữ liệu kinh tế, dân số và khí hậu trong quá khứ và thậm chí dựa vào học máy để mang lại những hiểu biết và quan điểm mới về lịch sử.

Tương tự như vậy, việc dựa vào những hiểu biết và ý kiến do máy tạo ra có thể khuếch đại tầm quan trọng của một số nguồn dữ liệu nhất định. Các nhà sản xuất tri thức ngày nay phụ thuộc quá nhiều vào thông tin chính thống, Internet và điện tử để tạo ra những thứ đã được "dịch" thành dữ liệu bởi những người khác. **Trong thời đại AI, sự tiện lợi và khả năng mở rộng do AI mang lại sẽ có khả năng khiến con người dễ dàng bỏ qua những tri thức kinh nghiệm, phi chính thống chưa được số hóa, điện tử hóa, từ đó bỏ lỡ khả năng hình thành quan điểm, góc nhìn mới. . **

Ở cấp độ sâu hơn, kiến thức mới thường nảy sinh từ việc khai quật các tư liệu mới, sự va chạm của các quan điểm và quan điểm khác nhau, và sự tái cấu trúc của kiến thức hiện có. Mô hình ngôn ngữ lớn cung cấp nhiều khả năng để hiển thị tri thức, nhưng logic và cấu trúc bên trong của nó có thể trái ngược với phương thức sản xuất này.

Dựa trên phương pháp đào tạo của mô hình ngôn ngữ lớn và các đặc điểm của đầu ra do mô hình tạo ra, trọng số của nội dung đầu ra được xếp hạng cao hơn và có xác suất cao hơn sẽ trở nên lớn hơn và các tính năng sẽ trở nên độc đáo hơn. "Do AI tạo ra" gần như đã trở thành một tính từ để mô tả những từ vô nghĩa, lặp đi lặp lại, vô nghĩa được nói như thể chúng không có. Đúng là đối với những người tiêu dùng tri thức, những câu trả lời "rất có thể" làm giảm đáng kể ngưỡng hiểu biết; nhưng đối với những người sản xuất tri thức, thay vào đó, những điều này có thể trở thành trở ngại.

**Những nhà sản xuất tri thức trong thời đại mới nên đi về đâu? **

Có lẽ nhiều nhà nghiên cứu khoa học xã hội như tôi đã gặp phải vấn đề này khi sử dụng ChatGPT: yêu cầu nó giải thích một khái niệm, và nó logic; một tác giả chưa bao giờ viết sách, chưa bao giờ xuất bản một bài báo. Lĩnh vực càng hẹp và chuyên biệt thì khả năng "vô nghĩa" càng lớn.

Quay trở lại với nguyên tắc của AI, kiểu "sáng tạo" này thực chất là khai thác các kết nối "có thể" của các từ và câu trong dữ liệu khổng lồ, nhưng những kết nối này không tồn tại trong thực tế. Nói trắng ra là chúng chỉ "nghe giống nhau" mà thôi. . Hiện tượng mới này được gọi là "ảo giác". Đối với những người sản xuất tri thức, cách sử dụng trí tuệ nhân tạo để khai thác các mô hình và kết nối trong cơ sở tri thức hiện có, nhưng vẫn cảnh giác trước "tầm nhìn" của máy móc, những gì tồn tại và những gì đáng nghi ngờ, là một kỹ năng rất quan trọng.

"Đối thoại" với AI cũng sẽ trở thành một kỹ năng mới. AI hiện tại vẫn là một chiếc "hộp đen" bí ẩn đối với hầu hết những người không chuyên về kỹ thuật (thậm chí là dân kỹ thuật). Làm thế nào để bắt đầu từ cấp độ công nghệ dưới cùng hoặc trung bình để nói chuyện với máy móc hiệu quả hơn, hiểu và chống lại "tầm nhìn" cần có sự hợp tác của những người sản xuất tri thức và những người thực hành kỹ thuật.

Đối với việc nghiên cứu kiến thức mới, quan điểm mới và tài liệu mới, cấu trúc và cách giải thích độc đáo của từng lĩnh vực vẫn rất quan trọng hiện nay. Các mô hình dự đoán của các mô hình ngôn ngữ lớn và AI tổng quát vẫn có xu hướng đơn lẻ và lặp đi lặp lại, đồng thời tài liệu đào tạo càng hạn chế thì khả năng sẽ càng bị hạn chế. Nếu bạn muốn kết hợp khả năng của máy móc và con người, bạn phải bắt đầu từ nguồn sản xuất dữ liệu, sử dụng dữ liệu chính xác, đa dạng, công bằng và mới lạ để đào tạo các mô hình AI và thiết lập mô hình tương tác giữa người và máy tính lành tính.

Sự ra đời của các mô hình ngôn ngữ lớn và AI tổng quát chỉ là khởi đầu của những thách thức đối với các nhà nghiên cứu. Thay vì thảo luận về "sự thay thế", tốt hơn hết là tìm kiếm khả năng thay thế và phát triển dưới cái nhìn thận trọng hơn.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)