Về mô hình lớn, tôi đã có một lần trò chuyện với một chuyên gia

Nguồn gốc: White Horse Business Review

Nguồn hình ảnh: Được tạo bởi Unbounded AI‌

"Nó gần như trở thành một biển đỏ." Khi tôi trò chuyện với một doanh nhân về mô hình lớn, anh ấy đã ném thẳng câu này vào tôi.

Vào tháng 11 năm ngoái, OpenAI đã phát hành ChatGPT dựa trên GPT-3.5, ngay lập tức kích hoạt sự bùng nổ của các mô hình lớn. "Cuộc chiến trăm mô hình" đã diễn ra ở Trung Quốc trong hơn nửa năm, các công ty Internet hàng đầu như BAT và các công ty trí tuệ nhân tạo về cơ bản đã công bố các mô hình quy mô lớn của riêng họ.

Vào đầu tháng 5, Zhou Hongyi, người đứng đầu 360, đã nói với thế giới bên ngoài: "Nếu bạn không trải qua hai năm bắt chước và đạo văn, nếu bạn đến và nói rằng bạn có thể vượt qua nó, đó là sự khoác lác. "Đại mô hình cùng nước ngoài có hai năm chênh lệch, ta thu hồi, hôm nay liền gần quốc tế trình độ."

Một số người cảm thấy rằng phải mất nửa năm để bắt kịp ChatGPT và có vẻ như mô hình lớn không khó.

Vì vậy, các rào cản cốt lõi đối với các mô hình lớn là gì? Mức độ của mô hình lớn của Trung Quốc là gì? Mô hình lớn mang lại rủi ro gì cho xã hội loài người?

Để đạt được điều này, chúng tôi đã trò chuyện với Shen Wei (bút danh), một giáo sư đại học nổi tiếng năm 985, người đã nghiên cứu về máy học trong nhiều năm, để khám phá sương mù của mô hình lớn.

Con đường GPT đã chạy qua nên có "Trăm Mẫu Chiến"

**Bạch Mã Business Review: Ông có thể giải thích mô hình lớn bằng ngôn ngữ phổ biến và đơn giản nhất được không, mô hình lớn là gì? Nó khác với các mô hình AI trước đây như thế nào? **

Shen Wei: Cái gọi là mô hình lớn đề cập đến số lượng lớn các tham số trong mô hình, nhưng không có định nghĩa rõ ràng và rõ ràng trong giới học thuật để xác định mức độ lớn của một tham số được gọi là "lớn". nghiên cứu và phát triển nhanh chóng.Nói chung, số lượng tham số của một mô hình lớn đạt 1. hơn 100 triệu.

Trên thực tế, sự phát triển của deep learning đại khái đã trải qua ba giai đoạn. Giai đoạn đầu từ 2012 đến 2017, được thể hiện bằng các mô hình nhỏ dành riêng cho miền như phân đoạn ảnh yolo và phân loại ảnh ResNet nên lượng tham số chiếm tối đa vài trăm MB bộ nhớ.

Vào năm 2017, sự ra đời của Transformer đã cho phép học sâu để song song hóa điện toán, hiệu quả hơn, có nghĩa là có thể thực hiện các hoạt động mô hình quy mô lớn và sau đó tạo ra các mô hình ngôn ngữ tự nhiên lớn như OpenAI GPT và Google Bert. Trong giai đoạn này, một mô hình lớn của một nhiệm vụ cụ thể đã ra đời và các tham số mô hình đã vượt quá 100 triệu.

Vào khoảng năm 2020, deep learning sẽ bước vào giai đoạn mô hình chung, đầu vào của nó là một câu có chỗ trống và vai trò của mô hình là "điền vào chỗ trống". là mô hình thích ứng ứng dụng xuôi dòng. Các mô hình ở giai đoạn này bao gồm GPT 3.5 và GPT 4 trong trường ngôn ngữ tự nhiên và Clip, DALLE, Stable Diffusion, Midjourney, v.v. trong trường hình ảnh. Ở giai đoạn này, các tham số mô hình có thể lên tới hàng chục tỷ và hàng trăm tỷ.

** Đánh giá về doanh nghiệp White Horse: Bạn có biết công ty hoặc tổ chức nào là người đầu tiên nghiên cứu các mô hình quy mô lớn không? Kết quả là gì? **

Shen Wei: Lúc đầu, các trường đại học và tổ chức nghiên cứu khoa học đã thực hiện nghiên cứu liên quan, tôi biết rằng Wu Dao của Viện nghiên cứu trí tuệ nhân tạo Zhiyuan Bắc Kinh và bộ não của Phòng thí nghiệm Pengcheng là sớm nhất, bây giờ nghiên cứu trong ngành cũng rất đồng bộ. Nghiên cứu trong giới học thuật đã có một số kết quả, nhưng hiệu suất không đáng kinh ngạc như ChatGPT.

**Bạch Mã Business Review: Chỉ trong vài tháng, tại Trung Quốc đã xảy ra "cuộc chiến trăm mẫu", số lượng công ty tung ra mẫu mã lớn nhiều không đếm xuể. Bạn nghĩ sao về hiện tượng này? **

Shen Wei: Các mô hình lớn chắc chắn là một xu hướng và mọi người đã nghiên cứu chúng. Trước đây, nhiều công ty có thể đầu tư vào một khu vực nhỏ và thực hiện một số nghiên cứu, bây giờ đột nhiên xuất hiện một sản phẩm tốt như ChatGPT, mọi người đều nhìn thấy hướng kinh doanh rõ ràng nên họ bắt đầu tăng cường đầu tư.

Mặt khác, nhiều công ty đang phải đối mặt với áp lực cạnh tranh thương mại, nếu không làm mô hình quy mô lớn thì có thể bị tụt lại phía sau, do đó phải triển khai các dự án mô hình quy mô lớn.

White Horse Business Review: Zhou Hongyi gần đây đã nói rằng anh ấy đã rút lại câu "khoảng cách giữa người mẫu quy mô lớn trong nước và nước ngoài là hai năm", anh ấy tin rằng ngày nay nó đã gần đạt đến trình độ quốc tế. Mới chỉ vài tháng, và mô hình lớn dường như không khó. Bạn nghĩ sự khác biệt là bao nhiêu?

Shen Wei: Sự khác biệt phụ thuộc vào người so sánh điểm chuẩn, tôi chưa trải nghiệm sản phẩm 360 Smart Brain cho đến nay nên không giỏi đánh giá chúng. Tuy nhiên, có một số sản phẩm AI sáng tạo ở Trung Quốc, sau khi trải nghiệm, tôi cảm thấy vẫn còn một khoảng cách với ChatGPT, các mô hình lớn trong nước vẫn cần phải nỗ lực.

**Dưới nguồn vốn đầu tư lớn, chỉ những công ty hàng đầu mới có cơ hội? **

**Bạch Mã Business Review: Đâu là rào cản cốt lõi đối với sự phát triển của người mẫu lớn? **

Shen Wei: Rào cản cốt lõi của các mô hình lớn bao gồm dữ liệu, sức mạnh tính toán và thuật toán.

Từ góc độ sức mạnh tính toán, cần ít nhất 10.000 card đồ họa Nvidia A100 để đào tạo một AI tổng quát như ChatGPT, giá một card đồ họa hiện tại là 60.000 đến 70.000 nhân dân tệ và đơn giá của V100 với hiệu suất tốt hơn là 80.000 nhân dân tệ . Khoản đầu tư ít nhất phải đạt sáu hoặc bảy tỷ nhân dân tệ, và chỉ một số công ty và tổ chức hàng đầu mới có thể chi trả. Đối với các tổ chức thương mại, việc bỏ ra hàng trăm triệu đồng để mua một đống card đồ họa chưa chắc đã mang lại kết quả, đây là một câu hỏi cần phải cân nhắc.

Tiếp theo là dữ liệu và thuật toán, các thuật toán dễ hiểu hơn, chẳng hạn như khung phát triển và thuật toán tối ưu hóa. Về dữ liệu, Trung Quốc không thiếu dữ liệu, thậm chí còn nhiều dữ liệu Internet hơn Mỹ, nhưng chọn dữ liệu nào để đào tạo và xử lý như thế nào mới là rào cản cốt lõi.

**Baima Business Review: Bạn có thường giao tiếp với các công ty không? Sự khác biệt giữa các tổ chức nghiên cứu phi lợi nhuận và các tập đoàn trong nghiên cứu là gì? **

Shen Wei: Chúng tôi sẽ có một số trao đổi với bộ phận nghiên cứu của công ty. Thông qua giao tiếp với doanh nghiệp, chúng ta sẽ hiểu rõ hơn về nhu cầu thực tế của doanh nghiệp, đôi khi nghiên cứu học thuật chúng ta thực hiện sẽ chú ý nhiều hơn đến công nghệ hướng tới tương lai, yêu cầu triển khai không quá cao nhưng nhìn chung doanh nghiệp chú trọng hơn đến việc triển khai.

**Baima Business Review: Bạn đã từng nghiên cứu các mô hình quy mô lớn trong nước chưa? Bạn thích cái nào nhất? **

Shen Wei: Có lẽ các công ty hàng đầu có thể thoát ra. Một là đầu tư vốn lớn, và chỉ có các công ty hàng đầu mới có thực lực; hai là dữ liệu trong tay của một số công ty hàng đầu phong phú hơn; thứ ba là đã có một thời kỳ tích lũy công nghệ trong lĩnh vực trí tuệ nhân tạo.

**Đánh giá doanh nghiệp White Horse: Ứng dụng mô hình quy mô lớn hứa hẹn nhất của bạn là gì? **

Shen Wei: Từ quan điểm kỹ thuật, ứng dụng đầu tiên nên là trong lĩnh vực xử lý ngôn ngữ tự nhiên và hình ảnh, và nhận dạng giọng nói có thể sau này.

Bạn có thể thấy rằng ngày càng có nhiều chatGPT được sử dụng để viết quảng cáo. Ngày càng có nhiều ứng dụng cho loại hình tạo nội dung này. Tôi nghĩ các ứng dụng khác như dịch vụ khách hàng thông minh sẽ nhanh hơn. Một số dịch vụ chăm sóc khách hàng thông minh hiện nay thường không thể hiểu được nhu cầu của người dùng và không thể giải quyết các vấn đề thực tế, nếu người dùng không thể phân biệt đó là người hay robot, trải nghiệm sẽ được cải thiện rất nhiều, bao gồm cả NPC trong trò chơi, trước đây cuộc đối thoại được mã hóa cứng, Bây giờ nó đang dần tương tác và trải nghiệm của người chơi sẽ tốt hơn.

**White Horse Business Review: Ông từng là trưởng phân tích của một công ty môi giới hàng đầu, ở góc độ đầu tư, ông thấy các mô hình lớn có cơ hội gì? **

Shen Wei: Logic của sự cường điệu vốn là từ ứng dụng đến thuật toán, mô hình, rồi đến sức mạnh tính toán; logic của ngành thì ngược lại, sức mạnh tính toán có kỳ vọng tăng trưởng rõ ràng, vì vậy Nvidia gần đây đã tăng lên nhanh chóng và rất nhiều. Các nhà đầu tư giờ đây cũng hiểu rằng vẫn cần phải xác minh rằng mô hình lớn có thể được hiện thực hóa và hiện thực hóa hay không, nhưng phần lớn khoản đầu tư vốn tăng thêm đã được đầu tư vào sức mạnh tính toán. Sau nhiều lần quảng cáo rầm rộ, sự gia tăng chung trên thị trường lẽ ra phải kết thúc, và cần phải xác minh hợp lý và hoàn thành hiệu suất sau đó.

Ban đầu tôi chủ yếu xem xét ngành truyền thông và Internet, chẳng hạn như lĩnh vực trò chơi tương đối mạnh trước đây, logic của vốn là đầu tiên áp dụng mô hình lớn để nâng cao hiệu quả R&D và giảm chi phí, thứ hai, mô hình lớn mang lại trải nghiệm tốt hơn và NPC ký tự thông minh hơn Tăng độ nhớt, tăng giá trị TĂNG. Tất nhiên, xác minh hiệu suất cuối cùng có thể được yêu cầu.

Con người không thể kiểm soát AI, hay thậm chí là vận mệnh của chính mình

** Đánh giá về doanh nghiệp của White Horse: Chúng tôi đã thấy rằng Altman và Musk đã nêu lên mối lo ngại về sự an toàn của trí tuệ nhân tạo, bây giờ chúng tôi chỉ biết rằng có kết quả thông minh thông qua đào tạo mô hình lớn, nhưng quá trình đào tạo giống như một hộp đen. Thực ra là vậy khá đáng sợ. Bạn cảm thấy thế nào về các vấn đề bảo mật? **

Shen Wei: Về mặt an ninh, trước hết, tôi đã quan sát thấy một số hiện tượng bất thường. Đầu tiên là một bức thư ngỏ được ký vào tháng 3 bởi hơn 1.000 người, bao gồm cả Musk và người đồng sáng lập Apple Steve Wozniak, kêu gọi tạm dừng đào tạo các hệ thống AI mạnh hơn GPT-4.

Thứ hai là Jeffrey Hinton, nhà khoa học trưởng của Google và là "Bố già của AI" 75 tuổi, đã từ chức vào tháng 5 năm nay, lý do trực tiếp khiến ông rời Google là ông lo lắng về sự nguy hiểm của trí tuệ nhân tạo , và thậm chí hối hận về công việc mà anh ấy đã làm cả đời. .

Thứ ba là hai năm trở lại đây, mô hình đào tạo đại trà trong lĩnh vực học thuật có thêm các buổi thảo luận về đạo đức.

Hiện tại tôi nghĩ mô hình lớn vẫn có thể kiểm soát được và không có vấn đề gì lớn, nhưng công nghệ phát triển quá nhanh, chỉ trong vài tháng kể từ khi ra mắt, GPT đã trải qua nhiều lần lặp lại và tốc độ phát triển cũng vậy. Khi chúng ta ngày càng thông minh hơn, liệu chúng ta có phát triển khả năng tự nhận thức, ngừng nghe “mệnh lệnh” của con người và vượt ra ngoài tầm kiểm soát? Câu hỏi này là điều mà ai cũng lo lắng.

** Đánh giá doanh nghiệp White Horse: Bạn có nghĩ rằng AI sẽ gây thất nghiệp hàng loạt? Khi đối mặt với AI, làm thế nào những người bình thường có thể giữ được công việc của họ? **

Shen Wei: Từ góc độ vĩ mô, tôi không nghĩ AI sẽ gây ra nhiều thất nghiệp, con người sẽ luôn có việc làm, chỉ là nội dung công việc của con người sẽ thay đổi. Tất nhiên, theo quan điểm cá nhân, chắc chắn sẽ có thất nghiệp cơ cấu, và chúng ta chỉ có thể tiếp tục học hỏi.

**Bạch Mã Business Review: Trước đây nhiều người nói máy móc không có cảm xúc, thiếu trí tưởng tượng, không thể thay thế con người, nay trí tuệ nhân tạo có thể mô phỏng bằng AI, liệu trong tương lai dục vọng và ham muốn tình dục của con người có thể mô phỏng được không? , dopamine, v.v. Đó là một cơ chế khen thưởng sinh học. **

Shen Wei: Giả định hiện tại là máy móc không có cảm xúc, trí tuệ nhân tạo đang tiến gần hơn đến hình thức suy nghĩ của con người, liệu nó có tạo ra "cảm xúc" giống con người không? Chỉ là họ sống ở một chiều không gian khác với con người, giống như con gái của Tu Hengyu trong "Trái đất lang thang". Trí tuệ nhân tạo có thể tạo ra thế giới của riêng nó với các cơ chế khen thưởng tương tự về mặt sinh học đối với con người.

**Bạch Mã Business Review: Nếu mọi thứ đều có thể tính toán, lên kế hoạch và sắp đặt, chẳng phải nó sẽ hơi nhàm chán sao? **

Shen Wei: Hành vi của AI không phải do con người dự đoán và lên kế hoạch mà là kết quả của quá trình tự rèn luyện và củng cố bản thân, việc ra quyết định của MOSS trong "Địa cầu du hành" là do chính nó đưa ra chứ không phải tuân theo mệnh lệnh do con người ban tặng.

** Đánh giá kinh doanh của White Horse: Việc thay thế nền văn minh dựa trên carbon bằng nền văn minh dựa trên silicon có phải là một hướng đi tất định không? **

Shen Wei: Câu hỏi này nằm ngoài đề cương. Theo xu thế phát triển hiện nay, có thể sẽ như thế này, giống như trong “Lưu lạc địa cầu”, chính Rêu chứ không phải con người mới thực sự chi phối vận mệnh của loài người; nhưng trên thực tế, cũng có khả năng công nghệ sẽ dậm chân tại chỗ. một giai đoạn nhất định và không thể vượt qua nó Xét cho cùng, sự phát triển công nghệ không phải là tuyến tính.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)