Dachang vượt qua ChatGPT

2023-07-21 06:38:44

Bản gốc: Luozhi Magnolia

Nguồn: Trích đoạn mới Đánh giá kinh doanh

Nguồn hình ảnh: Được tạo bởi công cụ Unbounded AI

Trong hai trăm ngày kể từ khi ChatGPT ra mắt, sự phát triển của các mô hình quy mô lớn trong nước đã bắt đầu ở chế độ "cơn bão".

Người ta nói rằng 79 mô hình quy mô lớn với quy mô hơn 1 tỷ thông số ở Trung Quốc đã được phát hành.

Lĩnh vực phát triển mô hình quy mô lớn tập trung vào hỗn hợp hàng trăm mô hình: Mô hình quy mô lớn của Baidu Wenxin đã phát triển lên 3,5; Ali Tongyi Qianwen đã xây dựng mô hình gia đình; Mô hình quy mô lớn của JD Yanxi là mô hình quy mô lớn công nghiệp "được thiết kế riêng" cho chính nó;

Lý thuyết tiến hóa của các mô hình quy mô lớn của các nhà máy lớn là tàn nhẫn và thực tế, và chúng phải bắt kịp hoặc bị loại bỏ.

Baidu Wenxin Big Model 3.5, đang chạy trước và luyện tập chăm chỉ, gần đây đã thông báo rằng phiên bản mới nhất của khả năng Yiyan của Wenxin đã vượt qua ChatGPT 3.5.

Chọn lọc tự nhiên, sự tồn tại của những nhà sản xuất lớn nhất, những nhà sản xuất lớn và những mô hình lớn đã vượt qua ChatGPT.

Mô hình nhà máy lớn, hơn ChatGPT3.5

Mặc một chiếc áo vest trắng bên trong và bên ngoài màu đen với mái tóc ngắn gọn gàng, anh ấy đã xuất hiện tại Hội nghị báo cáo đánh giá năng lực kỹ thuật mô hình lớn AI.

Chủ đề vẫn đang được sửa đổi vào đêm hôm trước, Wu Tian, phó chủ tịch Tập đoàn Baidu, người vừa trở về sau chuyến công tác, cho biết tại cuộc họp: "Phiên bản mới của Wenxin Yiyan đã vượt qua ChatGPT 3.5. Đây cũng là một cột mốc quan trọng để chúng tôi thực hiện công việc kỹ thuật liên quan tại Trung Quốc."

Đây là một nhà sản xuất lớn khác chính thức xác nhận mẫu xe cỡ lớn vượt qua ChatGPT sau khi Liu Qingfeng của HKUST Xunfei đề cập rằng mẫu xe cỡ lớn Spark sắp vượt qua ChatGPT.

Vào tháng 3 năm nay, mô hình ngôn ngữ quy mô lớn nâng cao tri thức thế hệ tiếp theo của Baidu "Wenxin Yiyan" đã được mời thử nghiệm công khai. Mô hình này dựa trên phiên bản 3.0 của mô hình quy mô lớn Wenxin. Sau hơn 3 tháng, mô hình Wenxin đã được nâng cấp lên phiên bản 3.5 và các hiệu ứng, chức năng và hiệu suất của nó đã được cải thiện toàn diện.

Wenxin Yiyan 3.5 đã vượt qua ChatGPT3.5, rất có thể là do cơ chế plug-in mới về chức năng, Wenxin Large Model 3.5 đã mở rộng ranh giới khả năng của mô hình lớn thông qua plug-in.

Mô hình lớn nhấn mạnh sức mạnh kỹ thuật và khả năng cơ bản của mô hình lớn. Vào tháng 5 năm nay, mô hình cơ sở lớn mới được Baidu tung ra là Wenxin Large Model 3.5, mô hình này là mô hình cơ bản của hệ thống Wenxin Yiyan.

Điều đáng nói là trong quá trình đào tạo mô hình cơ bản, phiên bản 3.5 cũng áp dụng công nghệ đào tạo song song kết hợp thích ứng tiên tiến nhất và chiến lược tính toán chính xác hỗn hợp của FlyPaddle, giúp tăng tốc đáng kể tốc độ lặp lại của mô hình.

Như chúng ta đã biết, Baidu đã và đang đào sâu nghiên cứu và phát triển công nghệ trí tuệ nhân tạo toàn diện, với tổng cộng bốn lớp: lớp chip, lớp khung, lớp mô hình và lớp ứng dụng.

Lớp chip có Kunlun Core; lớp khung có nền tảng học sâu Paddle, hỗ trợ mạnh mẽ cho việc đào tạo và lý luận hiệu quả của các mô hình lớn; lớp mô hình có mô hình lớn Wenxin; ở lớp ứng dụng, 150.000 công ty hiện đang đăng ký quyền truy cập vào bài kiểm tra Wenxin Yiyan.

Trong số đó, nền tảng Flying Paddle có 7,5 triệu nhà phát triển, so với 8 triệu đến 10 triệu người hành nghề phần mềm ở Trung Quốc. Mặc dù số lượng người hành nghề phần mềm và nhà phát triển deep learning không hoàn toàn giống nhau, nhưng lợi thế về số lượng nhân tài cũng mang lại cho Wenxin 3.5 một think tank dung lượng lớn để bắt kịp ChatGPT, tương tự như sự tồn tại của Ultrain.

So với các công ty nước ngoài, các công ty Trung Quốc có lợi thế tự nhiên là có được kho tàng văn hóa Trung Quốc và hiểu biết về văn hóa Trung Quốc, ngành sản xuất của Trung Quốc có nhiều hạng mục hoàn chỉnh nhất và có điều kiện thuận lợi để đào tạo AIGC cho các ngành thực tế.

Nhiều yếu tố đã góp phần thúc đẩy. Wenxin Big Model 3.0 dựa trên Wenxinyiyan đã được phát hành hơn 100 ngày trước. Dưới sự tối ưu hóa hợp tác của FlyPaddle và Wenxin, Wenxin Big Model 3.5 đã phát triển nhanh chóng. Hiệu ứng mô hình mới nhất đã tăng 50%, tốc độ đào tạo tăng 2 lần và tốc độ suy luận tăng 30 lần. Nó đã thành công vượt qua ChatGPT.

Ngoài công nghệ cơ bản, Baidu đã phát triển ba công nghệ nâng cao bổ sung: nâng cao kiến thức, tăng cường truy xuất và tăng cường đối thoại.

So với mô hình lớn đối với con người, nếu con người học theo cách cấu trúc kiến thức và hệ thống kiến thức thì hiệu quả học tập cao hơn. Sau đó, học cách sử dụng các công cụ để tìm kiếm, thực hiện truy xuất cực kỳ đơn giản từ đầu đến cuối và cải thiện tính kịp thời.

Sau khi mô hình lớn tự học xong, nó phải học đào tạo chuyên sâu phản hồi, tăng cường đối thoại giống như để mô hình lớn liên tục đặt câu hỏi, nói cho mô hình lớn điều gì đúng và điều gì sai trong cuộc đối thoại, đồng thời thông qua cách gợi mở, hãy để mô hình lớn tăng cường cơ chế ghi nhớ, để nó trả lời câu hỏi theo cách chúng ta muốn một cách hiệu quả, dạy trẻ cách trả lời tốt hơn.

Ngoài sức mạnh kỹ thuật, các mô hình lớn cần phải được nối đất.

Về ứng dụng công nghiệp, mô hình quy mô lớn của Baidu Wenxin bắt nguồn từ và phục vụ thực tiễn công nghiệp. Nó đã khám phá con đường chính để triển khai mô hình công nghiệp quy mô lớn và cũng đã phát hành các mô hình quy mô lớn bao gồm nhiều ngành và lĩnh vực để đẩy nhanh quá trình chuyển đổi thông minh của các ngành.

Hiện tại, các doanh nghiệp như State Grid, Pudong Development, Taikang, Geely, Harbin, Shenzhen Gas, TCL và Baidu Wenxin đã hợp tác với nhau.

Ngoài ra, Baidu đã đầu tư hơn 100 tỷ nhân dân tệ vào nghiên cứu và phát triển trong mười năm qua, và khoản đầu tư vào nghiên cứu và phát triển cốt lõi của Baidu sẽ chiếm hơn 23% vào năm 2021. Số lượng đơn đăng ký và giấy phép cho chuyên ngành trí tuệ nhân tạo đã đứng đầu Trung Quốc trong 5 năm liên tiếp và số lượng đơn đăng ký bằng sáng chế học sâu đã đứng đầu thế giới. Bước đột phá của Baidu trong lĩnh vực mô hình quy mô lớn AI cũng liên quan mật thiết đến việc Baidu đầu tư mạnh vào các nguồn nguyên tố.

Có thể thấy, đã đến lúc các nhà máy lớn, người mẫu lớn tranh nhau nghiên cứu và phát triển.

Nhà máy lớn, mô hình lớn cái nào tốt hơn?

Trong nửa đầu năm nay, đã có gần một trăm công ty chính thức tuyên bố sản xuất mô hình quy mô lớn, và mỗi mô hình quy mô lớn đều ở trong một cuộc chiến khốc liệt. Trong số đó, có những công ty Internet lớn như Ali, Baidu, Tencent, JD.com và ByteDance, cũng như các công ty AI như HKUST Xunfei và SenseTime, và những "đội quân vô danh" khác cũng tham gia.

Trong nửa năm, đường đua mô hình quy mô lớn đã hoàn thành quá trình từ ý tưởng đến hạ cánh, điều này rất bùng nổ trên bất kỳ đường đua nào.

Tuy nhiên, cho đến nay vẫn chưa có chỉ số hay hướng dẫn rõ ràng để xác minh mô hình quy mô lớn của ai tốt hơn, hết người này đến người khác, việc "Wang Po bán dưa, bán dưa khoe khoang" tự đánh giá là chói tai và không có nhiều khách quan.

Vậy trong cuộc chiến trăm người mẫu, ai hơn ai?

Trong "Báo cáo đánh giá năng lực kỹ thuật mô hình quy mô lớn AI năm 2023" mới nhất do IDC phát hành, khung đánh giá năng lực kỹ thuật mô hình quy mô lớn AI lần đầu tiên được đề xuất.

Có ba khía cạnh trong mô hình đánh giá: công nghệ sản phẩm, hệ sinh thái dịch vụ và ứng dụng công nghiệp.

Có tới 12 chỉ số phân khu cụ thể: mô hình thuật toán, năng lực dịch vụ, năng lực chung, năng lực đổi mới, năng lực nền tảng, bảo mật và khả năng giải thích, hợp tác sinh thái, phạm vi ngành, tài chính, công nghiệp, chăm sóc y tế và năng lượng.

Trong số đó, mô hình thuật toán và mức độ bao phủ của ngành là hai chỉ số quan trọng nhất để đo lường khả năng của các mô hình lớn, đặc biệt, cả hai có thể tạo thành bánh đà để cải tiến lặp đi lặp lại liên tục.

Trong số các khả năng kỹ thuật của sản phẩm, khía cạnh "mô hình thuật toán" là yếu tố cốt lõi của khả năng mô hình lớn và nó cũng là gốc quyết định hiệu ứng ứng dụng của mô hình lớn.

Lý do là chỉ thông qua sự đột phá của công nghệ mô hình thuật toán và việc hiện thực hóa cơ sở mô hình lớn với các lợi thế về hiệu quả chung, nó mới có thể hỗ trợ phạm vi bao phủ ngành rộng hơn, cho phép mọi tầng lớp xã hội tận hưởng đầy đủ cổ tức do đột phá công nghệ mang lại và giải quyết tình trạng tiến thoái lưỡng nan về ngưỡng triển khai AI cao.

Về khả năng ứng dụng của ngành, phạm vi ứng dụng là chỉ số được quan tâm nhất đối với các nhà sản xuất mô hình quy mô lớn và nó phản ánh toàn diện khả năng dẫn đầu toàn cầu của các hiệu ứng mô hình quy mô lớn và khả năng kết hợp của ngành.

Do đó, "độ bao phủ ngành" phản ánh sức mạnh của mô hình lớn trong việc triển khai công nghiệp thông qua số lượng khách hàng cấp doanh nghiệp và số lượng ngành hạ cánh.

Các mô hình quy mô lớn chính trong nước, bao gồm 14 nhà sản xuất bao gồm Baidu, Ali, Tencent, Huawei, iFlytek, 360, SenseTime và 4Paradigm, đã tham gia đánh giá này.

Các nhà sản xuất lớn và các mô hình lớn có mức độ cạnh tranh cao. Baidu có lợi thế độc nhất là bố cục hoàn chỉnh của ngăn xếp công nghệ bốn lớp "chip-khung-mô hình-ứng dụng": lớp chip-lõi Kunlun, mái chèo bay lớp khung, mô hình lớp mô hình lớn Wenxin và các ứng dụng AI khác nhau. Trong số đó, nền tảng học sâu Flying Paddle do Baidu tự phát triển cung cấp hỗ trợ mạnh mẽ cho việc đào tạo và lý luận hiệu quả của các mô hình lớn.

Aliyun cũng rất bắt mắt, với 6 trong số 12 chỉ số đạt điểm tối đa và là nhà cung cấp duy nhất đạt điểm tối đa cho "năng lực phục vụ". Với tư cách là nhà cung cấp mô hình cơ bản, khả năng nền tảng, khả năng dịch vụ và mức độ hợp tác sinh thái của các nhà sản xuất mô hình lớn là rất quan trọng đối với sự phát triển của ngành. Alibaba Cloud đạt điểm tối đa trong cả ba chỉ số.

Hiện tại, họ mô hình lớn đa năng của Alibaba Cloud có khả năng xử lý hoặc tạo văn bản, giọng nói và hình ảnh cũng như các phương thức khác. Trong ba tháng qua, Alibaba Cloud đã liên tiếp ra mắt mô hình cơ bản "Tongyi Thousand Questions", sản phẩm mô hình quy mô lớn âm thanh và video "Tongyi Tingwu" và mô hình quy mô lớn tạo tranh AI "Tongyi Wanxiang".

Tencent Cloud và JD Cloud, cả hai công ty Internet lớn, đã chọn tập trung vào khía cạnh ngành và phát hành các mô hình quy mô lớn của ngành dựa trên đặc điểm riêng của họ.

Trên cơ sở xây dựng một mô hình công nghiệp lớn, Tencent Cloud sử dụng dữ liệu của riêng mình để tinh chỉnh nhằm tạo ra một mô hình độc quyền với độ chính xác của dữ liệu cao hơn cũng như quyền riêng tư và bảo mật mạnh mẽ hơn.

Đối với JD.com, công ty đã phát triển chuỗi cung ứng trong vài năm, việc tập trung vào chuỗi cung ứng bằng cách tập trung vào kinh doanh thương mại điện tử và kinh doanh hậu cần trong một thời gian dài là lựa chọn tốt hơn. Như JD.com đã nói tại buổi họp báo về mô hình quy mô lớn của Yanxi, “Chỉ bằng cách biến chuỗi cung ứng thành hiện thực thì mô hình lớn mới có thể trở thành hiện thực.”

Các nhà sản xuất AI như HKUST iFLYTEK cũng đã ghi điểm tối đa trong ngành dọc, những người chơi này có cơ hội thâm nhập vào ngành dọc, trong cuộc cạnh tranh giữa các nhà sản xuất, doanh nghiệp có lợi thế rõ ràng trong lĩnh vực dọc sẽ dẫn đầu.

Lấy IFLYTEK làm ví dụ, IFLYTEK đã tập trung vào lĩnh vực trí tuệ nhân tạo hơn 20 năm, nhiều công nghệ cốt lõi đạt trình độ hàng đầu quốc tế, Spark Big Model kết hợp khả năng hiểu ngôn ngữ, khả năng diễn đạt chung của big model với plug-in tìm kiếm, giúp giải quyết hiệu quả các vấn đề của ngành như khó cập nhật kiến thức mới, câu hỏi và câu trả lời về sự kiện dễ "tạo sự khác biệt".

Do chi phí đào tạo người mẫu lớn quá cao, các nhà phát triển bình thường và doanh nghiệp vừa và nhỏ không có cách nào để bắt đầu, điều này cũng có thể thấy từ kết quả báo cáo: các nhà máy khác cũng đang làm việc chăm chỉ, nhưng tương lai còn dài.

Mô hình lớn sẽ đi về đâu trong tương lai?

Tại hội nghị WAIC cách đây không lâu, những người chơi tham gia mô hình lớn đã rút ra những điểm mấu chốt: đầu tiên giải quyết các vấn đề kỹ thuật, sau đó triển khai bối cảnh, cuối cùng là hiện thực hóa hoạt động kinh doanh và quy mô.

Hiện tại, chúng ta thấy rằng các mô hình lớn đã bắt đầu được tích hợp sâu với các kịch bản và ngành, ví dụ như các mô hình lớn trong các lĩnh vực như tạo mã và dự đoán cấu trúc protein đã xác minh rằng các mô hình lớn không chỉ được áp dụng trong các công ty công nghệ mà còn từng bước hướng tới mọi tầng lớp xã hội.

Mô hình quy mô lớn trong nước đã nhanh chóng vượt qua giai đoạn dự trữ khái niệm quy mô lớn và mô hình quy mô lớn AI đã phát triển từ cạnh tranh về tham số sang cạnh tranh về ứng dụng.

Ví dụ: mô hình lớn Pangu của Huawei đã được triển khai trong các lĩnh vực như khí tượng học, nghiên cứu và phát triển y tế, năng lượng điện và ngôn ngữ, đồng thời đã cung cấp nhiều mô hình lớn với hàng trăm tỷ tham số. Các khả năng mô hình công nghiệp quy mô lớn của Tencent Cloud sẽ được áp dụng cho các tình huống như kiểm soát rủi ro tài chính, dịch thuật tương tác và dịch vụ khách hàng thông minh kỹ thuật số, giúp cải thiện hiệu quả của các ứng dụng thông minh và dịch vụ MaaS một cửa giúp giảm gánh nặng cho doanh nghiệp.

Cụ thể với kịch bản ứng dụng, lấy lĩnh vực tài chính làm ví dụ, mô hình công nghiệp quy mô lớn có thể hỗ trợ các giải pháp kiểm soát rủi ro tài chính, hiệu quả tăng gấp 10 lần so với trước đây.

Mô hình quy mô lớn kết hợp kinh nghiệm chống gian lận tích lũy nhiều năm và hàng nghìn tình huống kinh doanh thực tế, so với mô hình truyền thống, hiệu quả chống gian lận tổng thể đã tăng khoảng 20%. Các doanh nghiệp có thể lặp lại các khả năng kiểm soát rủi ro dựa trên các mô hình, từ thu thập mẫu, đào tạo mô hình đến triển khai và khởi chạy, để không có sự tham gia thủ công trong toàn bộ quy trình và thời gian lập mô hình giảm từ 2 tuần xuống chỉ còn 2 ngày.

Ngay cả với việc tích lũy mẫu hạn chế, việc xây dựng có thể được hoàn thành nhanh chóng và có thể bỏ qua quy trình "khởi động nguội".

Làm thế nào để hạ cánh và thương mại hóa đang trở thành tâm điểm của các nhà sản xuất.

Điều này có nghĩa là AI đã bước vào giai đoạn triển khai công nghiệp có thể nhân rộng trên quy mô lớn và chỉ có thể đạt được kết quả tốt bằng cách sử dụng phương pháp học lấy mẫu nhỏ hoặc không lấy mẫu ở hạ nguồn, do đó giảm chi phí phát triển AI. Sau khi mô hình lớn của Baidu Wenxin được nâng cấp, chi phí đã giảm thành công xuống 10% so với trước đây.

Bất kỳ ngành nào cuối cùng cũng sẽ hình thành độc quyền nhóm và các mô hình lớn cũng không ngoại lệ.

Trong vài tháng qua, một số lượng lớn mô hình quy mô lớn mới đã xuất hiện, cho dù đó là khao khát điên cuồng nắm bắt cơ hội và sợ bị tụt lại phía sau, hay bố cục lâu dài của đường đua và nghiên cứu chuyên sâu, mỗi người chơi chỉ biết rõ.

Cuộc hỗn chiến của hàng trăm mô hình sẽ chỉ là một hiện tượng theo giai đoạn và kết quả cuối cùng vẫn tập trung vào một số ít mô hình lớn. Những lý do không gì khác hơn là những điều sau đây:

Đầu tiên, trong quá trình phát triển, các doanh nghiệp và tổ chức khác nhau đã dần dần tìm thấy vị trí của riêng mình, dần dần tiến tới phân khu và cuối cùng được đưa vào mô hình quy mô lớn hoàn chỉnh hơn.

Thứ hai, phải mất nhiều năm tích lũy. Mô hình quy mô lớn thực sự được xây dựng từ dưới lên rất tốn kém, đòi hỏi năng lực rất toàn diện và phải có tâm lý lâu dài tuyệt đối, đồng nghĩa với việc người chơi không có thực lực kinh tế tuyệt đối sẽ bị bỏ dở giữa chừng hoặc “chết” trên đường đến với ánh sáng.

Thứ ba là có rất nhiều chỗ cho trí tưởng tượng trong tương lai của các mô hình lớn ở cấp độ ứng dụng. Giả sử rằng mọi ngành đều có không gian phát triển rất lớn, công nghệ AI mới có thể được sử dụng để nâng cao hiệu quả và giá trị ở cấp độ ứng dụng chắc chắn sẽ được chuyển hướng, dựa vào một số mô hình đầu lớn sẽ có một hệ sinh thái ứng dụng rất rộng.

Không thể phủ nhận rằng trong tương lai tất cả các doanh nghiệp sẽ dựa mạnh vào các mô hình lớn và tất cả các sản phẩm sẽ được phát triển dựa trên các mô hình lớn.

Tỷ lệ thâm nhập ngành và thị phần đã trở thành những yếu tố thách thức quan trọng nhất đối với mô hình doanh nghiệp lớn trở thành độc quyền.

Xem bản gốc

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Phần thưởng
Thích
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
BTC Hits New High
64k Phổ biến
ETH Breaks $3,000
22k Phổ biến
VIP Exclusive Airdrop Carnival
6k Phổ biến
4Pump.Fun Debuts on Gate
4k Phổ biến
5Fed June Meeting Minutes
4k Phổ biến
6Join Gate VIP to Win MacBook
29k Phổ biến
7Trump Tariff Hikes
16k Phổ biến
8Gate xStocks Trading Share
22k Phổ biến
9HK Stablecoin Rules
12k Phổ biến
10Truth Social Crypto ETF
2k Phổ biến

Ghim

sơ đồ trang web