Phương tiện truyền thông dịch vụ đổi mới công nghiệp dữ liệu lớn
--Tập trung vào dữ liệu·Thay đổi hoạt động kinh doanh
Những tháng gần đây, một xu hướng phát triển rất rõ ràng trong lĩnh vực xe mô tô cỡ lớn trong nước là mọi người đang cùng nhau tập hợp lại để xây dựng những mẫu xe cỡ lớn trong ngành. Không chỉ các công ty trong nhiều lĩnh vực dọc khác nhau đã đưa ra nhiều mô hình công nghiệp lớn mà cả những gã khổng lồ hàng đầu như Baidu, Alibaba, Huawei, Tencent và JD.com cũng coi các mô hình lớn trong ngành là trọng tâm chính.
Cụ thể, các nhà sản xuất này có thể được chia thành hai loại dựa trên tỷ lệ các mẫu xe lớn trong chiến lược của họ:
Baidu, Alibaba, Tencent và iFlytek đều chú ý đến các mô hình lớn nói chung và các mô hình lớn trong ngành.
Một mặt, họ chú ý nhiều hơn đến các mô hình lớn nói chung và mở các mô hình lớn nói chung cho người dùng C-end. Baidu Wenxinyiyan và iFlytek Spark của iFlytek thậm chí còn tạo ra các ứng dụng di động để thúc đẩy ứng dụng của các mô hình lớn nói chung.
Mặt khác, họ cũng rất chú trọng đến các mô hình công nghiệp lớn. Nói chung, nó được xuất khẩu ra bên ngoài dưới dạng giải pháp công nghiệp. Thậm chí, vào ngày 19/9, Baidu đã trực tiếp ra mắt một mô hình lớn của ngành y tế - Mô hình Y học Tâm linh, phục vụ trực tiếp cho các bệnh viện, bệnh nhân và các công ty thiết bị y tế.
Hạng mục còn lại được đại diện bởi Huawei và JD.com, ngay từ đầu đã tập trung vào các mô hình công nghiệp quy mô lớn và hướng trực tiếp đến các ứng dụng công nghiệp.
Khẩu hiệu của mẫu Pangu của Huawei ngay từ đầu là "Đừng làm thơ, hãy làm đi." Nó không hào hứng với các ứng dụng C-end và gần như toàn bộ trọng tâm chiến lược của nó là vào ngành.
Mô hình lớn Yanxi của JD.com cũng tương tự, tuân thủ khái niệm "đám mây hiểu rõ hơn về ngành" của JD Cloud, JD.com cũng tập trung vào các ứng dụng công nghiệp trong lĩnh vực mô hình lớn. Ngoài ra, JD Health còn cho ra mắt mô hình lớn Jingyi Qianxun với tư cách là người tiên phong gia nhập ngành.
Có thể thấy, dù là Baidu, Alibaba, Tencent, iFlytek “quan tâm như nhau trên cả hai mặt trận”, hay Huawei và JD.com gần như “chiến đấu trên một mặt trận” thì đều coi mô hình lớn của ngành là như một chiến trường cho các nhà chiến lược quân sự.
Tác giả cho rằng đây là vấn đề. Những gã khổng lồ công nghệ này nên tập trung vào các mô hình lớn nói chung, các ứng dụng trong ngành nên để cho các đối tác trong các lĩnh vực công nghiệp khác nhau, họ chỉ nên xây dựng "cơ sở hạ tầng" của các mô hình lớn và không chạm vào các ứng dụng lớp trên.
Tại sao chúng tôi nói điều này Tiếp theo, hãy phân tích chi tiết ưu và nhược điểm.
##Các đại gia nên tập trung nghiên cứu phát triển các mẫu lớn nói chung
Các mô hình lớn nói chung giống như nền tảng của toàn bộ ngành công nghiệp mô hình lớn, nền móng có vững chắc hay không sẽ quyết định tòa nhà có thể xây được cao bao nhiêu. Vậy nền tảng hiện tại có vững chắc không?
Thật không may, mặc dù các mô hình lớn bước đầu đã đạt được sự “xuất hiện” của trí thông minh và đạt được tiến bộ lớn trong việc hiểu ngôn ngữ tự nhiên, tạo nội dung và suy luận logic, nhưng chúng vẫn chưa đủ tốt. Đặc biệt nếu chúng ta muốn triển khai thương mại các mô hình lớn trong các ngành khác nhau thì khả năng của mô hình hiện tại là không đủ.
Khả năng được đề cập ở đây không đủ mạnh và nó không đề cập cụ thể đến một mô hình lớn nào đó.
Ngay cả GPT-4 vẫn còn những thiếu sót đáng kể về khả năng nếu muốn triển khai trong lĩnh vực thương mại. Hãy xem xét một vài ví dụ.
Công cụ tìm kiếm là một kịch bản ứng dụng quan trọng cho các mô hình lớn.Bing của Microsoft đã tạo ra bước ngoặt lớn bằng cách thay đổi phương pháp tìm kiếm từ khóa ban đầu nhờ khả năng truy cập vào ChatGPT. Vậy hiệu suất thực sự của Bing với sự hỗ trợ ChatGPT là gì?
Chúng tôi đã thử nó và thành thật mà nói thì khá thất vọng.
Sau đây là một ví dụ Hãy để Bing tìm kiếm tin tức về các mẫu lớn hôm nay (26/9) 4 mục tin được đưa ra là Sau khi click vào thì nội dung mục 1 và 3 thực ra là đến từ một bài báo, và đây là những mục đầu tiên mẩu tin được phát hành vào ngày 21 tháng 2; mục thứ hai và thứ tư cũng từ cùng một bài báo được phát hành vào ngày 27 tháng 7.
Nói cách khác, tin tức đưa ra là sai, chúng ta đang tìm kiếm tin tức ngày hôm nay nhưng kết quả lại là nội dung từ vài tháng trước. Hơn nữa, chúng tôi đang tìm kiếm các sự kiện quan trọng trong lĩnh vực mô hình lớn, trong số bốn câu trả lời được đưa ra có hai báo cáo, một bài phân tích tin tức và một hoạt động diễn đàn. Nói một cách chính xác, các báo cáo và bài viết phân tích không phải là sự kiện tin tức quan trọng, từ góc độ này, kết quả do Bing cung cấp hoàn toàn không đáp ứng được yêu cầu.
Sau đó tác giả hỏi thêm và yêu cầu dùng bảng để sắp xếp nội dung tin tức đã cho. Kết quả là trong bảng anh đưa ra, thời gian của tin tức đổi thành ngày 26 tháng 9, khi nói đến thời gian cụ thể thì điều này rõ ràng là vô nghĩa.
Tác giả từng đặt nhiều kỳ vọng vào các công cụ tìm kiếm mới như Bing và đã thử chúng rất nhiều lần. Nhưng cảm giác chung là - về cơ bản là không thể sử dụng được. Đây là hiệu suất thực tế của ChatGPT trong trường tìm kiếm, ở một mức độ nào đó, đây là mức cao nhất mà các mô hình lớn có thể đạt được.
Baidu cũng đã ra mắt một chức năng tương tự. Ngoài tìm kiếm trên web thông thường, bạn cũng có thể truy vấn thông qua các cuộc hội thoại. Chúng tôi rất nóng lòng muốn dùng thử.
So với Bing, Baidu hiểu rõ hơn về các sự kiện tin tức, Bing đưa ra một số báo cáo, trong khi Baidu đưa ra kết quả dựa trên các bản phát hành mô hình lớn. Giá trị tin tức của những sự kiện này rõ ràng là cao hơn.
Tuy nhiên, những kết quả này do Baidu cung cấp có đáng tin cậy không? Tương tự, chúng tôi cho phép nó được biên soạn dưới dạng bảng và cung cấp thời gian cũng như liên kết tin tức. Có thể thấy, thời gian đều là ngày 11 tháng 5, rõ ràng là có vấn đề, thứ chúng ta muốn là tin tức ngày 26 tháng 9 chứ không phải ngày 11 tháng 5.
Hơn nữa, liên kết tin tức được đưa ra trong bảng cũng có vấn đề, khi mở trang web tương ứng, nó trực tiếp trả về "404". Tất nhiên, Bing của Microsoft cũng gặp phải vấn đề này, các link tin tức mà nó đưa ra hoặc không thể mở được hoặc không tồn tại.
Quay lại ChatGPT, một trong những hạn chế quan trọng của nó là không thể kết nối Internet và dữ liệu của nó không thể cập nhật theo thời gian thực.Bộ dữ liệu đào tạo của GPT-3 là tháng 9 năm 2021 và bộ dữ liệu đào tạo của GPT -4 là tính đến tháng 1 năm 2022. mặt trăng.
Hơn nữa, ChatGPT thường xuyên mắc lỗi trong việc tính toán và xử lý dữ liệu phức tạp. Khả năng tải lên và hiểu văn bản được tuyên bố của nó cũng không lý tưởng.
Hãy thử khả năng hiểu tài liệu của GPT-4. Chúng tôi đã tải lên báo cáo nửa năm 2023 của Loongson Zhongke và cố gắng để nó thực hiện phân tích SWOT đơn giản. Sau khi tải tài liệu lên, ChatGPT bắt đầu viết mã để phân tích tài liệu, mã này có vẻ rất mạnh mẽ.
Thế kết quả là gì?
Cuối cùng, ChatGPT không phân tích được tài liệu PDF. Chúng tôi đã thử nhiều lần nhưng không phân tích được.
Chỉ cần tưởng tượng, dựa vào những mô hình lớn này, nếu bạn muốn triển khai chúng trong các kịch bản ngành phức tạp thì hiệu quả chắc chắn sẽ không lý tưởng, và chúng đã là những mô hình lớn tổng hợp tốt nhất trên thị trường.
Đúng là đã có một số “sự xuất hiện trí tuệ” ở các mô hình lớn và khả năng của chúng đã được cải thiện về chất, nhưng hiện tại chúng đang ở giai đoạn đầu “bông sen nhỏ mới lộ ra những góc cạnh sắc bén”. Vì việc phát hiện ra những mô hình lớn là một hướng đi đầy hứa hẹn nên điều quan trọng nhất cần làm lúc này là tăng tốc và nuôi dưỡng “đứa con” tiềm năng này thay vì để nó phụ giúp gia đình quá sớm.
Đánh giá từ kinh nghiệm lịch sử, sau mỗi cơn sốt trí tuệ nhân tạo sẽ là một thời gian dài im lặng, nguyên nhân chính là do kỳ vọng của mọi người trong giai đoạn đầu đã được nâng lên quá cao, và họ sẽ thất vọng khi thấy rằng kỳ vọng của mình không được đáp ứng.
Tương tự như vậy, nếu bây giờ chúng ta vội vàng triển khai các mô hình lớn trong các ngành khác nhau thì chúng ta sẽ sớm gặp phải một giai đoạn khó khăn, người dân sẽ nhanh chóng chuyển từ kỳ vọng lớn sang những lời phàn nàn điên cuồng, những thăng trầm như vậy không có lợi cho sự phát triển lành mạnh của ngành. .
Vì vậy, nhiệm vụ cốt lõi của các gã khổng lồ công nghệ như Alibaba, Huawei, Baidu, Tencent là nuôi dưỡng “đứa con” General Model. Chỉ cần khả năng thực sự được cải thiện, việc triển khai trên quy mô lớn sẽ thực sự diễn ra rất nhanh, vì vậy không cần phải vội vàng chờ đợi cho đến bây giờ.
Có một đường cong xuất hiện trí tuệ nổi tiếng trong lĩnh vực mô hình lớn, đó là hiệu suất của mô hình không liên quan tuyến tính với thang đo tham số, một mô hình có 20 tỷ tham số không tốt gấp đôi mô hình có 10 tỷ tham số. thông số.
Có một ngưỡng trên đường cong xuất hiện trí thông minh này, hiện tại ngưỡng này là khoảng 100 tỷ thông số. Trước ngưỡng này, mức độ thông minh mà mô hình hiển thị không thay đổi đáng kể khi thang tham số tăng lên.Một mô hình có 20 tỷ tham số hoạt động tương đương với mô hình có 2 tỷ tham số. Tuy nhiên, khi thang tham số vượt qua ngưỡng 100 tỷ, hiệu suất của mô hình được cải thiện theo cấp số nhân.
Mặc dù quy mô mô hình không thể đại diện cho tất cả mọi thứ, nhưng xét theo kinh nghiệm phát triển trí tuệ nhân tạo trong mười năm qua, "bạo lực định lượng" thường là hướng đi chính. Các mô hình lớn hơn, mạng lưới thần kinh sâu hơn và nhiều dữ liệu hơn sẽ mang lại hiệu suất tốt hơn.
Đánh giá từ đường cong xuất hiện trí thông minh hiện tại, sau quy mô hàng trăm tỷ tham số, nó sẽ bước vào giai đoạn thắt cổ chai trí thông minh, có thể không có sự khác biệt đáng kể về "trí thông minh" giữa một mô hình có 500 tỷ tham số và một mô hình có 100 tỷ tham số . Tuy nhiên, nếu chúng ta muốn theo đuổi "ngưỡng khẩn cấp" tiếp theo, cách tốt nhất hiện tại là tiếp tục mở rộng kích thước tham số. Có lẽ, sau khi quy mô tham số mở rộng lên hàng chục nghìn tỷ, ngưỡng xuất hiện tiếp theo sẽ được mở ra và khả năng của các mô hình lớn sẽ đạt đến một tầm cao mới.
Bản đồ vượn dữ liệu dự đoán xuất hiện thông minh mô hình lớn
Tất nhiên, khi quy mô mô hình được mở rộng thì chi phí cũng sẽ tăng lên đáng kể nên đây chỉ có thể là cuộc chơi dành cho những gã khổng lồ. Hơn nữa, việc chỉ mở rộng kích thước mô hình cũng sẽ gây ra vấn đề quá khớp. Vì vậy, việc mở rộng quy mô mô hình cũng cần đi đôi với việc tối ưu hóa, điều chỉnh kiến trúc mô hình, đây mới là lúc năng lực kỹ thuật thực sự được thử nghiệm.
Lùi lại một bước, các mô hình lớn ngày nay đều dựa trên kiến trúc Transformer và kiến trúc này đã được một số nhà nghiên cứu của Google đề xuất trong một bài báo cách đây 5 năm. Vậy kiến trúc Transformer có thực sự là tốt nhất?Có kiến trúc mô hình nào tốt hơn không? Những câu hỏi này cần được trả lời bởi những gã khổng lồ công nghệ như Huawei, Baidu, Alibaba và Tencent.
Ngoài thang đo tham số và kiến trúc mô hình, các mô hình lớn còn cần giải quyết các vấn đề “ảo ảnh”, vấn đề về khả năng diễn giải và các vấn đề đa phương thức. Những vấn đề này vẫn chưa được giải quyết tốt, là vấn đề chung của toàn ngành. Chìa khóa để giải quyết những vấn đề này nằm ở những đột phá công nghệ cơ bản trong các mô hình lớn nói chung, chứ không phải trong các mô hình lớn trong ngành.
Tất nhiên, bất cứ ai thực sự có thể giải quyết những vấn đề quan trọng này sẽ được thị trường khen thưởng tương ứng.
Đừng đồng thời làm trọng tài và cầu thủ
Sở dĩ khuyến cáo các đại gia công nghệ không động đến các mẫu xe lớn của ngành là vì ngoài vấn đề chưa giải quyết được của các mẫu xe lớn nói chung, một lý do vô cùng quan trọng khác là tránh xung đột lợi ích với đối tác.
Đối với những gã khổng lồ công nghệ, họ chơi một trò chơi sinh thái và chia sẻ lợi ích về cơ sở hạ tầng.
Trong lĩnh vực mô hình lớn, đường truyền tải giá trị phải là mô hình lớn tổng hợp - mô hình lớn của ngành - khách hàng của ngành. Trong giai đoạn mô hình lớn của ngành, các nhà sản xuất mô hình lớn nói chung như Huawei, Baidu và Alibaba có thể tự phát triển các mô hình lớn trong ngành hoặc để các đối tác bên thứ ba tiến hành nghiên cứu và phát triển dựa trên các mô hình lớn chung của riêng họ.
Bản đồ cơ chế truyền dữ liệu giá trị ứng dụng công nghiệp mô hình lớn
Các mô hình lớn nói chung kiểm tra năng lực kỹ thuật, trong khi ngưỡng kỹ thuật của các mô hình lớn trong ngành không cao lắm, yếu tố cốt lõi của nó là dữ liệu và kinh nghiệm trong ngành, hai điểm này chính là khuyết điểm của các gã khổng lồ công nghệ. Để thu thập các bộ dữ liệu chất lượng cao từ nhiều ngành khác nhau như tài chính, chăm sóc y tế, sản xuất và bán lẻ cũng như hiểu được kịch bản kinh doanh của các ngành khác nhau, đây chắc chắn không phải là điều mà một công ty có thể làm được mà phải dựa vào sức mạnh của hệ sinh thái và sử dụng hàng nghìn dữ liệu từ toàn bộ hệ sinh thái. Các đối tác thực hiện việc đó.
Tất nhiên, các nhà sản xuất mô hình lớn nói chung như Baidu, Huawei và Tencent cũng có thể chiếm lĩnh cả hai tuyến truyền tải giá trị. Ví dụ, trong lĩnh vực y tế, Baidu không chỉ có thể sử dụng mô hình y học tâm linh quy mô lớn của riêng mình để phục vụ trực tiếp cho các bệnh viện, bệnh nhân và các công ty thiết bị y tế mà còn thúc đẩy việc xây dựng hệ thống đối tác mô hình y tế quy mô lớn theo chiều dọc.
Tuy nhiên, tình trạng này sẽ phải đối mặt với vấn đề “tranh lợi với người dân” là điều cấm kỵ trong kinh doanh.
Hãy tưởng tượng rằng một công ty mô hình y tế quy mô lớn nào đó A xây dựng trên mô hình quy mô lớn chung của công ty B, mở dữ liệu y tế cốt lõi của mình cho B và đào tạo một mô hình y tế quy mô lớn. Vài tháng sau, A phát hiện ra công ty B cũng đã cho ra mắt một mô hình y tế lớn và chức năng của nó cũng tương tự như công ty này. Khi một khách hàng trong ngành đặt hàng, anh ta phát hiện ra rằng Công ty B cũng đang đấu thầu và đối tác của anh ta đột nhiên trở thành đối thủ cạnh tranh. Nếu đúng như vậy, liệu Công ty A có còn sẵn sàng hợp tác với Công ty B hay không?
Trong một hệ sinh thái, niềm tin của đối tác vào chủ sở hữu hệ sinh thái quý như vàng. Chỉ khi các đối tác ứng dụng cấp cao tin tưởng chắc chắn rằng chủ sở hữu sinh thái sẽ không có xung đột lợi ích với anh ta hoặc ăn cắp hoạt động kinh doanh của anh ta, anh ta mới cảm thấy tự tin đặt doanh nghiệp của mình trên nền tảng do chủ sở hữu sinh thái xây dựng.
Điều này có phần giống với mối quan hệ giữa nhà cung cấp IaaS và nhà cung cấp SaaS trong lĩnh vực điện toán đám mây. Lý do quan trọng nhất khiến nhiều công ty SaaS ở Trung Quốc không hài lòng với các nhà cung cấp đám mây như Alibaba Cloud, Tencent Cloud, Baidu Cloud và Huawei Cloud là vì họ sợ xung đột lợi ích. Hiện tại, ranh giới kinh doanh của các nhà cung cấp đám mây IaaS chưa đủ rõ ràng, họ không chỉ cung cấp các sản phẩm IaaS và PaaS mà còn tham gia vào nhiều lĩnh vực SaaS, vốn là lĩnh vực cấm kỵ nhất đối với các đối tác SaaS của họ.
Trong giai đoạn đầu của Internet Trung Quốc, các nhà đầu tư đã đặt ra một câu hỏi nhức nhối nổi tiếng đối với các công ty khởi nghiệp – bạn sẽ làm gì nếu Tencent tạo ra sản phẩm tương tự?
Theo cách tương tự, nếu các nhà sản xuất mô hình lớn nói chung muốn xây dựng một hệ sinh thái ứng dụng, thì các nhà sản xuất mô hình lớn trong ngành trong lĩnh vực chăm sóc y tế, tài chính, chính phủ, sản xuất và các lĩnh vực khác cũng sẽ hỏi - liệu bạn có tạo ra thứ gì đó giống tôi trong tương lai, tôi nên làm gì?
Vậy loại hệ sinh thái mô hình lớn nào hợp lý hơn? Chúng ta có thể học hỏi từ hệ sinh thái điện toán đám mây, mô hình lớn nói chung tương đương với IaaS và mô hình lớn của ngành tương đương với SaaS.
Baidu, Huawei, Alibaba, Tencent, JD.com, ByteDance, iFlytek và các nhà sản xuất mô hình chung hàng đầu khác tập trung vào các mô hình chung lớn (IaaS+PaaS) và cố gắng không chạm vào các mô hình lớn trong ngành (SaaS).
Cần phải chỉ ra rằng ngay cả khi họ không tạo ra các mô hình lớn trong ngành, các nhà sản xuất mô hình lớn nói chung vẫn có thể chia sẻ lợi tức ứng dụng trong ngành của các mô hình lớn. Giống như các ứng dụng SaaS tiêu thụ tài nguyên IaaS và trả tiền cho IaaS, mô hình ngành cấp trên sẽ gọi các khả năng của mô hình chung cấp dưới và một mô hình kinh doanh hợp lý có thể được xây dựng dựa trên số lượng cuộc gọi và mức sử dụng.
Ví dụ: Baidu không tạo ra các mô hình y tế quy mô lớn, nhưng nó có 10 đối tác mô hình y tế quy mô lớn dựa trên Wen Xinyiyan và mỗi đối tác phục vụ 1.000 bệnh viện. Giả sử mỗi bệnh viện trả 1 triệu nhân dân tệ mỗi năm và Baidu chia sẻ 20% trong số 1 triệu nhân dân tệ này. Khi đó, mỗi công ty mô hình y tế quy mô lớn có thể kiếm được 1 tỷ nhân dân tệ mỗi năm và doanh thu của Baidu là 1 tỷ*20%*10=2 tỷ nhân dân tệ. Bằng cách này, Baidu chỉ cần phục vụ 10 đối tác, thay vì phục vụ 10.000 bệnh viện.
Tương tự, nếu có thể xây dựng được một hệ sinh thái mô hình lớn trong ngành thịnh vượng, thì việc ứng dụng công nghiệp các mô hình lớn cũng có thể mang lại hàng chục tỷ doanh thu cho các nhà sản xuất mô hình lớn nói chung.
Đối với các nhà sản xuất mô hình lớn nói chung như Baidu, Huawei, Tencent và Alibaba, không cần phải lo lắng về việc bỏ lỡ cổ tức của các ứng dụng mô hình lớn trong ngành. Cũng giống như trong lĩnh vực điện toán đám mây, doanh thu của nhà cung cấp SaaS nào có thể sánh ngang với Alibaba Cloud, Tencent Cloud và Huawei Cloud cung cấp IaaS?
Chỉ cần bạn tập trung đặt nền móng cho mô hình tổng thể lớn thì bạn có thể bán được “đất” mà không cần phải vất vả di chuyển gạch để xây nhà. Hãy nghĩ lại lĩnh vực bất động sản, các nhà phát triển bất động sản như Vanke và Evergrande có sinh lời nhiều nhất không? Rõ ràng là có lợi hơn và dễ bán đất hơn.
Đối với các nhà sản xuất mô hình lớn trong các ngành dọc, trạng thái lý tưởng nhất của họ là học hỏi từ các chiến lược triển khai trên nhiều đám mây của SaaS để đạt được việc triển khai mô hình chung xuyên suốt các mô hình lớn trong ngành và di chuyển hoạt động kinh doanh từ nền tảng mô hình chung này sang nền tảng mô hình chung khác một cách suôn sẻ. Điều này tránh bị ràng buộc vào một nền tảng duy nhất. Tất nhiên, các mô hình lớn của ngành hiện đang ở giai đoạn đầu và vẫn còn quá sớm để nói về việc triển khai mô hình tổng quát.
Ánh xạ dữ liệu chế độ triển khai trên nhiều mô hình của các mô hình công nghiệp lớn
Tóm lại, các gã khổng lồ công nghệ như Baidu, Huawei, Alibaba và Tencent nên tập trung vào nghiên cứu và phát triển các mô hình lớn nói chung hơn là ứng dụng các mô hình lớn trong ngành.
Một mặt, các mô hình lớn có mục đích chung vẫn chưa đủ tốt, các vấn đề như mức độ thông minh của mô hình không đủ, vấn đề ảo giác, khả năng diễn giải kém, khả năng kết hợp đa phương thức kém và chi phí đào tạo và suy luận mô hình cao vẫn còn nổi bật. Những gã khổng lồ công nghệ nên giải quyết những vấn đề này. Những câu đố cấp độ thấp hơn, mang tính thử thách hơn. Chỉ khi những vấn đề này được giải quyết thì nền tảng ứng dụng của ngành công nghiệp mô hình lớn mới có thể vững chắc.
Ở cấp độ ứng dụng của các ngành công nghiệp mô hình lớn, việc này hoàn toàn có thể được giao cho các công ty thuộc lĩnh vực dọc cấp trên hoàn thành. Có thể dự đoán rằng sẽ có hàng trăm, hàng nghìn công ty mô hình công nghiệp quy mô lớn cạnh tranh trong từng lĩnh vực, cuối cùng hàng chục công ty sẽ tồn tại và kẻ mạnh nhất sẽ tồn tại. Các nhà sản xuất mô hình lớn nói chung nên xây dựng một hệ sinh thái với các đối tác của mình để cùng phục vụ khách hàng trong ngành.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Tôi đề nghị Alibaba, Baidu, Huawei đừng vội giành lấy “việc làm” của những người mẫu lớn trong ngành!
Bản gốc: Yibi Yanyu
Nguồn: Data Ape
Phương tiện truyền thông dịch vụ đổi mới công nghiệp dữ liệu lớn
--Tập trung vào dữ liệu·Thay đổi hoạt động kinh doanh
Những tháng gần đây, một xu hướng phát triển rất rõ ràng trong lĩnh vực xe mô tô cỡ lớn trong nước là mọi người đang cùng nhau tập hợp lại để xây dựng những mẫu xe cỡ lớn trong ngành. Không chỉ các công ty trong nhiều lĩnh vực dọc khác nhau đã đưa ra nhiều mô hình công nghiệp lớn mà cả những gã khổng lồ hàng đầu như Baidu, Alibaba, Huawei, Tencent và JD.com cũng coi các mô hình lớn trong ngành là trọng tâm chính.
Cụ thể, các nhà sản xuất này có thể được chia thành hai loại dựa trên tỷ lệ các mẫu xe lớn trong chiến lược của họ:
Baidu, Alibaba, Tencent và iFlytek đều chú ý đến các mô hình lớn nói chung và các mô hình lớn trong ngành.
Một mặt, họ chú ý nhiều hơn đến các mô hình lớn nói chung và mở các mô hình lớn nói chung cho người dùng C-end. Baidu Wenxinyiyan và iFlytek Spark của iFlytek thậm chí còn tạo ra các ứng dụng di động để thúc đẩy ứng dụng của các mô hình lớn nói chung.
Mặt khác, họ cũng rất chú trọng đến các mô hình công nghiệp lớn. Nói chung, nó được xuất khẩu ra bên ngoài dưới dạng giải pháp công nghiệp. Thậm chí, vào ngày 19/9, Baidu đã trực tiếp ra mắt một mô hình lớn của ngành y tế - Mô hình Y học Tâm linh, phục vụ trực tiếp cho các bệnh viện, bệnh nhân và các công ty thiết bị y tế.
Hạng mục còn lại được đại diện bởi Huawei và JD.com, ngay từ đầu đã tập trung vào các mô hình công nghiệp quy mô lớn và hướng trực tiếp đến các ứng dụng công nghiệp.
Khẩu hiệu của mẫu Pangu của Huawei ngay từ đầu là "Đừng làm thơ, hãy làm đi." Nó không hào hứng với các ứng dụng C-end và gần như toàn bộ trọng tâm chiến lược của nó là vào ngành.
Mô hình lớn Yanxi của JD.com cũng tương tự, tuân thủ khái niệm "đám mây hiểu rõ hơn về ngành" của JD Cloud, JD.com cũng tập trung vào các ứng dụng công nghiệp trong lĩnh vực mô hình lớn. Ngoài ra, JD Health còn cho ra mắt mô hình lớn Jingyi Qianxun với tư cách là người tiên phong gia nhập ngành.
Có thể thấy, dù là Baidu, Alibaba, Tencent, iFlytek “quan tâm như nhau trên cả hai mặt trận”, hay Huawei và JD.com gần như “chiến đấu trên một mặt trận” thì đều coi mô hình lớn của ngành là như một chiến trường cho các nhà chiến lược quân sự.
Tác giả cho rằng đây là vấn đề. Những gã khổng lồ công nghệ này nên tập trung vào các mô hình lớn nói chung, các ứng dụng trong ngành nên để cho các đối tác trong các lĩnh vực công nghiệp khác nhau, họ chỉ nên xây dựng "cơ sở hạ tầng" của các mô hình lớn và không chạm vào các ứng dụng lớp trên.
Tại sao chúng tôi nói điều này Tiếp theo, hãy phân tích chi tiết ưu và nhược điểm.
##Các đại gia nên tập trung nghiên cứu phát triển các mẫu lớn nói chung
Các mô hình lớn nói chung giống như nền tảng của toàn bộ ngành công nghiệp mô hình lớn, nền móng có vững chắc hay không sẽ quyết định tòa nhà có thể xây được cao bao nhiêu. Vậy nền tảng hiện tại có vững chắc không?
Thật không may, mặc dù các mô hình lớn bước đầu đã đạt được sự “xuất hiện” của trí thông minh và đạt được tiến bộ lớn trong việc hiểu ngôn ngữ tự nhiên, tạo nội dung và suy luận logic, nhưng chúng vẫn chưa đủ tốt. Đặc biệt nếu chúng ta muốn triển khai thương mại các mô hình lớn trong các ngành khác nhau thì khả năng của mô hình hiện tại là không đủ.
Khả năng được đề cập ở đây không đủ mạnh và nó không đề cập cụ thể đến một mô hình lớn nào đó.
Công cụ tìm kiếm là một kịch bản ứng dụng quan trọng cho các mô hình lớn.Bing của Microsoft đã tạo ra bước ngoặt lớn bằng cách thay đổi phương pháp tìm kiếm từ khóa ban đầu nhờ khả năng truy cập vào ChatGPT. Vậy hiệu suất thực sự của Bing với sự hỗ trợ ChatGPT là gì?
Chúng tôi đã thử nó và thành thật mà nói thì khá thất vọng.
Sau đây là một ví dụ Hãy để Bing tìm kiếm tin tức về các mẫu lớn hôm nay (26/9) 4 mục tin được đưa ra là Sau khi click vào thì nội dung mục 1 và 3 thực ra là đến từ một bài báo, và đây là những mục đầu tiên mẩu tin được phát hành vào ngày 21 tháng 2; mục thứ hai và thứ tư cũng từ cùng một bài báo được phát hành vào ngày 27 tháng 7.
Sau đó tác giả hỏi thêm và yêu cầu dùng bảng để sắp xếp nội dung tin tức đã cho. Kết quả là trong bảng anh đưa ra, thời gian của tin tức đổi thành ngày 26 tháng 9, khi nói đến thời gian cụ thể thì điều này rõ ràng là vô nghĩa.
Baidu cũng đã ra mắt một chức năng tương tự. Ngoài tìm kiếm trên web thông thường, bạn cũng có thể truy vấn thông qua các cuộc hội thoại. Chúng tôi rất nóng lòng muốn dùng thử.
So với Bing, Baidu hiểu rõ hơn về các sự kiện tin tức, Bing đưa ra một số báo cáo, trong khi Baidu đưa ra kết quả dựa trên các bản phát hành mô hình lớn. Giá trị tin tức của những sự kiện này rõ ràng là cao hơn.
Hãy thử khả năng hiểu tài liệu của GPT-4. Chúng tôi đã tải lên báo cáo nửa năm 2023 của Loongson Zhongke và cố gắng để nó thực hiện phân tích SWOT đơn giản. Sau khi tải tài liệu lên, ChatGPT bắt đầu viết mã để phân tích tài liệu, mã này có vẻ rất mạnh mẽ.
Đúng là đã có một số “sự xuất hiện trí tuệ” ở các mô hình lớn và khả năng của chúng đã được cải thiện về chất, nhưng hiện tại chúng đang ở giai đoạn đầu “bông sen nhỏ mới lộ ra những góc cạnh sắc bén”. Vì việc phát hiện ra những mô hình lớn là một hướng đi đầy hứa hẹn nên điều quan trọng nhất cần làm lúc này là tăng tốc và nuôi dưỡng “đứa con” tiềm năng này thay vì để nó phụ giúp gia đình quá sớm.
Đánh giá từ kinh nghiệm lịch sử, sau mỗi cơn sốt trí tuệ nhân tạo sẽ là một thời gian dài im lặng, nguyên nhân chính là do kỳ vọng của mọi người trong giai đoạn đầu đã được nâng lên quá cao, và họ sẽ thất vọng khi thấy rằng kỳ vọng của mình không được đáp ứng.
Tương tự như vậy, nếu bây giờ chúng ta vội vàng triển khai các mô hình lớn trong các ngành khác nhau thì chúng ta sẽ sớm gặp phải một giai đoạn khó khăn, người dân sẽ nhanh chóng chuyển từ kỳ vọng lớn sang những lời phàn nàn điên cuồng, những thăng trầm như vậy không có lợi cho sự phát triển lành mạnh của ngành. .
Vì vậy, nhiệm vụ cốt lõi của các gã khổng lồ công nghệ như Alibaba, Huawei, Baidu, Tencent là nuôi dưỡng “đứa con” General Model. Chỉ cần khả năng thực sự được cải thiện, việc triển khai trên quy mô lớn sẽ thực sự diễn ra rất nhanh, vì vậy không cần phải vội vàng chờ đợi cho đến bây giờ.
Có một đường cong xuất hiện trí tuệ nổi tiếng trong lĩnh vực mô hình lớn, đó là hiệu suất của mô hình không liên quan tuyến tính với thang đo tham số, một mô hình có 20 tỷ tham số không tốt gấp đôi mô hình có 10 tỷ tham số. thông số.
Có một ngưỡng trên đường cong xuất hiện trí thông minh này, hiện tại ngưỡng này là khoảng 100 tỷ thông số. Trước ngưỡng này, mức độ thông minh mà mô hình hiển thị không thay đổi đáng kể khi thang tham số tăng lên.Một mô hình có 20 tỷ tham số hoạt động tương đương với mô hình có 2 tỷ tham số. Tuy nhiên, khi thang tham số vượt qua ngưỡng 100 tỷ, hiệu suất của mô hình được cải thiện theo cấp số nhân.
Đánh giá từ đường cong xuất hiện trí thông minh hiện tại, sau quy mô hàng trăm tỷ tham số, nó sẽ bước vào giai đoạn thắt cổ chai trí thông minh, có thể không có sự khác biệt đáng kể về "trí thông minh" giữa một mô hình có 500 tỷ tham số và một mô hình có 100 tỷ tham số . Tuy nhiên, nếu chúng ta muốn theo đuổi "ngưỡng khẩn cấp" tiếp theo, cách tốt nhất hiện tại là tiếp tục mở rộng kích thước tham số. Có lẽ, sau khi quy mô tham số mở rộng lên hàng chục nghìn tỷ, ngưỡng xuất hiện tiếp theo sẽ được mở ra và khả năng của các mô hình lớn sẽ đạt đến một tầm cao mới.
Tất nhiên, khi quy mô mô hình được mở rộng thì chi phí cũng sẽ tăng lên đáng kể nên đây chỉ có thể là cuộc chơi dành cho những gã khổng lồ. Hơn nữa, việc chỉ mở rộng kích thước mô hình cũng sẽ gây ra vấn đề quá khớp. Vì vậy, việc mở rộng quy mô mô hình cũng cần đi đôi với việc tối ưu hóa, điều chỉnh kiến trúc mô hình, đây mới là lúc năng lực kỹ thuật thực sự được thử nghiệm.
Lùi lại một bước, các mô hình lớn ngày nay đều dựa trên kiến trúc Transformer và kiến trúc này đã được một số nhà nghiên cứu của Google đề xuất trong một bài báo cách đây 5 năm. Vậy kiến trúc Transformer có thực sự là tốt nhất?Có kiến trúc mô hình nào tốt hơn không? Những câu hỏi này cần được trả lời bởi những gã khổng lồ công nghệ như Huawei, Baidu, Alibaba và Tencent.
Ngoài thang đo tham số và kiến trúc mô hình, các mô hình lớn còn cần giải quyết các vấn đề “ảo ảnh”, vấn đề về khả năng diễn giải và các vấn đề đa phương thức. Những vấn đề này vẫn chưa được giải quyết tốt, là vấn đề chung của toàn ngành. Chìa khóa để giải quyết những vấn đề này nằm ở những đột phá công nghệ cơ bản trong các mô hình lớn nói chung, chứ không phải trong các mô hình lớn trong ngành.
Tất nhiên, bất cứ ai thực sự có thể giải quyết những vấn đề quan trọng này sẽ được thị trường khen thưởng tương ứng.
Đừng đồng thời làm trọng tài và cầu thủ
Sở dĩ khuyến cáo các đại gia công nghệ không động đến các mẫu xe lớn của ngành là vì ngoài vấn đề chưa giải quyết được của các mẫu xe lớn nói chung, một lý do vô cùng quan trọng khác là tránh xung đột lợi ích với đối tác.
Đối với những gã khổng lồ công nghệ, họ chơi một trò chơi sinh thái và chia sẻ lợi ích về cơ sở hạ tầng.
Trong lĩnh vực mô hình lớn, đường truyền tải giá trị phải là mô hình lớn tổng hợp - mô hình lớn của ngành - khách hàng của ngành. Trong giai đoạn mô hình lớn của ngành, các nhà sản xuất mô hình lớn nói chung như Huawei, Baidu và Alibaba có thể tự phát triển các mô hình lớn trong ngành hoặc để các đối tác bên thứ ba tiến hành nghiên cứu và phát triển dựa trên các mô hình lớn chung của riêng họ.
Các mô hình lớn nói chung kiểm tra năng lực kỹ thuật, trong khi ngưỡng kỹ thuật của các mô hình lớn trong ngành không cao lắm, yếu tố cốt lõi của nó là dữ liệu và kinh nghiệm trong ngành, hai điểm này chính là khuyết điểm của các gã khổng lồ công nghệ. Để thu thập các bộ dữ liệu chất lượng cao từ nhiều ngành khác nhau như tài chính, chăm sóc y tế, sản xuất và bán lẻ cũng như hiểu được kịch bản kinh doanh của các ngành khác nhau, đây chắc chắn không phải là điều mà một công ty có thể làm được mà phải dựa vào sức mạnh của hệ sinh thái và sử dụng hàng nghìn dữ liệu từ toàn bộ hệ sinh thái. Các đối tác thực hiện việc đó.
Tất nhiên, các nhà sản xuất mô hình lớn nói chung như Baidu, Huawei và Tencent cũng có thể chiếm lĩnh cả hai tuyến truyền tải giá trị. Ví dụ, trong lĩnh vực y tế, Baidu không chỉ có thể sử dụng mô hình y học tâm linh quy mô lớn của riêng mình để phục vụ trực tiếp cho các bệnh viện, bệnh nhân và các công ty thiết bị y tế mà còn thúc đẩy việc xây dựng hệ thống đối tác mô hình y tế quy mô lớn theo chiều dọc.
Tuy nhiên, tình trạng này sẽ phải đối mặt với vấn đề “tranh lợi với người dân” là điều cấm kỵ trong kinh doanh.
Hãy tưởng tượng rằng một công ty mô hình y tế quy mô lớn nào đó A xây dựng trên mô hình quy mô lớn chung của công ty B, mở dữ liệu y tế cốt lõi của mình cho B và đào tạo một mô hình y tế quy mô lớn. Vài tháng sau, A phát hiện ra công ty B cũng đã cho ra mắt một mô hình y tế lớn và chức năng của nó cũng tương tự như công ty này. Khi một khách hàng trong ngành đặt hàng, anh ta phát hiện ra rằng Công ty B cũng đang đấu thầu và đối tác của anh ta đột nhiên trở thành đối thủ cạnh tranh. Nếu đúng như vậy, liệu Công ty A có còn sẵn sàng hợp tác với Công ty B hay không?
Trong một hệ sinh thái, niềm tin của đối tác vào chủ sở hữu hệ sinh thái quý như vàng. Chỉ khi các đối tác ứng dụng cấp cao tin tưởng chắc chắn rằng chủ sở hữu sinh thái sẽ không có xung đột lợi ích với anh ta hoặc ăn cắp hoạt động kinh doanh của anh ta, anh ta mới cảm thấy tự tin đặt doanh nghiệp của mình trên nền tảng do chủ sở hữu sinh thái xây dựng.
Điều này có phần giống với mối quan hệ giữa nhà cung cấp IaaS và nhà cung cấp SaaS trong lĩnh vực điện toán đám mây. Lý do quan trọng nhất khiến nhiều công ty SaaS ở Trung Quốc không hài lòng với các nhà cung cấp đám mây như Alibaba Cloud, Tencent Cloud, Baidu Cloud và Huawei Cloud là vì họ sợ xung đột lợi ích. Hiện tại, ranh giới kinh doanh của các nhà cung cấp đám mây IaaS chưa đủ rõ ràng, họ không chỉ cung cấp các sản phẩm IaaS và PaaS mà còn tham gia vào nhiều lĩnh vực SaaS, vốn là lĩnh vực cấm kỵ nhất đối với các đối tác SaaS của họ.
Trong giai đoạn đầu của Internet Trung Quốc, các nhà đầu tư đã đặt ra một câu hỏi nhức nhối nổi tiếng đối với các công ty khởi nghiệp – bạn sẽ làm gì nếu Tencent tạo ra sản phẩm tương tự?
Theo cách tương tự, nếu các nhà sản xuất mô hình lớn nói chung muốn xây dựng một hệ sinh thái ứng dụng, thì các nhà sản xuất mô hình lớn trong ngành trong lĩnh vực chăm sóc y tế, tài chính, chính phủ, sản xuất và các lĩnh vực khác cũng sẽ hỏi - liệu bạn có tạo ra thứ gì đó giống tôi trong tương lai, tôi nên làm gì?
Vậy loại hệ sinh thái mô hình lớn nào hợp lý hơn? Chúng ta có thể học hỏi từ hệ sinh thái điện toán đám mây, mô hình lớn nói chung tương đương với IaaS và mô hình lớn của ngành tương đương với SaaS.
Baidu, Huawei, Alibaba, Tencent, JD.com, ByteDance, iFlytek và các nhà sản xuất mô hình chung hàng đầu khác tập trung vào các mô hình chung lớn (IaaS+PaaS) và cố gắng không chạm vào các mô hình lớn trong ngành (SaaS).
Cần phải chỉ ra rằng ngay cả khi họ không tạo ra các mô hình lớn trong ngành, các nhà sản xuất mô hình lớn nói chung vẫn có thể chia sẻ lợi tức ứng dụng trong ngành của các mô hình lớn. Giống như các ứng dụng SaaS tiêu thụ tài nguyên IaaS và trả tiền cho IaaS, mô hình ngành cấp trên sẽ gọi các khả năng của mô hình chung cấp dưới và một mô hình kinh doanh hợp lý có thể được xây dựng dựa trên số lượng cuộc gọi và mức sử dụng.
Ví dụ: Baidu không tạo ra các mô hình y tế quy mô lớn, nhưng nó có 10 đối tác mô hình y tế quy mô lớn dựa trên Wen Xinyiyan và mỗi đối tác phục vụ 1.000 bệnh viện. Giả sử mỗi bệnh viện trả 1 triệu nhân dân tệ mỗi năm và Baidu chia sẻ 20% trong số 1 triệu nhân dân tệ này. Khi đó, mỗi công ty mô hình y tế quy mô lớn có thể kiếm được 1 tỷ nhân dân tệ mỗi năm và doanh thu của Baidu là 1 tỷ*20%*10=2 tỷ nhân dân tệ. Bằng cách này, Baidu chỉ cần phục vụ 10 đối tác, thay vì phục vụ 10.000 bệnh viện.
Tương tự, nếu có thể xây dựng được một hệ sinh thái mô hình lớn trong ngành thịnh vượng, thì việc ứng dụng công nghiệp các mô hình lớn cũng có thể mang lại hàng chục tỷ doanh thu cho các nhà sản xuất mô hình lớn nói chung.
Đối với các nhà sản xuất mô hình lớn nói chung như Baidu, Huawei, Tencent và Alibaba, không cần phải lo lắng về việc bỏ lỡ cổ tức của các ứng dụng mô hình lớn trong ngành. Cũng giống như trong lĩnh vực điện toán đám mây, doanh thu của nhà cung cấp SaaS nào có thể sánh ngang với Alibaba Cloud, Tencent Cloud và Huawei Cloud cung cấp IaaS?
Chỉ cần bạn tập trung đặt nền móng cho mô hình tổng thể lớn thì bạn có thể bán được “đất” mà không cần phải vất vả di chuyển gạch để xây nhà. Hãy nghĩ lại lĩnh vực bất động sản, các nhà phát triển bất động sản như Vanke và Evergrande có sinh lời nhiều nhất không? Rõ ràng là có lợi hơn và dễ bán đất hơn.
Đối với các nhà sản xuất mô hình lớn trong các ngành dọc, trạng thái lý tưởng nhất của họ là học hỏi từ các chiến lược triển khai trên nhiều đám mây của SaaS để đạt được việc triển khai mô hình chung xuyên suốt các mô hình lớn trong ngành và di chuyển hoạt động kinh doanh từ nền tảng mô hình chung này sang nền tảng mô hình chung khác một cách suôn sẻ. Điều này tránh bị ràng buộc vào một nền tảng duy nhất. Tất nhiên, các mô hình lớn của ngành hiện đang ở giai đoạn đầu và vẫn còn quá sớm để nói về việc triển khai mô hình tổng quát.
Tóm lại, các gã khổng lồ công nghệ như Baidu, Huawei, Alibaba và Tencent nên tập trung vào nghiên cứu và phát triển các mô hình lớn nói chung hơn là ứng dụng các mô hình lớn trong ngành.
Một mặt, các mô hình lớn có mục đích chung vẫn chưa đủ tốt, các vấn đề như mức độ thông minh của mô hình không đủ, vấn đề ảo giác, khả năng diễn giải kém, khả năng kết hợp đa phương thức kém và chi phí đào tạo và suy luận mô hình cao vẫn còn nổi bật. Những gã khổng lồ công nghệ nên giải quyết những vấn đề này. Những câu đố cấp độ thấp hơn, mang tính thử thách hơn. Chỉ khi những vấn đề này được giải quyết thì nền tảng ứng dụng của ngành công nghiệp mô hình lớn mới có thể vững chắc.
Ở cấp độ ứng dụng của các ngành công nghiệp mô hình lớn, việc này hoàn toàn có thể được giao cho các công ty thuộc lĩnh vực dọc cấp trên hoàn thành. Có thể dự đoán rằng sẽ có hàng trăm, hàng nghìn công ty mô hình công nghiệp quy mô lớn cạnh tranh trong từng lĩnh vực, cuối cùng hàng chục công ty sẽ tồn tại và kẻ mạnh nhất sẽ tồn tại. Các nhà sản xuất mô hình lớn nói chung nên xây dựng một hệ sinh thái với các đối tác của mình để cùng phục vụ khách hàng trong ngành.