Cuộc chiến của 100 mô hình đang diễn ra gay gắt, nhưng nhiều học viên ngày càng có nhiều câu hỏi về các mô hình lớn.
Trong lĩnh vực mô hình lớn cơ bản, Tencent, Alibaba, Baidu và những gã khổng lồ Internet khác đã đổ vào, và Alibaba, Baidu, iFLYTEK và các nhà sản xuất lớn khác đã liên tiếp phát hành các phiên bản mới nhất của các sản phẩm mô hình lớn trong tháng qua và khả năng kỹ thuật của họ cũng đã được cải thiện rất nhiều; Các startup lặp lại phiên bản mới cùng lúc, nhưng cũng "điên cuồng" tài chính, Zhipu AI mới đây thông báo năm nay đã nhận được tổng cộng 2,5 tỷ NDT tiền tài trợ, thành lập gần nửa năm Baichuan Intelligence đã nhận được 350 triệu USD tài trợ, trong số các nhà đầu tư của các startup này còn có Tencent, Alibaba, Meituan và các gã khổng lồ Internet khác.
Trung Quốc có thực sự cần nhiều mô hình cơ bản như vậy? Tất cả các công ty mô hình lớn cơ bản đều phát cuồng vì "lăn" các thông số kỹ thuật, nhưng thị trường cần loại mô hình lớn nào? Trong tình hình chiến đấu sôi nổi và hỗn loạn, những câu hỏi này đang được ngày càng nhiều người đặt ra.
Để trả lời câu hỏi này, trước tiên chúng ta phải hiểu mô hình lớn cơ bản kiếm tiền như thế nào tại thị trường Trung Quốc. Mặc dù đại đa số nhận thức của mọi người về các mô hình lớn là chatbot và nhiều người dùng bắt đầu sử dụng các sản phẩm này khi tìm kiếm thông tin và sắp xếp tài liệu, nhưng các công ty liên quan khó kiếm tiền từ các sản phẩm C-end này, và thậm chí quy mô người dùng càng lớn, doanh nghiệp càng mất tiền. **Hiện nay, hướng đi thực dụng nhất cho thương mại hóa các mô hình lớn cơ bản vẫn là mặt B, phục vụ các doanh nghiệp trong lĩnh vực bán lẻ, tài chính, sản xuất và các lĩnh vực khác để giảm chi phí và nâng cao hiệu quả, nhằm có được thu nhập thương mại ổn định. **
Chỉ có ba loại nhu cầu cho các mô hình lớn cơ bản: ** Trực tiếp gọi API mô hình lớn để có được các khả năng mô hình lớn có liên quan; Dựa trên mô hình lớn, việc phát triển thứ cấp được thực hiện phù hợp với thực tế kinh doanh; Phát triển các ứng dụng AI dựa trên các mô hình lớn. **Những yêu cầu này kiểm tra khả năng kỹ thuật của nền tảng mô hình lớn cơ bản và cũng kiểm tra khả năng dịch vụ doanh nghiệp của nó.
Từ góc độ khả năng dịch vụ, các công ty khởi nghiệp mô hình quy mô lớn và gã khổng lồ Internet phải bắt đầu lại từ đầu, và không ai có lợi thế bẩm sinh. Các nền tảng có thể hiểu rõ hơn về nhu cầu của khách hàng và cung cấp các dịch vụ ổn định và đáng tin cậy có thể nổi bật.
** Các mô hình lớn không bị "thổi bay" **
Với sự phổ biến của ChatGPT là điểm phân định ranh giới, sự phát triển của các mô hình lớn trong nước đã trải qua hai ngày.
Trước khi ChatGPT trở nên phổ biến, chỉ có một số ít các công ty trong nước tham gia vào việc nghiên cứu và phát triển các mô hình lớn cơ bản, bởi vì công nghệ và khả năng dịch vụ của các mô hình lớn chưa được thị trường chấp nhận rộng rãi và các công ty này chủ yếu tập trung vào nghiên cứu và phát triển công nghệ và tích lũy khả năng dịch vụ. Khi ChatGPT trở nên phổ biến, một số lượng lớn các nhà đầu tư và các học viên đã đổ vào, và các mô hình lớn đã trở thành một cửa hàng mới.
Thị trường nóng rất dễ làm phát sinh các nhà đầu cơ, những người không đi sâu vào công nghệ, nhưng kể những câu chuyện, khái niệm cường điệu, bất kể khả năng công nghệ và dịch vụ, trước tiên hãy kể câu chuyện lên bầu trời, và bằng cách này có được sự công nhận của thị trường vốn và khách hàng. Một học viên mô hình lớn nói đùa với Tiger Sniff rằng nhiều công ty mô hình lớn ở Trung Quốc tuyên bố rằng khoảng cách giữa họ và GPT-4 chỉ là vài tháng, và điều này là do họ đã thực hiện một số khóa đào tạo trên cơ sở GPT-2 là nguồn mở và xuất hiện để kể chuyện.
Trên thực tế, sự phát triển khả năng kỹ thuật của các mô hình lớn không thể đạt được bằng cách đào tạo trong vài tháng, bởi vì đây là một hệ thống phức tạp và điều rất quan trọng là phải có quy mô lớn, và không thể tạo ra một sự tiến hóa thông minh hơn mà không có quy mô nhất định. Tuy nhiên, việc tăng quy mô đào tạo của các mô hình lớn đòi hỏi rất nhiều thời gian và gỡ lỗi lặp đi lặp lại. Các kỹ thuật viên đã gỡ lỗi các thông số đào tạo của các mô hình lớn hiểu khó khăn này: không ai cho bạn biết phải làm gì, bạn phải tự mình tìm ra và tất cả các loại tình huống bất ngờ phát sinh trong quá trình cần có thời gian để giải quyết.
** Ở Trung Quốc, các mô hình lớn cơ bản thực sự tự tin vào khả năng kỹ thuật đã được đào tạo trước khi ChatGPT trở nên phổ biến **, vào thời điểm đó, mô hình lớn chưa được mọi người biết đến, và nhiều người không hiểu và không lạc quan về mô hình lớn, và các công ty khăng khăng đầu tư vào mô hình lớn rất chắc chắn về công nghệ mới.
Ví dụ, vào năm 2020, KLCII đã khởi động dự án nghiên cứu mô hình tiền đào tạo quy mô siêu lớn đầu tiên, Wudao và phiên bản 2.0 của nó đã trở thành mô hình nghìn tỷ cấp lớn nhất thế giới. Sau khi nâng cấp trong năm nay, "Wudao" bao gồm các mô hình lớn cơ bản như ngôn ngữ, tầm nhìn và đa phương thức, và đã bước vào giai đoạn nguồn mở đầy đủ.
Zhipu AI cũng đã phát triển kiến trúc tiền đào tạo GLM vào năm 2020, đồng thời đào tạo một mô hình GLM-10B với hàng chục tỷ thông số. Vào ngày 27 tháng 10, Zhipu AI đã phát hành mô hình đối thoại tự phát triển thế hệ thứ ba ChatGLM3, đã cải thiện đáng kể hiệu suất, khả năng suy luận và khả năng ngữ cảnh so với thế hệ trước. So với ChatGLM2, ChatGLM3 đứng đầu trong số 44 bộ dữ liệu công khai tiếng Trung và tiếng Anh ở Trung Quốc. Trong đó, MMLU tăng 36%, C tăng 33%, GSM8K tăng 179% và BBH tăng 126%.
Ngoài ra, về chức năng, một số mô hình lớn được phát triển trong nước (ChatGLM, CodeGeeX, WebGLM, CogVLM, v.v.) do Zhipu AI phát hành cũng là điểm chuẩn đầy đủ nhất Dòng OpenAI lớn ở Trung Quốc và có thể áp dụng cho trợ lý AI thế hệ "Zhipu Qingyan".
Loạt công ty đầu tiên tạo ra các mô hình lớn về cơ bản khác với các công ty đầu cơ vào các khái niệm và đuổi theo gió. Khi công nghệ mô hình quy mô lớn chưa bùng nổ và thị trường chưa quá biến động, họ tham gia vào nó vì họ đã tìm ra giá trị kỹ thuật và logic kinh doanh của mô hình quy mô lớn cơ bản. Sự khác biệt này cũng rất rõ ràng sau sự phổ biến của mô hình lớn, nhiều công ty tham gia vào các sản phẩm C-end vì lợi ích của lưu lượng truy cập và tính thời sự, trong khi các công ty sớm nhất như Zhipu AI tập trung hơn vào lĩnh vực dịch vụ doanh nghiệp, và tất cả các khả năng R &D và khả năng dịch vụ cũng được đặt ra xung quanh ý tưởng này, và họ đang tích lũy theo cách thực tế và phát triển theo hướng tạo ra giá trị cho khách hàng.
**Sự phức tạp của mô hình lớn xác định rằng các doanh nghiệp đã tích lũy công nghệ và khả năng dịch vụ trong một thời gian dài hơn có lợi thế mạnh hơn. Khi ngày càng có nhiều người trên thị trường nhận thức được sự phức tạp của các mô hình lớn và thời gian cần thiết cho sự phát triển của các mô hình lớn, những công ty mô hình lớn dựa vào cách kể chuyện để chiên các khái niệm sẽ ngày càng có ít chỗ để tồn tại và các công ty tích lũy nghiêm túc khả năng công nghệ và dịch vụ có thể chịu được thử thách của làn sóng cạnh tranh đầu tiên.
** Không có mô hình lớn về một hệ sinh thái thịnh vượng, không có tương lai **
**Trong quá trình thương mại hóa các mô hình lớn, bất cứ ai có thể đưa vào các kịch bản ứng dụng có nhu cầu cứng nhắc của xã hội sẽ là người đầu tiên hình thành một vòng tròn tự tạo máu đạo đức. **
Mô hình lớn nói chung có phạm vi ứng dụng rộng hơn, nhưng nó không đủ chuyên biệt để giải quyết các vấn đề cụ thể trong các lĩnh vực dọc. Các mô hình lớn theo chiều dọc có khả năng mạnh mẽ hơn để giải quyết các vấn đề cụ thể của miền, nhưng phạm vi dịch vụ rất hạn chế, điều này gây khó khăn cho nhiều mô hình lớn theo chiều dọc để đạt được sự cân bằng giữa chi phí và lợi ích kinh doanh, và không gian phát triển bị hạn chế.
Điểm cuối cùng của việc áp dụng các mô hình lớn là được sử dụng trong đời sống và sản xuất, giải quyết các vấn đề thực tiễn trong công việc và cuộc sống, nâng cao hiệu quả và năng suất công việc. Dựa trên những ưu nhược điểm của mô hình chung và mô hình dọc hiện tại, một ý tưởng phù hợp hơn trong quá trình thương mại hóa hiện tại của mô hình là mở nguồn công nghệ và khả năng dịch vụ cho bán lẻ, tài chính, sản xuất và các lĩnh vực khác, và mô hình chung và các doanh nghiệp trong các lĩnh vực liên quan làm việc cùng nhau để xây dựng các kịch bản ứng dụng. **
Tùy thuộc vào những hạn chế như dữ liệu, sức mạnh tính toán và kịch bản, không có quá nhiều mô hình lớn thực sự có thể chạy qua nguồn mở. Đồng thời, với tư cách là cơ sở công nghệ cơ bản, vai trò của mô hình lớn rất giống với hệ điều hành PC và điện thoại di động, và sẽ thể hiện một mô hình cạnh tranh "dưới gốc cây lớn, không một inch cỏ", nghĩa là một hoặc hai cơ sở kỹ thuật chiếm vị trí thống trị trong ngành và tất cả các nhà phát triển ứng dụng phải phát triển dựa trên hai cơ sở kỹ thuật này. Nếu mô hình bệ đỡ không thể hình thành một hệ sinh thái phát triển mạnh, sẽ không có khả năng phát triển bền vững.
Đánh giá từ lịch sử phát triển của hệ điều hành PC và điện thoại di động, lợi thế của người đi đầu là rất quan trọng. Khi Windows thống trị thị trường PC và iOS và Android được chia thành hai thế giới trong lĩnh vực điện thoại di động, rất khó để các hệ điều hành khác có chỗ cho một sự thay đổi.
Xu hướng tương tự cũng được quan sát thấy trong lĩnh vực mô hình lớn. Các mô hình lớn sẽ mở ra một hệ sinh thái ứng dụng AI thịnh vượng và dữ liệu, khả năng hoặc ứng dụng cá nhân và doanh nghiệp có thể nhanh chóng trở thành trình cắm AI, tăng cường khả năng của các mô hình lớn và làm cho các mô hình lớn trở nên thiết thực và dễ sử dụng hơn.
Hiện tại, Baidu, iFLYTEK và các công ty khổng lồ khác đã cam kết xây dựng sinh thái, nền tảng mô hình lớn Baidu Qianfan nền tảng 2.0 doanh nghiệp hoạt động hàng tháng của gần 10.000, bao gồm hơn 400 kịch bản về tài chính, giáo dục, sản xuất, năng lượng, các vấn đề chính phủ, giao thông vận tải và các ngành công nghiệp khác, quy mô nhà phát triển nền tảng mô hình lớn Spark của iFLYTEK đã vượt quá 700.000.
Một số startup đã tích lũy lâu năm trong lĩnh vực mô hình lớn cũng là những người đầu tiên ăn cua. Hiện tại, Zhipu AI có hơn 1.000 khách hàng và hơn 100 đối tác để xây dựng một hệ sinh thái, bao gồm nhiều kịch bản như truyền thông, SaaS, giáo dục và văn phòng. Ví dụ, đằng sau khả năng tạo tài liệu thông minh WPS của nội dung trình bày và viết thông cáo báo chí, có khả năng kỹ thuật của Zhipu AI như một sự hỗ trợ.
Trong cuộc cạnh tranh sinh thái của các nền tảng mô hình quy mô lớn khác nhau, thử nghiệm quan trọng nhất của nền tảng là giá trị mà nó mang lại cho các đối tác và khả năng phát triển cùng với các đối tác. Đối với kịch bản văn phòng, việc tạo nội dung thuyết trình, viết nội dung bài viết và viết lại văn phong có yêu cầu rất cao về độ chính xác và khả năng suy luận của nền tảng mô hình lớn và chỉ mô hình lớn đã đạt đến trình độ kỹ thuật nhất định mới có thể có khả năng hỗ trợ các ứng dụng này và nền tảng mô hình lớn cũng cần sửa lỗi và lặp lại theo phản hồi của người dùng trong các ứng dụng thực tế.
** Cho dù đó là một công ty khổng lồ hay một công ty mới thành lập, cho dù sức mạnh vốn và nguồn lực mạnh đến đâu, cần phải tích lũy và lặp lại từng bước từ đầu. Do đó, trong quá trình xây dựng hệ sinh thái cho các nền tảng mô hình lớn thì lợi thế về thời gian là rất quan trọng. Đây cũng là lý do tại sao các công ty khởi nghiệp có lợi thế đi đầu và các ông lớn Internet với tiềm lực tài chính mạnh hơn có thể cạnh tranh ngang hàng.
**100 cuộc chiến mô hình, ai phù hợp hơn với thị trường Trung Quốc? **
Mặc dù tình hình chiến đấu của cuộc chiến 100 mô hình diễn ra sôi nổi và hỗn loạn, nhưng hướng cạnh tranh đằng sau nó rất rõ ràng, và khả năng kỹ thuật và dịch vụ của nền tảng mô hình lớn để xây dựng một hệ sinh thái trực tiếp quyết định hướng cạnh tranh.
Việc xây dựng các khả năng này cần có thời gian để tích lũy và rất khó để đạt được chúng trong một sớm một chiều, nhưng nó không đủ để tích lũy chúng theo thời gian. Lợi thế của người đi trước, ngoài chênh lệch thời gian do hành động sớm mang lại, còn có khả năng nhận thức chính xác nhu cầu thị trường, nghĩa là hành động vững chắc và nhanh chóng theo một chiến lược chính xác, xoay vòng chiến lược và đường vòng có thể dễ dàng tiêu thụ tất cả các lợi thế thời gian tích lũy bằng hành động sớm.
Khi ngày càng có nhiều nền tảng mô hình lớn chuyển trọng tâm sang xây dựng sinh thái, việc xác định chiến lược và thực hiện nền tảng sẽ ngày càng trở nên quan trọng hơn trong cạnh tranh sinh thái. **Khi một vài nền tảng hoàn thành thay đổi về chất thành siêu nền tảng, bối cảnh cạnh tranh về cơ bản được xác định.
Trong thị trường nội địa rộng lớn và phức tạp, các công ty dịch vụ B-end dễ bị thay đổi và đi đường vòng chiến lược. Một mặt, khu vực và quy mô kinh doanh của các doanh nghiệp tại thị trường trong nước khác nhau, nhận thức về giá trị của các mô hình lớn đối với trí tuệ doanh nghiệp khá khác nhau, nguồn lực và chi phí họ sẵn sàng đầu tư cũng khác nhau, vì vậy rất khó để tìm ra một giải pháp chuẩn hóa; Mặt khác, các doanh nghiệp trong các lĩnh vực khác nhau có nhu cầu khác nhau về năng lực mô hình lớn, và thậm chí các doanh nghiệp khác nhau trong cùng một lĩnh vực có nhu cầu khác nhau đối với các mô hình lớn.
Trong một môi trường như vậy, so với kế hoạch thương mại hóa của OpenAI, việc thương mại hóa các nền tảng mô hình quy mô lớn trong nước đòi hỏi sự chú ý nhiều hơn đến chi tiết. Chúng tôi thấy một xu hướng như vậy trong các ý tưởng thương mại hóa của một số nền tảng.
Ví dụ, ngoài các dịch vụ API nền tảng mở phổ biến, Zhipu AI còn cung cấp hai giải pháp: tư nhân hóa đám mây và tư nhân hóa cục bộ. ** Tư nhân hóa đám mây có thể giúp các doanh nghiệp xây dựng các mô hình lớn của riêng họ dựa trên dữ liệu riêng tư với bảo mật mạnh mẽ hơn, trong khi tư nhân hóa địa phương là một giải pháp độc đáo tại thị trường Trung Quốc, ngoài việc cung cấp một mô hình mạnh mẽ hơn, nó còn cung cấp một ma trận mô hình hoàn chỉnh để đáp ứng các kịch bản và nhu cầu khác nhau. **
Để đáp ứng các nhu cầu khác nhau của khách hàng như tạo bài viết, dịch vụ khách hàng thông minh và chú thích dữ liệu, cũng như quy mô của các doanh nghiệp lớn, vừa và nhỏ, Zhipu AI cung cấp các giải pháp khác nhau, khách hàng có thể tự do kết hợp theo nhu cầu của riêng họ. Mô hình dịch vụ chi tiết và linh hoạt hơn này cũng dựa trên cái nhìn sâu sắc chính xác lâu dài về thị trường Trung Quốc.
Trước sự không chắc chắn của môi trường bên ngoài, Zhipu AI cũng đã đưa ra kế hoạch thích ứng chip trong nước, hợp tác với các nhà sản xuất phần cứng và nhà sản xuất chip trong nước để cung cấp các mức chứng nhận và thử nghiệm khác nhau cho các loại người dùng khác nhau và các loại chip khác nhau, để làm cho các dịch vụ mô hình lớn an toàn và đáng tin cậy hơn. Hiện tại, dòng ChatGLM đã hỗ trợ hơn 10 loại hệ sinh thái phần cứng trong nước, bao gồm Ascend, Siêu máy tính Shenwei, Haiguang DCU, Haifeike, Muxi Xiyun, Công nghệ máy tính, Tiantian Zhixin, Cambrian, Moore Threads, Baidu Kunlun Core, Lingxi Technology, Great Wall Chaoyun và mô hình thử nghiệm cuối cùng có thể triển khai điện thoại di động được phát hành đồng thời ChatGLM3-1.5B và 3B hỗ trợ Xiaomi, vivo, Samsung và các nền tảng điện thoại di động và xe khác.
Trận chiến càng khốc liệt trong cuộc chiến mô hình 100, những chi tiết dường như không rõ ràng này càng quan trọng, bởi vì những chi tiết này quyết định mức độ công nhận của các đối tác bên ngoài và cũng ảnh hưởng đến tốc độ hạ cánh của các mô hình lớn trong các kịch bản khác nhau. Ngưỡng chỉ đơn giản là phát hành một mô hình lớn không cao như thị trường tưởng tượng, nhưng có thể có các kịch bản dữ liệu chất lượng cao để tiếp tục lặp lại và hình thành các rào cản cạnh tranh, và chìa khóa cho các kịch bản dữ liệu chất lượng cao nằm ở các đối tác bên ngoài - nền tảng mà nhiều đối tác sẵn sàng lựa chọn giúp chạy qua chu kỳ kinh doanh này dễ dàng hơn.
Trong cuộc thi này, nhiều học viên tin rằng người chiến thắng phải là công ty khổng lồ với nguồn lực và khả năng tài chính mạnh hơn, nhưng thực tế không phải vậy. Các công ty khởi nghiệp và những người khổng lồ cũng cần phải đi bộ các thủ thuật và đi đến tận cùng của các chi tiết, và không có lối tắt. Đối với tài trợ, nó không phải là gốc rễ của cuộc chiến quyết định, bởi vì các công ty khởi nghiệp có khả năng cạnh tranh cốt lõi sẽ không thiếu tiền - ngay cả khi Zhipu AI đã nhận được số tiền tài trợ cao nhất từ các công ty khởi nghiệp mô hình quy mô lớn, vẫn có nhiều nhà đầu tư mới muốn tham gia trò chơi.
Nếu bạn nghĩ về nó từ một góc độ khác, trên thực tế, thị trường vốn đã bỏ phiếu bằng đôi chân của mình về việc ai phù hợp hơn với mô hình bệ đỡ của các doanh nghiệp Trung Quốc.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Mô hình lớn không phải là thú cưng của người khổng lồ
Nguồn bài viết: Tiger Sniff
Tác giả: Creek
Trong lĩnh vực mô hình lớn cơ bản, Tencent, Alibaba, Baidu và những gã khổng lồ Internet khác đã đổ vào, và Alibaba, Baidu, iFLYTEK và các nhà sản xuất lớn khác đã liên tiếp phát hành các phiên bản mới nhất của các sản phẩm mô hình lớn trong tháng qua và khả năng kỹ thuật của họ cũng đã được cải thiện rất nhiều; Các startup lặp lại phiên bản mới cùng lúc, nhưng cũng "điên cuồng" tài chính, Zhipu AI mới đây thông báo năm nay đã nhận được tổng cộng 2,5 tỷ NDT tiền tài trợ, thành lập gần nửa năm Baichuan Intelligence đã nhận được 350 triệu USD tài trợ, trong số các nhà đầu tư của các startup này còn có Tencent, Alibaba, Meituan và các gã khổng lồ Internet khác.
Trung Quốc có thực sự cần nhiều mô hình cơ bản như vậy? Tất cả các công ty mô hình lớn cơ bản đều phát cuồng vì "lăn" các thông số kỹ thuật, nhưng thị trường cần loại mô hình lớn nào? Trong tình hình chiến đấu sôi nổi và hỗn loạn, những câu hỏi này đang được ngày càng nhiều người đặt ra.
Để trả lời câu hỏi này, trước tiên chúng ta phải hiểu mô hình lớn cơ bản kiếm tiền như thế nào tại thị trường Trung Quốc. Mặc dù đại đa số nhận thức của mọi người về các mô hình lớn là chatbot và nhiều người dùng bắt đầu sử dụng các sản phẩm này khi tìm kiếm thông tin và sắp xếp tài liệu, nhưng các công ty liên quan khó kiếm tiền từ các sản phẩm C-end này, và thậm chí quy mô người dùng càng lớn, doanh nghiệp càng mất tiền. **Hiện nay, hướng đi thực dụng nhất cho thương mại hóa các mô hình lớn cơ bản vẫn là mặt B, phục vụ các doanh nghiệp trong lĩnh vực bán lẻ, tài chính, sản xuất và các lĩnh vực khác để giảm chi phí và nâng cao hiệu quả, nhằm có được thu nhập thương mại ổn định. **
Chỉ có ba loại nhu cầu cho các mô hình lớn cơ bản: ** Trực tiếp gọi API mô hình lớn để có được các khả năng mô hình lớn có liên quan; Dựa trên mô hình lớn, việc phát triển thứ cấp được thực hiện phù hợp với thực tế kinh doanh; Phát triển các ứng dụng AI dựa trên các mô hình lớn. **Những yêu cầu này kiểm tra khả năng kỹ thuật của nền tảng mô hình lớn cơ bản và cũng kiểm tra khả năng dịch vụ doanh nghiệp của nó.
Từ góc độ khả năng dịch vụ, các công ty khởi nghiệp mô hình quy mô lớn và gã khổng lồ Internet phải bắt đầu lại từ đầu, và không ai có lợi thế bẩm sinh. Các nền tảng có thể hiểu rõ hơn về nhu cầu của khách hàng và cung cấp các dịch vụ ổn định và đáng tin cậy có thể nổi bật.
** Các mô hình lớn không bị "thổi bay" **
Với sự phổ biến của ChatGPT là điểm phân định ranh giới, sự phát triển của các mô hình lớn trong nước đã trải qua hai ngày.
Trước khi ChatGPT trở nên phổ biến, chỉ có một số ít các công ty trong nước tham gia vào việc nghiên cứu và phát triển các mô hình lớn cơ bản, bởi vì công nghệ và khả năng dịch vụ của các mô hình lớn chưa được thị trường chấp nhận rộng rãi và các công ty này chủ yếu tập trung vào nghiên cứu và phát triển công nghệ và tích lũy khả năng dịch vụ. Khi ChatGPT trở nên phổ biến, một số lượng lớn các nhà đầu tư và các học viên đã đổ vào, và các mô hình lớn đã trở thành một cửa hàng mới.
Thị trường nóng rất dễ làm phát sinh các nhà đầu cơ, những người không đi sâu vào công nghệ, nhưng kể những câu chuyện, khái niệm cường điệu, bất kể khả năng công nghệ và dịch vụ, trước tiên hãy kể câu chuyện lên bầu trời, và bằng cách này có được sự công nhận của thị trường vốn và khách hàng. Một học viên mô hình lớn nói đùa với Tiger Sniff rằng nhiều công ty mô hình lớn ở Trung Quốc tuyên bố rằng khoảng cách giữa họ và GPT-4 chỉ là vài tháng, và điều này là do họ đã thực hiện một số khóa đào tạo trên cơ sở GPT-2 là nguồn mở và xuất hiện để kể chuyện.
Trên thực tế, sự phát triển khả năng kỹ thuật của các mô hình lớn không thể đạt được bằng cách đào tạo trong vài tháng, bởi vì đây là một hệ thống phức tạp và điều rất quan trọng là phải có quy mô lớn, và không thể tạo ra một sự tiến hóa thông minh hơn mà không có quy mô nhất định. Tuy nhiên, việc tăng quy mô đào tạo của các mô hình lớn đòi hỏi rất nhiều thời gian và gỡ lỗi lặp đi lặp lại. Các kỹ thuật viên đã gỡ lỗi các thông số đào tạo của các mô hình lớn hiểu khó khăn này: không ai cho bạn biết phải làm gì, bạn phải tự mình tìm ra và tất cả các loại tình huống bất ngờ phát sinh trong quá trình cần có thời gian để giải quyết.
** Ở Trung Quốc, các mô hình lớn cơ bản thực sự tự tin vào khả năng kỹ thuật đã được đào tạo trước khi ChatGPT trở nên phổ biến **, vào thời điểm đó, mô hình lớn chưa được mọi người biết đến, và nhiều người không hiểu và không lạc quan về mô hình lớn, và các công ty khăng khăng đầu tư vào mô hình lớn rất chắc chắn về công nghệ mới.
Ví dụ, vào năm 2020, KLCII đã khởi động dự án nghiên cứu mô hình tiền đào tạo quy mô siêu lớn đầu tiên, Wudao và phiên bản 2.0 của nó đã trở thành mô hình nghìn tỷ cấp lớn nhất thế giới. Sau khi nâng cấp trong năm nay, "Wudao" bao gồm các mô hình lớn cơ bản như ngôn ngữ, tầm nhìn và đa phương thức, và đã bước vào giai đoạn nguồn mở đầy đủ.
Zhipu AI cũng đã phát triển kiến trúc tiền đào tạo GLM vào năm 2020, đồng thời đào tạo một mô hình GLM-10B với hàng chục tỷ thông số. Vào ngày 27 tháng 10, Zhipu AI đã phát hành mô hình đối thoại tự phát triển thế hệ thứ ba ChatGLM3, đã cải thiện đáng kể hiệu suất, khả năng suy luận và khả năng ngữ cảnh so với thế hệ trước. So với ChatGLM2, ChatGLM3 đứng đầu trong số 44 bộ dữ liệu công khai tiếng Trung và tiếng Anh ở Trung Quốc. Trong đó, MMLU tăng 36%, C tăng 33%, GSM8K tăng 179% và BBH tăng 126%.
Ngoài ra, về chức năng, một số mô hình lớn được phát triển trong nước (ChatGLM, CodeGeeX, WebGLM, CogVLM, v.v.) do Zhipu AI phát hành cũng là điểm chuẩn đầy đủ nhất Dòng OpenAI lớn ở Trung Quốc và có thể áp dụng cho trợ lý AI thế hệ "Zhipu Qingyan".
**Sự phức tạp của mô hình lớn xác định rằng các doanh nghiệp đã tích lũy công nghệ và khả năng dịch vụ trong một thời gian dài hơn có lợi thế mạnh hơn. Khi ngày càng có nhiều người trên thị trường nhận thức được sự phức tạp của các mô hình lớn và thời gian cần thiết cho sự phát triển của các mô hình lớn, những công ty mô hình lớn dựa vào cách kể chuyện để chiên các khái niệm sẽ ngày càng có ít chỗ để tồn tại và các công ty tích lũy nghiêm túc khả năng công nghệ và dịch vụ có thể chịu được thử thách của làn sóng cạnh tranh đầu tiên.
** Không có mô hình lớn về một hệ sinh thái thịnh vượng, không có tương lai **
**Trong quá trình thương mại hóa các mô hình lớn, bất cứ ai có thể đưa vào các kịch bản ứng dụng có nhu cầu cứng nhắc của xã hội sẽ là người đầu tiên hình thành một vòng tròn tự tạo máu đạo đức. **
Mô hình lớn nói chung có phạm vi ứng dụng rộng hơn, nhưng nó không đủ chuyên biệt để giải quyết các vấn đề cụ thể trong các lĩnh vực dọc. Các mô hình lớn theo chiều dọc có khả năng mạnh mẽ hơn để giải quyết các vấn đề cụ thể của miền, nhưng phạm vi dịch vụ rất hạn chế, điều này gây khó khăn cho nhiều mô hình lớn theo chiều dọc để đạt được sự cân bằng giữa chi phí và lợi ích kinh doanh, và không gian phát triển bị hạn chế.
Điểm cuối cùng của việc áp dụng các mô hình lớn là được sử dụng trong đời sống và sản xuất, giải quyết các vấn đề thực tiễn trong công việc và cuộc sống, nâng cao hiệu quả và năng suất công việc. Dựa trên những ưu nhược điểm của mô hình chung và mô hình dọc hiện tại, một ý tưởng phù hợp hơn trong quá trình thương mại hóa hiện tại của mô hình là mở nguồn công nghệ và khả năng dịch vụ cho bán lẻ, tài chính, sản xuất và các lĩnh vực khác, và mô hình chung và các doanh nghiệp trong các lĩnh vực liên quan làm việc cùng nhau để xây dựng các kịch bản ứng dụng. **
Tùy thuộc vào những hạn chế như dữ liệu, sức mạnh tính toán và kịch bản, không có quá nhiều mô hình lớn thực sự có thể chạy qua nguồn mở. Đồng thời, với tư cách là cơ sở công nghệ cơ bản, vai trò của mô hình lớn rất giống với hệ điều hành PC và điện thoại di động, và sẽ thể hiện một mô hình cạnh tranh "dưới gốc cây lớn, không một inch cỏ", nghĩa là một hoặc hai cơ sở kỹ thuật chiếm vị trí thống trị trong ngành và tất cả các nhà phát triển ứng dụng phải phát triển dựa trên hai cơ sở kỹ thuật này. Nếu mô hình bệ đỡ không thể hình thành một hệ sinh thái phát triển mạnh, sẽ không có khả năng phát triển bền vững.
Đánh giá từ lịch sử phát triển của hệ điều hành PC và điện thoại di động, lợi thế của người đi đầu là rất quan trọng. Khi Windows thống trị thị trường PC và iOS và Android được chia thành hai thế giới trong lĩnh vực điện thoại di động, rất khó để các hệ điều hành khác có chỗ cho một sự thay đổi.
Xu hướng tương tự cũng được quan sát thấy trong lĩnh vực mô hình lớn. Các mô hình lớn sẽ mở ra một hệ sinh thái ứng dụng AI thịnh vượng và dữ liệu, khả năng hoặc ứng dụng cá nhân và doanh nghiệp có thể nhanh chóng trở thành trình cắm AI, tăng cường khả năng của các mô hình lớn và làm cho các mô hình lớn trở nên thiết thực và dễ sử dụng hơn.
Hiện tại, Baidu, iFLYTEK và các công ty khổng lồ khác đã cam kết xây dựng sinh thái, nền tảng mô hình lớn Baidu Qianfan nền tảng 2.0 doanh nghiệp hoạt động hàng tháng của gần 10.000, bao gồm hơn 400 kịch bản về tài chính, giáo dục, sản xuất, năng lượng, các vấn đề chính phủ, giao thông vận tải và các ngành công nghiệp khác, quy mô nhà phát triển nền tảng mô hình lớn Spark của iFLYTEK đã vượt quá 700.000.
Một số startup đã tích lũy lâu năm trong lĩnh vực mô hình lớn cũng là những người đầu tiên ăn cua. Hiện tại, Zhipu AI có hơn 1.000 khách hàng và hơn 100 đối tác để xây dựng một hệ sinh thái, bao gồm nhiều kịch bản như truyền thông, SaaS, giáo dục và văn phòng. Ví dụ, đằng sau khả năng tạo tài liệu thông minh WPS của nội dung trình bày và viết thông cáo báo chí, có khả năng kỹ thuật của Zhipu AI như một sự hỗ trợ.
** Cho dù đó là một công ty khổng lồ hay một công ty mới thành lập, cho dù sức mạnh vốn và nguồn lực mạnh đến đâu, cần phải tích lũy và lặp lại từng bước từ đầu. Do đó, trong quá trình xây dựng hệ sinh thái cho các nền tảng mô hình lớn thì lợi thế về thời gian là rất quan trọng. Đây cũng là lý do tại sao các công ty khởi nghiệp có lợi thế đi đầu và các ông lớn Internet với tiềm lực tài chính mạnh hơn có thể cạnh tranh ngang hàng.
**100 cuộc chiến mô hình, ai phù hợp hơn với thị trường Trung Quốc? **
Mặc dù tình hình chiến đấu của cuộc chiến 100 mô hình diễn ra sôi nổi và hỗn loạn, nhưng hướng cạnh tranh đằng sau nó rất rõ ràng, và khả năng kỹ thuật và dịch vụ của nền tảng mô hình lớn để xây dựng một hệ sinh thái trực tiếp quyết định hướng cạnh tranh.
Việc xây dựng các khả năng này cần có thời gian để tích lũy và rất khó để đạt được chúng trong một sớm một chiều, nhưng nó không đủ để tích lũy chúng theo thời gian. Lợi thế của người đi trước, ngoài chênh lệch thời gian do hành động sớm mang lại, còn có khả năng nhận thức chính xác nhu cầu thị trường, nghĩa là hành động vững chắc và nhanh chóng theo một chiến lược chính xác, xoay vòng chiến lược và đường vòng có thể dễ dàng tiêu thụ tất cả các lợi thế thời gian tích lũy bằng hành động sớm.
Khi ngày càng có nhiều nền tảng mô hình lớn chuyển trọng tâm sang xây dựng sinh thái, việc xác định chiến lược và thực hiện nền tảng sẽ ngày càng trở nên quan trọng hơn trong cạnh tranh sinh thái. **Khi một vài nền tảng hoàn thành thay đổi về chất thành siêu nền tảng, bối cảnh cạnh tranh về cơ bản được xác định.
Trong thị trường nội địa rộng lớn và phức tạp, các công ty dịch vụ B-end dễ bị thay đổi và đi đường vòng chiến lược. Một mặt, khu vực và quy mô kinh doanh của các doanh nghiệp tại thị trường trong nước khác nhau, nhận thức về giá trị của các mô hình lớn đối với trí tuệ doanh nghiệp khá khác nhau, nguồn lực và chi phí họ sẵn sàng đầu tư cũng khác nhau, vì vậy rất khó để tìm ra một giải pháp chuẩn hóa; Mặt khác, các doanh nghiệp trong các lĩnh vực khác nhau có nhu cầu khác nhau về năng lực mô hình lớn, và thậm chí các doanh nghiệp khác nhau trong cùng một lĩnh vực có nhu cầu khác nhau đối với các mô hình lớn.
Trong một môi trường như vậy, so với kế hoạch thương mại hóa của OpenAI, việc thương mại hóa các nền tảng mô hình quy mô lớn trong nước đòi hỏi sự chú ý nhiều hơn đến chi tiết. Chúng tôi thấy một xu hướng như vậy trong các ý tưởng thương mại hóa của một số nền tảng.
Ví dụ, ngoài các dịch vụ API nền tảng mở phổ biến, Zhipu AI còn cung cấp hai giải pháp: tư nhân hóa đám mây và tư nhân hóa cục bộ. ** Tư nhân hóa đám mây có thể giúp các doanh nghiệp xây dựng các mô hình lớn của riêng họ dựa trên dữ liệu riêng tư với bảo mật mạnh mẽ hơn, trong khi tư nhân hóa địa phương là một giải pháp độc đáo tại thị trường Trung Quốc, ngoài việc cung cấp một mô hình mạnh mẽ hơn, nó còn cung cấp một ma trận mô hình hoàn chỉnh để đáp ứng các kịch bản và nhu cầu khác nhau. **
Trước sự không chắc chắn của môi trường bên ngoài, Zhipu AI cũng đã đưa ra kế hoạch thích ứng chip trong nước, hợp tác với các nhà sản xuất phần cứng và nhà sản xuất chip trong nước để cung cấp các mức chứng nhận và thử nghiệm khác nhau cho các loại người dùng khác nhau và các loại chip khác nhau, để làm cho các dịch vụ mô hình lớn an toàn và đáng tin cậy hơn. Hiện tại, dòng ChatGLM đã hỗ trợ hơn 10 loại hệ sinh thái phần cứng trong nước, bao gồm Ascend, Siêu máy tính Shenwei, Haiguang DCU, Haifeike, Muxi Xiyun, Công nghệ máy tính, Tiantian Zhixin, Cambrian, Moore Threads, Baidu Kunlun Core, Lingxi Technology, Great Wall Chaoyun và mô hình thử nghiệm cuối cùng có thể triển khai điện thoại di động được phát hành đồng thời ChatGLM3-1.5B và 3B hỗ trợ Xiaomi, vivo, Samsung và các nền tảng điện thoại di động và xe khác.
Trận chiến càng khốc liệt trong cuộc chiến mô hình 100, những chi tiết dường như không rõ ràng này càng quan trọng, bởi vì những chi tiết này quyết định mức độ công nhận của các đối tác bên ngoài và cũng ảnh hưởng đến tốc độ hạ cánh của các mô hình lớn trong các kịch bản khác nhau. Ngưỡng chỉ đơn giản là phát hành một mô hình lớn không cao như thị trường tưởng tượng, nhưng có thể có các kịch bản dữ liệu chất lượng cao để tiếp tục lặp lại và hình thành các rào cản cạnh tranh, và chìa khóa cho các kịch bản dữ liệu chất lượng cao nằm ở các đối tác bên ngoài - nền tảng mà nhiều đối tác sẵn sàng lựa chọn giúp chạy qua chu kỳ kinh doanh này dễ dàng hơn.
Trong cuộc thi này, nhiều học viên tin rằng người chiến thắng phải là công ty khổng lồ với nguồn lực và khả năng tài chính mạnh hơn, nhưng thực tế không phải vậy. Các công ty khởi nghiệp và những người khổng lồ cũng cần phải đi bộ các thủ thuật và đi đến tận cùng của các chi tiết, và không có lối tắt. Đối với tài trợ, nó không phải là gốc rễ của cuộc chiến quyết định, bởi vì các công ty khởi nghiệp có khả năng cạnh tranh cốt lõi sẽ không thiếu tiền - ngay cả khi Zhipu AI đã nhận được số tiền tài trợ cao nhất từ các công ty khởi nghiệp mô hình quy mô lớn, vẫn có nhiều nhà đầu tư mới muốn tham gia trò chơi.
Nếu bạn nghĩ về nó từ một góc độ khác, trên thực tế, thị trường vốn đã bỏ phiếu bằng đôi chân của mình về việc ai phù hợp hơn với mô hình bệ đỡ của các doanh nghiệp Trung Quốc.