Baichuan VS Zhipu, OpenAI của Trung Quốc là ai?

Question

*Nguồn bài viết: Light Cone Intelligence**Nội dung: Hao Xin**Editor: Lưu Vũ Kỳ*Đầu tháng 6, truyền thông nước ngoài đã đưa ra lời tra tấn "ai là OpenAI của Trung Quốc", và sau khi trải qua làn sóng khởi nghiệp mô hình lớn, sóng lớn ùa xuống cát, cuối cùng chỉ còn lại vài người.Tòa nhà Xaar một vài giao lộ bên ngoài Đại học Thanh Hoa là Trí tuệ Bạch Xuyên của doanh nhân ngôi sao Wang Xiaochuan, và Tòa nhà Mạng Sohu là AI phổ trí tuệ do học viện gửi đến. Sau khi trải qua thử thách của thị trường, họ trở thành hai ứng cử viên triển vọng nhất.Cuộc chiến giành hai tòa nhà dường như đã lặng lẽ bắt đầu.** Từ góc độ tài chính, Zhipu AI và Baichuan Intelligent đã hoàn thành nhiều vòng tài trợ quy mô lớn trong năm nay. **![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-7e2e2823fa-dd1a6f-69ad2a) (Light Cone Intelligent Mapping: Tổ chức theo thông tin công cộng)Năm nay, tổng số tiền tài trợ tích lũy của Zhipu AI vượt quá 2,5 tỷ nhân dân tệ và tổng số tiền tài trợ của Baichuan Intelligent đạt 350 triệu đô la Mỹ (khoảng 2,3 tỷ nhân dân tệ). Theo thông tin công khai, định giá mới nhất của **Zhipu AI đã vượt quá 10 tỷ nhân dân tệ, cao nhất hoặc 15 tỷ, là một trong những công ty trong nước nhanh nhất với định giá hơn 10 tỷ nhân dân tệ; **Sau vòng tài trợ mới nhất, Baichuan Intelligent đã được định giá hơn 1 tỷ đô la Mỹ (khoảng 6,6 tỷ nhân dân tệ).Từ góc độ thành phần nhóm, Zhipu AI và Baichuan Intelligent Master đi ra khỏi cùng một nhà, và Wang Shaolan, chủ tịch của Zhipu AI, và Wang Xiaochuan, người sáng lập Sogou, đều là nhóm kinh doanh của Sở Thanh Hoa.**Từ góc độ tốc độ bắt kịp công nghệ, cả hai cũng không thể phân biệt được. ** GLM-130B của Zhipu AI đã đánh bại GPT-3 ngay khi nó ra mắt, và Baichuan 2 mới được phát hành đi trước Llama 2 về mọi mặt, tiên phong trong việc phát triển hệ sinh thái nguồn mở của Trung Quốc.Tất cả các dấu hiệu cho thấy Zhipu AI và Baichuan Intelligence đã trở thành "ngựa ô" của đường đua mô hình lớn của Trung Quốc, và dưới sự cạnh tranh khốc liệt, hươu chết là ai?  ## ** Những người tin tưởng vào OpenAI: AI khôn ngoan **  Mối quan hệ giữa Zhipu AI và OpenAI có thể bắt nguồn từ năm 2020, được Zhang Peng, Giám đốc điều hành của Zhipu AI, coi là "năm đầu tiên của mô hình ngôn ngữ lớn AI" thực sự trong trái tim ông.Mối quan hệ giữa Zhipu AI và OpenAI có thể bắt nguồn từ năm 2020, được Zhang Peng, Giám đốc điều hành của Zhipu AI, coi là "năm đầu tiên của mô hình ngôn ngữ lớn AI" thực sự trong trái tim ông.Vào ngày kỷ niệm của Zhipu AI, trong bầu không khí vui vẻ, bạn có thể ngửi thấy một số lo lắng do sự ra đời của GPT-3 theo thời gian. GPT-3, đạt 175 tỷ tham số, là mô hình ngôn ngữ lớn đầu tiên theo nghĩa chặt chẽ.Khi đó, Zhang Peng không chỉ bị sốc bởi khả năng xuất hiện của GPT-3, mà còn rơi vào suy nghĩ "có nên đi theo hay không", dù là lúc đó hay bây giờ, tất cả đều theo hướng mô hình lớn thông số quy mô cực lớn là một điều cực kỳ mạo hiểm. Sau khi cân nhắc, Zhipu AI quyết định lấy OpenAI làm chuẩn mực và đầu tư vào việc phát triển các mô hình tiền đào tạo quy mô cực lớn.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e41f17dbae-dd1a6f-69ad2a) (Light Cone Intelligent Mapping: Tổ chức theo thông tin công cộng)**Về lựa chọn con đường công nghệ, Zhipu AI có tư duy độc lập giống như OpenAI. **Vào thời điểm đó, có một số khung tiền đào tạo mô hình lớn như BERT, GPT và T5. Ba con đường đều có những ưu nhược điểm riêng về mục tiêu đào tạo, cấu trúc mô hình, nguồn dữ liệu đào tạo và kích thước mô hình.Nếu so sánh quá trình đào tạo mô hình lớn với một kỳ thi tiếng Anh, BERT giỏi làm câu hỏi thông qua mối quan hệ giữa từ và câu, và làm bài kiểm tra thông qua hiểu, và tài liệu ôn tập của nó chủ yếu đến từ sách giáo khoa và Wikipedia; GPT rất giỏi trong việc dự đoán từ tiếp theo để làm câu hỏi, chuẩn bị cho kỳ thi thông qua rất nhiều bài thực hành viết và các tài liệu ôn tập của nó chủ yếu đến từ nhiều trang web khác nhau; T5 áp dụng chiến lược chính thức hóa các câu hỏi, đầu tiên dịch các câu hỏi sang tiếng Trung và sau đó giải quyết các câu hỏi, và khi ôn tập, không chỉ đọc sách giáo khoa mà còn chải một số lượng lớn các ngân hàng câu hỏi.Như chúng ta đã biết, Google đã chọn BERT, OpenAI chọn GPT và Zhipu AI đã không mù quáng làm theo, ** dựa trên hai tuyến đường được đề xuất khung thuật toán GLM (Mô hình ngôn ngữ chung) này. Khung thực sự nhận ra những ưu điểm và nhược điểm bổ sung của BERT và GPT, "có thể hiểu được trong khi tiếp tục và điền vào chỗ trống". **Do đó, GLM đã trở thành niềm tin lớn nhất để Zhipu AI theo đuổi OpenAI và trong khuôn khổ này, các mô hình dòng GLM như GLM-130B, ChatGLM-6B và ChatGLM2-6B đã được phát triển liên tiếp. Dữ liệu thực nghiệm cho thấy các mô hình lớn dòng GLM vượt trội hơn GPT về độ chính xác hiểu ngôn ngữ, tốc độ suy luận, tỷ lệ bộ nhớ và ứng dụng thích ứng mô hình lớn.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-dc70c8e5d7-dd1a6f-69ad2a) (Nguồn: Internet)OpenAI hiện là tổ chức hoàn chỉnh nhất có thể cung cấp các dịch vụ mô hình cơ bản ở nước ngoài và việc thương mại hóa của nó chủ yếu được chia thành hai loại, một là phí thu API và hai là phí đăng ký ChatGPT. Về mặt thương mại hóa, Zhipu AI cũng đi theo ý tưởng chung và nằm trong tiếng vang của các doanh nghiệp có thương mại hóa tương đối trưởng thành các mô hình lớn trong nước.Theo lược thông minh hình nón quang học, kết hợp với sự đổ bộ của các doanh nghiệp Trung Quốc, mô hình kinh doanh của **Zhipu AI được chia thành phí thu API và chế độ phí tư nhân hóa. **Các loại mô hình tổng thể được cung cấp là mô hình lớn ngôn ngữ, mô hình lớn siêu nhân hình, mô hình lớn vectơ và mã mô hình lớn và theo từng tùy chọn mô hình lớn, bao gồm giá tiêu chuẩn, giá riêng trên đám mây và giá riêng địa phương. So với OpenAI, Zhapu AI thiếu việc cung cấp các dịch vụ mô hình lớn bằng giọng nói và hình ảnh, nhưng bổ sung các mô hình lớn siêu nhân hóa, cũng phục vụ cho nhu cầu của con người kỹ thuật số, NPC thông minh và các ngành công nghiệp khác của Trung Quốc.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d5dc94c153-dd1a6f-69ad2a) (Light Cone Intelligent Mapping: Tổ chức theo thông tin công cộng)Light Cone Intelligence đã học được từ nhà phát triển rằng "hiện tại, các đặc điểm của nền tảng Baidu Wenxin Qianfan là hoàn hảo, các đặc điểm của Tongyi Qianwen rất linh hoạt và Zhipu AI là một trong những công ty có phí API rẻ nhất trong số các nhà sản xuất chính thống trên thị trường."Phí cho ChaGLM-Pro là 0,01 nhân dân tệ / nghìn mã thông báo và 18 nhân dân tệ được cho đi và phí ChaGLM-Lite giảm xuống còn 0,002 nhân dân tệ / nghìn mã thông báo. Để tham khảo, OpenAI GPT-3.5 tính phí 0,014 nhân dân tệ / nghìn mã thông báo, Ali Tongyi Qianwen-turbo tính phí 0,012 nhân dân tệ / nghìn mã thông báo và Baidu Wenxin One Word emie-bot-turbo tính phí 0,008 nhân dân tệ / nghìn mã thông báo.Như Zhang Peng đã nói, Zhipu AI cũng đang trải qua một giai đoạn mới "không còn theo OpenAI" với OpenAI là mục tiêu.Về kinh doanh sản phẩm, khác với OpenAI vốn chỉ tập trung vào việc nâng cấp và xây dựng ChatGPT, Zhipu AI đã chọn tấn công từ ba phía.Theo trang web chính thức của mình, hoạt động kinh doanh hiện tại của Zhipu AI chủ yếu được chia thành ba khối, đó là nền tảng MaaS mô hình lớn, nền tảng trí tuệ công nghệ AMiner và con người kỹ thuật số nhận thức. Kết quả là, ba ma trận sản phẩm AI chính đã được hình thành, sản phẩm mô hình lớn, sản phẩm AMiner và sản phẩm con người kỹ thuật số. Trong số đó, các sản phẩm mô hình lớn không chỉ bao gồm các robot đối thoại cơ bản, mà còn lập trình, viết, vẽ bộ phận robot mặt dây chuyền.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-0bf9c101e1-dd1a6f-69ad2a) (Nguồn: Trang web chính thức của Zhipu AI)Đồng thời, Zhipu AI tiếp tục khám phá khía cạnh ứng dụng thông qua đầu tư. Cho đến nay, Zhipu AI đã đầu tư vào Lingxin Intelligence và Painting Wall Intelligence, đồng thời tăng cổ phần của Lingxin Intelligent một lần nữa vào tháng 9 năm nay.Lingxin Intelligence cũng được ươm tạo từ Khoa Khoa học Máy tính của Đại học Thanh Hoa, mặc dù khoa tương đồng, nhưng Lingxin Intelligence có xu hướng ứng dụng nhiều hơn và cộng đồng tương tác quan tâm AiU do nó phát triển là một mô hình lớn siêu nhân hóa dựa trên Zhipu AI. Ý tưởng phát triển các sản phẩm của nó tương tự như AI nhân vật nước ngoài, bằng cách tạo ra các nhân vật AI với tính cách và nhân vật khác nhau, tương tác và trò chuyện với họ, nó nghiêng về các ứng dụng C-end và nhấn mạnh các thuộc tính giải trí.  ## ** Chuyển từ OpenAI sang LIama: Baichuan Intelligence**  Light Cone Intelligence nhận thấy rằng so với OpenAI, Baichuan Intelligence giống Llama hơn.**Trước hết, trên cơ sở công nghệ và kinh nghiệm ban đầu, tốc độ phát hành và lặp lại rất nhanh. **Nửa năm sau khi thành lập, Baichuan Intelligent đã liên tiếp phát hành bốn mô hình thương mại mã nguồn mở Baichuan-7B / 13B, Baichuan2-7B / 13B và hai mô hình lớn nguồn đóng Baichuan-53B và Baichuan2-53B. Kể từ khi khai trương giao diện API Baichuan2-53B vào ngày 25 tháng 9, trong 168 ngày qua, Baichuan Intelligent đã phát hành một mô hình lớn với tốc độ trung bình là tháng.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e27cb1a5a0-dd1a6f-69ad2a) (Light Cone Intelligent Mapping: Tổ chức theo thông tin công cộng)Meta dựa vào LLama2 để giành lại vị trí AI và Baichuan Intelligent nổi tiếng với việc đánh bại LLama2 với loạt mô hình mã nguồn mở Baichuan2.Theo kết quả thử nghiệm, Baichuan2-7B-Base và Baichuan2-13B-Base vượt trội hơn LLaMA2 trong một số điểm chuẩn đánh giá có thẩm quyền như MMLU, CMMLU, GSM8K, v.v. và hiệu suất của chúng cũng rất sáng so với các mô hình khác có số lượng lớn các thông số tương tự và hiệu suất của chúng tốt hơn đáng kể so với các đối thủ cạnh tranh của LLaMA2 và các mẫu khác có cùng kích thước.Sự thật đã chứng minh rằng mô hình lớn thông minh Baichuan thực sự đã đứng trước thử thách. Theo dữ liệu chính thức, Baichuan đã được tải xuống hơn 5 triệu lần trong cộng đồng nguồn mở và hơn 3 triệu lần mỗi tháng.Light Cone Intelligent nhận thấy rằng mô hình dòng thông minh Baichuan có số lượt tải xuống cao nhất trong cộng đồng nguồn mở Hugging Face với hơn 110.000, vẫn cạnh tranh giữa các mô hình nguồn mở của Trung Quốc và nước ngoài.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-d6975a90e4-dd1a6f-69ad2a) (Nguồn: Trang web chính thức của Hugging Face)Lý do tại sao mã nguồn mở của nó có lợi thế cũng liên quan đến khả năng tương thích mạnh mẽ của nó, Baichuan Intelligent đã giới thiệu trước công chúng rằng toàn bộ cấu trúc cơ sở mô hình lớn của nó gần với cấu trúc của LLAMA của Meta hơn, vì vậy nó rất thân thiện với các doanh nghiệp và nhà sản xuất từ thiết kế nguồn mở.** "Sau mã nguồn mở, hệ sinh thái sẽ được xây dựng xung quanh LLaMA, và có nhiều dự án nguồn mở ở nước ngoài theo LLaMA để thúc đẩy, đó là lý do tại sao cấu trúc của chúng tôi gần gũi hơn với LLaMA." Vương Tiểu Xuyên nói.Theo trí thông minh hình nón quang học, Baichuan Intelligent áp dụng phích cắm nóng trong thiết kế kiến trúc, có thể hỗ trợ chuyển đổi ngẫu nhiên giữa các mô-đun khác nhau của mô hình Baichuan và mô hình LLAMA và mô hình Baichuan, chẳng hạn như đào tạo mô hình với LLAMA, không cần sửa đổi, mô hình có thể được đưa trực tiếp vào Baichuan để sử dụng. Điều này cũng giải thích tại sao hầu hết các nhà sản xuất Internet hiện nay sử dụng mô hình Baichuan và các nhà cung cấp đám mây giới thiệu mô hình dòng Baichuan.Con đường mà lịch sử đã đi dẫn đến cả quá khứ và tương lai, và tinh thần kinh doanh mô hình lớn của Wang Xiaochuan là như thế này.Dựa trên danh tính của người sáng lập Sogou và kinh nghiệm công nghệ tìm kiếm, trong những ngày đầu khởi nghiệp, Wang Xiaochuan đã nhận được nhiều đánh giá của mọi người, "Tiểu Xuyên, là phù hợp nhất với những người mẫu lớn."** Xây dựng các mô hình lớn trong trải nghiệm và khung tìm kiếm đã trở thành màu nền của Baichuan Intelligence. **Chen Weipeng, đồng sáng lập Baichuan Intelligent Technology, từng nói rằng R&D tìm kiếm có nhiều điểm tương đồng với phát triển mô hình lớn, "Baichuan Intelligent nhanh chóng chuyển kinh nghiệm tìm kiếm sang nghiên cứu và phát triển các mô hình lớn, tương tự như một dự án có hệ thống 'chế tạo tên lửa', tháo dỡ các hệ thống phức tạp, thúc đẩy hợp tác nhóm và cải thiện hiệu quả của nhóm thông qua đánh giá quy trình."Wang Xiaochuan cũng nói chuyện tại cuộc họp báo: "Bởi vì Baichuan Intelligence có gen tìm kiếm trước đó, nó tự nhiên biết cách chọn các trang tốt nhất từ giữa hàng nghìn tỷ trang web, có thể được khử trùng lặp và chống rác." Trong xử lý dữ liệu, Baichuan Intelligent cũng rút ra kinh nghiệm của các tìm kiếm trước đó và có thể hoàn thành việc làm sạch và chống trùng lặp hàng trăm tỷ dữ liệu trong một giờ.Cốt lõi của tìm kiếm mô hình lớn của nó được hiển thị sống động trong Baichuan-53B. Trong việc xử lý vấn đề "ảo ảnh" của các mô hình lớn, kết hợp với sự kết tủa của công nghệ tìm kiếm, Baichuan Intelligent đã thực hiện tối ưu hóa trong việc thu thập thông tin, cải thiện chất lượng dữ liệu và nâng cao tìm kiếm.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-e8c8a50de0-dd1a6f-69ad2a) Về mặt nâng cao chất lượng dữ liệu, ý tưởng cốt lõi của Baichuan Intelligent là "luôn tận dụng tốt nhất", phân loại dữ liệu có chất lượng thấp và chất lượng cao làm tiêu chuẩn, đồng thời đảm bảo rằng Baichuan2-53B luôn sử dụng dữ liệu chất lượng cao để đào tạo trước; Về mặt thu thập thông tin, Baichuan2-53B đã nâng cấp nhiều mô-đun, bao gồm các thành phần chính như hiểu ý định hướng dẫn, tìm kiếm thông minh và nâng cao kết quả, thông qua sự hiểu biết sâu sắc về hướng dẫn người dùng, thúc đẩy chính xác việc tìm kiếm các thuật ngữ truy vấn và cuối cùng kết hợp công nghệ mô hình ngôn ngữ lớn để tối ưu hóa độ tin cậy của việc tạo kết quả mô hình.Mặc dù nó bắt đầu với mã nguồn mở, Baichuan Intelligent đã bắt đầu khám phá con đường thương mại hóa. Theo thông tin chính thức, mục tiêu của Baichuan Intelligence là "xây dựng cơ sở mô hình lớn tốt nhất ở Trung Quốc", và mục tiêu của chiều dọc là tăng cường trong tìm kiếm, đa phương thức, giáo dục, y tế và các lĩnh vực khác.Thương mại hóa ngày nay tập trung ở Baichuan2-53B và trang web chính thức cho thấy lệnh gọi API của mô hình áp dụng tiêu chuẩn sạc dựa trên thời gian. 0: 00-8: 00 tính phí 0,01 nhân dân tệ / nghìn mã thông báo, 8: 00-24: 00 tính phí 0,02 nhân dân tệ / nghìn mã thông báo, so với giá phí ban ngày cao hơn ban đêm.![](https://img-cdn.gateio.im/resized-social/moments-bab2147faf-4543fd2d4b-dd1a6f-69ad2a) (Nguồn: Trang web chính thức của Baichuan Intelligent )  ## **Hết**  Tranh luận ai là OpenAI của Trung Quốc không có nhiều ý nghĩa trong những ngày đầu phát triển mô hình lớn. Nhiều công ty khởi nghiệp như Zhipu AI và Baichuan Intelligent đã nhận ra rằng việc mù quáng đi theo bước chân của OpenAI là không nên, ví dụ, Zhipu AI đã làm rõ con đường kỹ thuật "không làm GPT Trung Quốc". Hơn nữa, tại thời điểm nguồn mở đang trở nên phổ biến và hình thành một cuộc bao vây, ưu thế công nghệ tuyệt đối của OpenAI dường như không phải là không thể phá vỡ.Zhipu AI, Baichuan Intelligent đã đề cập rằng siêu ứng dụng là một thị trường rộng lớn hơn, nhưng cũng là vùng thoải mái của các doanh nghiệp mô hình lớn của Trung Quốc, không còn tồn tại, ví dụ, một người thân cận với Zhipu AI đã từng tiết lộ tin tức với giới truyền thông, nhóm Zhipu AI đã xác định chắc chắn lộ trình 2B, nhắm vào thị trường thông tin và đổi mới, và trong 5 tháng, nhanh chóng mở rộng đội ngũ, từ 200 lên 500 người, cho nhân lực dự trữ kinh doanh 2B tiếp theo.Trong con đường thương mại hóa, Baichuan Intelligent đã chọn tham khảo hệ sinh thái nguồn mở của Llama2, và cũng đã bắt đầu lặp lại theo từng bước nhỏ.Có thể thấy bằng mắt thường chỉ trong nửa năm, Baichuan Intelligent và Zhipu AI đã trải qua vùng đất công nghệ không người và đi đến giai đoạn thương mại hóa hạ cánh công nghiệp. So với sự bùng nổ kinh doanh của AI 1.0, thời gian đánh bóng công nghệ dài tới 3 năm (2016-2019), và chính vì sự cản trở trong việc hạ cánh thương mại mà một số lượng lớn các công ty AI sẽ cùng nhau suy giảm vào năm 2022 và sụp đổ trước bình minh.Học hỏi từ những bài học của giai đoạn trước, nhưng cũng vì tính linh hoạt của công nghệ mô hình lớn thuận tiện hơn để hạ cánh, các công ty khởi nghiệp do Baichuan Intelligence và Zhipu AI đại diện đang huy động quân đội và ngựa để chuẩn bị công nghệ, sản phẩm và dự trữ tài năng cho giai đoạn tiếp theo.Tuy nhiên, những tiếng súng đầu tiên chỉ được nghe thấy trong cuộc đua marathon, và còn quá sớm để nói rằng kết quả là quá sớm. Nhưng ít nhất giai đoạn đầu tiên của đường đua đã bị phân hủy, và sau khi mục tiêu rõ ràng, cuộc thi thậm chí còn kiên nhẫn và kiên trì hơn. Điều này cũng tương tự đối với Baichuan Intelligence, Zhipu AI hoặc OpenAI.