Nếu bạn nhìn vào các báo cáo phương tiện truyền thông về các mô hình lớn mỗi ngày, bạn sẽ bị lóa mắt bởi sự đa dạng của các mô hình và các ứng dụng đáng sợ tồn tại trong thời gian ngắn, nghĩ rằng tương lai của các mô hình nằm trong mô hình toàn diện tiếp theo. Vì vậy, AI dường như là một câu chuyện về OpenAI hoặc Anthropic chiến thắng.
Tài chính đã được hoàn thành với tốc độ và khối lượng đáng kinh ngạc dường như chứng minh nhận thức này.
Anthropic, được coi là một trong những đối thủ lớn nhất của OpenAI, đang trong vòng tài trợ theo chu kỳ hàng tháng là 2 tỷ - vào ngày 27 tháng 10, Google cho biết họ đã đầu tư thêm 2 tỷ đô la vào nó, chưa đầy một tháng sau khi Amazon đầu tư 4 tỷ đô la vào nó và mô hình Claude, cạnh tranh với các tính năng như độ dài ngữ cảnh, được coi là một trong những đối thủ cạnh tranh mạnh nhất của ChatGPT. Đồng thời, OpenAI cũng đang thu thập nhiều nguồn lực khác nhau và đằng sau mọi động thái của nó, SoftBank, Microsoft và Apple đều là tin đồn với nó theo nhiều cách khác nhau.
Tuy nhiên, trên thực tế, đây không phải là toàn bộ câu chuyện.
Đối với các học viên, mặt khác của câu chuyện sâu sắc hơn:
Rõ ràng, đó là một lựa chọn tốt hơn để lấy đô la của những nhà đầu tư có nhiều tiền hơn và ít việc phải làm hơn, tuy nhiên, tất cả họ đều chọn các nhà máy lớn lần lượt, và thậm chí cả các nhà máy lớn đang để mắt đến họ, chỉ vì một điều - họ có khả năng điện toán đám mây. Đóng góp của OpenAI cho Microsoft Azure đã được nói quá nhiều lần trên con đường thành công và Anthropic hiện đảm bảo cho mình sự hỗ trợ sức mạnh điện toán đám mây của Google và Amazon cùng một lúc, và nó nói rằng một trong những mục đích quan trọng của tài chính là xây dựng đảm bảo sức mạnh tính toán cho chính nó để đào tạo thế hệ mô hình tiếp theo.
Đây là một minh chứng tuyệt vời cho sự cần thiết của đám mây cho các mô hình lớn.
Tại Hội nghị Apsara hôm 31/10, hàng loạt dữ liệu từ Alibaba Cloud cũng cho thấy điều tương tự.
Alibaba Cloud đã công bố một số mô hình chạy trên các dịch vụ của mình, từ mô hình lớn Tongyi của riêng mình, đến Baichuan Intelligence, Zhipu AI, Zero One Everything, Kunlun Wanwei, vivo, Đại học Fudan, v.v., một nửa số công ty và tổ chức mô hình lớn của Trung Quốc được đào tạo tại đây.
Các mô hình chính thống này ở Trung Quốc cũng đang cung cấp dịch vụ API thông qua Alibaba Cloud, bao gồm loạt Tongyi, loạt Baichuan, dòng Zhipu AI ChatGLM, mô hình chung Jiang Ziya, v.v.
Những mô hình này bắt kịp với cấp cao nhất cùng một lúc, nhưng cũng bắt đầu phát triển các đặc điểm riêng của chúng, trong đó một trong những công ty mô hình lớn nhất Trung Quốc Baichuan Intelligence, đã thiết lập trung bình 28 ngày để lặp lại một phiên bản kỷ lục của một mô hình lớn, nó ngày 30 tháng 10 Phiên bản mới nhất của Baichuan2-192K đã trở thành hỗ trợ dài nhất thế giới cho cửa sổ ngữ cảnh của mô hình lớn, có thể nhập 350.000 từ cùng một lúc, dẫn đầu Claude2-100K.
Những ưu điểm này đều chỉ ra các ứng dụng thực tế hơn. Wang Xiaochuan, Giám đốc điều hành của Baichuan Intelligence, mô tả điều này là "chậm hơn một bước so với lý tưởng và nhanh hơn ba bước trên mặt đất". Mặt khác, cơ sở hạ tầng đám mây cung cấp khả năng nhanh chóng.
Wang Xiaochuan giới thiệu rằng một lý do quan trọng cho sự lặp lại hàng tháng của mô hình Baichuan là sự hỗ trợ của điện toán đám mây. "Việc lặp lại và triển khai nhanh chóng mô hình không thể tách rời khỏi điện toán đám mây, và Baichuan Intelligence và Alibaba Cloud đã thực hiện hợp tác sâu rộng. Với sự nỗ lực chung của hai bên, Baichuan đã hoàn thành xuất sắc nhiệm vụ đào tạo mô hình lớn kilocalo, giảm hiệu quả chi phí suy luận mô hình và nâng cao hiệu quả triển khai mô hình. "
Một lý do khác khiến tầm quan trọng của điện toán đám mây bị bỏ qua là lĩnh vực AI đã bị phân tâm bởi "thiếu thẻ cho tất cả".
"Mọi người đang chú ý quá nhiều đến GPU." Nhiều học viên mô hình lớn nói với tôi rằng là một đơn vị tính toán, nó thực sự được nâng cao liên tục, nhưng để giải quyết vấn đề của AI, điều cuối cùng cần thiết là một giải pháp sức mạnh tính toán có hệ thống và tối ưu. Ngay cả đám mây cũng là một thứ giải quyết vấn đề của một đơn vị duy nhất không đủ mạnh kể từ khi thành lập.
"Chỉ có thẻ, chỉ có mô hình tuyệt vời trong giấy, nó không đủ, và cuối cùng dựa vào đám mây để hạ cánh và sau đó nhận ra lý tưởng." Hắn nói. Nếu bạn cẩn thận chọc tai và lắng nghe "tiếng hét" của những người tham gia thực sự này ở tuyến đầu của hệ sinh thái mô hình, thì bạn có thể nghe thấy một từ:
Mây!
Tương lai của AI phát triển như thế nào phụ thuộc vào đám mây ngày nay hơn bao giờ hết.
Một đám mây mới
Nhưng điều này chắc chắn không có nghĩa là các nhà cung cấp đám mây đã thiết lập lợi thế có thể nằm xuống và giành chiến thắng.
Chỉ cần nhìn vào những gì đã xảy ra sau khi Google và Microsoft gần đây phát hành báo cáo thu nhập của họ trong cùng một ngày.
Vào ngày 25 tháng 10, Google đã công bố một báo cáo thu nhập vượt quá mong đợi, với mức tăng hàng năm là 11% và hoạt động kinh doanh quảng cáo cốt lõi cũng tăng 9%. Nhưng sau đó giá cổ phiếu giảm. Chỉ có một lý do, điện toán đám mây đã tăng trưởng 22%, nhưng thị trường tin rằng điều đó là không đủ. Đặc biệt, báo cáo tài chính của Microsoft được công bố cùng ngày cho thấy bộ phận đám mây thông minh của hãng trở thành nguồn doanh thu lớn nhất.
Lần đầu tiên, những gã khổng lồ thấy mình bị gạt ra ngoài lề với các doanh nghiệp như quảng cáo, điều mà họ từng nói đến, bởi vì điện toán đám mây được coi là một thước đo có thể quan sát được so với doanh thu trực tiếp được tạo ra bởi các mô hình vẫn còn ảo tưởng. Đằng sau chỉ số này là khả năng của các nhà cung cấp đám mây thích ứng với những thách thức do AI mang lại.
Ngay cả AWS, thị phần số 1, cũng đang cảm thấy áp lực và khoản đầu tư của Amazon vào Anthropic cũng xảy ra trong các báo cáo thu nhập này. Đã có báo cáo rằng 3% doanh thu Azure của Microsoft đến từ AI và khách hàng của họ bao gồm một số lượng lớn người dùng OpenAI và AWS đang bắt đầu nhấn mạnh các dịch vụ của mình cho các mô hình khác nhau. Sau khi ném 2 tỷ vào Anthropic, ngay lập tức có thông báo rằng LLM sau công ty mô hình sẽ được xây dựng với chip tăng tốc đào tạo của AWS Trainium và chip suy luận Inferentia. Ngoài ra, chẳng hạn như giải pháp cụm mới được nêu bật trong báo cáo tài chính của Microsoft và Bedrock, một dịch vụ mô hình cơ bản được quản lý toàn phần cho AWS, cũng đang nhấn mạnh sự chuyển đổi của chính họ cho các nhu cầu AI mới.
"Đối mặt với kỷ nguyên thông minh, Alibaba Cloud sẽ nâng cấp hệ thống điện toán đám mây của mình thông qua đổi mới công nghệ toàn diện từ sức mạnh tính toán cơ bản đến nền tảng AI đến dịch vụ mô hình." Zhou Jingren, người xác định lộ trình kỹ thuật của Alibaba Cloud, cũng đã đưa ra câu trả lời của mình tại Hội nghị Apsara. Những thay đổi được Alibaba Cloud phản ánh lần này mang tính quyết định và kỹ lưỡng, từ kết cấu đến cốt lõi, tất cả đều được biến đổi cho AI.
Theo giới thiệu của Zhou Jingren, Alibaba Cloud lần đầu tiên sử dụng một mô hình lớn để tự chuyển đổi và hơn 30 sản phẩm đám mây đã được kết nối với các khả năng mô hình lớn.
Ví dụ, DataWorks, nền tảng quản trị dữ liệu lớn của Alibaba Cloud, đã thêm một hình thức tương tác mới, Copilot, cho phép người dùng tạo các câu lệnh SQL với đầu vào ngôn ngữ tự nhiên và tự động thực hiện các hoạt động ETL dữ liệu tương ứng, cải thiện hiệu quả phát triển và phân tích tổng thể hơn 30%.
Zhou Jingren mô tả đây là một chế độ lái xe tự động của điện toán đám mây, sẽ cải thiện đáng kể hiệu quả và trải nghiệm của các nhà phát triển sử dụng đám mây.
Đồng thời, Alibaba Cloud cũng đã nâng cấp nền tảng trí tuệ nhân tạo PAI. Lớp cơ bản của PAI sử dụng kiến trúc mạng cụm AI thế hệ tiếp theo HPN 7.0, hỗ trợ quy mô có thể mở rộng của các cụm lên tới 100.000 thẻ và tỷ lệ tăng tốc của đào tạo phân tán quy mô cực lớn cao tới 96%, vượt xa cấp độ ngành. Trong các tác vụ đào tạo mô hình lớn, nó có thể tiết kiệm hơn 50% tài nguyên máy tính và hiệu suất hàng đầu thế giới.
Những thuật ngữ chuyên nghiệp này hơi phức tạp, được giải thích bởi các trường hợp khách hàng đơn giản và Zhou Jingren cũng chia sẻ một số trường hợp trong cùng một ngày: "Thông qua nền tảng PAI của chúng tôi, nó có thể giúp tối ưu hóa lý luận, giúp Xiaohongshu tiết kiệm 30% chi phí và thực sự có thể thúc đẩy sự phát triển kinh doanh nhanh chóng của Xiaohongshu, cũng như nhiều nhu cầu kinh doanh khác nhau." "
Các nhà cung cấp đám mây, bao gồm Alibaba Cloud, về cơ bản đang tìm ra cơ sở hạ tầng mới. Những thay đổi do các công nghệ AI mang lại như các mô hình lớn là full-stack, từ lớp dưới cùng của mô hình đến các ý tưởng đào tạo, từ yêu cầu dữ liệu đến giao diện tương tác, đang thay đổi, và thậm chí cần phải được "làm lại".
Điểm khởi đầu của tất cả các biến đổi của Alibaba Cloud là MaaS (mô hình như một Dịch vụ) được Zhou Jingren đề xuất từ sớm.
"Bản thân mô hình là một sự trừu tượng hóa cấp cao của dữ liệu và tính toán." Chu Cảnh Nhân nói trong một cuộc trao đổi nhỏ với chúng tôi ngày hôm đó.
"Ví dụ, trước đây, chúng tôi thường sử dụng nhiều dữ liệu hơn từ nhật ký hoặc cơ sở dữ liệu. Mô hình là gì? Một mô hình là một tập hợp dữ liệu được xử lý, đó là một sự trừu tượng trí tuệ cao. Vì vậy, từ quan điểm này, bạn có thể nghĩ rằng dữ liệu gốc là một vật liệu sản xuất nguyên thủy hơn, dựa vào sức mạnh tính toán ban đầu. Mô hình ngày nay là một lớp xử lý, là một yếu tố sản xuất trừu tượng hơn dựa trên nguyên liệu thô dữ liệu và bạn có thể sử dụng các yếu tố sản xuất đó để phát triển các hệ thống kinh doanh chiều cao hơn. Trước đây chúng ta có Cơ sở hạ tầng, là một yếu tố sản xuất, và ngày nay mô hình cũng là một yếu tố sản xuất. "
Cơ sở hạ tầng mới này xung quanh mô hình đòi hỏi khả năng hệ thống phức tạp hơn so với trước đây.
Trong khi ngưỡng cho các ứng dụng AI ngày càng thấp hơn, ngưỡng cung cấp điện toán đám mây đáp ứng nhu cầu của kỷ nguyên AI mới sẽ chỉ ngày càng cao hơn. Để khám phá điều mới mẻ này, rõ ràng là bạn cần nắm vững công nghệ cốt lõi của điện toán đám mây và bạn cần có hiểu biết thực sự về công nghệ của các mô hình lớn - bạn biết những gì bạn có và bạn biết khách hàng của mình cần gì.
"Dựa trên sự tích lũy của chúng tôi trong điện toán đám mây, chúng tôi đã xây dựng một cơ sở hạ tầng AI hoàn chỉnh. Thông qua loạt tối ưu hóa ngày nay trong mạng, lưu trữ, lập lịch, biên dịch, khả năng chịu lỗi, v.v. Chúng tôi đã thiết lập một nền tảng đào tạo hoàn chỉnh cho các mô hình lớn AI. Chu Cảnh Nhân nói. Đồng thời, thông qua một loạt các tối ưu hóa kết hợp với độ đàn hồi cao của chính đám mây, chúng tôi có thể cung cấp cho bạn dịch vụ đào tạo và suy luận mô hình rất hoàn chỉnh. "
Cùng ngày, Alibaba Cloud cũng phát hành mô hình tham số cấp 100 tỷ tự phát triển Tongyi Qianwen 2.0.
Tongyi Qianwen 2.0 đã đạt được tiến bộ lớn về hiệu suất và đã cải thiện đáng kể khả năng hiểu các hướng dẫn phức tạp, khả năng sáng tạo văn học, khả năng toán học nói chung, bộ nhớ kiến thức, khả năng chống ảo ảnh, v.v., và hiệu suất toàn diện của nó đã vượt qua GPT-3.5, tăng tốc để bắt kịp GPT-4.
Đồng thời, trang web chính thức của mô hình Tongyi đã được cập nhật đầy đủ, thêm các chức năng tương tác đa phương thức và plug-in, cho phép người dùng tương tác với Tongyi Qianwen 2.0 thông qua hình ảnh, đồng thời gọi thêm khả năng plug-in mới.
Zhou Jingren nói, "Tongyi Qianwen 2.0 trưởng thành hơn và dễ sử dụng hơn."
Mở, Mở hoặc Mở
Với sự chuyển đổi toàn diện như vậy, nó tự nhiên đặt ra câu hỏi liệu cả mô hình và cơ sở hạ tầng cuối cùng sẽ trở thành một tình huống mà bạn vừa là trọng tài vừa là vận động viên.
Câu trả lời được đưa ra bởi Alibaba Cloud là sự cởi mở tối đa.
Alibaba Cloud là công ty công nghệ sớm nhất ở Trung Quốc tự phát triển mã nguồn mở các mô hình lớn và hiện tại, Alibaba Cloud có các phiên bản Tongyi Qianwen 7B và 14B mã nguồn mở, với hơn một triệu lượt tải xuống. Tại hiện trường, Zhou Jingren thông báo rằng mô hình Tongyi Qianwen 72B sẽ sớm trở thành mã nguồn mở và nó sẽ trở thành mô hình nguồn mở lớn nhất ở Trung Quốc.
Trên thực tế, kiểu cởi mở này không phải là điều sẽ xảy ra sau ChatGPT. Tại Hội nghị Apsara cách đây một năm, Alibaba Cloud đã bắt đầu xây dựng một mô hình xây dựng cộng đồng ma thuật, trên thực tế, lô mã nguồn mở đầu tiên tại thời điểm đó là mô hình cốt lõi của riêng Alibaba Cloud. Vào thời điểm đó, kế hoạch của Moda là sử dụng Alibaba Cloud để bàn giao những thứ ở dưới cùng của hộp để thúc đẩy mọi người thay đổi trạng thái khép kín của AI trong quá khứ và sử dụng sự cởi mở để thực sự làm cho nó có thể truy cập được cho công chúng.
Zhou Jingren tiết lộ rằng cộng đồng đã tập hợp hơn 2.300 mô hình AI ngày hôm nay, thu hút 2,8 triệu nhà phát triển AI và số lượt tải xuống mô hình AI vượt quá 100 triệu, khiến nó trở thành cộng đồng AI lớn nhất và tích cực nhất ở Trung Quốc. Thành tựu này là sự công nhận trực tiếp nhất về sự cởi mở của nó với thế giới bên ngoài.
Ngày nay, trên Cộng đồng Phép thuật, Baichuan Intelligence, Zhipu AI, Phòng thí nghiệm Trí tuệ nhân tạo Thượng Hải, Viện nghiên cứu IDEA, v.v. đã mở nguồn các mô hình lớn cốt lõi của họ và Alibaba Cloud cung cấp cho các nhà phát triển sức mạnh tính toán GPU miễn phí cho "những người chấp nhận sớm" các mô hình lớn, đã vượt quá 30 triệu giờ cho đến nay.
"Định vị của chúng tôi ngày hôm nay là phục vụ nhiều khách hàng với các nhu cầu khác nhau." Chu Cảnh Nhân nói.
Trong hệ sinh thái Alibaba Cloud, có một siêu máy tính cùng được xây dựng với Đại học Fudan, hỗ trợ đào tạo mô hình lớn với hàng trăm tỷ thông số và đứng trong top 15 thế giới về sức mạnh tính toán tổng thể. Cụm máy tính phía sau nó bao gồm Jinsi số 1 trong khuôn viên Fudan và Qiewen số 1 tại trung tâm dữ liệu Ulanqab của Alibaba Cloud cách đó 1.500 km.
vivo đã tự phát triển các mô hình lớn, từ sức mạnh tính toán, chức năng nền tảng, hiệu suất đào tạo, v.v., đến khung tối ưu hóa đào tạo của nền tảng trí tuệ nhân tạo PAI của Alibaba Cloud về giám sát SFT và tinh chỉnh các mô hình lớn và học tăng cường, vivo và Alibaba Cloud hợp tác để lặp lại các mô hình lớn hiệu quả hơn.
Ngoài ra còn có "Camera vịt tuyệt vời" phổ biến, có khả năng tạo ảnh yêu cầu ít nhất vài nghìn máy chủ GPU ở mức cao nhất và triển khai ngoại tuyến là không thực tế và triển khai đám mây có thể tiết kiệm rất nhiều chi phí và thời gian cho các công ty khởi nghiệp. Hơn nữa, các ứng dụng như Miaoya đại diện cho một xu hướng mà trong tương lai, nhu cầu suy luận sẽ lớn hơn nhu cầu đào tạo, điều này sẽ chỉ làm cho điện toán đám mây trở nên quan trọng hơn đối với tính bền vững của các dịch vụ AI.
Theo định vị như vậy, mô hình lớn của Alibaba Cloud giống như sự tiếp nối của một ý tưởng mà Alibaba luôn sử dụng trong quá khứ - các phương pháp hay nhất. Suy nghĩ của nó là chỉ khi nó đã thực hiện các nhiệm vụ phức tạp nhất và thử nghiệm cơ sở hạ tầng của nó với nó, nó mới có thể cung cấp các dịch vụ và công nghệ đáng tin cậy hơn cho thế giới bên ngoài. Và tất cả những nỗ lực này cuối cùng đều nhằm vào một mục tiêu - thúc đẩy công nghiệp hóa AI.
Với mục tiêu này, Alibaba Cloud cũng đã phát hành Alibaba Cloud Bailian, một nền tảng phát triển ứng dụng mô hình quy mô lớn một cửa. Alibaba Cloud là một nhà tích hợp có hệ thống và mở.
Alibaba Cloud cho biết dựa trên nó, các nhà phát triển có thể phát triển một ứng dụng mô hình lớn trong 5 phút và "tinh chỉnh" một mô hình dành riêng cho doanh nghiệp trong vài giờ. Sau khi giúp các nhà phát triển chọn mô hình phù hợp nhất, nó cũng cung cấp nhiều phương pháp tinh chỉnh như SFT và LoRA, cho phép bạn tinh chỉnh mô hình của mình. Sau khi đào tạo xong, bạn cũng có thể triển khai nó thông qua Alibaba Cloud chỉ với một cú nhấp chuột. Việc phát triển các ứng dụng cũng được đơn giản hóa rất nhiều, và ngay cả các tác nhân mới nhất và các plugin khác cũng có sẵn cho người dùng lựa chọn.
"Mỗi liên kết và mọi nhóm người là một phần quan trọng của toàn bộ hệ sinh thái nhà phát triển ngày nay." Chu Cảnh Nhân nói.
"Mục tiêu của chúng tôi là làm cho Alibaba Cloud trở thành đám mây mở nhất và chúng tôi hy vọng rằng ngày nay Alibaba Cloud không chỉ có thể phục vụ một loại khách hàng, mà tất cả khách hàng của chúng tôi ngày nay, tất cả đều được đề cập theo nhiều cách khác nhau, có thể cung cấp cho họ sự hỗ trợ hiệu quả trong kỷ nguyên trí tuệ nhân tạo và có thể giúp họ đổi mới và tạo đột phá trong lĩnh vực chuyên môn của riêng họ. Đây là mục tiêu của chúng tôi và phản ánh đằng sau thiết kế các sản phẩm của chúng tôi ngày hôm nay. "
Trong "lý tưởng đi sau một bước" ngày nay, hệ sinh thái mô hình sống động không chỉ cần đám mây trong quá trình phát triển thực tế, mà còn là nguồn cảm hứng điện toán đám mây cho các công ty công nghệ Trung Quốc cũng cực kỳ quan trọng đối với AI và những người thực hành mô hình ngày nay.
Quá trình phát triển điện toán đám mây của Trung Quốc luôn có ý nghĩa biểu tượng, đó là khi chúng ta có tài năng phát triển công nghệ mạnh mẽ và nhu cầu ứng dụng công nghiệp rộng lớn nhất, làm thế nào để nắm bắt công nghệ cơ bản một cách tự phát. Và khi bạn gặp bất lợi nhất định về công nghệ, những cơ hội như vậy sẽ chỉ xuất hiện khi hệ thống công nghệ lớn được chuyển đổi hoàn toàn.
Khi cuộc cách mạng công nghệ mới xuất hiện trở lại và công nghệ cơ bản cần được xây dựng lại một lần nữa, điện toán đám mây đã trở thành sự tự tin và chi phí của mô hình Trung Quốc để tiếp tục vật lộn với các đồng nghiệp tiên tiến, và nó cũng là nguồn cảm hứng và cảnh báo. Trong khi ngành công nghiệp và các ứng dụng AI đang tăng tốc, việc có cơ sở công nghệ tiên tiến của riêng chúng ta và hình thành mối quan hệ cởi mở và hỗ trợ lẫn nhau dựa trên nó, sẽ trở nên quan trọng đối với toàn bộ hệ sinh thái để cùng nhau tiến bộ và điều quan trọng là nhắc nhở chúng ta cách nắm bắt sự đổi mới công nghệ này và thậm chí nó còn được kỳ vọng sẽ trở thành một lợi thế trong cuộc cạnh tranh này với những nỗ lực không ngừng.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Đừng chỉ nhìn chằm chằm vào mô hình lớn, tương lai của AI phụ thuộc vào đám mây hơn bao giờ hết
Nguồn gốc: Silicon Star People
**Mây! **
Nếu bạn nhìn vào các báo cáo phương tiện truyền thông về các mô hình lớn mỗi ngày, bạn sẽ bị lóa mắt bởi sự đa dạng của các mô hình và các ứng dụng đáng sợ tồn tại trong thời gian ngắn, nghĩ rằng tương lai của các mô hình nằm trong mô hình toàn diện tiếp theo. Vì vậy, AI dường như là một câu chuyện về OpenAI hoặc Anthropic chiến thắng.
Tài chính đã được hoàn thành với tốc độ và khối lượng đáng kinh ngạc dường như chứng minh nhận thức này.
Anthropic, được coi là một trong những đối thủ lớn nhất của OpenAI, đang trong vòng tài trợ theo chu kỳ hàng tháng là 2 tỷ - vào ngày 27 tháng 10, Google cho biết họ đã đầu tư thêm 2 tỷ đô la vào nó, chưa đầy một tháng sau khi Amazon đầu tư 4 tỷ đô la vào nó và mô hình Claude, cạnh tranh với các tính năng như độ dài ngữ cảnh, được coi là một trong những đối thủ cạnh tranh mạnh nhất của ChatGPT. Đồng thời, OpenAI cũng đang thu thập nhiều nguồn lực khác nhau và đằng sau mọi động thái của nó, SoftBank, Microsoft và Apple đều là tin đồn với nó theo nhiều cách khác nhau.
Tuy nhiên, trên thực tế, đây không phải là toàn bộ câu chuyện.
Đối với các học viên, mặt khác của câu chuyện sâu sắc hơn:
Rõ ràng, đó là một lựa chọn tốt hơn để lấy đô la của những nhà đầu tư có nhiều tiền hơn và ít việc phải làm hơn, tuy nhiên, tất cả họ đều chọn các nhà máy lớn lần lượt, và thậm chí cả các nhà máy lớn đang để mắt đến họ, chỉ vì một điều - họ có khả năng điện toán đám mây. Đóng góp của OpenAI cho Microsoft Azure đã được nói quá nhiều lần trên con đường thành công và Anthropic hiện đảm bảo cho mình sự hỗ trợ sức mạnh điện toán đám mây của Google và Amazon cùng một lúc, và nó nói rằng một trong những mục đích quan trọng của tài chính là xây dựng đảm bảo sức mạnh tính toán cho chính nó để đào tạo thế hệ mô hình tiếp theo.
Đây là một minh chứng tuyệt vời cho sự cần thiết của đám mây cho các mô hình lớn.
Alibaba Cloud đã công bố một số mô hình chạy trên các dịch vụ của mình, từ mô hình lớn Tongyi của riêng mình, đến Baichuan Intelligence, Zhipu AI, Zero One Everything, Kunlun Wanwei, vivo, Đại học Fudan, v.v., một nửa số công ty và tổ chức mô hình lớn của Trung Quốc được đào tạo tại đây.
Các mô hình chính thống này ở Trung Quốc cũng đang cung cấp dịch vụ API thông qua Alibaba Cloud, bao gồm loạt Tongyi, loạt Baichuan, dòng Zhipu AI ChatGLM, mô hình chung Jiang Ziya, v.v.
Những mô hình này bắt kịp với cấp cao nhất cùng một lúc, nhưng cũng bắt đầu phát triển các đặc điểm riêng của chúng, trong đó một trong những công ty mô hình lớn nhất Trung Quốc Baichuan Intelligence, đã thiết lập trung bình 28 ngày để lặp lại một phiên bản kỷ lục của một mô hình lớn, nó ngày 30 tháng 10 Phiên bản mới nhất của Baichuan2-192K đã trở thành hỗ trợ dài nhất thế giới cho cửa sổ ngữ cảnh của mô hình lớn, có thể nhập 350.000 từ cùng một lúc, dẫn đầu Claude2-100K.
Những ưu điểm này đều chỉ ra các ứng dụng thực tế hơn. Wang Xiaochuan, Giám đốc điều hành của Baichuan Intelligence, mô tả điều này là "chậm hơn một bước so với lý tưởng và nhanh hơn ba bước trên mặt đất". Mặt khác, cơ sở hạ tầng đám mây cung cấp khả năng nhanh chóng.
Wang Xiaochuan giới thiệu rằng một lý do quan trọng cho sự lặp lại hàng tháng của mô hình Baichuan là sự hỗ trợ của điện toán đám mây. "Việc lặp lại và triển khai nhanh chóng mô hình không thể tách rời khỏi điện toán đám mây, và Baichuan Intelligence và Alibaba Cloud đã thực hiện hợp tác sâu rộng. Với sự nỗ lực chung của hai bên, Baichuan đã hoàn thành xuất sắc nhiệm vụ đào tạo mô hình lớn kilocalo, giảm hiệu quả chi phí suy luận mô hình và nâng cao hiệu quả triển khai mô hình. "
Một lý do khác khiến tầm quan trọng của điện toán đám mây bị bỏ qua là lĩnh vực AI đã bị phân tâm bởi "thiếu thẻ cho tất cả".
"Mọi người đang chú ý quá nhiều đến GPU." Nhiều học viên mô hình lớn nói với tôi rằng là một đơn vị tính toán, nó thực sự được nâng cao liên tục, nhưng để giải quyết vấn đề của AI, điều cuối cùng cần thiết là một giải pháp sức mạnh tính toán có hệ thống và tối ưu. Ngay cả đám mây cũng là một thứ giải quyết vấn đề của một đơn vị duy nhất không đủ mạnh kể từ khi thành lập.
"Chỉ có thẻ, chỉ có mô hình tuyệt vời trong giấy, nó không đủ, và cuối cùng dựa vào đám mây để hạ cánh và sau đó nhận ra lý tưởng." Hắn nói. Nếu bạn cẩn thận chọc tai và lắng nghe "tiếng hét" của những người tham gia thực sự này ở tuyến đầu của hệ sinh thái mô hình, thì bạn có thể nghe thấy một từ:
Mây!
Tương lai của AI phát triển như thế nào phụ thuộc vào đám mây ngày nay hơn bao giờ hết.
Một đám mây mới
Nhưng điều này chắc chắn không có nghĩa là các nhà cung cấp đám mây đã thiết lập lợi thế có thể nằm xuống và giành chiến thắng.
Chỉ cần nhìn vào những gì đã xảy ra sau khi Google và Microsoft gần đây phát hành báo cáo thu nhập của họ trong cùng một ngày.
Vào ngày 25 tháng 10, Google đã công bố một báo cáo thu nhập vượt quá mong đợi, với mức tăng hàng năm là 11% và hoạt động kinh doanh quảng cáo cốt lõi cũng tăng 9%. Nhưng sau đó giá cổ phiếu giảm. Chỉ có một lý do, điện toán đám mây đã tăng trưởng 22%, nhưng thị trường tin rằng điều đó là không đủ. Đặc biệt, báo cáo tài chính của Microsoft được công bố cùng ngày cho thấy bộ phận đám mây thông minh của hãng trở thành nguồn doanh thu lớn nhất.
Lần đầu tiên, những gã khổng lồ thấy mình bị gạt ra ngoài lề với các doanh nghiệp như quảng cáo, điều mà họ từng nói đến, bởi vì điện toán đám mây được coi là một thước đo có thể quan sát được so với doanh thu trực tiếp được tạo ra bởi các mô hình vẫn còn ảo tưởng. Đằng sau chỉ số này là khả năng của các nhà cung cấp đám mây thích ứng với những thách thức do AI mang lại.
Ngay cả AWS, thị phần số 1, cũng đang cảm thấy áp lực và khoản đầu tư của Amazon vào Anthropic cũng xảy ra trong các báo cáo thu nhập này. Đã có báo cáo rằng 3% doanh thu Azure của Microsoft đến từ AI và khách hàng của họ bao gồm một số lượng lớn người dùng OpenAI và AWS đang bắt đầu nhấn mạnh các dịch vụ của mình cho các mô hình khác nhau. Sau khi ném 2 tỷ vào Anthropic, ngay lập tức có thông báo rằng LLM sau công ty mô hình sẽ được xây dựng với chip tăng tốc đào tạo của AWS Trainium và chip suy luận Inferentia. Ngoài ra, chẳng hạn như giải pháp cụm mới được nêu bật trong báo cáo tài chính của Microsoft và Bedrock, một dịch vụ mô hình cơ bản được quản lý toàn phần cho AWS, cũng đang nhấn mạnh sự chuyển đổi của chính họ cho các nhu cầu AI mới.
Theo giới thiệu của Zhou Jingren, Alibaba Cloud lần đầu tiên sử dụng một mô hình lớn để tự chuyển đổi và hơn 30 sản phẩm đám mây đã được kết nối với các khả năng mô hình lớn.
Ví dụ, DataWorks, nền tảng quản trị dữ liệu lớn của Alibaba Cloud, đã thêm một hình thức tương tác mới, Copilot, cho phép người dùng tạo các câu lệnh SQL với đầu vào ngôn ngữ tự nhiên và tự động thực hiện các hoạt động ETL dữ liệu tương ứng, cải thiện hiệu quả phát triển và phân tích tổng thể hơn 30%.
Zhou Jingren mô tả đây là một chế độ lái xe tự động của điện toán đám mây, sẽ cải thiện đáng kể hiệu quả và trải nghiệm của các nhà phát triển sử dụng đám mây.
Đồng thời, Alibaba Cloud cũng đã nâng cấp nền tảng trí tuệ nhân tạo PAI. Lớp cơ bản của PAI sử dụng kiến trúc mạng cụm AI thế hệ tiếp theo HPN 7.0, hỗ trợ quy mô có thể mở rộng của các cụm lên tới 100.000 thẻ và tỷ lệ tăng tốc của đào tạo phân tán quy mô cực lớn cao tới 96%, vượt xa cấp độ ngành. Trong các tác vụ đào tạo mô hình lớn, nó có thể tiết kiệm hơn 50% tài nguyên máy tính và hiệu suất hàng đầu thế giới.
Những thuật ngữ chuyên nghiệp này hơi phức tạp, được giải thích bởi các trường hợp khách hàng đơn giản và Zhou Jingren cũng chia sẻ một số trường hợp trong cùng một ngày: "Thông qua nền tảng PAI của chúng tôi, nó có thể giúp tối ưu hóa lý luận, giúp Xiaohongshu tiết kiệm 30% chi phí và thực sự có thể thúc đẩy sự phát triển kinh doanh nhanh chóng của Xiaohongshu, cũng như nhiều nhu cầu kinh doanh khác nhau." "
Các nhà cung cấp đám mây, bao gồm Alibaba Cloud, về cơ bản đang tìm ra cơ sở hạ tầng mới. Những thay đổi do các công nghệ AI mang lại như các mô hình lớn là full-stack, từ lớp dưới cùng của mô hình đến các ý tưởng đào tạo, từ yêu cầu dữ liệu đến giao diện tương tác, đang thay đổi, và thậm chí cần phải được "làm lại".
Điểm khởi đầu của tất cả các biến đổi của Alibaba Cloud là MaaS (mô hình như một Dịch vụ) được Zhou Jingren đề xuất từ sớm.
"Bản thân mô hình là một sự trừu tượng hóa cấp cao của dữ liệu và tính toán." Chu Cảnh Nhân nói trong một cuộc trao đổi nhỏ với chúng tôi ngày hôm đó.
"Ví dụ, trước đây, chúng tôi thường sử dụng nhiều dữ liệu hơn từ nhật ký hoặc cơ sở dữ liệu. Mô hình là gì? Một mô hình là một tập hợp dữ liệu được xử lý, đó là một sự trừu tượng trí tuệ cao. Vì vậy, từ quan điểm này, bạn có thể nghĩ rằng dữ liệu gốc là một vật liệu sản xuất nguyên thủy hơn, dựa vào sức mạnh tính toán ban đầu. Mô hình ngày nay là một lớp xử lý, là một yếu tố sản xuất trừu tượng hơn dựa trên nguyên liệu thô dữ liệu và bạn có thể sử dụng các yếu tố sản xuất đó để phát triển các hệ thống kinh doanh chiều cao hơn. Trước đây chúng ta có Cơ sở hạ tầng, là một yếu tố sản xuất, và ngày nay mô hình cũng là một yếu tố sản xuất. "
Cơ sở hạ tầng mới này xung quanh mô hình đòi hỏi khả năng hệ thống phức tạp hơn so với trước đây.
Trong khi ngưỡng cho các ứng dụng AI ngày càng thấp hơn, ngưỡng cung cấp điện toán đám mây đáp ứng nhu cầu của kỷ nguyên AI mới sẽ chỉ ngày càng cao hơn. Để khám phá điều mới mẻ này, rõ ràng là bạn cần nắm vững công nghệ cốt lõi của điện toán đám mây và bạn cần có hiểu biết thực sự về công nghệ của các mô hình lớn - bạn biết những gì bạn có và bạn biết khách hàng của mình cần gì.
"Dựa trên sự tích lũy của chúng tôi trong điện toán đám mây, chúng tôi đã xây dựng một cơ sở hạ tầng AI hoàn chỉnh. Thông qua loạt tối ưu hóa ngày nay trong mạng, lưu trữ, lập lịch, biên dịch, khả năng chịu lỗi, v.v. Chúng tôi đã thiết lập một nền tảng đào tạo hoàn chỉnh cho các mô hình lớn AI. Chu Cảnh Nhân nói. Đồng thời, thông qua một loạt các tối ưu hóa kết hợp với độ đàn hồi cao của chính đám mây, chúng tôi có thể cung cấp cho bạn dịch vụ đào tạo và suy luận mô hình rất hoàn chỉnh. "
Cùng ngày, Alibaba Cloud cũng phát hành mô hình tham số cấp 100 tỷ tự phát triển Tongyi Qianwen 2.0.
Đồng thời, trang web chính thức của mô hình Tongyi đã được cập nhật đầy đủ, thêm các chức năng tương tác đa phương thức và plug-in, cho phép người dùng tương tác với Tongyi Qianwen 2.0 thông qua hình ảnh, đồng thời gọi thêm khả năng plug-in mới.
Zhou Jingren nói, "Tongyi Qianwen 2.0 trưởng thành hơn và dễ sử dụng hơn."
Mở, Mở hoặc Mở
Với sự chuyển đổi toàn diện như vậy, nó tự nhiên đặt ra câu hỏi liệu cả mô hình và cơ sở hạ tầng cuối cùng sẽ trở thành một tình huống mà bạn vừa là trọng tài vừa là vận động viên.
Câu trả lời được đưa ra bởi Alibaba Cloud là sự cởi mở tối đa.
Alibaba Cloud là công ty công nghệ sớm nhất ở Trung Quốc tự phát triển mã nguồn mở các mô hình lớn và hiện tại, Alibaba Cloud có các phiên bản Tongyi Qianwen 7B và 14B mã nguồn mở, với hơn một triệu lượt tải xuống. Tại hiện trường, Zhou Jingren thông báo rằng mô hình Tongyi Qianwen 72B sẽ sớm trở thành mã nguồn mở và nó sẽ trở thành mô hình nguồn mở lớn nhất ở Trung Quốc.
Trên thực tế, kiểu cởi mở này không phải là điều sẽ xảy ra sau ChatGPT. Tại Hội nghị Apsara cách đây một năm, Alibaba Cloud đã bắt đầu xây dựng một mô hình xây dựng cộng đồng ma thuật, trên thực tế, lô mã nguồn mở đầu tiên tại thời điểm đó là mô hình cốt lõi của riêng Alibaba Cloud. Vào thời điểm đó, kế hoạch của Moda là sử dụng Alibaba Cloud để bàn giao những thứ ở dưới cùng của hộp để thúc đẩy mọi người thay đổi trạng thái khép kín của AI trong quá khứ và sử dụng sự cởi mở để thực sự làm cho nó có thể truy cập được cho công chúng.
Zhou Jingren tiết lộ rằng cộng đồng đã tập hợp hơn 2.300 mô hình AI ngày hôm nay, thu hút 2,8 triệu nhà phát triển AI và số lượt tải xuống mô hình AI vượt quá 100 triệu, khiến nó trở thành cộng đồng AI lớn nhất và tích cực nhất ở Trung Quốc. Thành tựu này là sự công nhận trực tiếp nhất về sự cởi mở của nó với thế giới bên ngoài.
"Định vị của chúng tôi ngày hôm nay là phục vụ nhiều khách hàng với các nhu cầu khác nhau." Chu Cảnh Nhân nói.
Trong hệ sinh thái Alibaba Cloud, có một siêu máy tính cùng được xây dựng với Đại học Fudan, hỗ trợ đào tạo mô hình lớn với hàng trăm tỷ thông số và đứng trong top 15 thế giới về sức mạnh tính toán tổng thể. Cụm máy tính phía sau nó bao gồm Jinsi số 1 trong khuôn viên Fudan và Qiewen số 1 tại trung tâm dữ liệu Ulanqab của Alibaba Cloud cách đó 1.500 km.
vivo đã tự phát triển các mô hình lớn, từ sức mạnh tính toán, chức năng nền tảng, hiệu suất đào tạo, v.v., đến khung tối ưu hóa đào tạo của nền tảng trí tuệ nhân tạo PAI của Alibaba Cloud về giám sát SFT và tinh chỉnh các mô hình lớn và học tăng cường, vivo và Alibaba Cloud hợp tác để lặp lại các mô hình lớn hiệu quả hơn.
Ngoài ra còn có "Camera vịt tuyệt vời" phổ biến, có khả năng tạo ảnh yêu cầu ít nhất vài nghìn máy chủ GPU ở mức cao nhất và triển khai ngoại tuyến là không thực tế và triển khai đám mây có thể tiết kiệm rất nhiều chi phí và thời gian cho các công ty khởi nghiệp. Hơn nữa, các ứng dụng như Miaoya đại diện cho một xu hướng mà trong tương lai, nhu cầu suy luận sẽ lớn hơn nhu cầu đào tạo, điều này sẽ chỉ làm cho điện toán đám mây trở nên quan trọng hơn đối với tính bền vững của các dịch vụ AI.
Theo định vị như vậy, mô hình lớn của Alibaba Cloud giống như sự tiếp nối của một ý tưởng mà Alibaba luôn sử dụng trong quá khứ - các phương pháp hay nhất. Suy nghĩ của nó là chỉ khi nó đã thực hiện các nhiệm vụ phức tạp nhất và thử nghiệm cơ sở hạ tầng của nó với nó, nó mới có thể cung cấp các dịch vụ và công nghệ đáng tin cậy hơn cho thế giới bên ngoài. Và tất cả những nỗ lực này cuối cùng đều nhằm vào một mục tiêu - thúc đẩy công nghiệp hóa AI.
Với mục tiêu này, Alibaba Cloud cũng đã phát hành Alibaba Cloud Bailian, một nền tảng phát triển ứng dụng mô hình quy mô lớn một cửa. Alibaba Cloud là một nhà tích hợp có hệ thống và mở.
"Mỗi liên kết và mọi nhóm người là một phần quan trọng của toàn bộ hệ sinh thái nhà phát triển ngày nay." Chu Cảnh Nhân nói.
"Mục tiêu của chúng tôi là làm cho Alibaba Cloud trở thành đám mây mở nhất và chúng tôi hy vọng rằng ngày nay Alibaba Cloud không chỉ có thể phục vụ một loại khách hàng, mà tất cả khách hàng của chúng tôi ngày nay, tất cả đều được đề cập theo nhiều cách khác nhau, có thể cung cấp cho họ sự hỗ trợ hiệu quả trong kỷ nguyên trí tuệ nhân tạo và có thể giúp họ đổi mới và tạo đột phá trong lĩnh vực chuyên môn của riêng họ. Đây là mục tiêu của chúng tôi và phản ánh đằng sau thiết kế các sản phẩm của chúng tôi ngày hôm nay. "
Trong "lý tưởng đi sau một bước" ngày nay, hệ sinh thái mô hình sống động không chỉ cần đám mây trong quá trình phát triển thực tế, mà còn là nguồn cảm hứng điện toán đám mây cho các công ty công nghệ Trung Quốc cũng cực kỳ quan trọng đối với AI và những người thực hành mô hình ngày nay.
Khi cuộc cách mạng công nghệ mới xuất hiện trở lại và công nghệ cơ bản cần được xây dựng lại một lần nữa, điện toán đám mây đã trở thành sự tự tin và chi phí của mô hình Trung Quốc để tiếp tục vật lộn với các đồng nghiệp tiên tiến, và nó cũng là nguồn cảm hứng và cảnh báo. Trong khi ngành công nghiệp và các ứng dụng AI đang tăng tốc, việc có cơ sở công nghệ tiên tiến của riêng chúng ta và hình thành mối quan hệ cởi mở và hỗ trợ lẫn nhau dựa trên nó, sẽ trở nên quan trọng đối với toàn bộ hệ sinh thái để cùng nhau tiến bộ và điều quan trọng là nhắc nhở chúng ta cách nắm bắt sự đổi mới công nghệ này và thậm chí nó còn được kỳ vọng sẽ trở thành một lợi thế trong cuộc cạnh tranh này với những nỗ lực không ngừng.