Mô hình lớn cần người làm

Bản gốc: Wu Xianzhi Wen Yehao

Biên tập: Vương Bàn

Nguồn: Hành tinh Photon

Nguồn hình ảnh: Được tạo bởi Unbounded AI‌

Cuộc chiến người mẫu quy mô lớn trong nước từng bị bao phủ bởi nhiều nghi vấn. Với việc JD.com và Tencent lần lượt nắm quyền, trò chơi phức tạp này đang trở nên rõ ràng hơn.

Baidu và Ali, với tư cách là nhóm người chơi mô hình quy mô lớn đầu tiên ở Trung Quốc, đã giành được lưu lượng truy cập sớm trong khi "khởi đầu thuận lợi". Ngược lại, mặc dù Tencent và JD.com bắt đầu muộn hơn một chút, nhưng họ có nhiều khả năng nghiên cứu sâu hơn về mô hình quy mô lớn để hiểu sâu hơn về ngành.

Vì điều này, một số nhà sản xuất lớn phát hành các mô hình quy mô lớn tương đối muộn đã không mù quáng theo dõi công chúng và đầu tư vào làn sóng các mô hình quy mô lớn đa năng. Ví dụ, mô hình lớn của Huawei đã đề cập đến tính thực tế trước đây và JD.com đã chọn một con đường có tầm nhìn xa hơn và có mục tiêu hơn nhờ tích lũy sâu rộng trong ngành và chuỗi cung ứng. một mô hình JD Yanxi theo định hướng công nghiệp đã được đưa ra.

Trong thời đại hiện nay của các mô hình quy mô lớn có mục đích chung, mô hình quy mô lớn Yanxi và con đường tạo ra giá trị công nghiệp do JD.com đưa ra không chỉ là một nỗ lực tuyệt vời để thiết lập trật tự kinh doanh theo mô hình quy mô lớn mà còn mang lại một tư duy và định hướng mới cho toàn ngành. Trong vùng nước trì trệ của việc thương mại hóa các mô hình lớn, các mô hình lớn công nghiệp sắp hạ cánh có khả năng dẫn đầu trong cuộc cạnh tranh các mô hình lớn trong tương lai và trở thành một thế lực mới không thể bỏ qua.

Mô hình lớn, không phải "câu chuyện" cũng không phải "đồ chơi"

Mỗi đợt sóng nối tiếp công nghệ thường mang theo rất nhiều phù sa.

Từ chip, robot, đến AI trong những năm đầu, trong mỗi làn sóng, luôn có một số người chơi với động cơ thầm kín xen vào, trộn lẫn công nghệ và tiếp thị với nhau, khiến con đường ban đầu rõ ràng càng thêm lầy lội. Điều này cũng đúng với các đường đua mô hình quy mô lớn trong nước ở giai đoạn này.

Một bên đường đua, người chơi loay hoay tìm hiểu bối cảnh kỹ thuật của mô hình lớn, cố tìm hướng hạ cánh; bên kia, ngay cả những công ty không liên quan gì đến lĩnh vực công nghệ cũng rời sân Cái gọi là sản phẩm "mô hình lớn" - Tôi phải thừa nhận rằng tình hình hiện tại "mọi thứ đều có thể là một mô hình lớn" có nghĩa là "mọi thứ đều có thể là siêu mẫu" hai năm trước.

Rõ ràng, khi cái gọi là "mô hình lớn" trở thành một từ đồng nghĩa, phục vụ cho sức hấp dẫn "kể chuyện" của chính nó thay vì tạo ra giá trị thực tế, thì khả năng cao là nó chỉ có thể đi theo số phận của metaverse. Và điều này cũng đúng với những người chơi nghiên cứu công nghệ một cách trung thực. Xét cho cùng, rất khó để bản thân công nghệ trực tiếp tạo ra giá trị - mục đích của mô hình lớn không phải là tự đào tạo mô hình lớn nói chung mà là để công nghệ tạo ra giá trị, sau đó thực hiện thương mại hóa trưởng thành.

Chính vì vậy, những thao tác tưởng chừng hài hước của các fan rượt đuổi thực chất lại gióng lên hồi chuông cảnh tỉnh cho đường đua mô hình phân khối lớn. Rốt cuộc, ChatGPT đã kích hoạt AIGC đã ảnh hưởng một cách tinh vi đến quan điểm của người chơi về mô hình lớn, khiến nhiều người chơi đổ xô sang mô hình lớn nói chung và tung ra nhiều "biến thể" của ChatGPT.

Khách quan mà nói, mô hình lớn đa năng có giá trị của nó, nhưng ở thời điểm cạnh tranh ngày càng gay gắt, mô hình đa năng lớn không suôn sẻ:

Một mặt, người chơi lần lượt đổ xô vào một lĩnh vực, rất dễ rơi vào tình trạng “lặp đi lặp lại bánh xe”, khó có thể bứt phá khỏi chiến trường đầy rẫy trong và ngoài nước những gã khổng lồ công nghệ.

Mặt khác, một mô hình lớn đa năng là một sản phẩm điển hình của sự tách biệt giữa tiêu dùng và thanh toán, và nó sẽ trở thành một "đồ chơi" nếu bạn không cẩn thận.

Lấy một ví dụ đơn giản, nhiều người dùng C-end có thể đặt câu hỏi hoặc thậm chí thảo luận về vũ trụ và bầu trời, nhưng đại đa số người dùng bình thường không có nhu cầu về năng suất, sau khi trải nghiệm chuyên sâu trong thời gian ngắn, họ sẽ nhanh chóng cảm nhận sự mới mẻ của các công nghệ mới nổi. Bị mất, có thể không có sức mạnh để sử dụng trong một thời gian dài.

Dựa trên điều này, ngay cả khi mô hình quy mô lớn có mục đích chung hiện tại có thể cải thiện hiệu quả của việc tạo nội dung ở một mức độ nhất định, ngoại trừ việc giảm chi phí và tăng hiệu quả trong một số ngành và tổ chức nội dung, thì nó vẫn chưa phát triển thành công và hoàn thiện. mô hình kinh doanh có thể nhân rộng. Có thể thấy trước rằng khi đường đua mô hình quy mô lớn nói chung ngày càng đông đúc, người chơi sẽ phải đối mặt với nhiều thách thức về mặt mở rộng thương mại.

Trong phân tích cuối cùng, giờ đây khi "điểm kỳ dị" đã đến, những mẫu xe cỡ lớn không chỉ là cột mốc quan trọng trong sự kế thừa công nghệ mà còn là động lực chính để định hình tương lai. Theo logic này, cuộc chiến mô hình quy mô lớn ở giai đoạn này hoàn toàn không phải là một cuộc đua đường ngắn, mà là một dự án có hệ thống. Nếu người chơi muốn đi hết vòng quay và đi đến cuối cùng, họ không thể chỉ dựa vào một điểm đột phá duy nhất ở cấp độ kỹ thuật mà cần phải đồng thời suy nghĩ về nhiều khía cạnh như hướng kỹ thuật, ứng dụng bối cảnh và mô hình kinh doanh. .

Mô hình công nghiệp quy mô lớn, một mặt trận mới trong "Cuộc chiến trăm mô hình"

Từ năm 1997, khi "Deep Blue" đánh bại bậc thầy cờ vua Garry Kasparov, đến "AlphaGo" bước vào vòng cờ vây, rồi đến hệ thống thị giác AI và lái xe tự động, AI đã trải qua nhiều vòng tiến hóa thú vị trong quá khứ. đang đứng trước bờ vực bùng nổ của ứng dụng, nhưng những nụ hoa đầy cành đã lâu không thể nở.

Nguyên nhân chính đằng sau điều này là do công nghệ chưa hình thành ứng dụng sâu rộng trong ngành, suy cho cùng, mục đích của tiến bộ công nghệ không phải bị mắc kẹt trong phòng thí nghiệm mà là lao vào "thế giới thực".

Theo logic này, nhìn vào các mô hình quy mô lớn có mục đích chung ngày nay, vẫn còn một chặng đường dài phía trước trước khi bám rễ vào các kịch bản kinh doanh thực và tạo ra giá trị thực.

Xu Ran, Giám đốc điều hành của Jingdong Group, cho biết tại hội nghị JDD rằng bản thân mô hình lớn là một công cụ để hiện thực hóa giá trị công nghiệp chứ không phải là mục tiêu. Giá trị thực của mô hình lớn phải được hiện thực hóa trong các ứng dụng công nghiệp.

Nói cách khác, mô hình lớn không phải là mục tiêu, mà ứng dụng mới là mục tiêu.

Các nhà sản xuất mô hình lớn hiện nay thường coi thông số mô hình là tiêu chuẩn kiểm tra chất lượng của mô hình lớn. Như mọi người đều biết, ở cấp độ triển khai thương mại, các tham số lớn cũng tương ứng với chi phí cao, đồng thời cũng có các vấn đề như thời gian tương ứng dài và khả năng đồng thời kém.

Một ví dụ đơn giản, một số "quái vật tham số" chỉ tốn hai hoặc ba xu để trả lời một câu hỏi và phải đợi trong 5-10 giây, cho dù câu trả lời có chính xác đến đâu cũng khó đạt được thương mại hóa quy mô lớn. Ngoài ra, mô hình lớn cho mục đích chung hiện tại có tỷ lệ chính xác khoảng 85%, có thể đủ cho người dùng thông thường, nhưng trong các tình huống kinh doanh nghiêm trọng, lỗi này có thể có tác động không thể bỏ qua đối với doanh nghiệp.

Về vấn đề ứng dụng, lãnh đạo kỹ thuật một số mảng kinh doanh của JD.com cho biết, câu trả lời bịa đặt của GPT sẽ khiến người ta cười nhạo, nhưng một khi nó được triển khai trong quá trình ứng dụng thực tế, bất kỳ sai lệch nào cũng sẽ dẫn đến tổn thất lớn.

Tiến sĩ He Xiaodong, Viện trưởng Viện Nghiên cứu Khám phá JD và Chủ tịch Bộ phận Sản phẩm và Dịch vụ Thông minh của JD Technology, đã từng tự mình trải nghiệm một điều gì đó khá tiêu biểu. "Một mô hình lớn trả lời căn bậc hai của 143 và câu trả lời được đưa ra là 11,5 (thực tế xấp xỉ bằng 11,96). Nếu nó được sử dụng trong một kịch bản ứng dụng thực tế, câu trả lời này sẽ mang lại tổn thất lớn."

Trong lĩnh vực kỹ thuật, các tham số và độ chính xác của mô hình rất quan trọng, nhưng trong thế giới kinh doanh, điều quan trọng là bản thân mô hình lớn phải dễ sử dụng và ổn định. Về vấn đề này, mô hình công nghiệp liên quan chặt chẽ đến các ngành công nghiệp nhỏ chắc chắn có những lợi thế tự nhiên.

Tuy nhiên, để phát triển mô hình công nghiệp quy mô lớn là điều không dễ dàng. Như chúng ta đã biết, dữ liệu huấn luyện là cơ sở của việc học mô hình lớn, đồng thời cũng quyết định khả năng khái quát hóa và các kịch bản ứng dụng của mô hình lớn. Do đó, bên cạnh những đột phá ở cấp độ kỹ thuật, các kịch bản và dữ liệu đầu tay từ ngành cũng không kém phần quan trọng đối với sự phát triển của các mô hình công nghiệp lớn.

Lấy JD.com làm ví dụ, lý do tại sao nó tung ra một mô hình quy mô lớn cho ngành phần lớn là do gen công nghiệp mạnh mẽ của nó. Xét cho cùng, trong số các nhà sản xuất lớn trong nước, JD.com, nơi liên kết thị trường tiêu dùng và hai đầu của chuỗi cung ứng, có mối liên hệ chặt chẽ với cùng ngành và sở hữu một lượng lớn dữ liệu chất lượng cao.

Được biết, khi mô hình lớn Yanxi được đào tạo, 70% dữ liệu chung và 30% dữ liệu gốc của chuỗi cung ứng thông minh kỹ thuật số được tích hợp. Có thể thấy, JD.com không thuần túy nhấn mạnh vào thông số, cũng không cố tình kể “câu chuyện” mà chú trọng đến mức độ “chỉnh độ”, nhằm tạo ra một mẫu xe lớn có tính tích hợp cao với ngành.

Mô hình công nghiệp quy mô lớn có thể trở thành một bước quan trọng hướng tới thương mại hóa quy mô lớn của đường đua mô hình quy mô lớn và những người chơi dần hiểu logic đang dần lên xe.

Gần đây, Tencent, công ty đã kìm hãm trong một thời gian dài, đã phát hành mô hình công nghiệp quy mô lớn của riêng mình; Baidu, công ty giương cao biểu ngữ về các mô hình quy mô lớn cho mục đích chung, cũng đã phát hành các mô hình công nghiệp quy mô lớn bao gồm giao thông vận tải năng lượng và các lĩnh vực khác. Không khó để nhận thấy khi các ông lớn gia tăng quy mô, những mẫu xe công nghiệp phân khối lớn tiến gần đến thương mại hóa trở thành một mặt trận mới trong “Cuộc chiến trăm mẫu”.

Gặp nhau trong ngõ hẹp, ai được "cảnh" thì thắng

Dù là mô hình tổng hợp hay công nghiệp thì việc xây dựng trật tự kinh doanh mới cũng không tránh khỏi những “cảnh tượng”.

Nói cách khác, để triển khai, các thuật ngữ kỹ thuật tối nghĩa và PPT thương mại rực rỡ đều là lâu đài trên không.Chỉ bằng cách thực sự áp dụng khả năng của các mô hình lớn vào hiện trường và tạo ra giá trị thực tế, vòng tròn đạo đức mới có thể được mở ra.

Vào thời điểm nhu cầu về AIGC trong mọi tầng lớp xã hội đang bùng nổ, không khó để tìm ra cái gọi là kịch bản ứng dụng cho các mô hình lớn. Nhưng nếu muốn tìm một khung cảnh phù hợp cho cuộc đổ bộ quy mô lớn của các mô hình lớn và chạy theo con đường thương mại hóa, có thể bạn sẽ phải đi rất nhiều đường vòng.

Theo logic này, những người chơi đã trình bày mô hình lớn không ngừng thử sức ở nhiều phân khu khác nhau, cố gắng tìm chỗ đứng của riêng mình:

Baidu đã nắm bắt các điểm nóng của kỳ thi tuyển sinh đại học hàng năm và tung ra các trợ lý tình nguyện AI. Trong khi tận dụng tối đa khả năng của các mô hình lớn, nó cũng cố gắng sử dụng điều này để thâm nhập thị trường C-end; Ali đã sử dụng Tmall Genie làm mỏ neo để khám phá ứng dụng của các mô hình lớn trong lĩnh vực điện tử tiêu dùng.

JD.com, công ty phát triển các mô hình công nghiệp lớn, đưa ra công thức "giá trị của các mô hình lớn = thuật toán × sức mạnh tính toán × dữ liệu × bình phương độ dày công nghiệp", và cái gọi là "độ dày công nghiệp" chỉ được xếp chồng lên nhau bởi các cảnh cụ thể .trở thành.

Bất kể con đường nào, những người chơi mô hình quy mô lớn nhất định phải tiếp tục thử và phạm sai lầm trước khi đến được "Miền đất hứa", thậm chí là vượt qua "Biển Đỏ".

Đối mặt với khó khăn trong việc hạ cánh các mô hình lớn, một số người chơi chọn đóng vai "người bán nước" để giúp các công ty xây dựng mô hình lớn của riêng họ. Tuy nhiên, JD.com, vốn luôn theo phong cách chơi thực dụng, đã đề xuất chiến lược "ba bước", tức là trước tiên xây dựng một mô hình lớn có mục đích chung, sau đó khám phá các kịch bản và ứng dụng trong nội bộ, sau đó dần dần mở ra. nâng cao khả năng của mình với thế giới bên ngoài - đồng thời sử dụng bản thân làm trường thử nghiệm, đồng thời cũng là tự phát triển, tiêu hóa chi phí thử và sai để đảm bảo rằng các sản phẩm mô hình quy mô lớn có thể tạo ra giá trị thực.

Được biết, trong JD.com, mô hình lớn không chỉ được nhúng vào các kịch bản ứng dụng phổ biến như tiếp thị kỹ thuật số, tối ưu hóa quy trình vận hành và dịch vụ khách hàng mà còn được mở rộng sang nhiều kịch bản theo chiều dọc như bán lẻ, hậu cần, tài chính. , và sức khỏe.

Lấy lĩnh vực hậu cần làm ví dụ, khi đối mặt với kỹ thuật hệ thống phức tạp này, JD.com đã khám phá nhiều con đường khám phá: sản phẩm chuỗi cung ứng Jinghui, đã được xây dựng trong 5 năm, bên cạnh các thuật toán bản địa phong phú như dự đoán AI và tối ưu hóa hoạt động, thông qua Công nghệ sinh thái mở không chỉ có thể giao tiếp tốt với các thuật toán và dữ liệu của các hệ thống không đồng nhất mà còn thể hiện rõ hơn về dự báo bán hàng, hàng tồn kho, kế hoạch cung ứng và bổ sung với sự hỗ trợ của các mô hình lớn. Đồng thời , do ứng dụng rộng rãi của AIGC , tháp điều khiển chuỗi cung ứng tương tác của nó có thể giúp người dùng nhanh chóng xác định vị trí và giải quyết các vấn đề về chuỗi cung ứng.

Trong kịch bản quản lý quỹ, sản phẩm “lựa chọn cơ sở thông minh” của JD Finance đã được ra mắt. Việc sàng lọc quỹ truyền thống rất tốn kém để hiểu và vận hành cồng kềnh, điều này ảnh hưởng trực tiếp đến tỷ lệ thành công của các giao dịch. Với sự trợ giúp của các mô hình lớn, JD.com đã tối ưu hóa các liên kết khớp ý định, tạo thuật toán, nhận dạng ý định và nhiều vòng đối thoại, giúp tỷ lệ chính xác của các câu hỏi sàng lọc phổ biến đạt 90%, cải thiện hiệu quả trải nghiệm của khách hàng và hiệu quả giao dịch. Sản phẩm này cũng sẽ phục vụ đầy đủ các tổ chức tài chính trong tương lai.

Có thể thấy rằng chiến lược "ba bước" của JD.com đã đạt được kết quả ban đầu và dần dần thâm nhập vào kết cấu của các ngành dọc như hậu cần và tài chính. Có thể thấy trước rằng khi chiến lược dần được triển khai, JD.com cũng sẽ tiếp tục tích lũy các kịch bản hạ cánh và dữ liệu chất lượng cao, từ đó quay bánh đà cho việc hạ cánh thương mại của các mô hình công nghiệp quy mô lớn.

Trong phân tích cuối cùng, chiến tranh mô hình quy mô lớn có vẻ phức tạp phải quay trở lại một vấn đề cốt lõi, đó là làm thế nào công nghệ có thể mang lại giá trị thực tế cho ngành công nghiệp thực sự. Ở giai đoạn này, người chơi với những con đường khác nhau chỉ có thể dần dần khám phá và thực hành các câu trả lời cho các câu hỏi trong cuộc đua marathon dài này.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)