mô hình, mát mẻ

Nguồn hình ảnh: Được tạo bởi Unbounded AI

Sau hơn 200 ngày kinh doanh quy mô lớn, tâm lý của các nhà thám hiểm Trung Quốc đã thay đổi từ sự phấn khích lý tưởng thành hiện thực.

Trước đó, ngoài bản thân công ty, tinh thần kinh doanh của mô hình AI còn mang nhiều ý nghĩa hơn như tình cảm dân tộc và xu hướng thời đại, trước sự xuất hiện của mô hình đa năng ChatGPT, các doanh nhân Trung Quốc đã nhanh chóng đạt được sự đồng thuận về cách xây dựng OpenAI và ChatGPT phiên bản Trung Quốc.

Không còn nghi ngờ gì nữa, ChatGPT là người chơi hàng đầu thế giới trong năm nay. Nhờ đó, lưu lượng truy cập của trang web OpenAI đã vượt quá 1,8 tỷ vào tháng 4, nằm trong top 20 trong bảng xếp hạng lưu lượng truy cập toàn cầu. Tuy nhiên, theo dữ liệu do công ty phân tích web Similarweb công bố, sau sáu tháng tăng trưởng nhanh chóng, Lượt truy cập của ChatGPT lần đầu tiên tăng trưởng âm và lượt truy cập trong tháng 6 đã giảm 9,7% so với tháng trước.

Sự sụt giảm đột ngột về lưu lượng truy cập ChatGPT đã làm dấy lên những lo ngại và thảo luận trong cộng đồng công nghệ toàn cầu về nguy cơ bong bóng trong ngành AI, tạp chí The Economist thậm chí còn đưa ra kết luận “con đường dẫn đến AI lớn hơn và tốt hơn đã không còn khả thi”. Ý tưởng trở thành một "ChatGPT phiên bản Trung Quốc" cũng đang trôi xa khỏi giới doanh nhân Trung Quốc.

Zhu Xiaohu, đối tác sáng lập của GSR, đã viết trong Moments: "Đừng mê tín về mô hình chung, vì năm tới GPT-3.5 sẽ trở thành hàng hóa (cơ sở hạ tầng chung) và ba năm sau, GPT-4 cũng sẽ như vậy. Đối với hầu hết các doanh nhân, bối cảnh là ưu tiên hàng đầu và dữ liệu là vua!"

Đồng thời khi tâm lý của những người hành nghề đã thay đổi, thị trường doanh nhân quy mô lớn đã bắt đầu phân chia.

Các công ty mô hình quy mô lớn của Trung Quốc không còn bị ám ảnh bởi mục tiêu lý tưởng hóa "trở thành OpenAI của Trung Quốc", cũng không bị ám ảnh bởi việc theo đuổi các mô hình tham số và sức mạnh tính toán.

Sự cạnh tranh của các mô hình AI lớn đã mở ra một nút theo dõi mới.

Chủ nghĩa thực dụng tập thể

Vào đầu năm nay, Liang Jianzhang, người sáng lập và chủ tịch hội đồng quản trị của Ctrip, bắt đầu liên hệ với ChatGPT. Trong những năm gần đây, anh ấy đã hoạt động tích cực trong giới học thuật và kinh doanh với tư cách là một nhà nhân khẩu học, nhưng anh ấy cũng là lập trình viên sớm nhất và trẻ nhất ở Trung Quốc, và suýt trở thành tiến sĩ về trí tuệ nhân tạo.

Năm 13 tuổi, Liang Jianzhang đã thiết kế một chương trình làm thơ thể thơ và giành được giải thưởng quốc gia, năm 15 tuổi, anh được nhận vào lớp cơ sở của Đại học Phúc Đán, sau khi tốt nghiệp, anh sang Mỹ du học và lấy bằng thạc sĩ khoa học máy tính của Học viện Công nghệ Georgia năm 21 tuổi. Ở tuổi 22, Liang Jianzhang, người đang học tiến sĩ, đột nhiên nhận ra những hạn chế của kiến thức lý thuyết và đã chọn từ bỏ bằng tiến sĩ để gia nhập Oracle tại Hoa Kỳ.

Sự xuất hiện của ChatGPT khiến Liang Jianzhang vui mừng vì anh không tiếp tục học tiến sĩ về trí tuệ nhân tạo, bởi vì "Tất cả các thuật toán xử lý ngôn ngữ tự nhiên này đã bị nó (ChatGPT) đánh bại hoàn toàn". Anh kể lại rằng lần đầu tiên tiếp xúc với ChatGPT, anh "rất, rất sốc", và cảm giác thứ hai là sự khiêm tốn, "Thuật toán thông minh nhất mà chúng tôi cuối cùng đã tạo ra rất gần với cấu trúc sinh học của bộ não con người".

Liang Jianzhang bắt đầu nghĩ về sự kết hợp giữa mô hình lớn AI và kinh doanh Ctrip.

Theo quan điểm của Liang Jianzhang, dưới nền tảng của xã hội thông minh, du lịch, với tư cách là một "ngành nhu cầu tinh thần khó tự động hóa", nhu cầu của nó sẽ tăng lên cùng với sự cải thiện của mức sung túc xã hội nói chung và tỷ trọng của nó trong nền kinh tế cũng sẽ tăng lên. Anh khóa mắt về mô hình dọc của ngành du lịch.

Trong sáu tháng qua, các thành viên từ các doanh nghiệp khác nhau của Ctrip đã thành lập nhóm kỹ thuật mô hình quy mô lớn Ctrip. Trong giai đoạn đầu phát triển mô hình lớn, Ctrip đã điều chỉnh cơ cấu tổ chức theo yêu cầu chiến lược của mô hình lớn và thành lập các bộ phận khác nhau bao gồm nhóm kỹ thuật chung, nhóm chiến lược nội dung, nhóm danh sách, v.v., đồng thời điều chỉnh nhóm kỹ thuật theo sự nâng cấp và lặp lại liên tục của các sản phẩm mô hình lớn.

Liang Jianzhang cho biết Ctrip sẽ nỗ lực hết sức để đầu tư vào mô hình lớn, "Chúng ta nên đầu tư thật chắc chắn về lâu dài nếu nó có giá trị đối với khách hàng hoặc người bán của chúng tôi. Mô hình này (mô hình lớn) rất mới và đội ngũ kỹ thuật không ngừng tối ưu hóa số tiền đầu tư của họ, nhưng chúng tôi không có giới hạn."

Giữa tháng 7, Ctrip chính thức cho ra mắt mẫu đứng lớn ngành du lịch. Asked đã sàng lọc 20 tỷ dữ liệu du lịch phi cấu trúc, kết hợp với dữ liệu thời gian thực có cấu trúc hiện có của Ctrip, các rô-bốt và thuật toán tìm kiếm đã được đào tạo trước đây của Ctrip, đồng thời tiến hành đào tạo mô hình dọc do chính họ phát triển.

Trước khi công bố câu hỏi, Ctrip đã tiến hành một cuộc kiểm tra nội bộ và nhân viên dịch vụ khách hàng Wang Yun rõ ràng cảm thấy rằng công việc của cô ấy đã có những thay đổi lớn. Trước đây, cô phải trả lời hơn 150 cuộc gọi mỗi ngày để giải đáp thắc mắc của khách hàng về việc hủy đơn hàng sau bán hàng và thất lạc hành lý; giờ đây, Wang Yun đã chuyển sang giới thiệu dịch vụ khách hàng trước chuyến đi và bước vào phòng phát sóng trực tiếp từ hậu trường để cung cấp cho cư dân mạng các dịch vụ và đề xuất cần chuẩn bị trước khi đi du lịch.

Theo quan điểm của Liang Jianzhang, trên cơ sở mô hình quy mô lớn có mục đích chung, giải quyết vấn đề về độ chính xác trong ngành du lịch vẫn là mấu chốt: "Du lịch là ngành nặng về tiêu dùng. Ngay cả khi lập kế hoạch tiết kiệm nửa giờ, vẫn có thể có 5% khả năng kết quả khách sạn hoặc hành trình được đề xuất sẽ sai."

Mặc dù nó không tốt bằng mô hình lớn nói chung về các tham số, cũng như không có các yêu cầu khắc nghiệt về khả năng tính toán và các điều kiện khác của mô hình lớn nói chung, nhưng mô hình lớn dọc đưa ra các yêu cầu cao hơn về dữ liệu và kịch bản.

Thách thức lớn nhất trong quá trình đào tạo mô hình quy mô lớn của Ask là trong bối cảnh thực tế, trong quá trình người dùng lấy thông tin du lịch, nhiều vòng thu thập và làm sạch dữ liệu tương tác, khối lượng dữ liệu và độ chính xác của dữ liệu cần phải được sửa chữa liên tục, đặc biệt là ngành du lịch đã trải qua những thay đổi to lớn và thông tin điểm đến ba năm trước có thể đã hoàn toàn lỗi thời cho đến nay, đặc biệt là tác động của dịch bệnh đối với ngành du lịch toàn cầu đã làm trầm trọng thêm tính kịp thời của dữ liệu.

Giống như Ctrip, ngày càng có nhiều công ty đưa việc theo dõi các người mẫu lớn vào lĩnh vực dọc.

Phiếu trả lời mô hình quy mô lớn Yanxi do JD.com cung cấp cũng lấy mô hình quy mô lớn công nghiệp làm một đặc điểm quan trọng. Theo Xu Ran, Giám đốc điều hành mới của Tập đoàn Jingdong, sự phát triển của công nghệ trí tuệ nhân tạo trong quá khứ đã nhiều lần trên bờ vực bùng nổ ứng dụng, nhưng cuối cùng nó thường chỉ tồn tại trong thời gian ngắn và một trong những lý do quan trọng là công nghệ này chưa tạo thành ứng dụng vững chắc trong ngành **.

Tại buổi họp báo về Huawei Pangu Large Model 3.0 vào ngày 7 tháng 7, Zhang Pingan, Giám đốc điều hành của Huawei Cloud, thậm chí còn nói thẳng: "Pangu Large Model không có thời gian để làm thơ và trò chuyện. Cho dù có bao nhiêu thông số và khả năng đối thoại tốt đến đâu, nếu nó không thể giải quyết các vấn đề thực tế, nó sẽ không có tác dụng gì nhiều."

Tencent vẫn chưa công bố tiến độ của mô hình quy mô lớn Hunyuan nói chung, nhưng họ đã công bố lộ trình mô hình quy mô lớn của ngành một cách nổi bật, đưa ra hơn 50 giải pháp cho 10 ngành chính trong một lần. Li Qiang, phó chủ tịch Tencent kiêm chủ tịch mảng kinh doanh doanh nghiệp và chính phủ của Tencent, cũng cho biết: "Các mô hình lớn nói chung không phải là hướng duy nhất cho ứng dụng mô hình và các mô hình cho các ngành dọc sẽ trở thành điểm bùng phát về giá trị của các mô hình lớn."

Thay đổi tư duy

Một điểm mấu chốt rõ ràng trong sự thay đổi tâm lý của các doanh nhân quy mô lớn bắt đầu khi Wang Huiwen được chẩn đoán mắc chứng trầm cảm và được Meituan mua lại cách ngày thành lập vài năm ánh sáng. Mọi người chợt nhận ra rằng ngay cả công ty ngôi sao được mọi người kỳ vọng và đặt nhiều hy vọng cũng có thể phải ngừng hoạt động vì nhiều tai nạn.

Chỉ nửa năm trước, các cửa hàng khác dường như tiêu tan trong một đêm và chỉ có mô hình lớn là ở vị trí C. Các doanh nhân và nhà đầu tư trong giới công nghệ của Trung Quốc đã bay đến Thung lũng Silicon để học hỏi từ OpenAI. Zhang Yiming, Ma Huateng và Wang Xing, những nhân vật trung tâm ra quyết định số 1 của những người khổng lồ này, đã trở lại trong một đêm với trạng thái phấn khích và tò mò khi họ mới bắt đầu kinh doanh, đọc báo và trao đổi công nghệ đến tận khuya.

Vào thời điểm đó, dường như mọi nhà thám hiểm mô hình quy mô lớn của Trung Quốc đều nghĩ về những vấn đề liên quan đến tình cảm gia đình và đất nước. Đối mặt với sự lặp đi lặp lại nhanh chóng của ChatGPT, mục tiêu mà các doanh nhân Trung Quốc đặt ra là làm thế nào để vượt qua trong thời gian bao lâu.

Li Yanhong cho biết, "Baidu Wenxinyiyan đang trong giai đoạn nghiên cứu và phát triển, nhóm kỹ thuật của Baidu đã tiến hành thử nghiệm so sánh với ChatGPT. Vào thời điểm đó, khoảng cách là 40 điểm và nó có thể bắt kịp sau một tháng."

Zhou Hongyi, người sáng lập 360, cho biết trong một cuộc phỏng vấn với "Doanh nhân Trung Quốc" rằng các mô hình lớn không còn là khía cạnh cạnh tranh thương mại. Nếu sự đóng cửa của Internet Trung Quốc và vấn đề đảo dữ liệu giữa các ứng dụng do Internet di động gây ra không được giải quyết, thì có khả năng dẫn đến những hạn chế trong đào tạo động cơ trí tuệ nhân tạo, điều này có thể dẫn đến một vòng cách mạng AI mới giữa Trung Quốc và Hoa Kỳ. Khoảng cách giữa các thế hệ.

Về việc tại sao không có công ty nào như OpenAI ra đời ở Trung Quốc, các doanh nhân Trung Quốc thậm chí đã bắt đầu suy ngẫm vào thời điểm đó, trước đây việc khám phá trí tuệ nhân tạo trong nước quá thực dụng, mọi thứ đều hướng đến KPI nên mọi người không đủ quyết tâm và kiên nhẫn để đầu tư vào đó nên đã bỏ lỡ một nút thắt quan trọng như vậy.

Dưới sự nhiệt tình, sau khi Baidu Wenxin nổ phát súng đầu tiên, hơn 80 mô hình AI quy mô lớn đã xuất hiện trong vòng nửa năm và hơn 30 mô hình quy mô lớn đã xuất hiện tại Hội nghị Trí tuệ Nhân tạo Thế giới được tổ chức tại Thượng Hải năm 2023. Không ngoa khi mô tả sự phổ biến của các mô hình quy mô lớn là "cuộc chiến trăm mô hình".

Nhưng chúng ta có thực sự cần nhiều mô hình lớn như vậy không? Chúng ta cần loại mô hình lớn nào?

Trên thực tế, Robin Li đã đề xuất từ rất sớm: "Việc các công ty khởi nghiệp tạo lại ChatGPT không có nhiều ý nghĩa. Tôi nghĩ rằng có một cơ hội tuyệt vời để phát triển các ứng dụng dựa trên mô hình ngôn ngữ lớn này. Không cần phải phát minh lại bánh xe. Sau khi có bánh xe, giá trị của việc chế tạo ô tô và máy bay có thể lớn hơn giá trị của bánh xe."

He Xiaodong, phó chủ tịch công nghệ của JD Group, cũng nhận ra ngay từ đầu: "Nếu mô hình lớn muốn có giá trị thì nó phải được đặt trong ngành, và tốt nhất là ở lĩnh vực có giá trị công nghiệp cao. Chỉ bằng cách này, nó mới thực sự trở thành thứ bền vững lâu dài, nếu không nó có thể trở thành thứ tồn tại trong thời gian ngắn."

BIẾN MỚI

Đúng vào lúc các doanh nhân trong nước đang loay hoay khám phá mô hình AI, bước chuyển mình lớn của Zuckerberg đã mang đến những biến số mới cho lĩnh vực luôn thay đổi này.

Vào rạng sáng ngày 19 tháng 7, giờ Bắc Kinh, Meta đã phát hành mô hình mã nguồn mở lớn Llama 2, mô hình này một lần nữa kích nổ vòng tròn AI: Llama 2 không chỉ có hiệu suất tương tự như GPT-3 mà còn miễn phí, mã nguồn mở và có sẵn trên thị trường. Llama 2 là phần tiếp theo của mẫu Llama được Meta phát hành hồi đầu tháng 3 vừa qua.

Tại hội nghị đối tác của Microsoft Inspire sau đó, Giám đốc điều hành Microsoft Satya Nadella đã công bố tin tức về sự hợp tác giữa Meta và Microsoft, sự hợp tác này cho phép Llama 2 chạy trên dịch vụ đám mây Microsoft Azure của Microsoft. Đồng thời, đám mây Amazon AWS cũng tham gia hợp tác với Meta.

Tầm quan trọng của Llama 2 đối với các doanh nhân mô hình quy mô lớn là, giống như hệ thống Android là phát triển APP, các nhà phát triển không cần phải phát minh lại bánh xe và trực tiếp có được cơ sở hạ tầng của các mô hình quy mô lớn với chi phí thấp nhất, để họ có thể tập trung hơn vào các kịch bản công nghiệp của riêng mình.

Ở một mức độ nào đó, điều này cũng có nghĩa là đối với hầu hết các doanh nhân, việc chọn tập trung vào các ứng dụng ngành dọc đã được chứng minh là một con đường thiết thực hơn.

Tuy nhiên, khác với các mô hình lớn thông thường, **Mô hình lớn công nghiệp cũng đưa ra các ngưỡng và yêu cầu khác nhau đối với những người tham gia trong ngành:**Một mặt, mô hình lớn công nghiệp yêu cầu nhà phát triển phải có tích lũy và sức mạnh kỹ thuật nhất định; mặt khác, mô hình lớn công nghiệp cũng yêu cầu người vận hành phải có kịch bản thực hành ứng dụng công nghiệp phong phú.

Liang Jianzhang nói với "Doanh nhân Trung Quốc": "Chỉ số quan trọng nhất của một mô hình lớn nói chung có thể là có bao nhiêu tham số hoặc bao nhiêu GPU được sử dụng, v.v., nhưng mô hình lớn theo chiều dọc và mô hình ngôn ngữ lớn chỉ là một phần của nó. Nó cũng có sự kết hợp với các dữ liệu khác, bao gồm cả xác minh thủ công, v.v. Những điều này quan trọng hơn. Cuối cùng, nó chỉ ra liệu có thể kiểm tra mức độ hiệu quả, độ chính xác và độ tin cậy của những câu hỏi và câu trả lời này từ khách hàng hay không."

"Vấn đề lớn nhất trong du lịch là độ tin cậy. Điều này thực sự phức tạp hơn so với AI viết thơ, viết báo và tiểu thuyết. Nó cũng là một công việc lâu dài. Bất cứ điều gì có thể cải thiện điều này thành 80%, 90%, 95%, thậm chí 99% đều đáng làm." Liang Jianzhang cuối cùng cũng nói.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)