AI thất vọng: mô hình nửa năm, vẫn bay trên bầu trời

2023-08-04 06:52:59

Nguồn: "Photon Planet" (ID: TMTweb), tác giả: Wu Kunyan, editor: Wu Xianzhi

Nguồn hình ảnh: Được tạo bởi Unbounded AI

Ngọn lửa mô hình lớn đã cháy trên mảnh đất này nửa năm nay. Khi các cuộc họp báo của Huawei, JD.com và Ctrip bắt kịp với các tập phim buổi tối, theo mô hình nhất quán của Internet, "điều mới" của các mô hình quy mô lớn trong nước cũng đã mở ra cuộc thử nghiệm kéo dài nửa năm của chính nó.

Nó chỉ khác với các cuộc kiểm tra nửa năm của các doanh nghiệp khác. Các cuộc kiểm tra nửa năm một lần đối với các hình thức kinh doanh như phương tiện năng lượng mới, điện thoại di động và nền tảng thương mại điện tử được hỗ trợ bởi đủ thông tin dữ liệu công khai để tạo điều kiện cho phân tích văn bản và quy mô lớn. các mô hình vẫn ở trạng thái Ở trạng thái "hộp đen", không có mô hình kinh doanh rõ ràng, vì vậy cái gọi là thông tin dữ liệu và các lập luận khác là không cần thiết.

Một điều khá mỉa mai là ngay cả từ góc độ chức năng sản phẩm, mô hình lớn vẫn chưa đưa ra một phương pháp đánh giá chung. Đối mặt với mục tiêu cuối cùng là AGI, đương nhiên sẽ có nhiều phương pháp đánh giá khác nhau, chẳng hạn như "phương pháp cá sóc" cổ điển mà người dùng C-end trong nước dựa vào để "đánh giá" các mô hình lớn.

Hoặc vì điều này, hầu hết các nhà sản xuất trong nước không mở các mô hình lớn của riêng họ để sử dụng như OpenAI, mà thực hiện các cơ chế thử nghiệm nội bộ.

Việc khám phá các mô hình quy mô lớn tập trung nhiều hơn vào B-side và G-side, chẳng hạn như các mô hình quy mô lớn hàng đầu trong ngành của Tencent, Pangu 3.0 của Huawei, Jingdong Lingxi, v.v. Là đường đua hiện tại mà những người chơi hàng đầu tập trung vào, mô hình lớn của nó tập trung vào việc hiển thị các dạng sản phẩm trưởng thành càng nhiều càng tốt, với mục tiêu cơ bản là thương mại hóa. Chẳng hạn, để nhanh chóng phổ biến và thúc đẩy thương mại hóa loại mô hình lớn này, bên cạnh định hướng về đích kinh doanh, khả năng triển khai nội địa hóa cũng trở thành chỉ số tham chiếu quan trọng.

Mặc dù vậy, trong mắt những người trong ngành, mô hình công nghiệp quy mô lớn "đem bát ra trước" vẫn thiếu vắng những công ty mua nó. không có hợp tác thương mại quy mô lớn cho đến nay. .

Do đó, không khó để nhận thấy trên thị trường đầu tư hiện nay, các khoản đầu tư liên quan đến các mẫu xe phân khối lớn đều tập trung ở thị trường thứ cấp hơn là sơ cấp. Ngay cả khi mức độ bò lớn của Wang Huiwen tham gia vào thị trường, các nguồn tin công khai nói rằng tài chính vòng A của nó cao hơn nhiều so với 230 triệu đô la Mỹ và khả năng tài chính của nó không bằng OpenAI, công ty nhận được hàng chục tỷ đô la từ Microsoft theo thời gian.

Thị trường đầu tư là một phong vũ biểu đủ tiêu chuẩn. Rõ ràng, các phiếu trả lời do các mô hình quy mô lớn trong nước gửi vào nút thời gian thi nửa năm là không khả quan, và sẽ cần một thời gian ngủ yên và trau chuốt để biến "câu chuyện" thành hiện thực.

Mô hình lớn không có mô hình kinh doanh?

Khi các mô hình quy mô lớn trong nước cần đáp ứng những nghi ngờ của thị trường, các mô hình kinh doanh nên được đặt lên hàng đầu.

ChatGPT vốn đã chiếm vị trí hàng đầu trong tâm trí người dùng đã giảm sút đáng kể về mức độ phổ biến, Baidu và Ali, những mô hình lớn đa năng đầu tiên được phát hành trong nước cũng rơi vào "im hơi lặng tiếng" sau khi một lượng lớn người chơi chạy theo hướng lên. Lý do là mô hình kinh doanh của mô hình lớn nói chung không hoạt động. Mặc dù nó đã giành được sự đồng tình của người dùng trong lĩnh vực dư luận, nhưng vòng khép kín thương mại chưa bao giờ xuất hiện.

Lấy mô hình quy mô lớn của Baidu với nhiều thử nghiệm làm ví dụ, mô hình thanh toán của ứng dụng thương mại Wenxin Qianfan dựa trên số lượng mã thông báo được tạo bằng cách gọi, tiêu chuẩn là 0,012 nhân dân tệ trên một nghìn mã thông báo và chi phí là 0,12 nhân dân tệ để xuất bản thảo hàng nghìn ký tự.

Bất kể tốc độ khôi phục của nó là bao nhiêu, phí 0,012 nhân dân tệ / nghìn mã thông báo có vẻ rẻ, nhưng việc tạo văn bản thường yêu cầu nhiều lần tương tác để có được kết quả mong muốn. Nhiều lần tương tác sẽ làm tăng chi phí ẩn vô hạn. loại nhân viên đến và đi.

Sun Quan (bút danh), một học giả, nói với Photon Planet rằng trải nghiệm sử dụng các ứng dụng mô hình tương tự như việc tìm kiếm câu trả lời chất lượng cao trong cộng đồng hỏi đáp. suy nghĩ của người dùng là mức độ chi tiết của câu hỏi và mức độ sẵn sàng trả tiền thường chỉ được tìm thấy trong các câu trả lời chất lượng cao. Do đó, Baidu đã chọn số lượng văn bản suy luận làm tiêu chuẩn thanh toán, nhưng nó vẫn không thể trang trải các chi phí ẩn của việc sử dụng thương mại.

Nếu bạn áp dụng khoản thanh toán hàng tháng mà bên B thích xem, thì điều đó sẽ chỉ chuyển chi phí từ người dùng sang chính bạn, đây rõ ràng không phải là giải pháp lâu dài. Bằng chứng tốt nhất là ChatGPT vẫn bị nghi ngờ cắt giảm giá dưới 20 đô la mỗi tháng cho người dùng C-end.

Hiện tại, việc thương mại hóa các mẫu xe phổ thông cỡ lớn khó đạt được mức hòa vốn dù là bên B hay bên C. Đồng thời, có khả năng gặp phải các rủi ro tuân thủ như đạo đức AI và giám sát. Do đó, công nghiệp hóa và mô hình hóa theo chiều dọc đã trở thành một sự thay đổi mô hình theo nhu cầu hạ cánh.

Ngược lại với mô hình công nghiệp quy mô lớn, mặc dù hình thức sản phẩm của nó bắt đầu từ nhu cầu hạ cánh, nhưng các vấn đề phát sinh trong hạ cánh thực tế vẫn cần được giải quyết.

Một loại trường hợp đáng tham khảo là mô hình vertical to C được xây dựng trên cơ sở hệ sinh thái sản phẩm của riêng mình, chẳng hạn như Zhihaitu AI, mà Zhihu đã công bố trước đó để tiến hành thử nghiệm nội bộ trong sản phẩm và Ctrip.com, được phát hành không lâu trước kia.

Lợi thế của cả hai khi tham gia theo dõi mô hình quy mô lớn là như nhau, nằm ở hệ sinh thái cộng đồng của riêng họ và nội dung cộng đồng chất lượng cao bắt nguồn từ điều này. Nội dung, dưới dạng dữ liệu ngành, có thể trở thành kho dữ liệu đào tạo của các mô hình lớn sau khi làm sạch đơn giản. Sự khác biệt tinh tế giữa hai loại này là Zhihu đã là một cộng đồng nội dung ngay từ đầu, trong khi Ctrip chỉ mới bắt đầu tập trung vào nội dung trong những năm gần đây.

Nhưng theo quan điểm hiện tại, dù là Zhihu hay Ctrip, dạng sản phẩm của mô hình lớn dường như không đáp ứng được điểm đau của người dùng, cũng như không thể cải thiện đầy đủ các chức năng hiện có.

Sản phẩm hiện đang được công bố của Zhihaitu AI là “Tóm tắt danh sách hấp dẫn” sử dụng AI để nắm bắt các câu hỏi và câu trả lời chất lượng cao, đồng thời đánh bóng và viết lại phần tóm tắt để trình bày cho người dùng, trong khi một ứng dụng khác “Tổng hợp tìm kiếm” tổng hợp ý kiến từ các câu trả lời của chính họ để cải thiện thông tin chuyển đổi của người dùng và hiệu quả trong việc ra quyết định.

Các chức năng tổng hợp như tự giới thiệu và danh sách hấp dẫn là “kỹ năng nghệ thuật truyền thống” của Zhihu, và hiệu suất của việc trao quyền cho mô hình lớn không gây được tiếng vang ở cấp độ người dùng. Ngoài ra, quá trình viết lại và đánh bóng AI cũng bao gồm các tính năng được cá nhân hóa của các câu trả lời phổ biến.Đối với người dùng, chức năng của ứng dụng này chỉ là hiểu nhanh thông tin, điều này đi ngược lại với giao tiếp khác biệt và cá nhân hóa được cộng đồng nội dung ủng hộ.

Dựa trên OTA, câu hỏi Ctrip, theo quan điểm của Liang Jianzhang, chủ tịch hội đồng quản trị của Ctrip, rằng đó là một “thư viện câu trả lời đáng tin cậy” cho ngành du lịch. Sẽ mất thời gian để kiểm tra tính hiệu quả của các sản phẩm của mình, nhưng từ góc độ định vị, nó cũng bị nghi ngờ là "hy sinh những điều cơ bản và theo đuổi điều cuối cùng".

Trong mắt người dùng trẻ, du lịch chưa có câu trả lời chuẩn, sự ra đời của các loại hình du lịch đa dạng như “biệt đội”, “đánh đấm”, “dìm hàng” đã chứng minh điều này. Ví dụ: giả sử rằng một số lượng lớn người dùng sử dụng AI để lập kế hoạch lộ trình di chuyển, thì việc lập kế hoạch lộ trình tương tự sẽ thực sự ảnh hưởng đến giao tiếp và bầu không khí của cộng đồng, thậm chí còn làm giảm thời gian lưu trú của người dùng.

Nói chung, nỗ lực hạ cánh của mô hình thẳng đứng ở đầu C không suôn sẻ và thậm chí có thể trở thành "chi phí chìm". Có lẽ bị ảnh hưởng bởi huyền thoại về "nâng cao hiệu quả" của chính mô hình lớn, định vị sản phẩm hầu như chỉ giới hạn ở từ "hiệu quả", mà hiệu quả chỉ là một khía cạnh không cốt lõi trong trải nghiệm người dùng.

Mô hình tương tự cũng đã được chứng minh trong lĩnh vực B, và ở phía B theo đuổi hiệu quả, mô hình kinh doanh và các vấn đề triển khai của mô hình lớn của ngành đã được chứng minh sâu sắc hơn.

Không rõ hộp đen

"AI không phải là vật lý. Về lý thuyết, có rất ít đột phá công nghệ lớn, nhưng có nhiều sự tinh chỉnh và tối ưu hóa nhỏ hơn về kích thước của cấu trúc mô hình và chất lượng dữ liệu. Trong nhiều trường hợp, đầu ra của mô hình thậm chí còn tốt hơn, nhưng nhóm không thể tìm nguyên nhân."

Theo ý kiến của một người trong ngành, có một sự thiên vị nhận thức rất lớn đối với các mô hình lớn bên ngoài ngành, và lý do là việc đào tạo mô hình lớn và ngành AI là một "hộp đen" đối với thế giới bên ngoài và rất khó để kiểm tra các mô hình lớn Quá trình lập luận tạo ra đầu ra là vô hình và vô hình.

Điều này đã khiến thế giới bên ngoài có thái độ thận trọng đối với "hộp đen" của mô hình lớn một khi họ đã bình tĩnh lại sau khoảng thời gian điên cuồng do ChatGPT mang lại. Điều này sẽ dẫn đến tình trạng tiến thoái lưỡng nan của mô hình lớn trên mặt đất, và hiện tượng này càng rõ ràng hơn trong quá trình chuyển sang tuyến đường B.

Lấy các sản phẩm được sản xuất bởi các nhà sản xuất lớn hiện đã xác định rõ lộ trình đến B làm ví dụ, bao gồm giải pháp công nghệ MaaS do Tencent Cloud đưa ra và mô hình lớn Pangu do Huawei Cloud đưa ra. Ngoài ra còn có những thành tựu về tương tác, vận hành và sau đó là bổ sung tối ưu hóa lặp lại dữ liệu ngành mới, có thể nói vì lợi ích của việc hạ cánh, ngưỡng cho các mô hình lớn đã được giảm xuống mức cực thấp.

Tuy nhiên, bức tường nhận thức do sự “thận trọng” mang lại vẫn chưa bị phá vỡ, ChatGPT dù đã nổi nửa năm nhưng nhiều hãng cũng không có động lực hay hứng thú nghiên cứu cách nhập khẩu các mẫu mã lớn.

Một logic tương tự có thể được nhìn thấy trong ngành công nghiệp điện toán đám mây cách đây vài năm. Điện toán đám mây là một dịch vụ và phái sinh dựa trên sự thừa nhận giá trị của dữ liệu, còn về giá trị của các mô hình lớn đối với doanh nghiệp, nói một cách tương đối là giá trị của dữ liệu đã tăng vọt. Đó cũng là những năng lực kỹ thuật mà khách hàng doanh nghiệp còn thiếu, ngay cả việc phổ cập điện toán đám mây vào các doanh nghiệp trong nước cũng còn lâu mới tới đích chứ chưa nói đến mô hình lớn.

Mô hình công nghiệp có hữu ích hay không thực ra không còn quan trọng nữa, suy cho cùng thì giá trị sử dụng của sản phẩm cuối cùng vẫn phải do người dùng khám phá. Hơn nữa, thế giới bên ngoài sẽ đo lường sơ bộ mức độ của mô hình thông qua một số thử nghiệm và hiệu suất nhất định, chẳng hạn như "phương pháp cá quýt sóc" hay Huawei Pangu, gần đây đã bị nghi ngờ do lỗi dự đoán vị trí hạ cánh và cường độ của siêu bão Dusuri.

Có lẽ vì điều này, mô hình quy mô lớn Jingdong Lingxi được phát hành gần đây đã chọn ưu tiên chạy qua các kịch bản kinh doanh của riêng mình và dự kiến sẽ mở cho "các kịch bản kinh doanh nghiêm túc bên ngoài" vào đầu năm tới.

Điều đáng nói hơn là theo "xu hướng công nghiệp", cái gọi là mô hình công nghiệp định hướng thương mại hóa đã thay thế cách kể "phổ thông" ban đầu của mô hình lớn, đồng thời cũng khiến nhiều người "lạc lối". “.

Định nghĩa của cái gọi là mô hình ngành là mơ hồ. Ý nghĩa của mô hình lớn (Mô hình nền tảng) không nằm ở số lượng tham số mà ở các khả năng chung xuất hiện từ đào tạo dữ liệu chung. Nếu cùng một kiến trúc mô hình được áp dụng, nhưng một dữ liệu miền duy nhất được sử dụng trên dữ liệu, thì không chỉ khả năng chung sẽ bị mất mà ngay cả các vấn đề về miền cũng không thể giải quyết được do giảm giá mới nổi.

Nếu dữ liệu ngành được sử dụng để đào tạo trước thứ cấp trên cơ sở mô hình lớn ban đầu, nó tương đương với việc tinh chỉnh mô hình ban đầu, thì bản thân sản phẩm vẫn nằm trong lớp mô hình, có thể được gọi là mô hình lớn của ngành ; nếu tri thức miền được thêm vào thông qua hoặc cơ sở dữ liệu bên ngoài, Điều đó chỉ để kích thích khả năng của mô hình ban đầu và sản phẩm cũng phải thuộc về tầng ứng dụng phía trên mô hình, gọi nó là mô hình công nghiệp thì hơi quá.

Hiện tại, hầu hết các mô hình công nghiệp quy mô lớn trong các nhà máy lớn đều là mô hình cũ, chẳng hạn như Tencent, Jingdong, Huawei, v.v. Loại thứ hai sẽ xuất hiện nhiều hơn trong cộng đồng nguồn mở do đầu tư nhẹ hơn và cải thiện nhanh chóng hiệu suất của mô hình, chẳng hạn như ChatLaw, một mô hình pháp lý lớn đã gây ra các cuộc thảo luận sôi nổi cách đây một thời gian.

Một người trong ngành cho biết: “So với cái trước, cái sau hoàn thiện hơn về hình thức sản phẩm, tạo điều kiện cho việc xây dựng nhanh chóng các khả năng của mô hình, nhưng cái sau thường có giới hạn trên cao hơn sau khi hoàn thành quá trình thấm nhuần kiến thức miền”.

Các mối đe dọa nguồn mở

Gần đây, Meta đã cung cấp miễn phí mô hình lớn Llama2 mã nguồn mở mới nhất của mình theo giấy phép thương mại mở và giới thiệu nó với nền tảng Azure của Microsoft. nhà sản xuất hàng đầu OpenAI.

Thông qua Microsoft, nhà tài trợ mô hình lớn, Meta thách thức OpenAI với thái độ cởi mở hơn.

Trên thực tế, "phe nguồn mở" đã âm thầm trỗi dậy với tư cách là bên thứ ba từ lâu trước đó. “Chúng tôi không có hào, và OpenAI cũng vậy,” một tài liệu nội bộ của Google vô tình bị rò rỉ vào tháng 5 cho biết. Ý kiến chung là nhìn bề ngoài, OpenAI và Google đang bắt kịp nhau trong mô hình lớn, nhưng người chiến thắng thực sự có thể không đến từ hai người này, lý do cho nhận định này nằm ở hệ sinh thái nguồn mở ngày càng phong phú.

Hệ sinh thái nguồn mở ngày càng trở nên tích cực hơn và thậm chí Llama2, đại diện cho khả năng của mô hình và LORA, công nghệ đại diện của mô hình Finetune (tinh chỉnh mô hình), đã xuất hiện. Tất cả những điều này đã tạo nên những nhà sản xuất khổng lồ. đang phấn đấu để "phấn đấu cho phép lạ" cảm thấy ớn lạnh rõ ràng.

Các yếu tố như chia sẻ công nghệ mã nguồn mở, chuyển giao nhân tài cũng đang khiến chiếc hộp đen của mô hình lớn trở nên “lạnh hóa” hơn. thời gian, dễ dàng bị lật đổ bởi cộng đồng mã nguồn mở. .

Hầu hết các nhà sản xuất hàng đầu trong nước đều đối phó với điều này bằng cách “bắt cá hai tay”. Tay trái “đóng cửa xây ô tô”, liên tục trau chuốt hình thức và tính năng của sản phẩm dưới hình thức thử nghiệm nội bộ quy mô nhỏ, còn tay phải “động não”, xây dựng cộng đồng mã nguồn mở trong hệ sinh thái dựa trên đám mây hệ sinh thái của nhà phát triển, nhưng điều này chỉ yêu cầu lớp sức mạnh tính toán của chính nhà sản xuất và lớp mô hình Bố cục toàn ngăn xếp cho lớp ứng dụng. Alibaba Cloud đã ra mắt cộng đồng nguồn mở quy mô lớn GPT và Huawei Cloud, Baidu Cloud và Tencent Cloud cũng đã lên kế hoạch.

Nói chung, cho dù đó là ngành công nghiệp hay GM, đến C hay B, thử nghiệm nửa năm của mô hình lớn cho chúng ta cảm giác trực tiếp rằng nó khó thực hiện và kỳ vọng lợi nhuận liên tục lùi về phía sau; rủi ro đang gia tăng mạnh hơn, và khó có thể nói là rào cản kỹ thuật. Vậy, đâu là cách để phá vỡ tình trạng hiện tại?

Hiện tại, có hai hướng thú vị. Một là cơ sở dữ liệu vectơ được gọi là "Bộ nhớ trong kỷ nguyên AI" và hai là phần cứng thông minh được cung cấp bởi trí thông minh mô hình.

Cái gọi là vectơ đề cập đến dữ liệu đa chiều có thể đại diện cho bất kỳ thứ gì, bao gồm văn bản, hình ảnh, video và âm thanh, điều quan trọng nhất trong đào tạo LLM ngày nay. Các dạng nội dung này được thể hiện rõ ràng trong cơ sở dữ liệu và hỗ trợ truy xuất ngữ nghĩa, tức là truy xuất theo mức độ tương tự, ví dụ: người đàn ông so với cậu bé. Nói cách khác, đối với các mô hình lớn, truy xuất vector chính là SEO của các mô hình lớn.

Như đã đề cập ở trên, kiến thức miền có thể cải thiện việc xây dựng và sử dụng các mô hình công nghiệp thông qua khả năng cơ sở dữ liệu vectơ, tinh chỉnh hoặc trình cắm thêm.Đối với các nhà sản xuất lớn, nó đương nhiên là trọng tâm của giai đoạn tiếp theo. Kể từ tháng 5, vốn đã đổ vào các hoạt động liên quan đến dữ liệu vectơ.Là một sản phẩm lớp ứng dụng có triển vọng chắc chắn hơn, dữ liệu vectơ cũng đã nhận được sự quan tâm đặc biệt của nhiều nhà đầu tư mạo hiểm.

Đối với mô hình phần cứng thông minh tích hợp, đây là một bước nhảy vọt về khả năng so với các trợ lý thông minh trước đây như "siri" và "Xiaoai", đồng thời nó cũng là một phần mở rộng của các thiết bị thông minh thực sự (điện thoại di động, máy tính). Trong cộng đồng nguồn mở, đã có những nỗ lực xây dựng các mô hình tham số lớn thành MAC, trong khi các nhà sản xuất lớn đã tích lũy được một lượng năng lực sản xuất phần cứng nhất định trong kỷ nguyên Internet di động vừa qua và nói một cách tương đối, lợi thế của người đi trước của họ rõ ràng hơn .

Không còn phong cách viết xuân thu kiểu PR, những mô hình đại trà đã trở thành yêu cầu cốt lõi cũng không còn bí ẩn, những câu chuyện ngày càng ít đi, những người chơi theo dõi đã bắt đầu "lặn sâu" vẫn vậy làm việc chăm chỉ. Ngành công nghiệp cần thời điểm "ChatGPT" tiếp theo trước khi chúng ta thấy các thợ lặn nổi lên và đối đầu trực diện với họ.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

1 thích