Lin Junchao: Nhìn vào các cơ hội đầu tư của AI từ góc độ thị trường sơ cấp

Nguồn: Viện nghiên cứu vốn titan

Sau khi ChatGPT càn quét thế giới, trí tuệ nhân tạo đã được đẩy lên một lối thoát mới, với tư cách là một công cụ năng suất thông minh mang tính lật đổ, nó đã trở thành một chủ đề nóng. Hiện tại, các quốc gia và khu vực phát triển trên thế giới đã nâng tầm phát triển của ngành trí tuệ nhân tạo lên chiến lược quốc gia, đồng thời liên tục triển khai các công nghệ và ứng dụng mới nổi liên quan. Với sự phát triển chuyên sâu của làn sóng AI mới, một cuộc cách mạng công nghiệp do công nghệ trí tuệ kỹ thuật số dẫn đầu sắp xuất hiện, đồng thời nó cũng mở đầu cho "kỷ nguyên mô hình lớn" trong mọi tầng lớp xã hội.

Tại sao các mô hình ngôn ngữ lớn có thể dẫn đầu xu hướng của AI? Đâu là cơ hội đầu tư cho AI trong nước? Gần đây, Titanium Capital đã mời Lin Junchao, giám đốc đầu tư của Rongyi Capital, chia sẻ chủ đề: Nhìn vào các cơ hội đầu tư của AI từ góc độ thị trường sơ cấp. Ông Lin có bằng cử nhân kỹ thuật điện và điện tử và bằng thạc sĩ danh dự hạng nhất của Đại học College London (UCL), đồng thời có ba năm kinh nghiệm kinh doanh và sáu năm kinh nghiệm đầu tư vốn cổ phần. Trọng tâm đầu tư của nó bao gồm các công cụ phát triển phần mềm cơ bản, Metaverse và AIGC, bao gồm Jingye Intelligence, Smart Open Source China và các dự án khác. Người dẫn chương trình chia sẻ này là Wu Kai, Giám đốc điều hành của Titanium Capital, sau đây là nội dung chia sẻ:

Vì sao mô hình ngôn ngữ lớn có thể dẫn đầu xu hướng AI‍‍‍

Sơ lược về lịch sử phát triển AI

Kể từ khi Shannon đề xuất trò chơi máy tính vào năm 1950, AI đã trải qua hơn 70 năm phát triển. Chúng ta có thể tạm chia nó thành bốn giai đoạn: khai sáng sớm + kỷ nguyên hệ thống chuyên gia (thập niên 50-70), kỷ nguyên máy học + thị giác máy tính (thập niên 80-90), kỷ nguyên học sâu (2006-2017), kỷ nguyên mô hình ngôn ngữ đa phương thức + ngôn ngữ lớn (2018-nay).

Sự kiện quan trọng trong giai đoạn khai sáng ban đầu xảy ra trong Hội nghị chuyên đề mùa hè của Đại học Dartmouth năm 1956. Khái niệm trí tuệ nhân tạo lần đầu tiên được đề xuất tại cuộc họp, chính thức mở đầu cho trí tuệ nhân tạo.

Trong thời đại của máy học, có một nhân vật mang tính bước ngoặt, đó là cha đỡ đầu của AI đã rời Google một thời gian trước-Jeffrey Hinton. Năm 1986, ông đề xuất thuật toán lan truyền ngược, giúp cho việc đào tạo mạng thần kinh quy mô lớn trở nên khả thi và mở đường cho các mạng thần kinh và học sâu sau này. Đồng thời, nhiều sự kiện và nhân vật quan trọng cũng xuất hiện trong giai đoạn này, chẳng hạn như ván cờ thỏ cáo vào năm 1979 và chiến thắng của Deep Blue trước nhà vô địch cờ vua thế giới Kastrov vào năm 1997. Năm 2006, Jeffrey Hinton và những người khác chính thức đề xuất khái niệm học sâu, do đó đưa AI vào giai đoạn thứ ba - kỷ nguyên học sâu.

Trong kỷ nguyên học sâu, Jeffrey Hinton đã đề xuất mạng thần kinh tích chập AlexNet vào năm 2012 và giành chiến thắng trong cuộc thi phân loại hình ảnh ImageNet, tỷ lệ lỗi tổng thể thấp hơn 10,8% so với vị trí thứ hai, chính thức mở ra năm đầu tiên học sâu về thị giác máy tính. Vào tháng 3 năm 2013, Google đã mua lại công ty khởi nghiệp DNNResearch của Jeffrey Hinton với giá 44 triệu đô la Mỹ. Kể từ đó, Google đã bắt đầu dẫn đầu sự phát triển của AI toàn cầu; vào năm 2015, TensorFlow, khung học sâu có ảnh hưởng nhất thế giới, đã được mã nguồn mở; vào năm 2016, AlphaGo đã đánh bại bậc thầy cờ vây chín đẳng Li Sedol với tỷ số 4:1; vào năm 2017, nó đã ra mắt mô hình Transformer, từ đó mở ra kỷ nguyên của mô hình ngôn ngữ lớn hiện tại . Đồng thời, cùng với làn sóng AI do Google dẫn đầu, các kỳ lân AI như Scale AI, HuggingFace, OpenAI cũng được thành lập vào năm 2016. Gã khổng lồ Internet Meta cũng mở nguồn một framework học sâu hữu ích hơn Pytorch vào năm 2017.

OpenAI, người dẫn đầu trong kỷ nguyên của các mô hình ngôn ngữ lớn, xuất hiện lần đầu tiên vào đầu tháng 4 năm 2019. OpenAI Five do nó phát triển đã đánh bại đội OG vô địch thế giới Dota2 với lợi thế tuyệt đối 2:0, sau đó phát hành GPT-3 với 175 tỷ tham số vào tháng 5 năm 2020, ChatGPT (GPT-3.5) vào tháng 11 năm 2022 và GPT-4 vào tháng 3 năm 2023. Kể từ đó, nó đã chính thức tiếp quản Google và bắt đầu dẫn đầu thế giới. Phát triển mô hình. Những gã khổng lồ Internet/phần mềm như Google, Meta, Microsoft cũng đã điều chỉnh chiến lược và tích cực tham gia cuộc thi mô hình quy mô lớn. Kể từ ChatGPT vào cuối năm 2022, chúng ta đã thấy rằng các nhà sản xuất lớn trên thế giới đã bước vào mô hình quy mô lớn và các trường đại học trong nước, các ông lớn công nghệ, công ty khởi nghiệp, v.v. cũng liên tục tung ra nhiều sản phẩm và ứng dụng mô hình quy mô lớn.

Lịch sử phát triển AI ở Trung Quốc có thể bắt nguồn từ việc thành lập Viện Nghiên cứu Châu Á của Microsoft vào năm 1998. Ngày nay, những người sáng lập và đội ngũ nòng cốt đằng sau các công ty nổi tiếng trong nước như Innovation Works, Baidu, Kingsoft, Alibaba, SenseTime và Questyle đều đến từ Viện Nghiên cứu Châu Á của Microsoft. Đợt đầu tiên của các công ty AI trong nước iFlytek, Dahua và Hikvision được niêm yết trên thị trường cổ phiếu hạng A vào khoảng năm 2008-2010. Từ năm 2011 đến 2015, nhiều công ty khởi nghiệp về thị giác máy tính đã nổi lên ở Trung Quốc, chẳng hạn như Megvii (thành lập năm 2011), YITU (thành lập năm 2012), SenseTime (thành lập năm 2014) và Yuncong (thành lập năm 2015). Năm 2018, đội tuyển quốc gia - Viện Nghiên cứu Trí tuệ Nhân tạo Trí Viễn Bắc Kinh được thành lập. Sự phát triển của các mẫu xe phân khối lớn thời gian này cũng được hưởng lợi từ làn sóng này. Kể từ năm 2002, các công ty liên quan đến AI như Cambrian, SenseTime, Haiti Ruisheng và Yuncong đã được niêm yết trên Sở Đổi mới Khoa học và Công nghệ và Sở Giao dịch Chứng khoán Hồng Kông.

Sức hấp dẫn của ChatGPT và GPT-4

Tại sao ChatGPT và GPT-4 cho phép chúng ta cảm nhận bằng trực giác sự khác biệt và sức mạnh của làn sóng AI này so với quá khứ? Nó chủ yếu có thể được nhìn từ các khía cạnh sau:

** Đầu tiên, từ quan điểm của người dùng, lần này là một phương thức tương tác rất giống con người. **Khi nói chuyện với ChatGPT, nội dung được tạo ra từng từ và câu trả lời được tạo ra trong khi suy nghĩ. Đồng thời, nó cũng có khả năng đối thoại nhiều vòng. Ngoài ra, nó cũng có thể đóng một số vai trò như phiên dịch viên, nhà tư vấn tâm lý, v.v.

**Thứ hai, khả năng khái quát hóa, chủ yếu thể hiện ở khả năng hiểu nhanh yêu cầu và đưa ra câu trả lời tương đối chính xác mà không cần ngữ cảnh. **Điều này dựa vào sự hỗ trợ của khối lượng lớn trước khi đào tạo và kỹ thuật gợi ý.

**Thứ ba, chuỗi suy nghĩ. ** Khả năng hiểu văn cảnh và ngữ cảnh, thậm chí cả những đoạn văn dài. Ví dụ: Claude2 mới được phát hành có khả năng xử lý ngữ cảnh là 100.000 mã thông báo, về cơ bản có thể nạp toàn bộ sách vào đó để xử lý. Đồng thời còn có khả năng suy luận logic vững chắc, có thể dần dần tháo rời và suy luận vấn đề theo cách suy nghĩ của con người.

Trên thực tế, những khả năng này xuất hiện cùng với việc tăng các tham số mô hình và kéo dài thời gian đào tạo. Ngoài ra, chúng ta có thể thấy rằng GPT-4 đã đạt được kết quả xuất sắc trong các kỳ thi nhân loại khác nhau, về cơ bản đã đạt đến trình độ của sinh viên đại học tương lai.

Thành phần của mô hình ngôn ngữ lớn

Quay trở lại với chính mô hình ngôn ngữ lớn, tôi khuyên mọi người nên xem bài phát biểu quan trọng về Trạng thái của GPT được chia sẻ bởi người đồng sáng lập OpenAI, Andrej Karpathy tại Hội nghị các nhà phát triển Microsoft. Ông đã chia quá trình đào tạo mô hình lớn thành bốn giai đoạn:

**Trong giai đoạn tiền đào tạo, cần có một lượng lớn dữ liệu đào tạo chất lượng tương đối thấp (bao gồm sách, Internet, giấy tờ, v.v.) và 99% sức mạnh tính toán cũng như thời gian trong toàn bộ quy trình đào tạo mô hình lớn để đào tạo một mô hình cơ bản. **Ví dụ: đào tạo mô hình cơ bản LLaMA 650 tỷ tham số cần 2048 GPU Nvidia A100, mất 21 ngày và toàn bộ chi phí đào tạo khoảng 5 triệu đô la Mỹ. Do đó, việc đào tạo một mô hình cơ bản không thân thiện với các công ty mới thành lập và các nguồn lực cũng như chi phí như vậy thường chỉ dành cho các nhà sản xuất lớn.

Bước thứ hai được giám sát và tinh chỉnh trên mô hình cơ bản, để huấn luyện mô hình SFT, chẳng hạn như Vicuna-13B và các mô hình nguồn mở phổ biến khác, là các mô hình được giám sát và tinh chỉnh. Ở giai đoạn này, chỉ cần cung cấp một lượng nhỏ dữ liệu chất lượng cao và nhu cầu về sức mạnh tính toán là tương đối nhỏ.

**Giai đoạn thứ ba và thứ tư là giai đoạn mô hình hóa phần thưởng và học tập củng cố, nghĩa là học tập phản hồi củng cố con người RLHF. ** Qua hai giai đoạn này, đầu ra của mô hình sẽ tốt hơn nhiều so với mô hình tinh chỉnh có giám sát và mô hình cơ bản, nhưng entropy của mô hình cơ bản sẽ bị hy sinh.

Từ góc nhìn của ngành thị trường sơ cấp để thấy các cơ hội AI

Nhìn vào các cơ hội đầu tư AI một cách có hệ thống từ góc độ đầu tư thị trường sơ cấp, có thể chia thành lớp cơ bản, lớp triển khai và lớp ứng dụng, cộng đồng mô hình AI chạy qua ba lớp này.

**Lớp cơ bản có thể được chia thành lớp cơ sở hạ tầng, lớp dữ liệu và lớp thuật toán. **

Tầng dưới cùng của tầng cơ sở hạ tầng là năng lực tính toán, đồng thời cũng là nơi đang phải đối mặt với nút thắt cổ chai trực tiếp nhất, hiện cả GPU Nvidia và AMD đều bị cấm vận tại Trung Quốc. Huawei Kunpeng, công ty dẫn đầu về sức mạnh tính toán trong nước, cũng đang đối mặt với vấn đề hết băng.Trong tương lai, Trung Quốc có thể phải đối mặt với áp lực ngày càng tăng về sức mạnh tính toán cao cấp. Đồng thời, vẫn còn vấn đề sử dụng GPU, ngay cả đối với OpenAI, một số lượng lớn các kỹ sư Nvidia thường trú tại chỗ để điều chỉnh thủ công, nhưng mức sử dụng GPU của nó chỉ là 50% -60%. Phía trên sức mạnh tính toán là lớp phần mềm cơ bản xung quanh mô hình lớn, chẳng hạn như lưu trữ dữ liệu gốc AI, truyền dữ liệu, bảo mật dữ liệu và các công cụ khác cũng như nền tảng phát triển và bảo trì xung quanh dữ liệu, bao gồm cơ sở dữ liệu vectơ, LLMOps, MLOps, v.v.

Có thể có nhiều cơ hội hơn trong lớp dữ liệu, bởi vì mô hình cơ bản có thể được phát triển bởi các công ty hàng đầu trong tương lai và sẽ có một số lượng lớn các mô hình cơ bản nguồn mở, vì vậy không cần phải chi nhiều tiền để phát triển mô hình cơ bản của riêng bạn. Chúng ta nên tập trung vào việc tích lũy dữ liệu của chính các ngành và doanh nghiệp theo chiều dọc và cách hình thành các ứng dụng quy mô lớn mà khách hàng sẵn sàng trả tiền. Hiện tại, điểm khó khăn nhất của các mô hình lớn là làm thế nào để có được bộ dữ liệu chất lượng cao và bộ dữ liệu ngành dọc, mọi người đều đã thấy tiềm năng của mô hình lớn trong các lĩnh vực công nghiệp, khoa học, y học, luật, tài chính và giáo dục. Các cơ hội trong tương lai có thể nằm ở cách lấy dữ liệu chất lượng cao một cách hiệu quả, cách xử lý dữ liệu đa phương thức, cách xác định, cách tận dụng dữ liệu, cách xác nhận quyền, cách giao dịch, cách bảo vệ an ninh, v.v.

Cốt lõi của lớp thuật toán nằm trong khung học sâu và mô hình cơ bản

Khung học sâu có thể được mô tả là hệ điều hành của AI. Nó điều phối việc triển khai tài nguyên máy tính ở cấp dưới, đảm nhận khả năng xây dựng của các mô hình thuật toán AI ở cấp trên và cung cấp một số lượng lớn thư viện toán tử, thư viện mô hình và tài liệu hướng dẫn. Nó cũng là một hệ sinh thái về bản chất và hạ thấp ngưỡng phát triển. Hiện tại, các framework deep learning chủ đạo trên thế giới chủ yếu là TensorFlow của Google và Pytorch của Meta, ở Trung Quốc chủ yếu có Baidu Fei Paddle, Huawei Shengsi và Oneflow, trước đây đã được Light Years Beyond mua lại.

Bản thân mô hình cơ bản cũng có sự đa dạng, ví dụ về đường dẫn kỹ thuật thì có CNN, RNN, GAN, Transformer, v.v. Mô hình Transformer có thể được chia thành mô hình mã hóa tự động, mô hình tự hồi quy, mô hình bộ mã hóa-giải mã, v.v. Hướng đi này có nhiều khả năng khai sinh ra những công ty có giá trị thị trường hàng trăm tỷ, thậm chí hàng nghìn tỷ đồng, nhưng cũng là chiến trường chính với sự cạnh tranh khốc liệt nhất.

Trong kỷ nguyên của cuộc chiến 100 mô hình, đánh giá mô hình đã trở thành một công cụ cốt lõi để đo lường khả năng của các mô hình khác nhau. Hiện tại, các công cụ đánh giá khác nhau cho các mô hình nhỏ truyền thống (GLUE, SuperGLUE, v.v.), các mô hình ngôn ngữ lớn (HELM, BIG-Bench, v.v.) và các mô hình ngôn ngữ lớn của Trung Quốc (SuperCLUE, C-, v.v.) đã xuất hiện trên thị trường. Giống như SuperCLUE và C-, một số lượng lớn các câu hỏi đặc sắc Trung Quốc (Tư tưởng Mao Trạch Đông, các nguyên tắc cơ bản của chủ nghĩa xạ thủ, v.v.) và đặc điểm Trung Quốc (thành ngữ, thơ, cổ điển Trung Quốc, v.v.) và các khía cạnh khác đã được thêm vào bộ đánh giá của họ. Đánh giá từ kết quả đánh giá, ngoại trừ GPT-4, GPT-3.5 và Claude, các sản phẩm mô hình quy mô lớn trong nước tốt hơn các mô hình nước ngoài khác về hiệu suất đánh giá tổng thể, vì vậy nhu cầu đào tạo các mô hình quy mô lớn của Trung Quốc là rất cao.

Lớp ứng dụng có thể được chia thành các mô hình lớn nói chung và các mô hình lớn ngành dọc.Chúng tôi chủ yếu tập trung vào thế hệ công cụ năng suất hỗ trợ AI mới trong lĩnh vực mô hình lớn nói chung và cơ hội ứng dụng của các mô hình lớn trong các lĩnh vực ngành dọc khác nhau.

to C—Công cụ năng suất được hỗ trợ bởi AI

Trong thời đại dịch bệnh, các công cụ năng suất theo chủ đề cộng tác như Notion, Figma và Canva đã trải qua những thay đổi. Tương tự, dưới làn sóng AI này, các công cụ năng suất cũng sẽ mở ra một cuộc cách mạng mới.

Giờ đây, chúng ta thấy rằng các mô hình lớn đã thâm nhập ở các mức độ khác nhau vào văn bản, mã, hình ảnh, âm nhạc, video, 3D, v.v. Nhiều sản phẩm mới và ứng dụng mới lần lượt xuất hiện, chẳng hạn như chatbot trong lĩnh vực văn bản và sản phẩm văn phòng đồng hành, GitHub đồng hành trong lĩnh vực mã, Midjourney và Stable Diffusion trong lĩnh vực hình ảnh, AI Stefanie Sun, vốn đã phổ biến trong lĩnh vực âm nhạc trước đây và đường băng trong lĩnh vực video, v.v. Các công ty trong nước như Baidu, Kingsoft Office, Evernote, Zhipu Huazhang, v.v. cũng đã tung ra các sản phẩm AI tương tự, đang thay đổi hình thức của các công cụ năng suất truyền thống ở các mức độ khác nhau, nhưng hiện tại chúng chỉ giới hạn ở các công cụ hiệu quả trong quy trình sản xuất công nghiệp ở nhiều lĩnh vực và chưa thể hiện thực hóa AGI theo đúng nghĩa.

Đồng thời, có thể thấy rằng các nhà sản xuất như Microsoft Office, Adobe Photoshop, Unity và Notion cũng đang tích cực đón nhận làn sóng AI này, đưa các khả năng của AGI vào các sản phẩm và chuỗi công cụ của riêng họ. Ban đầu người ta cho rằng sự xuất hiện của Midjourney và Stable Diffusion sẽ thay thế hoàn toàn Photoshop, nhưng sau đó người ta phát hiện ra rằng AGI, do các vấn đề về khả năng kiểm soát và các khía cạnh khác, đã khiến Photoshop kết hợp với khả năng tạo AI trở nên mạnh mẽ và dễ sử dụng hơn.

Lĩnh vực 3D hiện là một trong những lĩnh vực khó triển khai AI nhất, yếu tố cốt lõi là có quá ít dữ liệu 3D chất lượng cao. Hiện tại, AGI của nội dung 3D chủ yếu được khám phá và dẫn dắt bởi NVIDIA, Unity, Stability.ai và các viện nghiên cứu khoa học, nhưng ở giai đoạn này, nó vẫn chủ yếu là các công cụ demo và hình phân tán, và vẫn còn một chặng đường dài trước khi nó có thể được áp dụng cho các lĩnh vực công nghiệp như hiệu ứng đặc biệt trên phim và truyền hình, trò chơi và metaverse.

đến B—mô hình ngành dọc

Hiện tại, hầu hết các sản phẩm mô hình quy mô lớn do các nhà sản xuất lớn tung ra đều là mô hình quy mô lớn có mục đích chung.Tuy nhiên, khi đối mặt với các ngành dọc, khách hàng cấp B cần các mô hình lớn có độ chính xác cao, tính nhất quán cao và dễ triển khai, có thể giải quyết hiệu quả các vấn đề kịch bản cụ thể với ít dữ liệu hơn và sức mạnh tính toán thấp hơn. Mô hình lớn Pangu 3.0 mới nhất do Huawei phát hành dựa trên mô hình lớn cơ bản, bổ sung thêm các mô hình lớn N L1 trong ngành và khả năng của mô hình cảnh X L2.

Các điểm chính cốt lõi của các mô hình lớn theo ngành dọc là các bộ dữ liệu ngành chất lượng cao và khả năng kỹ thuật để điều chỉnh, nén và triển khai mô hình. Đây cũng là một điểm cơ hội đầu tư, giống như cơ hội container trong kỷ nguyên dựa trên đám mây, một số lượng lớn doanh nghiệp B vừa và nhỏ trong các ngành công nghiệp truyền thống cần dựa vào các nhà sản xuất container chuyên dụng để giúp họ dấn thân vào con đường dựa trên đám mây.

Hiện tại, đã có rất nhiều thăm dò và thực hành ở nước ngoài trong lĩnh vực mô hình lớn theo ngành dọc, chẳng hạn như BloombergGPT trong lĩnh vực FinGPT, Bloomberg đã chuyển đổi dữ liệu tài chính được tích lũy trong 40 năm qua thành bộ dữ liệu tài chính gồm 365 tỷ mã thông báo và kết hợp với bộ dữ liệu chung để đào tạo 50 tỷ tham số của riêng mình.

Cuối cùng, hãy nói về trọng tâm vốn của đường đua AGI ở nước ngoài: **Từ góc độ số tiền đầu tư, năm hạng mục hàng đầu là các ứng dụng văn bản tiếp thị, âm thanh, hỗ trợ khách hàng/rô-bốt dịch vụ khách hàng, hình ảnh và nền tảng MLOps; từ góc độ số tiền tài trợ, nhiều tiền hơn đổ vào các nền tảng MLOps, với giá trị cốt lõi nằm ở việc hạ thấp ngưỡng phát triển các mô hình lớn, tiếp theo là rô-bốt dịch vụ khách hàng, âm thanh, con người kỹ thuật số, lồng tiếng và hình ảnh. **

hỏi đáp

**Q1: Các công ty dịch vụ thuê ngoài thực hiện chú thích dữ liệu và hỗ trợ phát triển AI dường như đang hoạt động rất tốt gần đây. Xu hướng đầu tư của bạn là gì? **

A: Chúng tôi hiện đang chú ý đến hai hướng này. Lĩnh vực ghi nhãn dữ liệu chủ yếu tập trung vào cách các công ty này sử dụng khả năng của các mô hình lớn để cải thiện hiệu quả ghi nhãn, chẳng hạn như sử dụng GPT-4 để gắn nhãn văn bản và SAM để gắn nhãn hình ảnh. Bởi vì cạnh tranh cốt lõi hiện tại trong lĩnh vực ghi nhãn dữ liệu là tính hiệu quả và lợi nhuận gộp, ai có thể đạt được khả năng ghi nhãn hiệu quả hơn với sự trợ giúp của các khả năng của mô hình lớn. Về các dịch vụ mô hình quy mô lớn, nó sẽ tương tự như các cơ hội vùng chứa trong kỷ nguyên dựa trên đám mây. Cần có các nhà cung cấp chuyên nghiệp để hạ thấp ngưỡng cho việc đào tạo, phát triển và triển khai mô hình quy mô lớn, đồng thời giúp mỗi doanh nghiệp nhận ra sự tự do của mô hình quy mô lớn.

**Q2: AI hiện có hai hạng mục: TO C và TO B. Bạn nghĩ TO C hay TO B có nhiều cơ hội hơn? **

A: Chúng tôi chú ý nhiều hơn đến TO B. Do có quá nhiều gã khổng lồ Internet trong lĩnh vực TOC, đặc biệt là ở những nơi có hệ sinh thái ứng dụng APP trong nước mạnh mẽ như vậy, các nhà sản xuất lớn sẽ dễ dàng nhúng các khả năng AI vào APP của riêng họ hơn. Do đó, chúng tôi chú ý nhiều hơn đến khả năng tích hợp dữ liệu, hiểu biết thương mại và khả năng kỹ thuật của họ.

**Q3: Ngay cả đối với các mẫu lớn có hơn một tỷ thông số, hơn 80 mẫu đã được báo cáo ở Trung Quốc. Còn xu hướng đầu tư theo mô hình lớn thì sao? Làm cách nào để chọn giữa mã nguồn mở và mã nguồn đóng? **

A: Về mã nguồn mở và mã nguồn đóng, cần suy nghĩ về cách tận dụng tốt nguồn mở và cách sử dụng mô hình mã nguồn mở để thương mại hóa, ví dụ như LLaMA có các hạn chế thương mại trong thỏa thuận mã nguồn mở. Mã nguồn đóng đòi hỏi hệ sinh thái và hỗ trợ riêng, điều này có lẽ chỉ được duy trì bởi các nhà sản xuất lớn có khả năng và tiềm lực tài chính.

**Q4: Từ quan điểm của các doanh nhân AI, họ có thể được chia thành ba loại. Một loại đến từ các nhà máy lớn và những người sáng lập đã nổi tiếng. Loại còn lại là các học giả, viện sĩ và chuyên gia từ Đại học Thanh Hoa hoặc các lĩnh vực khác. Ngoài ra còn có một loại doanh nhân có xu hướng cơ sở. Bạn thích loại nào trong ba loại này? **

A: Nhiều làn sóng mô hình lớn ở Trung Quốc đã xuất hiện sau khi Open AI phát hành các mô hình lớn như ChatGPT, LLaMA và Bloom dưới dạng mã nguồn mở. Chúng tôi hiện đang giữ thái độ chờ xem. Tất nhiên, cũng có nhiều nhà sản xuất lớn hướng tới tương lai và các công ty khởi nghiệp học thuật ở Trung Quốc đã khám phá trước làn sóng bùng nổ mô hình quy mô lớn này.

Đối với các nhóm học thuật, làm thế nào để đạt được thương mại hóa là thách thức lớn nhất. Vì vậy, tôi không nghĩ rằng cần phải tự mình làm điều đó trong tương lai.Ví dụ, sự hợp tác giữa OpenAI và Microsoft có thể cung cấp khả năng mô hình quy mô lớn cho các nhà sản xuất lớn. Chúng tôi hiện đang tìm kiếm các mục tiêu xung quanh Nguồn mở Trung Quốc, bởi vì nó có dòng sản phẩm IDE và cần người đồng hành viết mã, vì vậy chúng tôi đang tìm kiếm khả năng hợp tác với các nhóm học thuật. Tôi nghĩ cách tiếp cận này khả thi hơn.

**Q5: Những ngành dọc nào ở phía B có nhiều khả năng đạt được đột phá thương mại nhất? **

Trả lời: Do khả năng của mô hình lớn có tính khái quát và đa phương thức, lĩnh vực pháp lý là một kịch bản rất phổ biến và nhu cầu về nội dung văn bản là rất lớn. Các mô hình lớn hơn có chính xác khả năng này, mặc dù vẫn còn một số vấn đề cần giải quyết về độ chính xác. Ngoài ra, các sản phẩm trợ lý cá nhân cũng là một viễn cảnh có thể tưởng tượng được, mặc dù chu kỳ phát triển có thể dài hơn.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)