Nhân tài cho các mô hình quy mô lớn rất khan hiếm và “tuyển chọn” quan trọng hơn “tu luyện”｜Trò chuyện với Kunlun Wanwei

2023-10-02 06:23:56

Nguồn: Qubit

Gần đây, "Trận chiến trăm mẫu" ngày càng gay gắt. Trong sự bùng nổ của các mô hình lớn, “nhân tài” đã trở thành tâm điểm cạnh tranh khốc liệt giữa các công ty công nghệ lớn, đội ngũ doanh nhân và tổ chức nghiên cứu. Tuy nhiên, vẫn còn một khoảng cách lớn về những tài năng tiên tiến trong lĩnh vực AIGC.

Những loại tài năng nào nên được tuyển dụng để tạo điều kiện phát triển mô hình?

Tuyển người mẫu tài năng ở đâu?

Làm thế nào để trau dồi tài năng R&D mô hình lớn?

Để trả lời những câu hỏi trên, Qubit Think Tank đặc biệt mời các học viên, chuyên gia và học giả trong lĩnh vực mô hình lớn AI chia sẻ cơ hội và thách thức và triển vọng phát triển trong tương lai của các tài năng mô hình lớn với các nhóm công ty và người tìm việc.

Bài viết này là chuyên mục phỏng vấn sâu trong chuỗi bài “Tài năng mô hình lớn” của Qubit Think Tank. Để biết thêm thông tin, vui lòng chú ý đến “Báo cáo toàn cảnh về phát triển tài năng mô hình lớn AIGC 2023” sắp tới

Giới thiệu nhân vật phỏng vấn

Fang Han, Chủ tịch kiêm Giám đốc điều hành của Kunlun Wanwei, một trong những người sáng lập Linux Trung Quốc, đã lãnh đạo việc phát triển phần mềm tăng tốc DUDU tải xuống P2P nội địa đầu tiên.

** **###### △Fang Han, Chủ tịch kiêm Giám đốc điều hành của Kunlun Wanwei

Anh gia nhập Kunlun Wanwei vào năm 2008 và lãnh đạo sự phát triển của "Tam Quốc" và trò chơi web RPG "Võ Thuật", đồng thời giành được nhiều giải thưởng.

Phong cảnh tuyệt vời

Trong vòng 1-2 năm, tình trạng thiếu nhân tài thuật toán sẽ giảm bớt đáng kể.
Ý thức đổi mới tài năng mà tôi hiểu đề cập đến cách giải quyết vấn đề một cách sáng tạo và cải thiện các chỉ số từ góc độ kỹ thuật và kỹ thuật.
“Tuyển chọn” quan trọng hơn “tu luyện”, và việc học tập độc lập quan trọng hơn việc thầy dẫn dắt người học việc.
Ở lĩnh vực mới như mô hình lớn, nghiên cứu sinh mới tốt nghiệp có thể trở thành chuyên gia lĩnh vực sau nửa năm đào tạo.
Từ góc độ nguồn cung, tài năng người mẫu lớn hiện đang trong giai đoạn thiếu hụt và tình hình sẽ giảm bớt đáng kể sau 3-5 năm nữa.
Ở góc độ vĩ mô, so với các ngành truyền thống, khó khăn trong việc bồi dưỡng nhân tài mô hình quy mô lớn nằm ở chỗ năng lực tính toán của các trường đại học hiện nay còn chưa đủ.
Các công ty tạo ra mô hình kinh doanh mới ở cấp độ ứng dụng dựa trên AI và các mô hình lớn sẽ thu được cổ tức lớn nhất.

Bản ghi phỏng vấn

Làm thế nào để xác định tài năng người mẫu lớn?

**Qubit Think Tank: Kunlun Wanwei phân chia tài năng người mẫu lớn như thế nào? **

Fang Han: Tôi nghĩ việc đào tạo mô hình nên được chia thành hai phần chính, đào tạo suy luận và phát triển ứng dụng. Theo quy trình đào tạo mô hình, chúng tôi chia nhân tài thành nhân tài bên thuật toán, nhân tài bên kiến trúc và nhân tài bên phát triển ứng dụng. Các tài năng thuật toán cốt lõi được chia nhỏ hơn thành đào tạo trước, xử lý dữ liệu, tối ưu hóa suy luận tinh chỉnh, v.v.

**Qubit Think Tank: Bạn nghĩ loại tài năng nào khan hiếm nhất trong số các tài năng thuật toán, tài năng kiến trúc và tài năng phát triển ứng dụng? Và nó có thể sẽ khan hiếm trong một thời gian dài sắp tới. **

Fang Han: Hiện tại, nhân tài khan hiếm nhất chắc chắn là tài năng thuật toán cốt lõi, nhưng tình hình cung cầu sẽ nhanh chóng được giảm bớt. Bởi vì ở đây có một hiện tượng rất thú vị, hiện nay, năng lực tính toán của các trường đại học khác nhau còn thiếu trầm trọng, hướng liên quan đến các mô hình lớn hiện đang là chủ đề nóng, có rất nhiều nhân tài có thể chuyển hướng sang lĩnh vực nghiên cứu này, chẳng hạn như NLP .. Tất cả các tài năng NLP đều đang hướng tới những mô hình lớn.

Vì vậy, quan điểm cá nhân của tôi là trong vòng 1-2 năm tới tình trạng thiếu nhân tài thuật toán sẽ giảm bớt rất nhiều, vì có rất nhiều nhân tài thuật toán với mức lương cao nên tôi cho rằng Trung Quốc vẫn rất định hướng thị trường trong việc phân bổ nhân tài.

Những yếu tố năng lực mà những tài năng người mẫu lớn nên sở hữu

**Qubit Think Tank: Khi tuyển dụng nhân tài, phẩm chất nào của nhân tài quan trọng hơn? **

Fang Han: Xét về thành tích học tập, kinh nghiệm thực tế, nền tảng học vấn và nhận thức đổi mới mà bạn đã đề cập, ưu tiên của chúng tôi là kinh nghiệm thực tế và nhận thức đổi mới : Trước hết, Đào tạo mô hình lớn thực chất là một vấn đề kỹ thuật nên kinh nghiệm thực tế chắc chắn là rất quan trọng. Thứ hai, mô hình lớn là dự án sáng tạo, bởi vì tất cả các công ty mô hình lớn đều đang cạnh tranh nhau, nếu không có ý thức đổi mới thì sẽ khó đi trước người khác, vì đây là một hướng kỹ thuật hoàn toàn mới.

**Qubit Think Tank: Bạn nghĩ gì về ý nghĩa đổi mới này? **

Fang Han: Sự đổi mới mà tôi hiểu khác với sự đổi mới do công chúng định nghĩa, trước đây nó thiên về đổi mới về mặt thuật toán hơn. Ý tôi khi nói đổi mới, trước hết là theo kịp sự tiến bộ vượt bậc của các mô hình lớn, trên thế giới có rất nhiều người đang theo học đào tạo mô hình lớn, hướng này đang tiến triển rất nhanh, hàng trăm bài báo mới được xuất bản mỗi ngày , thực hiện cải tiến theo nhiều hướng và lĩnh vực khác nhau. . Thứ hai là có thể sử dụng các phương pháp mới để giải quyết các vấn đề gặp phải trong kỹ thuật dựa trên nhu cầu thực tế Sự đổi mới ở đây tập trung hơn vào cách giải quyết vấn đề một cách sáng tạo và cải thiện các chỉ số từ góc độ kỹ thuật và kỹ thuật.

**Qubit Think Tank: Bạn có nghĩ rằng ý thức đổi mới của những tài năng quy mô lớn có thể được đánh giá thông qua thành tích học tập, thành tích bằng sáng chế, v.v. không? **

Fang Han: Tôi nghĩ thật vô lý khi đánh giá ý thức đổi mới của những nhân tài dựa trên kết quả bằng sáng chế. **OpenAI không chú ý nhiều đến thành tích của các tài năng trong việc xin cấp bằng sáng chế. Sự đổi mới tốt nhất thực sự dựa vào sự tích lũy kinh nghiệm nội bộ. Việc chỉ đánh giá từ góc độ bằng sáng chế là không hợp lý.

Tuy nhiên, ** kết quả học tập có thể được sử dụng làm cơ sở quan trọng hơn để đánh giá. **Ví dụ: những người đầu tiên tạo ra mô hình Vicuna và những người đầu tiên tạo ra ControlNet đều là nghiên cứu sinh tiến sĩ. Từ góc độ này, kết quả học tập có thể được sử dụng làm tài liệu tham khảo nhất định.

Tuy nhiên, trong quá trình vận hành thực tế, bên cạnh những đổi mới lớn về xuất bản giấy tờ, còn có vô số những đổi mới nhỏ về kỹ thuật cần đạt được. **Vì vậy, nhận thức về đổi mới vẫn phải được đánh giá dựa trên tốc độ và khả năng thực hiện của các nhân tài trong việc giải quyết vấn đề trong thực tế.

#### Cách nuôi dưỡng tài năng người mẫu lớn

**Qubit Think Tank: Khi Mô hình Tiangong được nâng cấp từ 1.0 lên 3.5, những lĩnh vực tài năng nào sẽ được tập trung vào ở các giai đoạn khác nhau? **

Fang Han: Trong giai đoạn đầu, chúng tôi thực sự cần những tài năng thuật toán quen thuộc hơn với kiến trúc cơ bản của các mô hình lớn, CNN và Transformer. Tất nhiên, điều này cũng bao gồm các tài năng làm sạch dữ liệu và xử lý dữ liệu. Khi các mô hình lớn dần trưởng thành và cần chuyển sang đa phương thức, sẽ cần một nhóm nhân tài làm thị giác máy tính; nếu các mô hình lớn muốn được tung ra thế giới bên ngoài, sẽ cần có các nhân tài kiểm toán bảo mật cần thiết.

**Qubit Think Tank: Kunlun Wanwei trau dồi tài năng người mẫu lớn của riêng mình như thế nào? **

Fang Han: Kunlun Wanwei bắt đầu đào tạo mô hình lớn vào năm 2020. Vào thời điểm đó, trên thị trường có rất ít nhân tài đào tạo mô hình lớn, có nhiều người đi theo con đường BERT hơn và ít người đi theo con đường GPT hơn , vì vậy chúng tôi ** Vào thời điểm đó, chúng tôi chọn cách tự mình trau dồi những tài năng người mẫu lớn. **

Phương pháp đào tạo là cho phép những nhân tài có nền tảng thuật toán học theo hướng đào tạo mô hình, sau đó khi tuyển dụng phải cân nhắc lựa chọn những nhân tài quen thuộc với machine learning và deep learning, có động lực tự chủ mạnh mẽ và tốc độ học tập nhanh. Nhân tài, nhân tài có nền tảng thuật toán, ban đầu chúng tôi có một số nhân tài đang theo học các hướng kỹ thuật như CNN, nhưng bây giờ họ sẽ chuyển sang đào tạo GPT nhiều hơn.

**Qubit Think Tank: Bạn nghĩ sao về mô hình huấn luyện “bò lớn dắt bê” này? **

Fang Han: Thực tế, mọi công ty định hướng công nghệ sẽ chọn phương pháp đào tạo "bò lớn dắt bò non", nhưng **chọn nhân tài quan trọng hơn trau dồi nhân tài, và việc học độc lập quan trọng hơn các bậc thầy dẫn dắt người học việc, ** vì vậy khi tuyển dụng chúng tôi cũng rất coi trọng khả năng học hỏi độc lập của nhân tài.

Đối với các hướng kỹ thuật truyền thống, chẳng hạn như Java, bạn cần dựa vào kinh nghiệm phong phú, còn sinh viên mới ra trường cần thời gian đào tạo lâu hơn để phát triển thành chuyên gia lĩnh vực. Tuy nhiên, đào tạo theo mô hình lớn là một lĩnh vực mới nổi và sự tích lũy trong công nghiệp không sâu hơn nhiều so với trong học viện **Cái chúng ta có hơn học thuật là sức mạnh tính toán **Thực tế, ở cấp độ thuật toán, chúng ta không có nhiều trước các trường đại học.

**Qubit Think Tank: Sẽ mất bao lâu để sinh viên mới tốt nghiệp có thể phát triển thành chuyên gia mô hình lớn? **

Fang Han: Có một số lượng lớn nghiên cứu sinh tiến sĩ có thể xuất bản các bài báo mô hình lớn rất tiên tiến, cũng có thể thấy rằng nhiều bài báo đổi mới quy mô lớn được xuất bản bởi Tiến sĩ năm thứ hai và thứ ba. D. sinh viên. Chúng tôi tìm thấy những tài năng ở trường có thể bắt đầu ngay khi họ đến và họ có thể phát triển thành chuyên gia tên miền sau vài tháng.

Ý tưởng của chúng tôi là tuyển chọn những tài năng tốt nhất từ những nghiên cứu sinh tiến sĩ mới tốt nghiệp, những người đã thể hiện khả năng đổi mới và **tầm nhìn kỹ thuật khi còn đi học. Chúng tôi có thể trau dồi "bắp chân" trong một khoảng thời gian ngắn hơn. Có thể trở thành thứ mà bạn gọi là một “con bò lớn”.

**Qubit Think Tank: Trong vài tháng đến một năm, những nghiên cứu sinh tiến sĩ mới ra trường như vậy có thể trở thành những "con bò lớn" trong lĩnh vực này. Tôi hiểu rằng những "con bò lớn" mà bạn đang nói đến là những người có năng lực nghiên cứu và phát triển cốt lõi. **

Phương Hàn: Đúng vậy, chúng tôi mang đến cho người trẻ rất nhiều cơ hội. Trên thực tế, có lẽ chỉ có vài chục người đang đào tạo GPT tại OpenAI và một lượng lớn trong số họ là những nhân tài mới ra trường cách đây vài năm. Tôi nghĩ về cơ bản đây là trường hợp của các đội người mẫu lớn ở Trung Quốc, đây là một lĩnh vực hoàn toàn mới và cơ hội dành cho những người mới đến là đặc biệt lớn. **Một nghiên cứu sinh mới tốt nghiệp có thể trở thành chuyên gia kỹ thuật trong lĩnh vực này sau nửa năm làm việc không có vấn đề gì, nhưng khả năng quản lý của anh ta chắc chắn còn thiếu. **Lĩnh vực kỹ thuật này còn rất mới, mọi người đều chạy về phía trước trên cùng một vạch xuất phát, mới ra trường không nhất thiết phải gặp khó khăn.

**Qubit Think Tank: Có phải hầu hết sinh viên mới tốt nghiệp mà bạn đề cập đều theo chuyên ngành xử lý ngôn ngữ tự nhiên không? Nó sẽ được chia thành những lĩnh vực cụ thể nào? **

Fang Han: Đó không hẳn là xử lý ngôn ngữ tự nhiên. Tôi nghĩ rằng trong toàn bộ vòng đời của một mô hình lớn, ngoài việc xử lý dữ liệu, nó cần phải dựa vào sự tích lũy kỹ thuật, trong *pre- đào tạo, RLHF, SFT, tối ưu hóa người vận hành * và các khía cạnh khác, họ có hướng nghiên cứu học thuật tương ứng nên tôi nghĩ họ có khả năng phát triển và đào tạo 70-80% mô hình lớn.

Rất dễ dàng cho những người tài năng nghiên cứu về machine learning, recurance learning và deep learning chuyển sang các mô hình lớn. Và bởi vì hiện nay có nhiều mô hình nguồn mở và có nhiều người trong giới học thuật thực hiện các tài liệu nghiên cứu dựa trên mô hình nguồn mở nên tôi không nghĩ có một khoảng cách tuyệt đối trong sự phân công lao động giữa các nhân tài trong trường đại học.

#### Phát triển thị trường nhân tài người mẫu lớn trong nước

**Qubit Think Tank: Bạn nghĩ gì về sự phát triển chung hiện nay của thị trường nhân tài kiểu mẫu lớn? **

Fang Han: Tôi nghĩ **những tài năng người mẫu lớn nói chung đang ở tình trạng khan hiếm cao và **sẽ có nhiều người làm công việc chứng khoán hơn. Tuy nhiên, khi ngày càng có nhiều người thực hành các mô hình lớn thì sự phân công lao động sẽ ngày càng chi tiết hơn, đây là quá trình phân hóa tự nhiên. Quá trình phát triển của bất kỳ công nghệ mới nào cũng như vậy, từ những kỹ sư full-stack đời đầu đến trưởng nhóm và lãnh đạo cấp giám đốc, sự phân biệt định hướng kỹ thuật của các thành viên trong nhóm sẽ trở nên rõ ràng hơn.

**Qubit Think Tank: Hầu hết các nhân tài được Kunlun Wanwei tuyển dụng đều đến từ các trường đại học, hay họ đến từ ngành này nhiều hơn? **

Fang Han: Chúng tôi hiện đang cần những nhân tài có tích lũy thực tế, vì vậy chúng tôi sẽ chọn thêm những nhân tài từ ngành, những người có kinh nghiệm kỹ thuật phong phú. Tuy nhiên, sinh viên mới ra trường cũng sẽ được tuyển dự bị nên trường tuyển nhiều hơn, tỷ lệ tuyển trường so với tuyển xã hội gần như là 1:5.

**Qubit Think Tank: Bạn nghĩ quá trình phát triển nhân tài hiện tại của mô hình lớn này đang ở giai đoạn nào? **

Phương Hàn: Xét tổng thể thành tích học tập của các nhân tài, Trung Quốc đứng đầu về số lượng bài báo về AI được xuất bản trên thế giới, còn Hoa Kỳ đứng thứ hai. Số lượng bài báo ở Hoa Kỳ nhiều hơn ở Trung Quốc.

Tôi cho rằng xét về yếu tố năng lực của nhân tài, những người mẫu lớn cần có những tài năng có kinh nghiệm khác nhau, cần có cả 3 yếu tố này bao gồm sinh viên mới ra trường, chuyên gia lĩnh vực và lãnh đạo. **Nhưng nhìn từ góc độ cung thì hiện tại đang ở giai đoạn chưa đủ, tình hình cung sẽ giảm bớt rất nhiều trong khoảng 3-5 năm nữa, **vì từ khi bắt đầu môn học đến khi sinh viên tốt nghiệp phải mất 5 năm.

Khó khăn trong việc nuôi dưỡng tài năng người mẫu lớn

**Qubit Think Tank: Bạn nghĩ việc đào tạo nhân tài có thể được cải thiện ở những khía cạnh nào? **

Fang Han: Tôi sẽ chia sẻ chủ yếu từ hai góc độ, góc độ doanh nghiệp và góc độ vĩ mô.

Ở góc độ doanh nghiệp, nhân tài sẽ phát triển nhanh hơn nếu họ tham gia vào các dự án kỹ thuật, đây là một cách làm rất rõ ràng và thiết thực. Đối với những công ty lớn kiên nhẫn hơn với nhân tài thì nhân tài sẽ chuyên nghiệp hơn trong công việc mình làm, nhưng ở công ty nhỏ, nhân tài của những nhóm kiểu mẫu lớn sẽ phát triển toàn diện hơn và họ phải có đầy đủ năng lực của cả tập thể lớn. các mô hình.

Từ góc nhìn vĩ mô, **so với các ngành truyền thống khác, khó khăn trong việc bồi dưỡng nhân tài mô hình quy mô lớn nằm ở năng lực tính toán chưa đủ của các trường đại học hiện nay, khiến các trường khó đào tạo nhân tài kiến trúc và những tài năng này chỉ có thể đến doanh nghiệp để đào tạo. Đây là một vấn đề nan giải mà tất cả các trường đại học trên thế giới phải đối mặt. Sau khi sức mạnh tính toán cấp quốc gia được chia sẻ với các trường đại học, chúng tôi tin rằng tình trạng này sẽ được giảm bớt.

**Qubit Think Tank: Nghĩa là, nó dựa nhiều hơn vào mối liên kết giữa ngành, học viện, nghiên cứu và chính sách để nuôi dưỡng những tài năng quy mô lớn. **

Fang Han: Tôi nghĩ chúng ta nên cố gắng hết sức để cung cấp điều kiện phần cứng ở trường học giống như ở doanh nghiệp, nếu không những gì chúng ta học ở trường chắc chắn sẽ tương đối hạn chế.

#### Xu hướng phát triển trong tương lai của các tài năng người mẫu lớn và các công ty AI

**Qubit Think Tank: Theo quan điểm của bạn, xu hướng phát triển trong tương lai của toàn bộ ngành công nghiệp mô hình lớn là gì? **

Fang Han: Tôi nghĩ không nên gọi nó là ngành công nghiệp mô hình lớn mà là toàn bộ ngành công nghiệp AI. Cơ hội mà ngành AI gặp phải không kém gì Internet và Internet di động. Tôi rất lạc quan về xu hướng phát triển của ngành AI. Tôi cho rằng AI sẽ thay đổi sâu sắc toàn bộ Internet, toàn bộ cuộc sống con người sẽ bị ảnh hưởng và thay đổi rất nhiều. Tôi cho rằng toàn bộ ngành sẽ trải qua một sự thay đổi có định hướng.

**Qubit Think Tank: Dựa trên xu hướng này, bạn nghĩ loại tài năng người mẫu lớn nào sẽ được doanh nghiệp ưa chuộng hơn? **

Fang Han: Trước hết, tình hình "Trăm Mô Hình Chiến Tranh" đã được hình thành. Mọi người đều đang làm những căn cứ mô hình lớn. Trong tương lai, những căn cứ mô hình lớn chắc chắn sẽ giảm xuống còn một vài căn cứ lớn các nhà sản xuất và hơn thế nữa Nhiều công ty lẽ ra phải ở trong tình thế sử dụng các mô hình lớn cho các ứng dụng, vì vậy tôi nghĩ sẽ ngày càng có nhiều tài năng phát triển các ứng dụng dựa trên các mô hình lớn. **

Những nhân tài chịu trách nhiệm đào tạo cơ bản, thuật toán tối ưu hóa và kiến trúc của các mô hình lớn sẽ đến với các nhà sản xuất lớn hoặc nhóm mô hình lớn. Tuy nhiên, chúng tôi tin rằng những gã khổng lồ lớn nhất không nhất thiết phải là chính các công ty mô hình lớn mà là những người tạo ra các ứng dụng mạnh mẽ dựa trên trên các mô hình lớn của các doanh nghiệp này. Khi các doanh nghiệp này lớn lên, họ cũng sẽ tự xây dựng những mô hình lớn cho riêng mình.

Chúng tôi tin rằng "ứng dụng là vua" có nghĩa là các công ty phát triển mô hình kinh doanh mới dựa trên AI và các mô hình lớn trong ứng dụng sẽ thu được cổ tức lớn nhất. **Vậy thì chúng tôi tin rằng trong mười năm tới, những công ty khổng lồ mới như Byte, Meituan, Didi chắc chắn sẽ xuất hiện và họ phải tăng trưởng từ 0 lên 100. Các công ty thành lập trong năm nay hoặc năm sau nên có khả năng này. cơ hội.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.