Khi hầu hết mọi người đang than thở về những con sóng khổng lồ, các thủy thủ quan tâm đã lên đường đi tìm lục địa mới. Gần đây, Karpathy, giám đốc AI của Tesla và là người phát trực tuyến hàng đầu về AI, người đã trở lại OpenAI cách đây không lâu, đã đăng lại tập mới nhất của podcast Latent Space, cho rằng việc theo kịp sự phát triển của AI đã trở thành một công việc toàn thời gian. cần thiết và nhu cầu sẽ vượt xa các kỹ sư thuật toán học máy ngày nay. Trong số này, chúng tôi sẽ tiếp tục phân tích sâu hơn về chân dung năng lực của các tài năng AI sẽ cần trong tương lai.
Suy nghĩ hợp lý
Chúng tôi cố gắng đưa ra những suy luận khác biệt và suy nghĩ sâu sắc hơn dựa trên nội dung của bài viết, hoan nghênh bạn trao đổi.
**Công nghệ mô hình so với hạ cánh sản phẩm: **Trong khi hầu hết mọi người đang than thở về những con sóng khổng lồ, các thủy thủ quan tâm đã lên đường đi tìm các lục địa mới. Những người thợ thủ công phát minh ra la bàn và đóng tàu đóng vai trò mở đầu thời đại, kế đến là các thủy thủ và công nhân mở rộng lãnh thổ.
**Kỷ nguyên phần mềm 3.0:**SenseAI một lần nữa nhấn mạnh đến mạng Agent, lần này máy móc sẽ đến với chúng ta và ngôn ngữ tự nhiên sẽ trở thành gói ngôn ngữ đáp ứng hầu hết nhu cầu phát triển, tiếp tục giải phóng trí tưởng tượng của con người. Các tác nhân sử dụng mật độ tương tác và cộng tác mạng để giải quyết việc thực thi và những gì con người phải làm là đề xuất trí tưởng tượng cấp dưới, phá hủy và tái tạo.
Bài viết này có tổng cộng 3255 từ, đọc kỹ mất khoảng 9 phút
01. Công việc mới: Kỹ sư AI
Chúng tôi đang quan sát AI được ứng dụng theo thế hệ "chuyển sang phải" được thúc đẩy bởi các khả năng mới nổi và tính khả dụng của mã nguồn mở/API của các mô hình cơ bản. Một loạt nhiệm vụ trí tuệ nhân tạo mất 5 năm và một nhóm nghiên cứu hoàn thành vào năm 2013 giờ có thể hoàn thành chỉ với tài liệu API và một buổi chiều rảnh rỗi.
API là phổ quát: Các kỹ sư AI có thể sang trái để tối ưu hóa/lưu trữ các mô hình và các kỹ sư nghiên cứu có thể sang phải để xây dựng các ứng dụng trên API, nhưng sức mạnh tương đối và cơ sở kỹ thuật của chúng là rõ ràng.
Tuy nhiên, khó khăn nhất là chi tiết triển khai cụ thể, hiện tại LLM vẫn còn những thách thức sau về đánh giá, ứng dụng và sản xuất thành công:
**1. Mô hình:**Từ việc đánh giá các mô hình GPT-4 và Claude lớn nhất đến các mô hình mã nguồn mở Huggingface, LLaMA và các mô hình khác nhỏ nhất.
2. Công cụ: Từ các công cụ liên kết, truy xuất và tìm kiếm vectơ phổ biến nhất như LangChain, LlamaIndex và Pinecone, cho đến lĩnh vực công cụ proxy mới nổi như Auto-GPT và BabyAGT.
3. Tin tức: Số lượng bài báo, mô hình và kỹ thuật được xuất bản mỗi ngày đang tăng theo cấp số nhân cùng với sự chú ý và vốn, đến mức việc theo dõi tất cả những phát triển tiên tiến này gần như trở thành một công việc toàn thời gian .
LLM tạo ra một công việc toàn thời gian. Kỹ thuật phần mềm sẽ tạo ra một phân ngành mới, tập trung vào ứng dụng AI và sử dụng hiệu quả nhóm công nghệ mới nổi, giống như "kỹ sư độ tin cậy của trang web", "kỹ sư vận hành và bảo trì phát triển", "kỹ sư dữ liệu ” và "Kỹ sư phân tích" là người mới nổi.
**Các kỹ sư AI, sẽ vươn lên để thể hiện loại vai trò này. **
Hầu như mọi công ty khởi nghiệp đều có một số dạng nhóm thảo luận về AI. Các nhóm này sẽ chuyển đổi từ các nhóm không chính thức sang các nhóm chính thức, như Biên độ, Trả lời và Khái niệm đã thực hiện. Hàng nghìn kỹ sư phần mềm đang làm việc để sản xuất các mô hình OSS và API AI, dù là vào thời gian của công ty hay ban đêm và cuối tuần, trên Slack của công ty hay Discord độc lập, sẽ được chuyên môn hóa và tập hợp lại dưới một chức danh - kỹ sư AI. Đây có thể là công việc kỹ thuật có nhu cầu cao nhất trong thập kỷ tới.
Từ những công ty lớn nhất như Microsoft và Google, đến những công ty khởi nghiệp tiên tiến như Figma (được Diagram mua lại), Vercel (RoomGPT của Hassan El Mghari) và Notion (Notion AI của Ivan Zhao và Simon Last), cho đến những tin tặc độc lập như Simon Willison, Pieter Levels (Ảnh/InteriorAI) và Riley Goodside (hiện ở Scale AI). Họ kiếm được 300.000 đô la một năm khi làm kỹ thuật gợi ý tại Anthropic và 900.000 đô la xây dựng phần mềm tại OpenAI. Họ dành những ngày cuối tuần rảnh rỗi để lên ý tưởng tại AGI House và chia sẻ mẹo trên /r/LocalLLaMA2. Điểm chung của tất cả họ là họ đang biến những tiến bộ trong trí tuệ nhân tạo thành những sản phẩm thực sự được hàng triệu người sử dụng gần như chỉ sau một đêm.
** Không ai có bằng tiến sĩ. Khi nói đến việc phát hành các sản phẩm AI, bạn cần các kỹ sư chứ không phải nhà nghiên cứu. **
02, kỹ sư AI sẽ thay thế kỹ sư ML
Nhu cầu về các kỹ sư AI sẽ tăng nhanh trong tương lai. Hiện tại trên Indeed, kỹ sư ML có cơ hội việc làm gấp 10 lần kỹ sư AI, tuy nhiên tốc độ tăng trưởng của AI cao hơn khiến người ta tin rằng tỷ lệ này sẽ bị đảo ngược trong vòng 5 năm.
Biểu đồ xu hướng việc làm hàng tháng cho HN Ai đang tuyển dụng
Tất cả các chức danh công việc là một chiều, nhưng một số là hữu ích. Chúng tôi cảnh giác và mệt mỏi với cuộc tranh luận vô tận về ngữ nghĩa giữa AI và ML, nhưng chúng tôi nhận thức rõ rằng vai trò "kỹ sư phần mềm" thông thường hoàn toàn có khả năng xây dựng phần mềm AI. Tuy nhiên, một câu hỏi gần đây trên Ask HN về cách xâm nhập vào kỹ thuật AI cho thấy một nhận thức cơ bản vẫn tồn tại trên thị trường:
Ảnh chụp màn hình Tháng 6 năm 2023: Các câu trả lời được bình chọn hàng đầu cho "Làm thế nào để thâm nhập vào kỹ thuật AI"
Hầu hết mọi người vẫn coi kỹ thuật AI là một hình thức học máy hoặc kỹ thuật dữ liệu, vì vậy họ đề xuất cùng một nhóm công nghệ. Nhưng bạn có thể chắc chắn rằng không có kỹ sư AI hiệu quả cao nào được đề cập ở trên đã hoàn thành công việc tương đương với các khóa học của Andrew Ng Coursera, họ không biết PyTorch và họ không biết sự khác biệt giữa hồ dữ liệu và kho dữ liệu.
**Chẳng bao lâu nữa, sẽ không còn ai đề nghị bắt đầu kỹ thuật AI bằng cách đọc Chú ý là tất cả những gì bạn cần, cũng như việc bạn học lái xe bằng cách đọc bản vẽ của Ford Model T. Tất nhiên, việc hiểu các nguyên tắc cơ bản và lịch sử luôn hữu ích và nó thực sự có thể giúp bạn tìm ra những đổi mới và hiệu quả/năng lực đạt được chưa đi vào nhận thức chung. Nhưng đôi khi, bạn có thể trực tiếp sử dụng sản phẩm và biết chất lượng của chúng thông qua trải nghiệm.
Phải thừa nhận rằng sự đảo ngược của các kỹ sư AI và kỹ sư ML sẽ không xảy ra trong một sớm một chiều. Mọi người tự nhiên muốn làm rõ sơ yếu lý lịch của họ, điền vào bản đồ thị trường và nổi bật bằng cách trích dẫn các chủ đề chuyên sâu có thẩm quyền hơn. Điều đó nói rằng, kỹ thuật nhanh chóng và kỹ thuật AI sẽ cảm thấy bất lợi so với những người có nền tảng khoa học dữ liệu/máy học vững chắc trong một thời gian dài. Tuy nhiên, tính kinh tế của cung và cầu cuối cùng sẽ thắng thế và nhu cầu về các kỹ sư AI sẽ vượt xa nhu cầu về các kỹ sư ML.
**03.Tại sao lại là bây giờ? **
Mô hình cơ sở là một "người học ít ảnh", thể hiện khả năng học cách chuyển ngay cả khi không bắn trong ngữ cảnh, điều này vượt ra ngoài mục đích ban đầu của người huấn luyện mô hình. Nói cách khác, những người tạo ra những mô hình này không biết hết khả năng của chúng. Những người không phải là nhà nghiên cứu LLM có thể khám phá và tận dụng các khả năng này chỉ bằng cách dành nhiều thời gian hơn để tương tác với các mô hình và áp dụng chúng vào các lĩnh vực nghiên cứu không được đánh giá cao (ví dụ: ứng dụng của Jasper để viết quảng cáo).
Microsoft, Google, Meta và các phòng thí nghiệm mô hình cơ bản lớn đã độc quyền tài năng nghiên cứu khan hiếm, về cơ bản cung cấp các API "nghiên cứu AI dưới dạng dịch vụ". Bạn không thể thuê họ, nhưng bạn có thể thuê họ - nếu bạn có các kỹ sư phần mềm trong nhóm của mình, những người biết cách làm việc với họ. **Có khoảng 5.000 nhà nghiên cứu LLM trên toàn thế giới, nhưng có khoảng 50 triệu kỹ sư phần mềm. Những hạn chế về nguồn cung xác định rằng một kỹ sư AI "trung tâm" sẽ xuất hiện để đáp ứng nhu cầu thị trường. **
**3. Dự trữ GPU. **Tất nhiên, OpenAI/Microsoft là những người đầu tiên thực hiện công việc này, nhưng Ổn định AI đã gây ra cuộc chạy đua vũ trang GPU giữa các công ty khởi nghiệp bằng cách nhấn mạnh vào cụm 4000 GPU của họ.
**4 Hành động linh hoạt trực tiếp từ sản phẩm. **Thay vì yêu cầu các nhà khoa học dữ liệu/kỹ sư ML thực hiện rất nhiều công việc thu thập dữ liệu trước khi đào tạo một mô hình miền cụ thể rồi đưa mô hình đó vào sản xuất, các nhà quản lý sản phẩm/kỹ sư phần mềm có thể nhắc LLM trước và sau đó xây dựng/xác thực ý tưởng sản phẩm Sau đó lấy dữ liệu cụ thể để tinh chỉnh.
Giả sử cái sau gấp 100 lần đến 1000 lần so với cái trước và bằng cách sắp xếp quy trình "khai hỏa, chuẩn bị, nhắm" của LLM giúp bạn nhanh hơn gấp 10 lần đến 100 lần so với học máy truyền thống. Do đó, các kỹ sư AI sẽ có thể xác thực các sản phẩm AI với chi phí thấp hơn từ 1.000 đến 10.000 lần. Đây là một sự phát triển Thác nước khác so với Agile và AI là Agile.
**5. Python → Java. **Dữ liệu/AI có truyền thống phụ thuộc rất nhiều vào Python và các công cụ kỹ thuật AI đầu tiên như LangChain, LlamaIndex và Guardrails cũng bắt nguồn từ cùng một cộng đồng. Tuy nhiên, hiện tại số lượng nhà phát triển Java cũng nhiều như số lượng nhà phát triển Python, vì vậy các công cụ hiện ngày càng phục vụ cho cơ sở người dùng mở rộng này, từ LangChain.js và Transformers.js cho đến AI SDK mới của Vercel. Cơ hội mở rộng thị trường là rất lớn.
**6. AI sáng tạo so với ML phân loại. ** "AI sáng tạo" là một thuật ngữ đã lỗi thời, nhường chỗ cho các danh mục khác như "Công cụ suy luận", nhưng trình bày ngắn gọn sự khác biệt giữa các công cụ MLOps hiện có và những người thực hành máy học và điều gì phù hợp nhất để sử dụng LLM và Vẫn rất hữu ích khi xem xét vai trò mới và khác biệt của trình tạo văn bản thành hình ảnh. Mặc dù nghiên cứu máy học hiện tại có thể tập trung vào những thứ như rủi ro gian lận, hệ thống đề xuất, phát hiện điểm bất thường và lưu trữ tính năng, nhưng các kỹ sư AI đang xây dựng ứng dụng viết, công cụ học tập được cá nhân hóa, bảng tính ngôn ngữ tự nhiên và ứng dụng giống như Factorio.
Bất cứ khi nào có một nhóm nhỏ có nền tảng hoàn toàn khác, nói một ngôn ngữ khác, tạo ra một sản phẩm hoàn toàn khác và sử dụng một công cụ hoàn toàn khác, cuối cùng họ sẽ chia thành các nhóm riêng biệt.
04, 1+2=3: Lập trình trong kỷ nguyên phần mềm 3.0
6 năm trước, Andrej Karpathy đã viết một bài báo rất có ảnh hưởng mô tả Phần mềm 2.0, tương phản giữa "ngăn xếp cổ điển" của các ngôn ngữ lập trình viết tay truyền thống mô hình logic chính xác và mạng thần kinh "máy học" mới xấp xỉ logic ngăn xếp, cho phép phần mềm giải quyết nhiều vấn đề hơn con người có thể mô hình hóa. Năm nay, anh ấy đã lưu ý trong một bài báo tiếp theo rằng Ngôn ngữ lập trình mới hấp dẫn nhất là tiếng Anh, cuối cùng đã lấp đầy khoảng xám mà anh ấy đã không đánh dấu trong bài viết gốc của mình.
Kỹ thuật đã trở thành một meme vào năm ngoái, mô tả công việc sẽ thay đổi như thế nào khi mọi người bắt đầu tận dụng lợi thế của GPT-3 và Khuếch tán ổn định. Mọi người chế giễu các công ty khởi nghiệp AI vì gọi họ là "trình bao bọc OpenAI" và nêu lên mối lo ngại rằng các ứng dụng LLM dễ bị kỹ thuật gợi ý và kỹ thuật gợi ý đảo ngược. Các rào cản có thực sự tồn tại? (Sense Says: Tham khảo bài viết đầu tiên của chúng tôi "Hệ thống thông minh: Con hào của các doanh nghiệp AI trong tương lai")
Nhưng một trong những chủ đề lớn nhất vào năm 2023 sẽ là thiết lập lại vai trò của mã do con người viết trong việc điều phối và thay thế các khả năng của LLM, từ Langchain trị giá hơn 200 triệu đô la, đến Du hành do Nvidia hậu thuẫn, thể hiện tầm quan trọng rõ ràng của việc tạo và tái sử dụng mã . Kỹ thuật vừa được cường điệu hóa vừa tồn tại, nhưng sự xuất hiện trở lại của mô hình Phần mềm 1.0 trong các ứng dụng Phần mềm 3.0 vừa là một cơ hội lớn vừa là một lĩnh vực gây nhầm lẫn, tạo ra khoảng trắng cho nhiều công ty khởi nghiệp.
Nhà đầu tư không nghiên cứu thị trường không phải là nhà đầu tư giỏi
Tất nhiên, đây không chỉ là mã được viết bởi con người. Câu chuyện về nhiều dự án (smol-developer, rộng hơn là gpt-engineer và cuộc phiêu lưu của các tác nhân tạo mã khác như Codium AI, Codegen.ai và Morph/Rift) cho thấy rằng chúng sẽ ngày càng trở thành một phần của AI . bộ công cụ của kỹ sư. Khi các kỹ sư con người học cách khai thác AI, AI sẽ ngày càng tham gia nhiều hơn vào lĩnh vực kỹ thuật.
Cho đến một ngày nào đó trong tương lai xa, chúng ta sẽ tra cứu và không còn có thể phân biệt được sự khác biệt giữa hai điều này.
Người giới thiệu
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
_ Kỹ sư đã lỗi thời? Một sự nghiệp mới được thúc đẩy bởi AI bigwigs đã ra đời
Nguồn: SenseAI
Suy nghĩ hợp lý
Chúng tôi cố gắng đưa ra những suy luận khác biệt và suy nghĩ sâu sắc hơn dựa trên nội dung của bài viết, hoan nghênh bạn trao đổi.
**Công nghệ mô hình so với hạ cánh sản phẩm: **Trong khi hầu hết mọi người đang than thở về những con sóng khổng lồ, các thủy thủ quan tâm đã lên đường đi tìm các lục địa mới. Những người thợ thủ công phát minh ra la bàn và đóng tàu đóng vai trò mở đầu thời đại, kế đến là các thủy thủ và công nhân mở rộng lãnh thổ.
**Kỷ nguyên phần mềm 3.0:**SenseAI một lần nữa nhấn mạnh đến mạng Agent, lần này máy móc sẽ đến với chúng ta và ngôn ngữ tự nhiên sẽ trở thành gói ngôn ngữ đáp ứng hầu hết nhu cầu phát triển, tiếp tục giải phóng trí tưởng tượng của con người. Các tác nhân sử dụng mật độ tương tác và cộng tác mạng để giải quyết việc thực thi và những gì con người phải làm là đề xuất trí tưởng tượng cấp dưới, phá hủy và tái tạo.
Bài viết này có tổng cộng 3255 từ, đọc kỹ mất khoảng 9 phút
01. Công việc mới: Kỹ sư AI
Chúng tôi đang quan sát AI được ứng dụng theo thế hệ "chuyển sang phải" được thúc đẩy bởi các khả năng mới nổi và tính khả dụng của mã nguồn mở/API của các mô hình cơ bản. Một loạt nhiệm vụ trí tuệ nhân tạo mất 5 năm và một nhóm nghiên cứu hoàn thành vào năm 2013 giờ có thể hoàn thành chỉ với tài liệu API và một buổi chiều rảnh rỗi.
Tuy nhiên, khó khăn nhất là chi tiết triển khai cụ thể, hiện tại LLM vẫn còn những thách thức sau về đánh giá, ứng dụng và sản xuất thành công:
**1. Mô hình:**Từ việc đánh giá các mô hình GPT-4 và Claude lớn nhất đến các mô hình mã nguồn mở Huggingface, LLaMA và các mô hình khác nhỏ nhất.
2. Công cụ: Từ các công cụ liên kết, truy xuất và tìm kiếm vectơ phổ biến nhất như LangChain, LlamaIndex và Pinecone, cho đến lĩnh vực công cụ proxy mới nổi như Auto-GPT và BabyAGT.
3. Tin tức: Số lượng bài báo, mô hình và kỹ thuật được xuất bản mỗi ngày đang tăng theo cấp số nhân cùng với sự chú ý và vốn, đến mức việc theo dõi tất cả những phát triển tiên tiến này gần như trở thành một công việc toàn thời gian .
LLM tạo ra một công việc toàn thời gian. Kỹ thuật phần mềm sẽ tạo ra một phân ngành mới, tập trung vào ứng dụng AI và sử dụng hiệu quả nhóm công nghệ mới nổi, giống như "kỹ sư độ tin cậy của trang web", "kỹ sư vận hành và bảo trì phát triển", "kỹ sư dữ liệu ” và "Kỹ sư phân tích" là người mới nổi.
**Các kỹ sư AI, sẽ vươn lên để thể hiện loại vai trò này. **
Hầu như mọi công ty khởi nghiệp đều có một số dạng nhóm thảo luận về AI. Các nhóm này sẽ chuyển đổi từ các nhóm không chính thức sang các nhóm chính thức, như Biên độ, Trả lời và Khái niệm đã thực hiện. Hàng nghìn kỹ sư phần mềm đang làm việc để sản xuất các mô hình OSS và API AI, dù là vào thời gian của công ty hay ban đêm và cuối tuần, trên Slack của công ty hay Discord độc lập, sẽ được chuyên môn hóa và tập hợp lại dưới một chức danh - kỹ sư AI. Đây có thể là công việc kỹ thuật có nhu cầu cao nhất trong thập kỷ tới.
Từ những công ty lớn nhất như Microsoft và Google, đến những công ty khởi nghiệp tiên tiến như Figma (được Diagram mua lại), Vercel (RoomGPT của Hassan El Mghari) và Notion (Notion AI của Ivan Zhao và Simon Last), cho đến những tin tặc độc lập như Simon Willison, Pieter Levels (Ảnh/InteriorAI) và Riley Goodside (hiện ở Scale AI). Họ kiếm được 300.000 đô la một năm khi làm kỹ thuật gợi ý tại Anthropic và 900.000 đô la xây dựng phần mềm tại OpenAI. Họ dành những ngày cuối tuần rảnh rỗi để lên ý tưởng tại AGI House và chia sẻ mẹo trên /r/LocalLLaMA2. Điểm chung của tất cả họ là họ đang biến những tiến bộ trong trí tuệ nhân tạo thành những sản phẩm thực sự được hàng triệu người sử dụng gần như chỉ sau một đêm.
** Không ai có bằng tiến sĩ. Khi nói đến việc phát hành các sản phẩm AI, bạn cần các kỹ sư chứ không phải nhà nghiên cứu. **
02, kỹ sư AI sẽ thay thế kỹ sư ML
Nhu cầu về các kỹ sư AI sẽ tăng nhanh trong tương lai. Hiện tại trên Indeed, kỹ sư ML có cơ hội việc làm gấp 10 lần kỹ sư AI, tuy nhiên tốc độ tăng trưởng của AI cao hơn khiến người ta tin rằng tỷ lệ này sẽ bị đảo ngược trong vòng 5 năm.
Tất cả các chức danh công việc là một chiều, nhưng một số là hữu ích. Chúng tôi cảnh giác và mệt mỏi với cuộc tranh luận vô tận về ngữ nghĩa giữa AI và ML, nhưng chúng tôi nhận thức rõ rằng vai trò "kỹ sư phần mềm" thông thường hoàn toàn có khả năng xây dựng phần mềm AI. Tuy nhiên, một câu hỏi gần đây trên Ask HN về cách xâm nhập vào kỹ thuật AI cho thấy một nhận thức cơ bản vẫn tồn tại trên thị trường:
Hầu hết mọi người vẫn coi kỹ thuật AI là một hình thức học máy hoặc kỹ thuật dữ liệu, vì vậy họ đề xuất cùng một nhóm công nghệ. Nhưng bạn có thể chắc chắn rằng không có kỹ sư AI hiệu quả cao nào được đề cập ở trên đã hoàn thành công việc tương đương với các khóa học của Andrew Ng Coursera, họ không biết PyTorch và họ không biết sự khác biệt giữa hồ dữ liệu và kho dữ liệu.
**Chẳng bao lâu nữa, sẽ không còn ai đề nghị bắt đầu kỹ thuật AI bằng cách đọc Chú ý là tất cả những gì bạn cần, cũng như việc bạn học lái xe bằng cách đọc bản vẽ của Ford Model T. Tất nhiên, việc hiểu các nguyên tắc cơ bản và lịch sử luôn hữu ích và nó thực sự có thể giúp bạn tìm ra những đổi mới và hiệu quả/năng lực đạt được chưa đi vào nhận thức chung. Nhưng đôi khi, bạn có thể trực tiếp sử dụng sản phẩm và biết chất lượng của chúng thông qua trải nghiệm.
Phải thừa nhận rằng sự đảo ngược của các kỹ sư AI và kỹ sư ML sẽ không xảy ra trong một sớm một chiều. Mọi người tự nhiên muốn làm rõ sơ yếu lý lịch của họ, điền vào bản đồ thị trường và nổi bật bằng cách trích dẫn các chủ đề chuyên sâu có thẩm quyền hơn. Điều đó nói rằng, kỹ thuật nhanh chóng và kỹ thuật AI sẽ cảm thấy bất lợi so với những người có nền tảng khoa học dữ liệu/máy học vững chắc trong một thời gian dài. Tuy nhiên, tính kinh tế của cung và cầu cuối cùng sẽ thắng thế và nhu cầu về các kỹ sư AI sẽ vượt xa nhu cầu về các kỹ sư ML.
**03.Tại sao lại là bây giờ? **
Mô hình cơ sở là một "người học ít ảnh", thể hiện khả năng học cách chuyển ngay cả khi không bắn trong ngữ cảnh, điều này vượt ra ngoài mục đích ban đầu của người huấn luyện mô hình. Nói cách khác, những người tạo ra những mô hình này không biết hết khả năng của chúng. Những người không phải là nhà nghiên cứu LLM có thể khám phá và tận dụng các khả năng này chỉ bằng cách dành nhiều thời gian hơn để tương tác với các mô hình và áp dụng chúng vào các lĩnh vực nghiên cứu không được đánh giá cao (ví dụ: ứng dụng của Jasper để viết quảng cáo).
Microsoft, Google, Meta và các phòng thí nghiệm mô hình cơ bản lớn đã độc quyền tài năng nghiên cứu khan hiếm, về cơ bản cung cấp các API "nghiên cứu AI dưới dạng dịch vụ". Bạn không thể thuê họ, nhưng bạn có thể thuê họ - nếu bạn có các kỹ sư phần mềm trong nhóm của mình, những người biết cách làm việc với họ. **Có khoảng 5.000 nhà nghiên cứu LLM trên toàn thế giới, nhưng có khoảng 50 triệu kỹ sư phần mềm. Những hạn chế về nguồn cung xác định rằng một kỹ sư AI "trung tâm" sẽ xuất hiện để đáp ứng nhu cầu thị trường. **
**3. Dự trữ GPU. **Tất nhiên, OpenAI/Microsoft là những người đầu tiên thực hiện công việc này, nhưng Ổn định AI đã gây ra cuộc chạy đua vũ trang GPU giữa các công ty khởi nghiệp bằng cách nhấn mạnh vào cụm 4000 GPU của họ.
**4 Hành động linh hoạt trực tiếp từ sản phẩm. **Thay vì yêu cầu các nhà khoa học dữ liệu/kỹ sư ML thực hiện rất nhiều công việc thu thập dữ liệu trước khi đào tạo một mô hình miền cụ thể rồi đưa mô hình đó vào sản xuất, các nhà quản lý sản phẩm/kỹ sư phần mềm có thể nhắc LLM trước và sau đó xây dựng/xác thực ý tưởng sản phẩm Sau đó lấy dữ liệu cụ thể để tinh chỉnh.
**5. Python → Java. **Dữ liệu/AI có truyền thống phụ thuộc rất nhiều vào Python và các công cụ kỹ thuật AI đầu tiên như LangChain, LlamaIndex và Guardrails cũng bắt nguồn từ cùng một cộng đồng. Tuy nhiên, hiện tại số lượng nhà phát triển Java cũng nhiều như số lượng nhà phát triển Python, vì vậy các công cụ hiện ngày càng phục vụ cho cơ sở người dùng mở rộng này, từ LangChain.js và Transformers.js cho đến AI SDK mới của Vercel. Cơ hội mở rộng thị trường là rất lớn.
**6. AI sáng tạo so với ML phân loại. ** "AI sáng tạo" là một thuật ngữ đã lỗi thời, nhường chỗ cho các danh mục khác như "Công cụ suy luận", nhưng trình bày ngắn gọn sự khác biệt giữa các công cụ MLOps hiện có và những người thực hành máy học và điều gì phù hợp nhất để sử dụng LLM và Vẫn rất hữu ích khi xem xét vai trò mới và khác biệt của trình tạo văn bản thành hình ảnh. Mặc dù nghiên cứu máy học hiện tại có thể tập trung vào những thứ như rủi ro gian lận, hệ thống đề xuất, phát hiện điểm bất thường và lưu trữ tính năng, nhưng các kỹ sư AI đang xây dựng ứng dụng viết, công cụ học tập được cá nhân hóa, bảng tính ngôn ngữ tự nhiên và ứng dụng giống như Factorio.
Bất cứ khi nào có một nhóm nhỏ có nền tảng hoàn toàn khác, nói một ngôn ngữ khác, tạo ra một sản phẩm hoàn toàn khác và sử dụng một công cụ hoàn toàn khác, cuối cùng họ sẽ chia thành các nhóm riêng biệt.
04, 1+2=3: Lập trình trong kỷ nguyên phần mềm 3.0
6 năm trước, Andrej Karpathy đã viết một bài báo rất có ảnh hưởng mô tả Phần mềm 2.0, tương phản giữa "ngăn xếp cổ điển" của các ngôn ngữ lập trình viết tay truyền thống mô hình logic chính xác và mạng thần kinh "máy học" mới xấp xỉ logic ngăn xếp, cho phép phần mềm giải quyết nhiều vấn đề hơn con người có thể mô hình hóa. Năm nay, anh ấy đã lưu ý trong một bài báo tiếp theo rằng Ngôn ngữ lập trình mới hấp dẫn nhất là tiếng Anh, cuối cùng đã lấp đầy khoảng xám mà anh ấy đã không đánh dấu trong bài viết gốc của mình.
Nhưng một trong những chủ đề lớn nhất vào năm 2023 sẽ là thiết lập lại vai trò của mã do con người viết trong việc điều phối và thay thế các khả năng của LLM, từ Langchain trị giá hơn 200 triệu đô la, đến Du hành do Nvidia hậu thuẫn, thể hiện tầm quan trọng rõ ràng của việc tạo và tái sử dụng mã . Kỹ thuật vừa được cường điệu hóa vừa tồn tại, nhưng sự xuất hiện trở lại của mô hình Phần mềm 1.0 trong các ứng dụng Phần mềm 3.0 vừa là một cơ hội lớn vừa là một lĩnh vực gây nhầm lẫn, tạo ra khoảng trắng cho nhiều công ty khởi nghiệp.
Tất nhiên, đây không chỉ là mã được viết bởi con người. Câu chuyện về nhiều dự án (smol-developer, rộng hơn là gpt-engineer và cuộc phiêu lưu của các tác nhân tạo mã khác như Codium AI, Codegen.ai và Morph/Rift) cho thấy rằng chúng sẽ ngày càng trở thành một phần của AI . bộ công cụ của kỹ sư. Khi các kỹ sư con người học cách khai thác AI, AI sẽ ngày càng tham gia nhiều hơn vào lĩnh vực kỹ thuật.
Cho đến một ngày nào đó trong tương lai xa, chúng ta sẽ tra cứu và không còn có thể phân biệt được sự khác biệt giữa hai điều này.
Người giới thiệu