Tham gia vào mô hình lớn, câu chuyện mới của các nhà sản xuất điện thoại di động

2023-08-16 02:28:43

Tác giả｜Vô Tinh Tinh

Chỉnh sửa｜Hạt dẻ

Nguồn: Gia Tử Quảng Nam

Mô hình lớn của Xiaomi đã ra mắt công chúng trong bài phát biểu thường niên năm 2023 của Lei Jun.

Lei Jun đã đề cập rằng, không giống như nhiều nền tảng Internet, hướng đột phá chính của mô hình lớn của Xiaomi là trọng lượng nhẹ và triển khai cục bộ, có thể chạy mượt mà trên mặt điện thoại di động.

Ông cho biết, hiện tại, mô hình MiLM1.3B với quy mô 1,3 tỷ tham số đã được chạy trên điện thoại di động và hiệu quả tương đương với kết quả của các mô hình lớn với 6 tỷ tham số trong điện toán đám mây. Trong thẻ báo cáo mà anh ấy đã đăng, mẫu end-to-side lớn của Xiaomi hoạt động tốt hơn mẫu ChatGLM2-6B của Zhipu AI trong các chủ đề khác nhau của bài đánh giá CMMLU của Trung Quốc và khoảng cách điểm số với mẫu lớn Baichuan-13B của Baichuan Intelligent khoảng 5 phút.

(Nguồn: Xiaomi)

Trước đây, mô hình ngôn ngữ tiền đào tạo quy mô lớn MiLM-6B/1.3B do Xiaomi phát triển đã cập bến GitHub, nền tảng lưu trữ mã và xếp thứ mười trong danh sách chung C, đứng đầu về cùng độ lớn tham số và xếp hạng đầu tiên trong tiêu chuẩn mô hình lớn của Trung Quốc "CMMLU", "MiLM-6B" được xếp hạng đầu tiên.

Tất nhiên, vì kích thước của các danh sách thử nghiệm này đều được công khai, nên nhiều công ty mô hình quy mô lớn sẽ cho điểm theo các nhiệm vụ thử nghiệm, vì vậy, những kết quả đánh giá này chỉ có thể được sử dụng làm tài liệu tham khảo và không có ý nghĩa gì. rằng kết quả là hoàn toàn xuất sắc.

Đồng thời, Lei Jun cũng thông báo rằng Xiao Ai, với tư cách là doanh nghiệp ứng dụng đầu tiên của mô hình lớn của Xiaomi, đã trải qua một bản nâng cấp mới và chính thức mở thử nghiệm lời mời.

Đây là thành tích mô hình quy mô lớn được dàn dựng của Xiaomi trong bốn tháng kể từ khi công bố nhóm mô hình quy mô lớn mới vào tháng 4 năm nay.

Thực hành của Xiaomi mang đến tư duy mới nào cho việc triển khai các mô hình lớn? Điều đó có ý nghĩa gì đối với các nhà sản xuất điện thoại di động dựa trên sự lặp lại công nghệ mới?

1. Xiaomi không sản xuất các mô hình lớn cho mục đích chung và nhóm nòng cốt có khoảng 30 người

Xiaomi thuộc trường phái duy lý trên con đường mô hình quy mô lớn-** không theo đuổi quy mô tham số và không tạo ra các mô hình quy mô lớn cho mục đích chung. **

Trước đó trong cuộc gọi hội nghị về thu nhập, Lu Weibing, chủ tịch của Tập đoàn Xiaomi, cho biết Xiaomi sẽ tích cực nắm bắt các mô hình quy mô lớn và hướng đi là tích hợp sâu các sản phẩm và hoạt động kinh doanh, chứ không tạo ra các mô hình quy mô lớn cho mục đích chung như OpenAI .

Theo các báo cáo trước đây của Shenran, Tiến sĩ Wang Bin, Giám đốc Phòng thí nghiệm AI của Tập đoàn Xiaomi, đã từng nói rằng Xiaomi sẽ không phát hành một sản phẩm giống như ChatGPT một mình và mô hình lớn tự phát triển cuối cùng sẽ được đưa ra bởi sản phẩm và chính phủ có liên quan sẽ đầu tư hàng chục triệu nhân dân tệ. **

Ông nói: "Đối với các mô hình lớn, chúng tôi thuộc trường phái duy lý. Xiaomi có lợi thế trong các kịch bản ứng dụng và những gì chúng tôi thấy là cơ hội lớn cho sự kết hợp giữa các mô hình và kịch bản lớn."

Ông tiết lộ, trước khi ChatGPT ra đời, Xiaomi đã nghiên cứu phát triển nội bộ và ứng dụng các mô hình lớn, lúc đó sử dụng đào tạo trước + giám sát tác vụ xuôi dòng và tinh chỉnh để tiến hành đối thoại giữa người và máy, với thang đo tham số. từ 2,8 tỷ đến 3 tỷ. Điều này chủ yếu đạt được thông qua việc tinh chỉnh dữ liệu hội thoại trên cơ sở mô hình cơ sở được đào tạo trước, chứ không phải mô hình lớn có mục đích chung như hiện nay.

Theo thông tin được công khai, người đứng đầu nhóm mô hình lớn hiện tại của Xiaomi là Luan Jian, một chuyên gia về hướng giọng nói AI, báo cáo với Wang Bin, phó chủ tịch ủy ban kỹ thuật kiêm giám đốc phòng thí nghiệm AI. Toàn bộ đội mô hình lớn có khoảng 30 người.

Luan Jian từng là nhà khoa học giọng nói trưởng và trưởng nhóm giọng nói của robot giọng nói thông minh "Microsoft Xiaoice", nhà nghiên cứu tại Viện nghiên cứu Toshiba (Trung Quốc) và là nhà khoa học giọng nói cấp cao tại Học viện Kỹ thuật Microsoft (Trung Quốc). Sau khi gia nhập Xiaomi, Luan Jian lần lượt phụ trách tạo giọng nói, NLP và các nhóm khác cũng như triển khai các công nghệ liên quan trong các sản phẩm như Xiao Ai. Wang Bin gia nhập Xiaomi vào năm 2018 và phụ trách phòng thí nghiệm AI từ năm 2019. Trước khi gia nhập Xiaomi, ông là nhà nghiên cứu và giám sát tiến sĩ tại Viện Kỹ thuật Thông tin, Học viện Khoa học Trung Quốc. Ông đã có gần 30 năm nghiên cứu kinh nghiệm trong lĩnh vực truy xuất thông tin và xử lý ngôn ngữ tự nhiên.

Mô hình quy mô lớn cũng dựa vào nhóm AI đứng sau Xiaomi Lei Jun cho biết sau 7 năm và 6 lần mở rộng, nhóm AI của Xiaomi đã có hơn 3.000 người, bao gồm CV, NLP, hình ảnh AI, lái xe tự động, người máy, v.v. lĩnh vực. .

(Nguồn: Xiaomi)

2. Google, Qualcomm và Huawei lần lượt tham gia cuộc chơi

Ngoài Xiaomi, việc sản xuất các mẫu điện thoại cỡ lớn chạy bằng di động là mục tiêu trọng điểm hiện nay của nhiều hãng công nghệ.

Các công ty công nghệ đang tưởng tượng khả năng của các mô hình lớn: bất kể bạn mở WPS, tài liệu than chì hay email, miễn là bạn nhập các lệnh như viết, điện thoại di động có thể gọi các khả năng cục bộ để tạo một bài báo hoặc email hoàn chỉnh. Trên điện thoại di động, tất cả các Ứng dụng có thể gọi mô hình quy mô lớn cục bộ bất cứ lúc nào để giúp giải quyết công việc và giải quyết các vấn đề trong cuộc sống, sự tương tác giữa con người và các Ứng dụng khác nhau trên điện thoại di động không còn là những cú nhấp chuột thường xuyên mà có thể được gọi một cách thông minh bằng giọng nói.

Nhiều công ty đang cố gắng thu nhỏ kích thước của mô hình, làm cho việc chạy các mô hình lớn cục bộ trên điện thoại di động trở nên thực tế và tiết kiệm hơn. Tại hội nghị Google I/O vào tháng 5 năm nay, khi Google phát hành PaLM2, nó được chia thành 4 thông số kỹ thuật theo kích thước từ nhỏ đến lớn theo thứ tự Gecko, Otter, Bison và Unicorn. chạy trên điện thoại di động. Và nó rất nhanh, nó có thể xử lý 20 mã thông báo mỗi giây, gần tương đương với 16 hoặc 17 từ và nó cũng có thể hỗ trợ điện thoại di động chạy ngoại tuyến. Nhưng vào thời điểm đó, Google không cho biết mẫu điện thoại nào sẽ được sử dụng.

Hiện Qualcomm mới là bên đưa ra kết quả cụ thể. Tại MWC 2023 vào tháng 3 năm nay, Qualcomm đã chạy Stable Diffusion, một mô hình đồ thị Wensheng với hơn 1 tỷ thông số, trên điện thoại thông minh được trang bị Snapdragon 8 thế hệ thứ hai. Trong phần trình diễn, nhân viên đã sử dụng Khuếch tán ổn định để tạo hình ảnh trên điện thoại Android không có kết nối Internet và toàn bộ quá trình mất 15 giây.

Tại CVPR, hội nghị hàng đầu về thị giác máy tính vào tháng 6, Qualcomm đã trình diễn mô hình ControlNet chạy trên điện thoại Android với quy mô 1,5 tỷ tham số và thời gian vẽ chỉ 11,26 giây. Ziad Asghar, phó chủ tịch cấp cao về quản lý sản phẩm và trưởng bộ phận AI của Qualcomm, cho biết: **Về mặt kỹ thuật, chỉ mất chưa đầy một tháng để chuyển những mô hình lớn này với hơn 1 tỷ thông số vào điện thoại di động. **

Hành động mới nhất là Qualcomm đã công bố hợp tác với Meta để khám phá các ứng dụng và ứng dụng dựa trên mẫu Llama 2 trên điện thoại thông minh, PC, thiết bị hiển thị đeo đầu AR/VR, ô tô và các thiết bị khác dựa trên chip Qualcomm Snapdragon mà không cần kết nối mạng. Phục vụ. Theo Qualcomm, so với LLM dựa trên đám mây, việc chạy các mô hình ngôn ngữ quy mô lớn như Llama 2 cục bộ trên thiết bị không chỉ có chi phí thấp hơn và hiệu suất tốt hơn mà còn không cần kết nối với các dịch vụ trực tuyến** và dịch vụ được cá nhân hóa hơn và hiệu quả hơn. An toàn và riêng tư hơn.

Apple, chưa chính thức công bố bất kỳ hành động mô hình quy mô lớn nào, cũng đang khám phá sự đổ bộ của các mô hình quy mô lớn về phía thiết bị. Theo báo cáo của "Financial Times", Apple đang tuyển dụng đầy đủ các kỹ sư và nhà nghiên cứu để nén các mô hình ngôn ngữ lớn để chúng có thể chạy hiệu quả trên iPhone và iPad, và nhóm chịu trách nhiệm chính là Machine Intelligence and Neural Design ( TÂM) đội .

Hiện tại, trên Github, một dự án MLC LLM mô hình mã nguồn mở phổ biến có thể hỗ trợ triển khai cục bộ, giải quyết các hạn chế về bộ nhớ bằng cách lập kế hoạch phân bổ cẩn thận và chủ động nén các tham số mô hình, đồng thời có thể chạy các mô hình AI trên nhiều thiết bị phần cứng khác nhau như iPhone. Dự án do Trợ lý Giáo sư CMU, Giám đốc công nghệ OctoML Chen Tianqi và các nhà nghiên cứu khác cùng phát triển.Nhóm sử dụng công nghệ Biên dịch Máy học (MLC) làm cơ sở để triển khai hiệu quả các mô hình AI. Chưa đầy hai ngày sau khi MLC-LLM trực tuyến, số sao trên GitHub đã đạt gần 1.000. Ai đó đã thử chạy một mô hình ngôn ngữ lớn cục bộ ở chế độ trên máy bay của iPhone.

Không giống như Google và Qualcomm nước ngoài nhấn mạnh rằng các mô hình lớn có thể được triển khai cục bộ trên thiết bị và có thể chạy ngoại tuyến, các nhà sản xuất điện thoại di động trong nước hiện đang ưu tiên triển khai các mô hình lớn trên trợ lý giọng nói của điện thoại di động hoặc các chức năng tìm kiếm hình ảnh hiện có. nâng cấp này là để gọi Nhiều khả năng đám mây hơn để sử dụng các mô hình lớn.

Lần này, Xiaomi đã sử dụng mô hình lớn trên trợ lý giọng nói Xiao Ai. Tuy nhiên, do các thông tin liên quan về mẫu màn hình lớn cuối cùng của Xiaomi vẫn chưa được tiết lộ nên không thể đánh giá chính xác lộ trình phát triển của mẫu màn hình lớn Xiaomi trong tương lai. Đánh giá theo hướng triển khai cục bộ và gọn nhẹ mà Lei Jun nhấn mạnh, Xiaomi có thể sẽ thử chạy mô hình lớn ngoại tuyến trên điện thoại di động trong tương lai.

Huawei cũng đang cố gắng triển khai các mô hình quy mô lớn trên điện thoại di động, nhưng trọng tâm vẫn là trợ lý giọng nói trên điện thoại di động và cảnh tìm kiếm hình ảnh. Đầu tháng 4, trên điện thoại di động P60 mới ra mắt của Huawei, đằng sau chức năng tìm kiếm hình ảnh thông minh mới là công nghệ mô hình quy mô lớn đa phương thức và mô hình này đã được thu nhỏ về phía điện thoại di động trong quá trình này. Gần đây, trợ lý thông minh thiết bị đầu cuối Xiaoyi mới được nâng cấp của Huawei cũng đã tối ưu hóa trải nghiệm dựa trên mô hình lớn và có thể đề xuất các nhà hàng theo lời nhắc bằng giọng nói và thực hiện các chức năng mới như tóm tắt.

OPPO và vivo cũng đang nỗ lực theo hướng này.Vào ngày 13 tháng 8, OPPO đã thông báo rằng Trợ lý Xiaobu mới dựa trên AndesGPT sẽ sớm bắt đầu trải nghiệm.Từ dữ liệu có thể thấy rằng sau khi Trợ lý Xiaobu tích hợp khả năng của các mẫu máy lớn, nó sẽ hiệu quả hơn trong đối thoại và viết quảng cáo Khả năng viết và các khía cạnh khác sẽ được củng cố. AndesGPT là một mô hình ngôn ngữ lớn tổng quát dựa trên kiến trúc đám mây lai được tạo bởi Nhóm đám mây thông minh OPPO Andes.

Đối với các nhà sản xuất điện thoại di động, cho dù đó là triển khai cục bộ hay gọi các khả năng của đám mây, các mô hình lớn là một cơ hội mới không thể bỏ lỡ cho điện thoại di động.

3. Mô hình lớn chạy trên điện thoại di động, vấn đề chính nằm ở đâu?

Để tạo ra một mô hình lớn chạy trên điện thoại di động không phải là một nhiệm vụ dễ dàng.

Sức mạnh tính toán là vấn đề chính. Sử dụng mô hình lớn trên điện thoại di động không chỉ yêu cầu sức mạnh tính toán của đám mây mà còn cả sức mạnh tính toán của thiết bị đầu cuối, do mức tiêu thụ tài nguyên lớn của mô hình lớn, mỗi cuộc gọi có nghĩa là chi phí cao. Chủ tịch Alphabet John Hennessy từng đề cập rằng chi phí tìm kiếm khi sử dụng mô hình ngôn ngữ lớn cao gấp 10 lần so với chi phí tìm kiếm từ khóa trước đây. Năm ngoái, Google có 3,3 nghìn tỷ truy vấn tìm kiếm, chi phí khoảng 1/5 xu cho mỗi truy vấn. Các nhà phân tích Phố Wall dự đoán rằng nếu Google sử dụng các mô hình ngôn ngữ lớn để xử lý một nửa số truy vấn tìm kiếm của mình, mỗi truy vấn cung cấp câu trả lời khoảng 50 từ,** Google có thể phải đối mặt với mức tăng chi tiêu 6 tỷ đô la vào năm 2024. **

(Nguồn: Reuters)

Chạy các mô hình lớn trên điện thoại di động phải đối mặt với các vấn đề chi phí tương tự, được đề cập trong báo cáo "Hybrid AI is the Future of AI" do Qualcomm phát hành, giống như điện toán truyền thống đã phát triển từ máy tính lớn và máy khách thành sự kết hợp giữa đám mây và thiết bị đầu cuối biên. . Ở chế độ tương tự, việc chạy một mô hình lớn ở phía thiết bị đầu cuối cũng yêu cầu kiến trúc AI kết hợp để cho phép khối lượng công việc AI được phân phối và điều phối giữa đám mây và thiết bị đầu cuối biên,** cho phép các nhà sản xuất điện thoại di động sử dụng sức mạnh tính toán của thiết bị đầu cuối biên để giảm chi phí. Ngoài việc xem xét chi phí này, các mô hình lớn có thể được triển khai tại địa phương.

Ngoài ra, với tư cách là vật dụng cá nhân của mọi người, điện thoại di động là nơi dữ liệu được tạo ra và một lượng lớn dữ liệu riêng tư cũng được lưu trữ cục bộ, nếu có thể triển khai cục bộ, nó sẽ bảo vệ các cá nhân về mặt bảo mật và quyền riêng tư .

Điều này dẫn đến vấn đề thứ hai, nếu bạn muốn sử dụng nhiều khả năng phía cuối hơn để chạy các mô hình lớn, làm thế nào bạn có thể làm cho mức tiêu thụ năng lượng của điện thoại di động rất thấp, đồng thời làm cho mô hình hiệu quả hơn?

Qualcomm từng tuyên bố rằng khả năng chính để triển khai các mô hình lớn cho các thiết bị cục bộ như điện thoại di động nằm ở khả năng tối ưu hóa phần cứng và phần mềm AI toàn diện của Qualcomm, bao gồm Bộ công cụ cải tiến mô hình AI của Qualcomm (AIMET), Qualcomm AI Engine và các công nghệ Qualcomm Related như ngăn xếp phần mềm AI có thể nén khối lượng mô hình, tăng tốc suy luận và giảm độ trễ thời gian chạy cũng như mức tiêu thụ điện năng. Hou Jilei, phó chủ tịch toàn cầu của Qualcomm và trưởng bộ phận nghiên cứu AI của Qualcomm, từng đề cập rằng một phần quan trọng trong nghiên cứu và phát triển AI hiệu quả cao của Qualcomm là nghiên cứu hiệu quả mô hình tổng thể, mục đích là giảm mô hình AI theo nhiều hướng để nó có thể chạy hiệu quả trên phần cứng. .

Nén mô hình đơn lẻ là một khó khăn không nhỏ. Một số nén mô hình sẽ làm giảm hiệu suất của các mô hình lớn và một số phương pháp kỹ thuật có thể đạt được nén không mất dữ liệu, tất cả đều yêu cầu các nỗ lực kỹ thuật theo các hướng khác nhau với sự trợ giúp của các công cụ khác nhau.

Những khả năng phần cứng và phần mềm quan trọng này là một thách thức lớn đối với các nhà sản xuất điện thoại di động. Ngày nay, nhiều nhà sản xuất điện thoại di động đã thực hiện bước đầu tiên để chạy các mô hình lớn trên điện thoại di động. Tiếp theo, làm thế nào để một mô hình lớn tốt hơn phù hợp với từng điện thoại di động một cách kinh tế và hiệu quả hơn là một bước khó khăn hơn và quan trọng hơn.

Cuộc phiêu lưu chỉ mới bắt đầu.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.