OPML: Học máy với Hệ thống Tổng hợp Lạc quan

2023-08-02 01:10:18

Nguồn: github; Biên dịch: MarsBit

TL;DR

Chúng tôi đề xuất OPML (Học máy lạc quan), có thể sử dụng các phương pháp lạc quan để lập luận mô hình AI và đào tạo/tinh chỉnh các hệ thống chuỗi khối.

So với ZKML, OPML có thể cung cấp các dịch vụ ML chi phí thấp và hiệu quả cao. Yêu cầu tham gia đối với OPML thấp: giờ đây chúng tôi có thể chạy OPML với các mô hình ngôn ngữ lớn như 7B-LLaMA (kích thước mô hình ~26GB) trên PC thông thường không có GPU.

OPML áp dụng các trò chơi xác minh (tương tự như hệ thống Truebit và Optimistic Rollup) để đảm bảo tính phân cấp và sự đồng thuận có thể kiểm chứng của các dịch vụ ML.

Người yêu cầu trước tiên bắt đầu tác vụ dịch vụ ML.
Sau đó, máy chủ hoàn thành nhiệm vụ dịch vụ ML và gửi kết quả tới chuỗi.
Người xác minh sẽ xác minh kết quả. Giả sử rằng có một trình xác thực tuyên bố rằng kết quả là sai. Nó bắt đầu trò chơi xác minh với máy chủ (thỏa thuận hai bên) và cố gắng bác bỏ khiếu nại bằng cách chỉ ra một bước sai cụ thể.
Cuối cùng, quá trình phân xử trọng tài một bước diễn ra trên hợp đồng thông minh.

Trò chơi xác minh một giai đoạn

Giao thức xác định chính xác một pha hoạt động tương tự như ủy quyền tính toán (RDoC), trong đó giả định rằng hai hoặc nhiều bên (với ít nhất một bên trung thực) thực hiện cùng một quy trình. Sau đó, cả hai bên có thể đặt câu hỏi cho nhau một cách chính xác để xác định các bước tranh chấp. Gửi các bước tới một thẩm phán ít tính toán hơn (hợp đồng thông minh trên chuỗi khối) để phân xử.

Trong OPML một giai đoạn:

Chúng tôi đã xây dựng một máy ảo (VM) để thực thi ngoài chuỗi và phân xử trên chuỗi. Chúng tôi đảm bảo tính tương đương của máy ảo ngoài chuỗi và máy ảo trên chuỗi được triển khai trên các hợp đồng thông minh.
Để đảm bảo tính hiệu quả của suy luận mô hình AI trong các máy ảo, chúng tôi đã triển khai một thư viện DNN nhẹ được thiết kế dành riêng cho mục đích này, thay vì dựa vào các khung ML phổ biến như Tensorflow hoặc PyTorch. Ngoài ra, một tập lệnh được cung cấp để chuyển đổi các mô hình Tensorflow và PyTorch sang thư viện nhẹ này.
Sử dụng công nghệ biên dịch chéo để biên dịch mã lý luận của mô hình trí tuệ nhân tạo thành các hướng dẫn chương trình máy ảo.
Hình ảnh máy ảo được quản lý bằng cây Merkle và chỉ gốc Merkle mới được tải lên hợp đồng thông minh trên chuỗi. (Merkel root đại diện cho trạng thái máy ảo)

Thỏa thuận hai bên sẽ giúp xác định bước tranh chấp, sẽ được gửi đến hợp đồng trọng tài trên chuỗi khối

Hiệu suất: Chúng tôi đã thử nghiệm mô hình AI cơ bản (mô hình DNN để phân loại MNIST) trên PC. Chúng tôi có thể hoàn thành suy luận DNN trong vòng 2 giây trong VM và toàn bộ quá trình thử thách có thể được hoàn thành trong vòng 2 phút trong môi trường thử nghiệm Ethereum cục bộ.

Trò chơi xác minh nhiều giai đoạn

Hạn chế của các giao thức xác định chính xác một pha

Trò chơi xác minh một giai đoạn có một nhược điểm nghiêm trọng: tất cả các tính toán phải được thực hiện bên trong một máy ảo (VM), điều này khiến chúng tôi không thể khai thác hết tiềm năng tăng tốc GPU/TPU hoặc xử lý song song. Do đó, giới hạn này cản trở nghiêm trọng hiệu quả của suy luận mô hình lớn, điều này cũng phù hợp với giới hạn của giao thức RDoC hiện tại.

Chuyển đổi sang Giao thức Nhiều Giai đoạn

Để giải quyết các hạn chế do giao thức một pha áp đặt và đảm bảo rằng OPML có thể đạt được mức hiệu suất tương đương với môi trường gốc, chúng tôi đề xuất một phần mở rộng cho giao thức nhiều pha. Sử dụng phương pháp này, chúng ta chỉ cần thực hiện các tính toán trong VM ở giai đoạn cuối, tương tự như giao thức một giai đoạn. Đối với các giai đoạn khác, chúng tôi có thể linh hoạt thực hiện các tính toán để đạt được chuyển đổi trạng thái trong môi trường gốc, tận dụng sức mạnh của CPU, GPU, TPU và thậm chí cả quá trình xử lý song song. Bằng cách giảm sự phụ thuộc vào VM, chúng tôi giảm đáng kể chi phí hoạt động và do đó cải thiện đáng kể hiệu suất thực thi của OPML, gần như tương tự với môi trường gốc.

Hình dưới đây minh họa một trò chơi xác minh bao gồm hai giai đoạn (k = 2). Trong Giai đoạn 1, quá trình này giống như một trò chơi xác minh một giai đoạn, trong đó mỗi chuyển đổi trạng thái tương ứng với một VM uop duy nhất thay đổi trạng thái của máy ảo. Trong giai đoạn 2, các chuyển đổi trạng thái tương ứng với "các lệnh lớn" chứa nhiều thao tác thay đổi bối cảnh tính toán.

Người cam kết và người xác minh trước tiên sẽ sử dụng thỏa thuận hai bên để bắt đầu giai đoạn thứ hai của trò chơi xác minh để xác định các bước tranh chấp về "đơn đặt hàng lớn". Bước này sẽ gửi đến giai đoạn tiếp theo, giai đoạn -1. Giai đoạn đầu tiên hoạt động giống như trò chơi xác minh một giai đoạn. Thỏa thuận hai bên giai đoạn 1 sẽ giúp xác định các bước tranh chấp trên VM uops. Bước này sẽ được gửi đến hợp đồng trọng tài trên blockchain.

Để đảm bảo tính toàn vẹn và bảo mật của quá trình chuyển đổi sang giai đoạn tiếp theo, chúng tôi dựa vào cây Merkle. Hoạt động này bao gồm trích xuất các cây con Merkle từ các giai đoạn cấp cao hơn, do đó đảm bảo quá trình xác minh được tiếp tục liền mạch.

OPML nhiều giai đoạn

Trong phần trình bày này, chúng tôi đề xuất cách tiếp cận OPML hai giai đoạn được sử dụng trong mô hình LLaMA:

Quá trình tính toán của máy học (ML), đặc biệt là deep neural network (DNN), có thể biểu diễn dưới dạng biểu đồ tính toán, ký hiệu là G. Biểu đồ bao gồm các nút tính toán khác nhau có khả năng lưu trữ kết quả tính toán trung gian.
Suy luận mô hình DNN thực chất là quá trình tính toán trên đồ thị tính toán trên. Toàn bộ biểu đồ có thể được coi là trạng thái suy luận (bối cảnh tính toán trong Giai đoạn 2). Khi mỗi nút được tính toán, kết quả được lưu trữ trong nút đó, do đó chuyển biểu đồ tính toán sang trạng thái tiếp theo.

Do đó, trước tiên chúng ta có thể thực hiện trò chơi xác minh trên biểu đồ tính toán (trong giai đoạn 2). Trong giai đoạn thứ hai của trò chơi xác minh, việc tính toán nút biểu đồ có thể được thực hiện trong môi trường cục bộ bằng cách sử dụng CPU hoặc GPU đa luồng. Thỏa thuận hai bên sẽ giúp xác định vị trí nút đang tranh chấp mà tính toán sẽ được gửi đến giai đoạn tiếp theo (giai đoạn 1) của thỏa thuận hai bên.
Trong giai đoạn chia đôi đầu tiên, chúng tôi chuyển đổi tính toán của một nút đơn lẻ thành hướng dẫn máy ảo (VM), tương tự như những gì được thực hiện trong giao thức một giai đoạn.

Điều đáng chú ý là chúng tôi dự đoán việc giới thiệu các phương pháp OPML nhiều giai đoạn (bao gồm nhiều hơn hai giai đoạn) khi việc tính toán một nút trong biểu đồ tính toán vẫn còn phức tạp về mặt tính toán. Phần mở rộng này sẽ cải thiện hơn nữa hiệu suất tổng thể và hiệu quả của quá trình xác minh.

Cải tiến hiệu suất

Ở đây, chúng tôi cung cấp một cuộc thảo luận và phân tích ngắn gọn về khung xác minh nhiều giai đoạn được đề xuất của chúng tôi.

Giả sử rằng có n nút trong biểu đồ tính toán DNN, mỗi nút cần tìm nạp m vi lệnh VM để hoàn thành phép tính trong VM. Giả sử rằng tỷ lệ tăng tốc điện toán cho mỗi nút sử dụng GPU hoặc điện toán song song là α. Tỷ lệ này thể hiện tốc độ tăng tốc mà GPU hoặc điện toán song song đạt được và có thể đạt đến giá trị đáng kể, thường nhanh hơn hàng chục hoặc thậm chí hàng trăm lần so với thực thi máy ảo.

Dựa trên những cân nhắc này, chúng tôi rút ra kết luận sau:

OPML hai giai đoạn vượt trội hơn so với OPML một giai đoạn và nhận ra khả năng tăng tốc tính toán α lần. Việc sử dụng xác minh nhiều giai đoạn cho phép chúng tôi tận dụng sức mạnh tính toán được tăng tốc do GPU hoặc quá trình xử lý song song cung cấp, từ đó cải thiện đáng kể hiệu suất tổng thể.
Khi so sánh kích thước của các cây Merkle, chúng tôi thấy rằng trong OPML hai tầng, kích thước là O(m+n), trong khi ở OPML một tầng, kích thước lớn hơn đáng kể so với O(mn). Việc giảm kích thước cây Merkle càng làm nổi bật hiệu quả và khả năng mở rộng của thiết kế nhiều giai đoạn.

Tóm lại, khung xác minh nhiều giai đoạn cung cấp các cải tiến hiệu suất đáng kể, đảm bảo tính toán hiệu quả hơn và nhanh hơn, đặc biệt là khi khai thác khả năng tăng tốc của GPU hoặc xử lý song song. Hơn nữa, kích thước cây Merkle giảm làm tăng hiệu quả và khả năng mở rộng của hệ thống, làm cho OPML nhiều giai đoạn trở thành lựa chọn cho các ứng dụng khác nhau.

Tính nhất quán và tính quyết định

Trong OPML, việc đảm bảo tính nhất quán của kết quả ML là rất quan trọng.

Trong quá trình thực thi riêng các phép tính DNN, đặc biệt là trên các nền tảng phần cứng khác nhau, do các đặc điểm của số dấu phẩy động, có thể xảy ra sự khác biệt trong kết quả thực thi. Ví dụ: các phép tính song song liên quan đến các số dấu phẩy động, chẳng hạn như (a+b)+c và a+(b+c), thường tạo ra các kết quả khác nhau do lỗi làm tròn số. Ngoài ra, các yếu tố như ngôn ngữ lập trình, phiên bản trình biên dịch và hệ điều hành đều có thể ảnh hưởng đến kết quả tính toán của các số dấu phẩy động, dẫn đến kết quả ML không nhất quán hơn nữa.

Để giải quyết những thách thức này và đảm bảo tính nhất quán của OPML, chúng tôi đã áp dụng hai phương pháp chính:

Sử dụng thuật toán điểm cố định hay còn gọi là công nghệ lượng tử hóa. Kỹ thuật này cho phép chúng tôi biểu diễn và thực hiện các phép tính bằng cách sử dụng độ chính xác cố định thay vì các số dấu phẩy động. Bằng cách này, chúng tôi giảm thiểu ảnh hưởng của lỗi làm tròn dấu phẩy động, dẫn đến kết quả nhất quán và đáng tin cậy hơn.
Chúng tôi sử dụng các thư viện dấu phẩy động dựa trên phần mềm được thiết kế để duy trì chức năng nhất quán trên các nền tảng khác nhau. Các thư viện này đảm bảo tính nhất quán trên nhiều nền tảng và tính xác định của kết quả ML, bất kể cấu hình phần cứng hoặc phần mềm cơ bản.

Bằng cách kết hợp các thư viện số học dấu phẩy động và số học cố định dựa trên phần mềm, chúng tôi đã thiết lập một nền tảng vững chắc cho các kết quả ML nhất quán và đáng tin cậy trong khuôn khổ OPML. Sự phối hợp các kỹ thuật này cho phép chúng tôi vượt qua những thách thức vốn có do các biến dấu phẩy động và sự khác biệt của nền tảng đặt ra, cuối cùng là nâng cao tính toàn vẹn và độ tin cậy của các tính toán OPML.

OPML so với ZKML

*: Trong khung OPML hiện tại, trọng tâm chính của chúng tôi là suy luận về các mô hình ML, cho phép tính toán mô hình hiệu quả và an toàn. Tuy nhiên, cần phải nhấn mạnh rằng khung của chúng tôi cũng hỗ trợ quá trình đào tạo, khiến nó trở thành một giải pháp chung cho các tác vụ học máy khác nhau.

Lưu ý rằng OPML vẫn đang được phát triển. Nếu bạn quan tâm đến việc trở thành một phần của chương trình thú vị này và đóng góp cho dự án OPML, vui lòng liên hệ với chúng tôi.

Xem bản gốc

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Phần thưởng
Thích
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
BTC Hits New High
92k Phổ biến
ETH Breaks $3,000
45k Phổ biến
VIP Exclusive Airdrop Carnival
15k Phổ biến
4Pump.Fun Debuts on Gate
4k Phổ biến
5Fed June Meeting Minutes
5k Phổ biến
6Join Gate VIP to Win MacBook
29k Phổ biến
7Trump Tariff Hikes
16k Phổ biến
8Gate xStocks Trading Share
23k Phổ biến
9HK Stablecoin Rules
13k Phổ biến
10Truth Social Crypto ETF
3k Phổ biến

Ghim

sơ đồ trang web