AI modeli muhakemesi ve blockchain sistemlerinin eğitimi/ince ayarı için İyimser yöntemleri kullanabilen OPML'yi (İyimser Makine Öğrenimi) öneriyoruz.
ZKML ile karşılaştırıldığında OPML, düşük maliyetli ve yüksek verimli makine öğrenimi hizmetleri sağlayabilir. OPML için katılım gereksinimleri düşüktür: OPML'yi artık GPU'suz sıradan bir bilgisayarda 7B-LLaMA (model boyutu ~26GB) gibi büyük dil modelleriyle çalıştırabiliyoruz.
OPML, makine öğrenimi hizmetlerinin ademi merkeziyetçiliğini ve doğrulanabilir mutabakatını garanti etmek için bir doğrulama oyunu (Truebit ve Optimistic Rollup sistemlerine benzer) kullanır.
İstek sahibi önce bir ML hizmeti görevi başlatır.
Daha sonra sunucu, makine öğrenimi hizmeti görevini tamamlar ve sonucu zincire gönderir.
Doğrulayıcı, sonucu doğrulayacaktır. Sonucun yanlış olduğunu iddia eden bir doğrulayıcı olduğunu varsayalım. Sunucuyla (iki taraflı anlaşma) bir doğrulama oyunu başlatır ve belirli bir yanlış adımı belirleyerek iddiayı çürütmeye çalışır.
Son olarak, akıllı sözleşme üzerinde tek adımlı bir tahkim gerçekleşir.
Tek Aşamalı Doğrulama Oyunu
Tek aşamalı nokta belirleme protokolü, iki veya daha fazla tarafın (en az bir dürüst tarafla) aynı prosedürü uyguladığının varsayıldığı hesaplama delegasyonuna (RDoC) benzer şekilde çalışır. Daha sonra her iki taraf da ihtilaflı adımları belirlemek için birbirini kesin bir şekilde sorgulayabilir. Tahkim için adımları hesaplama açısından daha az güçlü bir yargıca (blok zincirinde akıllı sözleşme) gönderin.
Tek aşamalı OPML'de:
Zincir dışı yürütme ve zincir üstü tahkim için bir sanal makine (VM) oluşturduk. Akıllı sözleşmelerde uygulanan zincir dışı VM'ler ile zincir üstü VM'lerin eşdeğerliğini garanti ediyoruz.
Sanal makinelerde yapay zeka modeli çıkarımının verimliliğini sağlamak için, Tensorflow veya PyTorch gibi popüler makine öğrenimi çerçevelerine güvenmek yerine, özellikle bu amaç için tasarlanmış hafif bir DNN kitaplığı uyguladık. Ek olarak, Tensorflow ve PyTorch modellerini bu hafif kitaplığa dönüştüren bir betik sağlanmıştır.
Yapay zeka modeli muhakeme kodunu sanal makine program talimatlarına derlemek için çapraz derleme teknolojisini kullanın.
Sanal makine görüntüsü bir Merkle ağacı ile yönetilir ve zincirdeki akıllı sözleşmeye yalnızca Merkle kökü yüklenir. (Merkel kökü, sanal makine durumunu temsil eder)
İki taraflı anlaşma, blok zincirindeki tahkim sözleşmesine gönderilecek olan anlaşmazlık adımının bulunmasına yardımcı olacaktır.
Performans: PC'de temel bir AI modelini (MNIST sınıflandırması için DNN modeli) test ettik. DNN çıkarımını sanal makinede 2 saniye içinde tamamlayabildik ve yerel Ethereum test ortamında tüm meydan okuma süreci 2 dakika içinde tamamlanabiliyor.
Çok aşamalı doğrulama oyunu
Tek Aşamalı Nokta Tespiti Protokollerinin Sınırlamaları
Tek aşamalı doğrulama oyununun ciddi bir dezavantajı vardır: tüm hesaplamalar, GPU/TPU hızlandırma veya paralel işlemenin tam potansiyelinden yararlanmamızı engelleyen bir sanal makine (VM) içinde yapılmalıdır. Bu nedenle, bu sınırlama, mevcut RDoC protokolünün sınırlamasıyla da tutarlı olan büyük model çıkarımının verimliliğini ciddi şekilde engeller.
Çok Aşamalı Protokole Geçiş
Tek fazlı protokolün getirdiği sınırlamaları ele almak ve OPML'nin yerel ortamlarla karşılaştırılabilir performans seviyelerine ulaşabilmesini sağlamak için çok fazlı protokolün bir uzantısını öneriyoruz. Bu yaklaşımı kullanarak, tek aşamalı bir protokole benzer şekilde VM'de yalnızca son aşamada hesaplamalar yapmamız gerekiyor. Diğer aşamalar için, CPU'ların, GPU'ların, TPU'ların ve hatta paralel işlemenin gücünden yararlanarak yerel bir ortamda durum geçişleri elde etmek için hesaplamalar yapma esnekliğine sahibiz. VM'ye bağımlılığı azaltarak ek yükü önemli ölçüde azaltıyoruz ve böylece OPML'nin yürütme performansını neredeyse yerel ortama benzer şekilde önemli ölçüde iyileştiriyoruz.
Aşağıdaki şekil, iki aşamadan (k = 2) oluşan bir doğrulama oyununu göstermektedir. Aşama 1'de süreç, her durum geçişinin sanal makinenin durumunu değiştiren tek bir VM uop'a karşılık geldiği tek aşamalı bir doğrulama oyununa benzer. 2. aşamada, durum geçişleri, hesaplama bağlamını değiştiren çoklu uop'lar içeren "büyük talimatlara" karşılık gelir.
Görevlendirenler ve doğrulayıcılar, "büyük sipariş" konusundaki tartışmalı adımları bulmak için doğrulama oyununun ikinci aşamasını başlatmak için önce ikili anlaşmayı kullanacaklar. Bu adım bir sonraki aşamaya, aşama -1'e gönderir. İlk aşama, tek aşamalı bir doğrulama oyunu gibi çalışır. 1. Aşama ikili anlaşma, VM uop'larında ihtilaflı adımların bulunmasına yardımcı olacaktır. Bu adım, blok zincirindeki tahkim sözleşmesine gönderilecektir.
Bir sonraki aşamaya geçişin bütünlüğünü ve güvenliğini sağlamak için Merkle ağaçlarına güveniyoruz. Bu işlem, Merkle alt ağaçlarının üst düzey aşamalardan çıkarılmasını içerir, böylece doğrulama sürecinin sorunsuz bir şekilde devam etmesini garanti eder.
Çok aşamalı OPML
Bu sunumda, LLaMA modelinde kullanılan iki aşamalı OPML yaklaşımını öneriyoruz:
Makine öğreniminin (ML), özellikle derin sinir ağının (DNN) hesaplama süreci, G ile gösterilen bir hesaplama grafiği olarak ifade edilebilir. Grafik, ara hesaplama sonuçlarını saklayabilen çeşitli hesaplama düğümlerinden oluşur.
DNN modeli muhakemesi esasen yukarıdaki hesaplama grafiği üzerinde bir hesaplama işlemidir. Grafiğin tamamı çıkarım durumu olarak görülebilir (Faz-2'deki hesaplama bağlamı). Her düğüm hesaplanırken, sonuç o düğümde depolanır ve böylece hesaplama grafiği bir sonraki duruma ilerler.
Bu nedenle, doğrulama oyununu önce hesaplamalı grafik üzerinde gerçekleştirebiliriz (aşama-2'de). Doğrulama oyununun ikinci aşamasında, çok iş parçacıklı CPU veya GPU kullanılarak yerel ortamda grafik düğümünün hesaplanması yapılabilir. İkili anlaşma, hesaplaması ikili anlaşmanın bir sonraki aşamasına (faz-1) gönderilecek olan ihtilaflı düğümün bulunmasına yardımcı olacaktır.
Birinci aşama ikiye bölmede, tek fazlı protokolde yapılana benzer şekilde, tek bir düğümün hesaplamasını sanal makine (VM) talimatlarına dönüştürürüz.
Hesaplama grafiğindeki tek bir düğümün hesaplanması hala hesaplama açısından karmaşık olduğunda, çok aşamalı OPML yöntemlerinin (ikiden fazla aşamadan oluşan) kullanılmasını beklediğimizi belirtmekte fayda var. Bu uzantı, doğrulama sürecinin genel verimliliğini ve etkinliğini daha da artıracaktır.
Performans geliştirmeleri
Burada, önerilen çok aşamalı doğrulama çerçevemizin kısa bir tartışmasını ve analizini sunuyoruz.
DNN hesaplama grafiğinde n düğüm olduğunu varsayarsak, her düğümün VM'deki hesaplamayı tamamlamak için m VM mikro yönergesini getirmesi gerekir. GPU veya paralel bilgi işlem kullanan her düğüm için bilgi işlem hızlanma oranının α olduğunu varsayalım. Bu oran, GPU veya paralel bilgi işlem tarafından elde edilen hızı temsil eder ve önemli değerlere, genellikle VM yürütmesinden onlarca hatta yüzlerce kat daha hızlı ulaşabilir.
Bu değerlendirmelere dayanarak, aşağıdaki sonuçları çıkarıyoruz:
İki aşamalı OPML, tek aşamalı OPML'den üstündür ve hesaplama ivmesini α kat gerçekleştirir. Çok aşamalı doğrulamanın kullanılması, GPU'lar veya paralel işleme tarafından sağlanan hızlandırılmış bilgi işlem gücünden yararlanmamıza olanak tanır ve böylece genel performansı önemli ölçüde artırır.
Merkle ağaçlarının boyutunu karşılaştırdığımızda, iki aşamalı OPML'de boyutun O(m+n) olduğunu, tek aşamalı OPML'de ise boyutun O(mn)'den önemli ölçüde daha büyük olduğunu görüyoruz. Merkle ağacı boyutundaki azalma, çok aşamalı tasarımın verimliliğini ve ölçeklenebilirliğini daha da vurgular.
Özetle, çok aşamalı doğrulama çerçevesi, özellikle GPU'ların veya paralel işlemenin hızlandırma özelliklerinden yararlanılırken daha verimli ve daha hızlı hesaplamalar sağlayarak önemli performans iyileştirmeleri sağlar. Ayrıca, küçültülmüş Merkle ağacı boyutu, sistemin etkinliğini ve ölçeklenebilirliğini artırarak çok aşamalı OPML'yi çeşitli uygulamalar için tercih haline getirir.
Tutarlılık ve Determinizm
OPML'de, makine öğrenimi sonuçlarının tutarlılığının sağlanması kritik öneme sahiptir.
DNN hesaplamalarının yerel olarak yürütülmesi sırasında, özellikle farklı donanım platformlarında, kayan noktalı sayıların özelliklerinden dolayı yürütme sonuçlarında farklılıklar meydana gelebilir. Örneğin, (a+b)+c ve a+(b+c) gibi kayan noktalı sayıları içeren paralel hesaplamalar genellikle yuvarlama hatalarından dolayı farklı sonuçlar verir. Ayrıca, programlama dili, derleyici sürümü ve işletim sistemi gibi faktörlerin tümü, kayan noktalı sayıların hesaplama sonuçlarını etkileyerek ML sonuçlarında daha fazla tutarsızlığa yol açabilir.
Bu zorlukların üstesinden gelmek ve OPML'nin tutarlılığını garanti etmek için iki temel yaklaşımı benimsedik:
Niceleme teknolojisi olarak da bilinen sabit nokta algoritmasının kullanılması. Bu teknik, kayan noktalı sayılar yerine sabit hassasiyet kullanarak hesaplamalar yapmamızı ve gerçekleştirmemizi sağlar. Bunu yaparak, kayan nokta yuvarlama hatalarının etkilerini azaltarak daha güvenilir ve tutarlı sonuçlar elde ediyoruz.
Farklı platformlarda tutarlı işlevsellik sağlamak için tasarlanmış yazılım tabanlı kayan nokta kitaplıklarından yararlanıyoruz. Bu kitaplıklar, altta yatan donanım veya yazılım yapılandırmasından bağımsız olarak platformlar arası tutarlılığı ve makine öğrenimi sonuçlarının belirleyiciliğini sağlar.
Sabit nokta aritmetiği ile yazılım tabanlı kayan nokta kitaplıklarını birleştirerek, OPML çerçevesi içinde tutarlı ve güvenilir makine öğrenimi sonuçları için sağlam bir temel oluşturduk. Tekniklerin bu koordinasyonu, kayan noktalı değişkenlerin ve platform farklılıklarının ortaya çıkardığı doğal zorlukların üstesinden gelmemizi sağlayarak nihai olarak OPML hesaplamalarının bütünlüğünü ve güvenilirliğini geliştirmemizi sağlar.
OPML ve ZKML
*: Mevcut OPML çerçevesinde, ana odak noktamız, verimli ve güvenli model hesaplaması sağlayan ML modellerinin çıkarımıdır. Ancak, çerçevemizin eğitim sürecini de desteklediği ve onu çeşitli makine öğrenimi görevleri için genel bir çözüm haline getirdiği vurgulanmalıdır.
OPML'nin hala geliştirme aşamasında olduğunu unutmayın. Bu heyecan verici programın bir parçası olmak ve OPML projesine katkıda bulunmak istiyorsanız, lütfen bizimle iletişime geçmekten çekinmeyin.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
OPML: Optimistic Toplama Sistemi ile Makine Öğrenimi
TL;DR
AI modeli muhakemesi ve blockchain sistemlerinin eğitimi/ince ayarı için İyimser yöntemleri kullanabilen OPML'yi (İyimser Makine Öğrenimi) öneriyoruz.
ZKML ile karşılaştırıldığında OPML, düşük maliyetli ve yüksek verimli makine öğrenimi hizmetleri sağlayabilir. OPML için katılım gereksinimleri düşüktür: OPML'yi artık GPU'suz sıradan bir bilgisayarda 7B-LLaMA (model boyutu ~26GB) gibi büyük dil modelleriyle çalıştırabiliyoruz.
OPML, makine öğrenimi hizmetlerinin ademi merkeziyetçiliğini ve doğrulanabilir mutabakatını garanti etmek için bir doğrulama oyunu (Truebit ve Optimistic Rollup sistemlerine benzer) kullanır.
Tek Aşamalı Doğrulama Oyunu
Tek aşamalı nokta belirleme protokolü, iki veya daha fazla tarafın (en az bir dürüst tarafla) aynı prosedürü uyguladığının varsayıldığı hesaplama delegasyonuna (RDoC) benzer şekilde çalışır. Daha sonra her iki taraf da ihtilaflı adımları belirlemek için birbirini kesin bir şekilde sorgulayabilir. Tahkim için adımları hesaplama açısından daha az güçlü bir yargıca (blok zincirinde akıllı sözleşme) gönderin.
Tek aşamalı OPML'de:
Performans: PC'de temel bir AI modelini (MNIST sınıflandırması için DNN modeli) test ettik. DNN çıkarımını sanal makinede 2 saniye içinde tamamlayabildik ve yerel Ethereum test ortamında tüm meydan okuma süreci 2 dakika içinde tamamlanabiliyor.
Çok aşamalı doğrulama oyunu
Tek Aşamalı Nokta Tespiti Protokollerinin Sınırlamaları
Tek aşamalı doğrulama oyununun ciddi bir dezavantajı vardır: tüm hesaplamalar, GPU/TPU hızlandırma veya paralel işlemenin tam potansiyelinden yararlanmamızı engelleyen bir sanal makine (VM) içinde yapılmalıdır. Bu nedenle, bu sınırlama, mevcut RDoC protokolünün sınırlamasıyla da tutarlı olan büyük model çıkarımının verimliliğini ciddi şekilde engeller.
Çok Aşamalı Protokole Geçiş
Tek fazlı protokolün getirdiği sınırlamaları ele almak ve OPML'nin yerel ortamlarla karşılaştırılabilir performans seviyelerine ulaşabilmesini sağlamak için çok fazlı protokolün bir uzantısını öneriyoruz. Bu yaklaşımı kullanarak, tek aşamalı bir protokole benzer şekilde VM'de yalnızca son aşamada hesaplamalar yapmamız gerekiyor. Diğer aşamalar için, CPU'ların, GPU'ların, TPU'ların ve hatta paralel işlemenin gücünden yararlanarak yerel bir ortamda durum geçişleri elde etmek için hesaplamalar yapma esnekliğine sahibiz. VM'ye bağımlılığı azaltarak ek yükü önemli ölçüde azaltıyoruz ve böylece OPML'nin yürütme performansını neredeyse yerel ortama benzer şekilde önemli ölçüde iyileştiriyoruz.
Aşağıdaki şekil, iki aşamadan (k = 2) oluşan bir doğrulama oyununu göstermektedir. Aşama 1'de süreç, her durum geçişinin sanal makinenin durumunu değiştiren tek bir VM uop'a karşılık geldiği tek aşamalı bir doğrulama oyununa benzer. 2. aşamada, durum geçişleri, hesaplama bağlamını değiştiren çoklu uop'lar içeren "büyük talimatlara" karşılık gelir.
Görevlendirenler ve doğrulayıcılar, "büyük sipariş" konusundaki tartışmalı adımları bulmak için doğrulama oyununun ikinci aşamasını başlatmak için önce ikili anlaşmayı kullanacaklar. Bu adım bir sonraki aşamaya, aşama -1'e gönderir. İlk aşama, tek aşamalı bir doğrulama oyunu gibi çalışır. 1. Aşama ikili anlaşma, VM uop'larında ihtilaflı adımların bulunmasına yardımcı olacaktır. Bu adım, blok zincirindeki tahkim sözleşmesine gönderilecektir.
Bir sonraki aşamaya geçişin bütünlüğünü ve güvenliğini sağlamak için Merkle ağaçlarına güveniyoruz. Bu işlem, Merkle alt ağaçlarının üst düzey aşamalardan çıkarılmasını içerir, böylece doğrulama sürecinin sorunsuz bir şekilde devam etmesini garanti eder.
Çok aşamalı OPML
Bu sunumda, LLaMA modelinde kullanılan iki aşamalı OPML yaklaşımını öneriyoruz:
Hesaplama grafiğindeki tek bir düğümün hesaplanması hala hesaplama açısından karmaşık olduğunda, çok aşamalı OPML yöntemlerinin (ikiden fazla aşamadan oluşan) kullanılmasını beklediğimizi belirtmekte fayda var. Bu uzantı, doğrulama sürecinin genel verimliliğini ve etkinliğini daha da artıracaktır.
Performans geliştirmeleri
Burada, önerilen çok aşamalı doğrulama çerçevemizin kısa bir tartışmasını ve analizini sunuyoruz.
DNN hesaplama grafiğinde n düğüm olduğunu varsayarsak, her düğümün VM'deki hesaplamayı tamamlamak için m VM mikro yönergesini getirmesi gerekir. GPU veya paralel bilgi işlem kullanan her düğüm için bilgi işlem hızlanma oranının α olduğunu varsayalım. Bu oran, GPU veya paralel bilgi işlem tarafından elde edilen hızı temsil eder ve önemli değerlere, genellikle VM yürütmesinden onlarca hatta yüzlerce kat daha hızlı ulaşabilir.
Bu değerlendirmelere dayanarak, aşağıdaki sonuçları çıkarıyoruz:
İki aşamalı OPML, tek aşamalı OPML'den üstündür ve hesaplama ivmesini α kat gerçekleştirir. Çok aşamalı doğrulamanın kullanılması, GPU'lar veya paralel işleme tarafından sağlanan hızlandırılmış bilgi işlem gücünden yararlanmamıza olanak tanır ve böylece genel performansı önemli ölçüde artırır.
Merkle ağaçlarının boyutunu karşılaştırdığımızda, iki aşamalı OPML'de boyutun O(m+n) olduğunu, tek aşamalı OPML'de ise boyutun O(mn)'den önemli ölçüde daha büyük olduğunu görüyoruz. Merkle ağacı boyutundaki azalma, çok aşamalı tasarımın verimliliğini ve ölçeklenebilirliğini daha da vurgular.
Özetle, çok aşamalı doğrulama çerçevesi, özellikle GPU'ların veya paralel işlemenin hızlandırma özelliklerinden yararlanılırken daha verimli ve daha hızlı hesaplamalar sağlayarak önemli performans iyileştirmeleri sağlar. Ayrıca, küçültülmüş Merkle ağacı boyutu, sistemin etkinliğini ve ölçeklenebilirliğini artırarak çok aşamalı OPML'yi çeşitli uygulamalar için tercih haline getirir.
Tutarlılık ve Determinizm
OPML'de, makine öğrenimi sonuçlarının tutarlılığının sağlanması kritik öneme sahiptir.
DNN hesaplamalarının yerel olarak yürütülmesi sırasında, özellikle farklı donanım platformlarında, kayan noktalı sayıların özelliklerinden dolayı yürütme sonuçlarında farklılıklar meydana gelebilir. Örneğin, (a+b)+c ve a+(b+c) gibi kayan noktalı sayıları içeren paralel hesaplamalar genellikle yuvarlama hatalarından dolayı farklı sonuçlar verir. Ayrıca, programlama dili, derleyici sürümü ve işletim sistemi gibi faktörlerin tümü, kayan noktalı sayıların hesaplama sonuçlarını etkileyerek ML sonuçlarında daha fazla tutarsızlığa yol açabilir.
Bu zorlukların üstesinden gelmek ve OPML'nin tutarlılığını garanti etmek için iki temel yaklaşımı benimsedik:
Niceleme teknolojisi olarak da bilinen sabit nokta algoritmasının kullanılması. Bu teknik, kayan noktalı sayılar yerine sabit hassasiyet kullanarak hesaplamalar yapmamızı ve gerçekleştirmemizi sağlar. Bunu yaparak, kayan nokta yuvarlama hatalarının etkilerini azaltarak daha güvenilir ve tutarlı sonuçlar elde ediyoruz.
Farklı platformlarda tutarlı işlevsellik sağlamak için tasarlanmış yazılım tabanlı kayan nokta kitaplıklarından yararlanıyoruz. Bu kitaplıklar, altta yatan donanım veya yazılım yapılandırmasından bağımsız olarak platformlar arası tutarlılığı ve makine öğrenimi sonuçlarının belirleyiciliğini sağlar.
Sabit nokta aritmetiği ile yazılım tabanlı kayan nokta kitaplıklarını birleştirerek, OPML çerçevesi içinde tutarlı ve güvenilir makine öğrenimi sonuçları için sağlam bir temel oluşturduk. Tekniklerin bu koordinasyonu, kayan noktalı değişkenlerin ve platform farklılıklarının ortaya çıkardığı doğal zorlukların üstesinden gelmemizi sağlayarak nihai olarak OPML hesaplamalarının bütünlüğünü ve güvenilirliğini geliştirmemizi sağlar.
OPML ve ZKML
*: Mevcut OPML çerçevesinde, ana odak noktamız, verimli ve güvenli model hesaplaması sağlayan ML modellerinin çıkarımıdır. Ancak, çerçevemizin eğitim sürecini de desteklediği ve onu çeşitli makine öğrenimi görevleri için genel bir çözüm haline getirdiği vurgulanmalıdır.
OPML'nin hala geliştirme aşamasında olduğunu unutmayın. Bu heyecan verici programın bir parçası olmak ve OPML projesine katkıda bulunmak istiyorsanız, lütfen bizimle iletişime geçmekten çekinmeyin.