Сучасні системи штучного інтелекту залежать не лише від обчислювальних потужностей і алгоритмів, але й від зворотного зв'язку від людини. Компанії застосовують такі методи оптимізації після навчання, як навчання з використанням зворотного зв'язку від людини (RLHF) та пряма оптимізація переваг (DPO), щоб поліпшити моделі. Ці технології можуть зменшити упередження, забезпечуючи моделі більш якісні та узгоджені відповіді на підказки — це критично важливо для прискорення розвитку ШІ. Оцінка моделей також є ключовою, але лише визначивши, що таке "краще", можна досягти оптимізації моделей.
Ось тут і виникає проблема: компанії неохоче діляться – вони ставляться до даних і процесів навчання як до конфіденційних. Як наслідок, оцінка моделей штучного інтелекту може покладатися лише на обмежену інформацію із закритих систем або статичні контрольні показники, які відірвані від практичного застосування, що серйозно обмежує простір для вдосконалення моделі. Користувачі також знаходяться в сліпій зоні, не знаючи, як їх відгуки вплинуть на модель, і навіть чи буде вона прийнята. Деякі модельні таблиці лідерів і краудсорсингові платформи намагаються підвищити прозорість, але часто не дозволяють користувачам відстежувати свій внесок або забезпечувати відчутну віддачу від участі. Платформи, які заявляють про себе як справедливі та прозорі, часто покладаються на чесність, а не на обов'язкові стандарти.
Ми віримо, що технології криптографії можуть забезпечити прозорість та право власності в цій сірій зоні штучного інтелекту. Блокчейн може допомогти учасникам зручно отримувати винагороди, а також надати розробникам ШІ надійну гарантію якості та походження даних зворотного зв'язку. Користувачі отримують стимул, розробники отримують надійні дані, і всі можуть здійснювати двосторонній аудит на цьому відкритому ринку. Для цього ми очолили інвестиції у споживчий продукт Yupp на суму 33 мільйони доларів у рамках початкового етапу, ця платформа дозволяє кожному безкоштовно досліджувати та порівнювати останні моделі ШІ.
Yupp використовує краудсорсингову модель для оцінки моделей: користувачі вводять підказки, паралельно переглядають кілька відповідей, згенерованих ШІ, а потім обирають найкращу відповідь. Їхній вибір створює уподобання даних "пакет" з цифровим підписом, які є надзвичайно цінними для оптимізації та оцінки після навчання ШІ. Користувачі можуть безкоштовно використовувати останні моделі та отримувати винагороду за наданий зворотний зв'язок.
Дизайн Yupp перетворює людське судження на відновлювальний економічний ресурс. З появою нових інтерактивних даних старі дані "втрачають актуальність", формуючи природне колесо: більше використання приносить свіжіші оцінки; свіжіші оцінки породжують якісніші моделі; якісніші моделі приваблюють більше користувачів. Усі учасники — незалежно від того, чи є вони звичайними користувачами, чи розробниками AI-моделей — можуть приєднатися до цього процесу і бачити прозорі правила, які підходять для всіх, що забезпечує збереження надійної нейтральності ринку. Ніхто не може приховати оцінки, і ніхто не може маніпулювати винагородами або результатами.
Засновницька команда має глибокий досвід у галузях AI та криптовалют. Вони спільно розробляли споживчі продукти машинного навчання на ранньому етапі Twitter. Панкадж Гупта раніше був глобальним керівником інженерії споживчого сегмента в Google Pay та Coinbase, а Гілад Мішне був керівником машинного навчання в GoogleX. Стартап- команда об'єднала старших інженерів з Google, Coinbase та провідних лабораторій.
Штучному інтелекту необхідна надійна та стійка система оцінювання, заснована на масштабних людських внесках, а технології блокчейн є машиною довіри для досягнення цієї мети. Завдяки тому, що користувачі з усього світу вносять свої відгуки для покращення моделей, Yupp прагне стати основним рівнем оцінювання для майбутнього ШІ. Ми пишаємося тим, що можемо підтримувати Yupp, і з нетерпінням чекаємо можливості допомогти їм побудувати замкнуте коло зворотного зв'язку на блокчейні, забезпечуючи, щоб результати інновацій ШІ були спільною власністю всіх будівельників.
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
a16z: Чому ми інвестуємо в Yupp
Автор: Кріс Діксон, засновник a16z crypto; Елізабет Харкеві, партнер a16z crypto; Переклад: Jinse Finance xiaozou
Сучасні системи штучного інтелекту залежать не лише від обчислювальних потужностей і алгоритмів, але й від зворотного зв'язку від людини. Компанії застосовують такі методи оптимізації після навчання, як навчання з використанням зворотного зв'язку від людини (RLHF) та пряма оптимізація переваг (DPO), щоб поліпшити моделі. Ці технології можуть зменшити упередження, забезпечуючи моделі більш якісні та узгоджені відповіді на підказки — це критично важливо для прискорення розвитку ШІ. Оцінка моделей також є ключовою, але лише визначивши, що таке "краще", можна досягти оптимізації моделей.
Ось тут і виникає проблема: компанії неохоче діляться – вони ставляться до даних і процесів навчання як до конфіденційних. Як наслідок, оцінка моделей штучного інтелекту може покладатися лише на обмежену інформацію із закритих систем або статичні контрольні показники, які відірвані від практичного застосування, що серйозно обмежує простір для вдосконалення моделі. Користувачі також знаходяться в сліпій зоні, не знаючи, як їх відгуки вплинуть на модель, і навіть чи буде вона прийнята. Деякі модельні таблиці лідерів і краудсорсингові платформи намагаються підвищити прозорість, але часто не дозволяють користувачам відстежувати свій внесок або забезпечувати відчутну віддачу від участі. Платформи, які заявляють про себе як справедливі та прозорі, часто покладаються на чесність, а не на обов'язкові стандарти.
Ми віримо, що технології криптографії можуть забезпечити прозорість та право власності в цій сірій зоні штучного інтелекту. Блокчейн може допомогти учасникам зручно отримувати винагороди, а також надати розробникам ШІ надійну гарантію якості та походження даних зворотного зв'язку. Користувачі отримують стимул, розробники отримують надійні дані, і всі можуть здійснювати двосторонній аудит на цьому відкритому ринку. Для цього ми очолили інвестиції у споживчий продукт Yupp на суму 33 мільйони доларів у рамках початкового етапу, ця платформа дозволяє кожному безкоштовно досліджувати та порівнювати останні моделі ШІ.
Yupp використовує краудсорсингову модель для оцінки моделей: користувачі вводять підказки, паралельно переглядають кілька відповідей, згенерованих ШІ, а потім обирають найкращу відповідь. Їхній вибір створює уподобання даних "пакет" з цифровим підписом, які є надзвичайно цінними для оптимізації та оцінки після навчання ШІ. Користувачі можуть безкоштовно використовувати останні моделі та отримувати винагороду за наданий зворотний зв'язок.
Дизайн Yupp перетворює людське судження на відновлювальний економічний ресурс. З появою нових інтерактивних даних старі дані "втрачають актуальність", формуючи природне колесо: більше використання приносить свіжіші оцінки; свіжіші оцінки породжують якісніші моделі; якісніші моделі приваблюють більше користувачів. Усі учасники — незалежно від того, чи є вони звичайними користувачами, чи розробниками AI-моделей — можуть приєднатися до цього процесу і бачити прозорі правила, які підходять для всіх, що забезпечує збереження надійної нейтральності ринку. Ніхто не може приховати оцінки, і ніхто не може маніпулювати винагородами або результатами.
Засновницька команда має глибокий досвід у галузях AI та криптовалют. Вони спільно розробляли споживчі продукти машинного навчання на ранньому етапі Twitter. Панкадж Гупта раніше був глобальним керівником інженерії споживчого сегмента в Google Pay та Coinbase, а Гілад Мішне був керівником машинного навчання в GoogleX. Стартап- команда об'єднала старших інженерів з Google, Coinbase та провідних лабораторій.
Штучному інтелекту необхідна надійна та стійка система оцінювання, заснована на масштабних людських внесках, а технології блокчейн є машиною довіри для досягнення цієї мети. Завдяки тому, що користувачі з усього світу вносять свої відгуки для покращення моделей, Yupp прагне стати основним рівнем оцінювання для майбутнього ШІ. Ми пишаємося тим, що можемо підтримувати Yupp, і з нетерпінням чекаємо можливості допомогти їм побудувати замкнуте коло зворотного зв'язку на блокчейні, забезпечуючи, щоб результати інновацій ШІ були спільною власністю всіх будівельників.