Поскольку приложения ИИ проникают в различные отрасли, точная оценка производительности модели и повышение доверия пользователей становятся актуальными проблемами. Традиционные оценки часто полагаются на централизованные механизмы, что затрудняет охват разнообразных сценариев и не отражает истинные предпочтения пользователей; одновременно с этим часто возникает проблема «галлюцинации» модели, из-за чего пользователи часто попадают в информационные изоляторы при принятии решений.
В этом контексте Yupp, как новая платформа, пытается изменить процесс открытия, сравнения и использования моделей ИИ с помощью своей уникальной модели краудсорсинга и механизма стимулов, что приносит парадигмальный сдвиг в области оценки ИИ. Эта статья углубится в основные механизмы Yupp, технические особенности, фон команды и его потенциальное влияние на экосистему ИИ.
Yupp сосредоточен на решении давних проблем оценки в области ИИ, посвящен созданию «доверительного» рынка обратной связи ИИ — позволяя разнообразной обратной связи пользователей свободно циркулировать под защитой блокчейна и криптоэкономических стимулов, тем самым формируя масштабируемый, справедливый и прозрачный слой оценки моделей. Стимулируя распределение высококачественных вручную аннотированных данных, Yupp может быстро захватывать реальные потребности и предпочтения пользователей в различных сценариях, помогая разработчикам ИИ оптимизировать производительность модели итеративным образом.
Проект был основан в июне 2024 года Панкджем Гуптой (соучредитель и CEO) и Гиладом Мишне (соучредитель и глава AI), в команде также участвовал главный научный сотрудник Джимми Лин (профессор Университета Ватерлоо). Трое из них ранее работали вместе в Twitter в 2010 году, где они создавали и оптимизировали масштабные системы рекомендаций и поиска, а затем получили большой опыт работы в Google и Coinbase.
Благодаря своей концепции децентрализации и прозрачности стоимости данных, которая может удовлетворить двойные требования производителей ИИ к надежной оценке и участию пользователей, а также благодаря богатому опыту своей основной команды, Yupp получил высокую признательность от известных личностей в технологической отрасли и ведущих венчурных капиталистов.
На прошлой неделе Yupp объявила о завершении финансирования на 33 миллиона долларов в сид раунде, возглавляемом партнером A16z Крисом Диксоном. Среди других инвесторов — главный ученый Google Джефф Дин, сооснователь Twitter Биз Стоун, сооснователь Pinterest Эван Шарп, генеральный директор Perplexity Аравинд Сринивас, Дэн Бонех из Стэнфордского университета, Крис Ре, Ник Макион и Балажи Прабхакар, среди 45 известных ангелов и корпоративных руководителей, а также Coinbase Ventures.
Как централизованная платформа оценки ИИ, Yupp придерживается философии "Каждый ИИ для всех", позволяя пользователям легко находить, сравнивать и использовать новейшие модели ИИ. В отличие от традиционных одиночных ответов, Yupp возвращает ответы от двух (или даже более) моделей одновременно для каждого запроса, формируя "парламент ИИ". Этот дизайн не только удовлетворяет потребности пользователей в разнообразных выборах, но и эффективно выявляет потенциальные "галлюцинации", которые могут возникнуть у моделей, помогая пользователям принимать более обоснованные решения через сравнение. Как заявил генеральный директор Yupp Панкодж Гупта, параллельные выводы особенно полезны для пользователей, обеспокоенных ошибками генерации, поскольку они могут перекрестно проверять результаты.
Платформа теперь поддерживает более 500 AI моделей, охватывающих области генерации текста и изображений, включая известные модели, такие как ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama и многие новые модели. Чтобы дополнительно оптимизировать опыт, Yupp также запустил функцию "QuickTake", которая может сжимать длинные ответы в краткий твит.
Кроме того, Yupp придает большое значение конфиденциальности пользователей: все записи чата по умолчанию являются частными, если пользователь не сделает их общедоступными; даже когда они делятся публично, никакая личная информация не раскрывается. Пользователи могут контролировать содержание и объем обмена в любое время.
Yupp будет использовать отзывы пользователей бесплатно и измерять использование модели через систему "Yupp Points". Новые пользователи получают 5000 очков при регистрации и могут зарабатывать больше очков, оценивая ответы моделей, выбирая предпочтения и объясняя свои причины. Чем выше качество обратной связи, тем больше вознаграждений, что обеспечивает пользователям возможность устойчиво использовать высококачественные модели, такие как Claude Opus 4 или OpenAI o3, бесплатно. Платформа обещает, что количество очков будет только увеличиваться и что все текущие модели можно будет опробовать бесплатно.
После каждого вопроса пользователи получат два модельных ответа и смогут заработать «цифровую лотерейную карточку» через обратную связь, вознаграждая Yupp очками в диапазоне от 0 до 250. Каждые 1000 очков могут быть обменяны на 1 доллар, с максимальным ежедневным выводом в 10 долларов и месячным максимумом в 50 долларов. Очки могут быть обменяны на более чем 20 валют, включая доллары и евро, с партнерами, такими как Stripe, PayPal и Coinbase. В то же время платформа интегрирует Base Ethernet L2 и стейблкоины Solana, чтобы предоставить глобальным пользователям мгновенные, безкомиссионные вознаграждения.
Как сказал Панкдж Гупта, высококачественная обратная связь, генерируемая пользователями, гораздо более ценна для настройки моделей и обучения с подкреплением в компаниях ИИ, чем сами вознаграждения. Хотя ежемесячные доходы пользователей могут быть эквивалентны лишь нескольким чашкам кофе, эти оплаченные аннотированные данные имеют решающее значение для итерации ИИ.
Чтобы стимулировать большее количество людей участвовать, Yupp также установил награду за рефералов: реферер получает 5000 очков, а рекомендованный человек получает 1000 очков; в настоящее время новые зарегистрированные пользователи могут получить 5000 очков, а рекомендованный человек дополнительно получает 2500 очков.
Чтобы решить существующие проблемы недостаточной прозрачности в рейтингах, отсутствия справедливости и неравномерного доступа к данным оценки, Yupp запустила бета-версию ИИ-рейтинга и систему оценки "Yupp VIBE (Vibe Intelligence Benchmark) Score". Эта система агрегирует данные о предпочтениях, генерируемые глобальными пользователями в естественных взаимодействиях, с целью предоставления надежных и достоверных результатов оценки.
Принципы оценки Yupp включают:
Платформа не только собирает бинарные предпочтения, но также поощряет пользователей указывать преимущества и недостатки ответов (таких как "по делу", "быстрая скорость", "хороший стиль" и т.д.), и проводит кластерный анализ на основе возраста пользователей, образования, профессии и другой информации, чтобы показать различия в предпочтениях среди различных групп.
На техническом уровне Yupp исследует использование Блокчейна, криптографических примитивов и доказательств с нулевым разглашением для обеспечения того, чтобы процесс оценки был справедливым, прозрачным и проверяемым. В то же время платформа сотрудничает с профессиональными поставщиками AI-данных для калибровки оценщиков через архивную проверку и многоуровневое качество обнаружения, чтобы исключить злонамеренные данные.
Недавний рейтинг был обновлен, демонстрируя оценки VIBE моделей, таких как GPT‑4.5 Preview, Claude Opus 4 и Claude Sonnet 4, а также их коэффициенты побед, коэффициенты неприязни, скорость, задержку, размер контекстного окна и метрики стоимости.
Yupp официально запустился 13 июня 2025 года после шести месяцев внутреннего тестирования. С момента запуска продукт постоянно обновляется:
Миссией Yupp является «уполномочить человечество формировать будущее ИИ». Панкдж Гупта считает, что развитие ИИ требует участия и вклада каждого. Через многоаспектные ответы ИИ и отзывы пользователей Yupp не только помогает пользователям принимать лучшие решения, но и предоставляет непрерывный стимул для эволюции ИИ.
Стоит отметить, что одним из основных конкурентов Yupp является открытая платформа оценки AI-моделей LMArena (веб-сайт:https://lmarena.ai/)Веб-сайт очень популярен среди специалистов в области ИИ, но платформа в настоящее время находится на стадии коммерческого исследования и не предоставляет прямых материальных вознаграждений или механизмов поощрения баллами за участие пользователей с использованием Блокчейн технологии.
В целом, Yupp открыл новый путь для оценки ИИ с помощью своей модели краудсорсинга, механизма стимулов и системы оценки, основанной на реальных предпочтениях пользователей. Он не только предлагает пользователям бесплатный и разнообразный интерактивный опыт с ИИ, но и преобразует отзывы пользователей в высокоценные обучающие данные, способствуя постоянной оптимизации модели. С опытной командой и первоклассным финансовым обеспечением ожидается, что Yupp сыграет ключевую роль в будущем экосистемы ИИ, реализуя видение "ИИ для всех, сформированный всеми."
Однако для только что запущенного Yupp, как постоянно обеспечивать качество данных, противостоять потенциальным мошенническим действиям при участии большого числа пользователей и находить баланс между коммерциализацией и пользовательскими стимулами, все еще будет направлением, которое необходимо исследовать и оптимизировать в его будущем развитии.
Поскольку приложения ИИ проникают в различные отрасли, точная оценка производительности модели и повышение доверия пользователей становятся актуальными проблемами. Традиционные оценки часто полагаются на централизованные механизмы, что затрудняет охват разнообразных сценариев и не отражает истинные предпочтения пользователей; одновременно с этим часто возникает проблема «галлюцинации» модели, из-за чего пользователи часто попадают в информационные изоляторы при принятии решений.
В этом контексте Yupp, как новая платформа, пытается изменить процесс открытия, сравнения и использования моделей ИИ с помощью своей уникальной модели краудсорсинга и механизма стимулов, что приносит парадигмальный сдвиг в области оценки ИИ. Эта статья углубится в основные механизмы Yupp, технические особенности, фон команды и его потенциальное влияние на экосистему ИИ.
Yupp сосредоточен на решении давних проблем оценки в области ИИ, посвящен созданию «доверительного» рынка обратной связи ИИ — позволяя разнообразной обратной связи пользователей свободно циркулировать под защитой блокчейна и криптоэкономических стимулов, тем самым формируя масштабируемый, справедливый и прозрачный слой оценки моделей. Стимулируя распределение высококачественных вручную аннотированных данных, Yupp может быстро захватывать реальные потребности и предпочтения пользователей в различных сценариях, помогая разработчикам ИИ оптимизировать производительность модели итеративным образом.
Проект был основан в июне 2024 года Панкджем Гуптой (соучредитель и CEO) и Гиладом Мишне (соучредитель и глава AI), в команде также участвовал главный научный сотрудник Джимми Лин (профессор Университета Ватерлоо). Трое из них ранее работали вместе в Twitter в 2010 году, где они создавали и оптимизировали масштабные системы рекомендаций и поиска, а затем получили большой опыт работы в Google и Coinbase.
Благодаря своей концепции децентрализации и прозрачности стоимости данных, которая может удовлетворить двойные требования производителей ИИ к надежной оценке и участию пользователей, а также благодаря богатому опыту своей основной команды, Yupp получил высокую признательность от известных личностей в технологической отрасли и ведущих венчурных капиталистов.
На прошлой неделе Yupp объявила о завершении финансирования на 33 миллиона долларов в сид раунде, возглавляемом партнером A16z Крисом Диксоном. Среди других инвесторов — главный ученый Google Джефф Дин, сооснователь Twitter Биз Стоун, сооснователь Pinterest Эван Шарп, генеральный директор Perplexity Аравинд Сринивас, Дэн Бонех из Стэнфордского университета, Крис Ре, Ник Макион и Балажи Прабхакар, среди 45 известных ангелов и корпоративных руководителей, а также Coinbase Ventures.
Как централизованная платформа оценки ИИ, Yupp придерживается философии "Каждый ИИ для всех", позволяя пользователям легко находить, сравнивать и использовать новейшие модели ИИ. В отличие от традиционных одиночных ответов, Yupp возвращает ответы от двух (или даже более) моделей одновременно для каждого запроса, формируя "парламент ИИ". Этот дизайн не только удовлетворяет потребности пользователей в разнообразных выборах, но и эффективно выявляет потенциальные "галлюцинации", которые могут возникнуть у моделей, помогая пользователям принимать более обоснованные решения через сравнение. Как заявил генеральный директор Yupp Панкодж Гупта, параллельные выводы особенно полезны для пользователей, обеспокоенных ошибками генерации, поскольку они могут перекрестно проверять результаты.
Платформа теперь поддерживает более 500 AI моделей, охватывающих области генерации текста и изображений, включая известные модели, такие как ChatGPT, Claude, Gemini, DeepSeek, Grok, Llama и многие новые модели. Чтобы дополнительно оптимизировать опыт, Yupp также запустил функцию "QuickTake", которая может сжимать длинные ответы в краткий твит.
Кроме того, Yupp придает большое значение конфиденциальности пользователей: все записи чата по умолчанию являются частными, если пользователь не сделает их общедоступными; даже когда они делятся публично, никакая личная информация не раскрывается. Пользователи могут контролировать содержание и объем обмена в любое время.
Yupp будет использовать отзывы пользователей бесплатно и измерять использование модели через систему "Yupp Points". Новые пользователи получают 5000 очков при регистрации и могут зарабатывать больше очков, оценивая ответы моделей, выбирая предпочтения и объясняя свои причины. Чем выше качество обратной связи, тем больше вознаграждений, что обеспечивает пользователям возможность устойчиво использовать высококачественные модели, такие как Claude Opus 4 или OpenAI o3, бесплатно. Платформа обещает, что количество очков будет только увеличиваться и что все текущие модели можно будет опробовать бесплатно.
После каждого вопроса пользователи получат два модельных ответа и смогут заработать «цифровую лотерейную карточку» через обратную связь, вознаграждая Yupp очками в диапазоне от 0 до 250. Каждые 1000 очков могут быть обменяны на 1 доллар, с максимальным ежедневным выводом в 10 долларов и месячным максимумом в 50 долларов. Очки могут быть обменяны на более чем 20 валют, включая доллары и евро, с партнерами, такими как Stripe, PayPal и Coinbase. В то же время платформа интегрирует Base Ethernet L2 и стейблкоины Solana, чтобы предоставить глобальным пользователям мгновенные, безкомиссионные вознаграждения.
Как сказал Панкдж Гупта, высококачественная обратная связь, генерируемая пользователями, гораздо более ценна для настройки моделей и обучения с подкреплением в компаниях ИИ, чем сами вознаграждения. Хотя ежемесячные доходы пользователей могут быть эквивалентны лишь нескольким чашкам кофе, эти оплаченные аннотированные данные имеют решающее значение для итерации ИИ.
Чтобы стимулировать большее количество людей участвовать, Yupp также установил награду за рефералов: реферер получает 5000 очков, а рекомендованный человек получает 1000 очков; в настоящее время новые зарегистрированные пользователи могут получить 5000 очков, а рекомендованный человек дополнительно получает 2500 очков.
Чтобы решить существующие проблемы недостаточной прозрачности в рейтингах, отсутствия справедливости и неравномерного доступа к данным оценки, Yupp запустила бета-версию ИИ-рейтинга и систему оценки "Yupp VIBE (Vibe Intelligence Benchmark) Score". Эта система агрегирует данные о предпочтениях, генерируемые глобальными пользователями в естественных взаимодействиях, с целью предоставления надежных и достоверных результатов оценки.
Принципы оценки Yupp включают:
Платформа не только собирает бинарные предпочтения, но также поощряет пользователей указывать преимущества и недостатки ответов (таких как "по делу", "быстрая скорость", "хороший стиль" и т.д.), и проводит кластерный анализ на основе возраста пользователей, образования, профессии и другой информации, чтобы показать различия в предпочтениях среди различных групп.
На техническом уровне Yupp исследует использование Блокчейна, криптографических примитивов и доказательств с нулевым разглашением для обеспечения того, чтобы процесс оценки был справедливым, прозрачным и проверяемым. В то же время платформа сотрудничает с профессиональными поставщиками AI-данных для калибровки оценщиков через архивную проверку и многоуровневое качество обнаружения, чтобы исключить злонамеренные данные.
Недавний рейтинг был обновлен, демонстрируя оценки VIBE моделей, таких как GPT‑4.5 Preview, Claude Opus 4 и Claude Sonnet 4, а также их коэффициенты побед, коэффициенты неприязни, скорость, задержку, размер контекстного окна и метрики стоимости.
Yupp официально запустился 13 июня 2025 года после шести месяцев внутреннего тестирования. С момента запуска продукт постоянно обновляется:
Миссией Yupp является «уполномочить человечество формировать будущее ИИ». Панкдж Гупта считает, что развитие ИИ требует участия и вклада каждого. Через многоаспектные ответы ИИ и отзывы пользователей Yupp не только помогает пользователям принимать лучшие решения, но и предоставляет непрерывный стимул для эволюции ИИ.
Стоит отметить, что одним из основных конкурентов Yupp является открытая платформа оценки AI-моделей LMArena (веб-сайт:https://lmarena.ai/)Веб-сайт очень популярен среди специалистов в области ИИ, но платформа в настоящее время находится на стадии коммерческого исследования и не предоставляет прямых материальных вознаграждений или механизмов поощрения баллами за участие пользователей с использованием Блокчейн технологии.
В целом, Yupp открыл новый путь для оценки ИИ с помощью своей модели краудсорсинга, механизма стимулов и системы оценки, основанной на реальных предпочтениях пользователей. Он не только предлагает пользователям бесплатный и разнообразный интерактивный опыт с ИИ, но и преобразует отзывы пользователей в высокоценные обучающие данные, способствуя постоянной оптимизации модели. С опытной командой и первоклассным финансовым обеспечением ожидается, что Yupp сыграет ключевую роль в будущем экосистемы ИИ, реализуя видение "ИИ для всех, сформированный всеми."
Однако для только что запущенного Yupp, как постоянно обеспечивать качество данных, противостоять потенциальным мошенническим действиям при участии большого числа пользователей и находить баланс между коммерциализацией и пользовательскими стимулами, все еще будет направлением, которое необходимо исследовать и оптимизировать в его будущем развитии.