Найкраще лікування галюцинацій в країні! Завдяки 53 мільярдам параметрів можливості міркування Baichuan2 зросли на 100%, а API вперше було відкрито для комерційного використання.

Перше джерело: Xinzhiyuan

Джерело зображення: створено Unbounded AI

Велика модель Baichuan була повністю оновлена вчора!

Тільки 25 вересня компанія Baichuan Intelligent офіційно випустила нещодавно оновлену велику модель Baichuan2-53B з 53 мільярдами параметрів.

Адреса досвіду:

Цього разу його здібності до математичних і логічних міркувань значно вдосконалені.

Що ще важливіше, завдяки високоякісній системі даних і покращенню пошуку галюцинації Baichuan2-53B були значно зменшені, що зробило його найбільшою моделлю з найменшою проблемою галюцинацій у Китаї.

Крім того, як одна з перших великих модельних компаній, яка пройшла процес реєстрації, Baichuan Intelligence також відкрила інтерфейс Baichuan2-53B API.

Це означає, що Baichuan Intelligence офіційно вийшла на сферу To B і відтепер розпочне процес комерціалізації.

Обробка ілюзій, далеко вперед у Китаї

Найбільш примітним є те, що щойно модернізований Baichuan2-53B вже далеко попереду у вітчизняній промисловості з точки зору обробки «ілюзій».

Простіше кажучи, «ілюзія» означає, що LLM часто говорить серйозно та нісенітниці без будь-яких відомих фактів на підтвердження цього.

Хоча GPT-4 добре виконує різноманітні завдання, він не може уникнути цього прокляття.

Отже, чому у великих моделей з'являються «галюцинації»?

У квітні співзасновник OpenAI і дослідник Джон Шульман у своїй промові в Каліфорнійському університеті в Берклі розповів про труднощі, які важко подолати з великими моделями.

На думку Шульмана, всередині чорної скриньки LLM є «графік знань». Якщо в цій архітектурі немає знань і лише навчання великої моделі (тобто поведінкового клонування) за допомогою SFT, це фактично навчання її виводу ілюзій.

У відповідь на цю проблему, як Baichuan Intelligence досягає провідної в галузі продуктивності в «обробці ілюзій» великих моделей?

З точки зору побудови високоякісних даних, Baichuan2-53B створив унікальну систему якості даних.

Класифікуйте дані на основі стандартів низької та високої якості, щоб гарантувати, що Baichuan2-53B завжди використовує високоякісні дані для попереднього навчання.

Крім того, з точки зору отримання інформації, Baichuan2-53B оновив кілька модулів, включаючи такі ключові компоненти, як розуміння наміру команд, інтелектуальний пошук і покращення результатів.

Ця комплексна система точно керує пошуком термінів запиту, глибоко розуміючи інструкції користувача, і, нарешті, поєднує технологію великої мовної моделі для оптимізації надійності генерації результатів моделі, отримання більш точних і інтелектуальних результатів відповіді моделі та зменшення ілюзій моделі.

Наприклад, коли справа доходить до пояснення проблеми «зачепити три нитки, чотири струни і п’ять», GPT-4, очевидно, говорить дурниці.

Навпаки, Baichuan2-53B дав правильну відповідь з першого разу.

Для іншого прикладу, відповідь Baichuan2-53B на класичне запитання «Чи Чжоу Шурень і Лу Сюнь одна й та сама особа?» є вичерпною та точною.

Можна побачити, що завдяки побудові високоякісної системи даних і оптимізації технології покращення пошуку Baichuan2-53B ефективно зменшує ілюзію моделі.

Результати після оцінки FacTool показують, що Baichuan2-53B має загальну оцінку 140,5, поступаючись лише GPT-4 серед основних базових великих моделей, і знаходиться на внутрішньому провідному рівні.

FacTool — це загальна структура, спільно запропонована вченими з Шанхайського університету Цзяо Тонг, Університету Карнегі-Меллона, Міського університету Гонконгу, Meta та інших установ. Вона може перевіряти фактичну точність вмісту, створеного великими моделями (вона також може перевіряти фактичну точність загального змісту).стать).

адреса проекту:

Покращення можливостей, розмірковування на 100%

Насправді Baichuan2-53B є вже шостою великою моделлю, випущеною Baichuan Intelligence.

Відтоді, як Baichuan Intelligence було засновано 10 квітня, він впроваджував інновації з неймовірною швидкістю. Середня швидкість ітерацій досягла запуску великої моделі кожні 28 днів!

Уже 8 серпня, коли Baichuan2-53B був уперше випущений, він продемонстрував чудові знання та здібності до літературної творчості.

Якщо ви хочете запитати, які важливі показники для оцінки того, чи є велика модель провідною, я вважаю, що багато людей у галузі дадуть відповідь «здатність до математичних і логічних міркувань».

Цього разу, заснований на Baichuan-53B, Baichuan2-53B зосереджується на зміцненні своїх можливостей математичних і логічних міркувань, а також всебічно вдосконалює свої загальні можливості.

Зокрема, його здатність до логічного міркування збільшена на 100%, його математичні здібності збільшені на 31%, його здатність розуміння мови збільшена на 29%, його здатність створювати текст збільшена на 18%, а його здатність до запитань і відповідей на знання збільшена на 9%.

### Математичне міркування

Baichuan2-53B, який значно покращив свої математичні здібності, може легко розв’язувати математичні текстові задачі.

Наприклад, сума двох чисел дорівнює 572, а цифра одиниць одного з доданків дорівнює 0. Після видалення 0 вона збігається з другим доданком. Отже, що це за два числа?

Baichuan2-53B перераховує рівняння, припускаючи, що один доданок дорівнює 10A, а інший – B, а потім на основі відомих умов отримується правильне рішення.

Для іншого прикладу, у наведеному нижче запитанні Baichuan2-53B спочатку обчислив загальний дохід від транспортування, а потім розділив його на втрати на скляну коробку, щоб отримати кількість пошкоджених скляних коробок.

Давайте розглянемо інше класичне запитання: «Скільки кілометрів становить відстань між двома місцями?» Baichuan2-53B отримав правильну відповідь за допомогою покрокових обчислень.

З точки зору міркування, давайте почнемо з простого запитання: прогноз погоди сказав, що в середу буде дощ, а вчора був дощ. Який сьогодні день тижня?

Baichuan2-53B легко придумав «четвер»!

Далі міркування трохи складніше: припустімо, що є ставок з нескінченною кількістю води.

Є два порожніх чайника об’ємом 5 л і 6 л відповідно. Як я можу отримати 3 літри води зі ставка, маючи лише ці 2 чайники?

Baichuan2-53B почав відповідати плавно та дав правильну відповідь протягом 6 кроків.

Після багатьох раундів тестування можна виявити, що можливості математичних і логічних міркувань оновленого Baichuan2-53B справді відрізняються від можливостей тієї ж моделі. Це значно покращило теми, які раніше були не дуже хорошими.

Проблема своєчасності

З точки зору своєчасності, продуктивність Baichuan2-53B чудова.

Азійські ігри в Ханчжоу щойно відкрилися, а наймолодшому гравцеві лише 9 років. Baichuan2-53B також правильно відповів на останнє запитання.

Baichuan2-53B навіть точно пояснив принцип нейронної мережі, що лежить в основі Optimus, людиноподібного робота, щойно анонсованого Tesla.

Наприклад, на початку вересня цього року в Італії завершився 80-й Венеціанський кінофестиваль.

Чи якісь китайські фільми та актори отримують нагороди на цьому кінофестивалі?

Baichuan2-53B одразу відповів, що «Любов — це рушниця» Лі Хунці отримав найкращий перший повнометражний фільм, а Тоні Люн отримав нагороду «Золотий лев» за життєві досягнення.

Контракт Босса Мея з Парісом закінчується в кінці червня цього року, а в липні він офіційно приєднався до Інтер Маямі.

Baichuan2-53B також це добре знає.

Крім того, він також може точно сказати вам, що Druid виграв загалом 24 турніри Великого шолома, включаючи цей у 2023 році.

Відкрийте API та офіційно запустіть комерційне використання

Мало того, цього разу Baichuan2-53B також офіційно відкрив інтерфейс API, що дозволяє підприємствам і розробникам інтегрувати модель у власні програми та служби.

Адреса API:

Чи є якийсь поріг для цієї послуги?

Можна сказати, що майже ніяких. Інтерфейс API Baichuan2-53B дуже зручний і простий у використанні. Для доступу до нього потрібна лише проста настройка та інтеграція.

Крім того, він дуже сумісний з інтерфейсом OpenAI, що дозволяє клієнтам швидко переходити, значно знижуючи як витрати на розгортання моделі, так і витрати на перетворення.

Коротше кажучи, тепер, незалежно від того, чи це інтелектуальне обслуговування клієнтів, інтелектуальне написання чи розумна рекомендація, все може підтримуватися можливостями великих моделей.

Корпоративні користувачі найбільше хвилюються щодо дотримання правил безпеки.

Про це не варто турбуватися.

Як одна з перших великих модельних компаній, яка прийняла «Тимчасові заходи щодо управління послугами генеративного штучного інтелекту», Baichuan Intelligent створила вдосконалення безпеки для Baichuan2-53B, які охоплюють повний цикл попереднього навчання великомасштабної моделі, тонкого Можна сказати, що весь процес під загрозою.

Завдяки багатим і потужним можливостям моделі Baichuan2-53B корпоративні користувачі можуть не тільки оновити існуючі служби та зменшити витрати, але й дослідити більше сценаріїв застосування.

Вважається, що на даний момент у ґрунті вже назріває велика хвиля вражаючих інновацій.

Література:

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити