Лучшее лечение галлюцинаций в стране! Благодаря 53 миллиардам параметров возможности рассуждения Baichuan2 возросли на 100%, и API был впервые открыт для коммерческого использования.
Большая модель Байчуаня вчера была полностью обновлена!
Только 25 сентября компания Baichuan Intelligent официально выпустила недавно модернизированную большую модель с 53 миллиардами параметров — Baichuan2-53B.
Адрес опыта:
На этот раз его математические и логические способности к рассуждению значительно улучшаются.
Что еще более важно, благодаря высококачественной системе данных и усовершенствованию поиска галлюцинации Baichuan2-53B были значительно уменьшены, что сделало ее крупнейшей отечественной моделью с наименьшим количеством галлюцинаций.
Мало того, Baichuan Intelligence, одна из первых крупных модельных компаний, прошедших процесс регистрации, также открыла интерфейс API Baichuan2-53B.
Это означает, что Baichuan Intelligence официально вошла в сферу To B и с этого момента начнет процесс коммерциализации.
Обработка иллюзий в Китае далеко впереди
Самое примечательное, что недавно модернизированный Baichuan2-53B уже далеко впереди в отечественной промышленности по «иллюзорной» обработке.
Проще говоря, «иллюзия» означает, что LLM часто говорит серьезно и бессмыслицу без каких-либо известных фактов, подтверждающих это.
Хотя GPT-4 хорошо справляется с различными задачами, ему не избежать этого проклятия.
Итак, почему у крупных моделей появляются «галлюцинации»?
В апреле соучредитель OpenAI и ученый-исследователь Джон Шульман подробно остановился на трудностях, которые трудно преодолеть с помощью больших моделей, в своем выступлении в Калифорнийском университете в Беркли.
По мнению Шульмана, внутри черного ящика LLM спрятан «график знаний». Если в этой архитектуре нет знаний, и только обучение большой модели (т. е. поведенческому клонированию) знаний через SFT фактически учит ее выводить иллюзии.
В ответ на эту проблему, как Baichuan Intelligence достигает лучших в отрасли показателей «обработки иллюзий» больших моделей?
Что касается построения высококачественных данных, Baichuan2-53B создал уникальную систему качества данных.
Классифицируйте данные на основе стандартов низкого и высокого качества, чтобы Baichuan2-53B всегда использовал данные высокого качества для предварительного обучения.
Кроме того, что касается сбора информации, Baichuan2-53B обновил несколько модулей, включая ключевые компоненты, такие как понимание намерения команды, интеллектуальный поиск и улучшение результатов.
Эта комплексная система точно управляет поиском условий запроса, глубоко понимая инструкции пользователя, и, наконец, объединяет технологию больших языковых моделей для оптимизации надежности генерации результатов модели, достижения более точных и интеллектуальных результатов ответов модели и уменьшения иллюзий модели.
Например, когда дело доходит до объяснения проблемы «зацепить три нити, четыре струны и пять», GPT-4 явно несет чушь.
Напротив, Baichuan2-53B дал правильный ответ с первого раза.
Другой пример: ответ Baichuan2-53B на классический вопрос «Являются ли Чжоу Шужэнь и Лу Синь одним и тем же человеком?» одновременно исчерпывающий и точный.
Видно, что благодаря построению высококачественной системы данных и оптимизации технологии улучшения поиска Baichuan2-53B эффективно уменьшает иллюзию модели.
Результаты оценки FacTool показывают, что Baichuan2-53B имеет общий балл 140,5, уступая лишь GPT-4 среди основных базовых больших моделей, и находится на лидирующем внутри страны уровне.
FacTool — это общая структура, совместно предложенная учеными из Шанхайского университета Цзяо Тонг, Университета Карнеги-Меллона, Городского университета Гонконга, Меты и других учреждений. Он может проверять фактическую точность контента, созданного с помощью больших моделей (он также может проверять фактическую точность общего содержания) секс).
адрес проекта:
Улучшение способностей, усиление рассуждений на 100 %
Фактически, Baichuan2-53B — уже шестая крупная модель, выпущенная Baichuan Intelligence.
С тех пор, как 10 апреля была создана компания Baichuan Intelligence, она внедряла инновации с поразительной скоростью: скорость итерации достигла в среднем запуска большой модели каждые 28 дней!
Уже 8 августа, когда Baichuan2-53B был впервые выпущен, он продемонстрировал отличные знания вопросов и ответов, а также способности к литературному творчеству.
Если вы хотите спросить, каковы важные показатели для оценки лидерства большой модели, я считаю, что «возможности математического и логического рассуждения» будут ответом, который дадут многие люди в отрасли.
На этот раз Baichuan2-53B, основанный на Baichuan-53B, фокусируется на усилении своих математических и логических способностей, а также на комплексном обновлении своих общих возможностей.
В частности, его способность к логическому рассуждению увеличивается на 100%, его математические способности увеличиваются на 31%, его способность понимать язык увеличивается на 29%, его способность создавать текст увеличивается на 18%, а его способность задавать вопросы и ответы увеличивается. на 9%.
### Математическое рассуждение
Baichuan2-53B, который значительно улучшил свои математические способности, может легко решать математические словесные задачи.
Например, сумма двух чисел равна 572, а единица одного из слагаемых равна 0. После удаления 0 получается то же самое, что и второе слагаемое. Итак, что же это за два числа?
Baichuan2-53B перечисляет уравнение, предполагая, что одно слагаемое равно 10A, а другое — B, а затем на основе известных условий получается правильное решение.
Другой пример: в вопросе ниже Baichuan2-53B сначала рассчитал общий доход от транспортировки, а затем разделил его на потери на коробку стекла, чтобы получить количество поврежденных стеклянных ящиков.
Возьмем еще один классический вопрос: «Сколько километров составляет расстояние между двумя местами?» Baichuan2-53B получил правильный ответ путем пошаговых вычислений.
Что касается рассуждений, давайте начнем с простого вопроса: прогноз погоды обещал, что в эту среду будет дождь, и вчера дождь шел. Какой сегодня день недели?
Baichuan2-53B без особых усилий придумал «Четверг»!
Далее рассуждения немного сложнее: предположим, что есть пруд с бесконечной водой.
Есть два пустых чайника емкостью 5 литров и 6 литров соответственно. Как с помощью этих двух чайников набрать из пруда 3 литра воды?
Baichuan2-53B начал плавно отвечать и дал правильный ответ за 6 шагов.
После многих раундов испытаний можно обнаружить, что возможности математического и логического рассуждения модернизированного Baichuan2-53B действительно отличаются от возможностей той же модели. Он значительно улучшился в темах, в которых раньше не очень хорошо разбирался.
Проблема со сроками
С точки зрения своевременности производительность Baichuan2-53B превосходна.
Азиатские игры в Ханчжоу только открылись, а самому юному игроку всего 9 лет. Baichuan2-53B также правильно ответил на последний вопрос.
Baichuan2-53B даже точно объяснил принцип нейронной сети, лежащей в основе Optimus, робота-гуманоида, только что анонсированного Tesla.
Другой пример: в начале сентября этого года в Италии завершился 80-й Венецианский кинофестиваль.
Получают ли какие-нибудь китайские фильмы и актеры награды на этом кинофестивале?
Baichuan2-53B сразу же ответил, что фильм Ли Хунци «Любовь - это пистолет» стал лучшим первым полнометражным фильмом, а Тони Люн получил премию «Золотой лев» за выдающиеся достижения.
Контракт тренера Мэя с «ПСЖ» истекает в конце июня этого года, а официально он присоединился к «Интер Майами» в июле.
Baichuan2-53B тоже это прекрасно знает.
Точно так же он также может точно сказать вам, что Друид выиграл в общей сложности 24 турнира Большого шлема, включая этот в 2023 году.
Откройте API и официально начните коммерческое использование
Мало того, на этот раз Baichuan2-53B также официально открыл интерфейс API, что позволяет предприятиям и разработчикам интегрировать модель в свои собственные приложения и сервисы.
Адрес API:
Есть ли какой-то порог для этой услуги?
Можно сказать, что почти нет. API-интерфейс Baichuan2-53B очень удобен и прост в использовании, для доступа к нему требуется лишь простая настройка и интеграция.
Более того, он полностью совместим с интерфейсом OpenAI, что позволяет клиентам быстро мигрировать, значительно снижая как затраты на развертывание модели, так и затраты на преобразование.
Короче говоря, теперь, будь то интеллектуальное обслуживание клиентов, интеллектуальное письмо или интеллектуальные рекомендации, все это может быть поддержано возможностями больших моделей.
Больше всего корпоративных пользователей беспокоят вопросы соблюдения требований безопасности.
Об этом не стоит беспокоиться.
Являясь одной из первых крупных модельных компаний, принявших «Временные меры по управлению услугами генеративного искусственного интеллекта», Baichuan Intelligent создала улучшения безопасности для Baichuan2-53B, которые охватывают полный цикл предварительного обучения крупномасштабной модели, точного настройка и вывод.Можно сказать, что весь процесс находится под защитой.
Благодаря богатым и мощным возможностям модели Baichuan2-53B корпоративные пользователи могут не только модернизировать существующие услуги и сократить расходы, но и изучить больше сценариев применения.
Считается, что в этот момент в почве уже назревает большая волна впечатляющих инноваций.
Использованная литература:
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Лучшее лечение галлюцинаций в стране! Благодаря 53 миллиардам параметров возможности рассуждения Baichuan2 возросли на 100%, и API был впервые открыт для коммерческого использования.
Первоисточник: Синьчжиюань
Большая модель Байчуаня вчера была полностью обновлена!
Только 25 сентября компания Baichuan Intelligent официально выпустила недавно модернизированную большую модель с 53 миллиардами параметров — Baichuan2-53B.
На этот раз его математические и логические способности к рассуждению значительно улучшаются.
Что еще более важно, благодаря высококачественной системе данных и усовершенствованию поиска галлюцинации Baichuan2-53B были значительно уменьшены, что сделало ее крупнейшей отечественной моделью с наименьшим количеством галлюцинаций.
Мало того, Baichuan Intelligence, одна из первых крупных модельных компаний, прошедших процесс регистрации, также открыла интерфейс API Baichuan2-53B.
Это означает, что Baichuan Intelligence официально вошла в сферу To B и с этого момента начнет процесс коммерциализации.
Обработка иллюзий в Китае далеко впереди
Самое примечательное, что недавно модернизированный Baichuan2-53B уже далеко впереди в отечественной промышленности по «иллюзорной» обработке.
Проще говоря, «иллюзия» означает, что LLM часто говорит серьезно и бессмыслицу без каких-либо известных фактов, подтверждающих это.
Итак, почему у крупных моделей появляются «галлюцинации»?
В апреле соучредитель OpenAI и ученый-исследователь Джон Шульман подробно остановился на трудностях, которые трудно преодолеть с помощью больших моделей, в своем выступлении в Калифорнийском университете в Беркли.
По мнению Шульмана, внутри черного ящика LLM спрятан «график знаний». Если в этой архитектуре нет знаний, и только обучение большой модели (т. е. поведенческому клонированию) знаний через SFT фактически учит ее выводить иллюзии.
Что касается построения высококачественных данных, Baichuan2-53B создал уникальную систему качества данных.
Классифицируйте данные на основе стандартов низкого и высокого качества, чтобы Baichuan2-53B всегда использовал данные высокого качества для предварительного обучения.
Эта комплексная система точно управляет поиском условий запроса, глубоко понимая инструкции пользователя, и, наконец, объединяет технологию больших языковых моделей для оптимизации надежности генерации результатов модели, достижения более точных и интеллектуальных результатов ответов модели и уменьшения иллюзий модели.
Например, когда дело доходит до объяснения проблемы «зацепить три нити, четыре струны и пять», GPT-4 явно несет чушь.
Результаты оценки FacTool показывают, что Baichuan2-53B имеет общий балл 140,5, уступая лишь GPT-4 среди основных базовых больших моделей, и находится на лидирующем внутри страны уровне.
Улучшение способностей, усиление рассуждений на 100 %
Фактически, Baichuan2-53B — уже шестая крупная модель, выпущенная Baichuan Intelligence.
С тех пор, как 10 апреля была создана компания Baichuan Intelligence, она внедряла инновации с поразительной скоростью: скорость итерации достигла в среднем запуска большой модели каждые 28 дней!
Уже 8 августа, когда Baichuan2-53B был впервые выпущен, он продемонстрировал отличные знания вопросов и ответов, а также способности к литературному творчеству.
Если вы хотите спросить, каковы важные показатели для оценки лидерства большой модели, я считаю, что «возможности математического и логического рассуждения» будут ответом, который дадут многие люди в отрасли.
На этот раз Baichuan2-53B, основанный на Baichuan-53B, фокусируется на усилении своих математических и логических способностей, а также на комплексном обновлении своих общих возможностей.
В частности, его способность к логическому рассуждению увеличивается на 100%, его математические способности увеличиваются на 31%, его способность понимать язык увеличивается на 29%, его способность создавать текст увеличивается на 18%, а его способность задавать вопросы и ответы увеличивается. на 9%.
Baichuan2-53B, который значительно улучшил свои математические способности, может легко решать математические словесные задачи.
Например, сумма двух чисел равна 572, а единица одного из слагаемых равна 0. После удаления 0 получается то же самое, что и второе слагаемое. Итак, что же это за два числа?
Baichuan2-53B перечисляет уравнение, предполагая, что одно слагаемое равно 10A, а другое — B, а затем на основе известных условий получается правильное решение.
Baichuan2-53B без особых усилий придумал «Четверг»!
Есть два пустых чайника емкостью 5 литров и 6 литров соответственно. Как с помощью этих двух чайников набрать из пруда 3 литра воды?
Baichuan2-53B начал плавно отвечать и дал правильный ответ за 6 шагов.
Проблема со сроками
С точки зрения своевременности производительность Baichuan2-53B превосходна.
Азиатские игры в Ханчжоу только открылись, а самому юному игроку всего 9 лет. Baichuan2-53B также правильно ответил на последний вопрос.
Получают ли какие-нибудь китайские фильмы и актеры награды на этом кинофестивале?
Baichuan2-53B сразу же ответил, что фильм Ли Хунци «Любовь - это пистолет» стал лучшим первым полнометражным фильмом, а Тони Люн получил премию «Золотой лев» за выдающиеся достижения.
Baichuan2-53B тоже это прекрасно знает.
Мало того, на этот раз Baichuan2-53B также официально открыл интерфейс API, что позволяет предприятиям и разработчикам интегрировать модель в свои собственные приложения и сервисы.
Адрес API:
Есть ли какой-то порог для этой услуги?
Можно сказать, что почти нет. API-интерфейс Baichuan2-53B очень удобен и прост в использовании, для доступа к нему требуется лишь простая настройка и интеграция.
Более того, он полностью совместим с интерфейсом OpenAI, что позволяет клиентам быстро мигрировать, значительно снижая как затраты на развертывание модели, так и затраты на преобразование.
Короче говоря, теперь, будь то интеллектуальное обслуживание клиентов, интеллектуальное письмо или интеллектуальные рекомендации, все это может быть поддержано возможностями больших моделей.
Больше всего корпоративных пользователей беспокоят вопросы соблюдения требований безопасности.
Об этом не стоит беспокоиться.
Являясь одной из первых крупных модельных компаний, принявших «Временные меры по управлению услугами генеративного искусственного интеллекта», Baichuan Intelligent создала улучшения безопасности для Baichuan2-53B, которые охватывают полный цикл предварительного обучения крупномасштабной модели, точного настройка и вывод.Можно сказать, что весь процесс находится под защитой.
Благодаря богатым и мощным возможностям модели Baichuan2-53B корпоративные пользователи могут не только модернизировать существующие услуги и сократить расходы, но и изучить больше сценариев применения.
Считается, что в этот момент в почве уже назревает большая волна впечатляющих инноваций.
Использованная литература: