NVIDIA анонсировала новые модели Llama 3.1, превзошедшие GPT-4o и Claude 3.5

NVIDIA молча выпустила файнтюн модели Llama 3.1 70B, которая превзошла по производительности GPT-4o и AnthropicAI Claude Sonnet 3.5. 85.0 на Arena Hard, 57.6 на AlpacaEval 2 LC, и 8.98 MT-Bench Превосходит GPT-4o и Claude 3.5 Sonnet на Нескольких бенчмарках Основан на Llama-3.1-70B-Instruct и обучен с помощью RLHF REINFORCE Выпущена также Llama-3.1-Nemotron-70B-Reward #2 на RewardBench Доступно на Hugging Face

Технологии3 дня назад

addmeto

Nvidia выпускают опенсорсную LLM Nemotron ну точнее это llama-3.1-nemotron-70B-Instruct, т.е. большая llama доученная на в нвидии . Утверждается что эта 70B модель лучше чем gpt-4o и Sonnet 3.5. Я еще не проверял, но если тесты подтвердятся, то сейчас начнется... В камементах правильно указывают, что даже на арене показатели этой модели на уровне LLama 3.1 и уж точно не догоняет gpt-4o

Технологии1 день назад

Tek.fm

Забирай эксклюзивное предложение для пользователей Tek.fm *Предложение ограничено

Реклама1 день назад

Nvidia опубликовали новую модель Llama-3.1-Nemotron-70B-Instruct-HF. Модель занимает первое место по некоторым бенчмаркам AlpacaEval, MT-Bench, Mean Response Length . В основе — опенсорсная Llama 3.1 от Meta , 70 млрд параметров и обучение методом RLHF с подкреплением человеческих отзывов . Тестируем тут. Meta признана в РФ экстремистской и запрещена

Технологии2 дня назад

Сфера Блогинга

Внезапно начали очень хвалить новую LLM-модель выложенную Nvidia — модель Nemotron 70B-Instruct представляет собой файн-тюнинг Llama 3.1, но по появляющимся заявлениям, превосходит в задачах кодинга и GPT-4o, и Claude 3.5 Sonnet. Правда, в официальной Chatbot Arena её пока нет, но в Arena Hard — автоматическом рейтинге моделей, где оценки выставляет GPT-4 Turbo по сравнению с GPT-4, — модель уже пробилась на 3 место, уступив лишь o1-mini и o1-preview. Попробовать пообщаться с моделью можно на официальном сайте Nvidia или на HuggingChat. Впрочем, наверняка сейчас популярные сервисы начнут у себя раскатывать.

Технологии2 дня назад