18 октября, 15:57

NVIDIA анонсировала новые модели Llama 3.1, превзошедшие GPT-4o и Claude 3.5

NVIDIA молча выпустила файнтюн модели Llama 3.1 70B, которая превзошла по производительности GPT-4o и  AnthropicAI  Claude Sonnet 3.5.    85.0 на Arena Hard, 57.6 на AlpacaEval 2 LC, и 8.98 MT-Bench   Превосходит GPT-4o и Claude 3.5 Sonnet на Нескольких бенчмарках   Основан на Llama-3.1-70B-Instruct и обучен с помощью RLHF  REINFORCE    Выпущена также Llama-3.1-Nemotron-70B-Reward #2 на RewardBench   Доступно на Hugging Face
NewSpace Times
NewSpace Times
NVIDIA молча выпустила файнтюн модели Llama 3.1 70B, которая превзошла по производительности GPT-4o и AnthropicAI Claude Sonnet 3.5. 85.0 на Arena Hard, 57.6 на AlpacaEval 2 LC, и 8.98 MT-Bench Превосходит GPT-4o и Claude 3.5 Sonnet на Нескольких бенчмарках Основан на Llama-3.1-70B-Instruct и обучен с помощью RLHF REINFORCE Выпущена также Llama-3.1-Nemotron-70B-Reward #2 на RewardBench Доступно на Hugging Face
addmeto
addmeto
Nvidia выпускают опенсорсную LLM Nemotron ну точнее это llama-3.1-nemotron-70B-Instruct, т.е. большая llama доученная на в нвидии . Утверждается что эта 70B модель лучше чем gpt-4o и Sonnet 3.5. Я еще не проверял, но если тесты подтвердятся, то сейчас начнется... В камементах правильно указывают, что даже на арене показатели этой модели на уровне LLama 3.1 и уж точно не догоняет gpt-4o
Забирай эксклюзивное предложение для пользователей Tek.fm
        
        *Предложение ограничено
Tek.fm
Tek.fm
Забирай эксклюзивное предложение для пользователей Tek.fm *Предложение ограничено
Nvidia опубликовали новую модель Llama-3.1-Nemotron-70B-Instruct-HF. Модель занимает первое место по некоторым бенчмаркам  AlpacaEval, MT-Bench, Mean Response Length .   В основе — опенсорсная Llama 3.1 от Meta , 70 млрд параметров и обучение методом RLHF  с подкреплением человеческих отзывов .   Тестируем тут.   Meta признана в РФ экстремистской и запрещена
NN
NN
Nvidia опубликовали новую модель Llama-3.1-Nemotron-70B-Instruct-HF. Модель занимает первое место по некоторым бенчмаркам AlpacaEval, MT-Bench, Mean Response Length . В основе — опенсорсная Llama 3.1 от Meta , 70 млрд параметров и обучение методом RLHF с подкреплением человеческих отзывов . Тестируем тут. Meta признана в РФ экстремистской и запрещена
Сфера Блогинга
Сфера Блогинга
Внезапно начали очень хвалить новую LLM-модель выложенную Nvidia — модель Nemotron 70B-Instruct представляет собой файн-тюнинг Llama 3.1, но по появляющимся заявлениям, превосходит в задачах кодинга и GPT-4o, и Claude 3.5 Sonnet. Правда, в официальной Chatbot Arena её пока нет, но в Arena Hard — автоматическом рейтинге моделей, где оценки выставляет GPT-4 Turbo по сравнению с GPT-4, — модель уже пробилась на 3 место, уступив лишь o1-mini и o1-preview. Попробовать пообщаться с моделью можно на официальном сайте Nvidia или на HuggingChat. Впрочем, наверняка сейчас популярные сервисы начнут у себя раскатывать.