18 октября, 15:57
NVIDIA анонсировала новые модели Llama 3.1, превзошедшие GPT-4o и Claude 3.5
NewSpace Times
NVIDIA молча выпустила файнтюн модели Llama 3.1 70B, которая превзошла по производительности GPT-4o и AnthropicAI Claude Sonnet 3.5. 85.0 на Arena Hard, 57.6 на AlpacaEval 2 LC, и 8.98 MT-Bench Превосходит GPT-4o и Claude 3.5 Sonnet на Нескольких бенчмарках Основан на Llama-3.1-70B-Instruct и обучен с помощью RLHF REINFORCE Выпущена также Llama-3.1-Nemotron-70B-Reward #2 на RewardBench Доступно на Hugging Face
Технологии3 дня назад
addmeto
Nvidia выпускают опенсорсную LLM Nemotron ну точнее это llama-3.1-nemotron-70B-Instruct, т.е. большая llama доученная на в нвидии . Утверждается что эта 70B модель лучше чем gpt-4o и Sonnet 3.5. Я еще не проверял, но если тесты подтвердятся, то сейчас начнется... В камементах правильно указывают, что даже на арене показатели этой модели на уровне LLama 3.1 и уж точно не догоняет gpt-4o
Технологии1 день назад
NN
Nvidia опубликовали новую модель Llama-3.1-Nemotron-70B-Instruct-HF. Модель занимает первое место по некоторым бенчмаркам AlpacaEval, MT-Bench, Mean Response Length . В основе — опенсорсная Llama 3.1 от Meta , 70 млрд параметров и обучение методом RLHF с подкреплением человеческих отзывов . Тестируем тут. Meta признана в РФ экстремистской и запрещена
Технологии2 дня назад
Сфера Блогинга
Внезапно начали очень хвалить новую LLM-модель выложенную Nvidia — модель Nemotron 70B-Instruct представляет собой файн-тюнинг Llama 3.1, но по появляющимся заявлениям, превосходит в задачах кодинга и GPT-4o, и Claude 3.5 Sonnet. Правда, в официальной Chatbot Arena её пока нет, но в Arena Hard — автоматическом рейтинге моделей, где оценки выставляет GPT-4 Turbo по сравнению с GPT-4, — модель уже пробилась на 3 место, уступив лишь o1-mini и o1-preview. Попробовать пообщаться с моделью можно на официальном сайте Nvidia или на HuggingChat. Впрочем, наверняка сейчас популярные сервисы начнут у себя раскатывать.
Технологии2 дня назад
Похожие новости
Криптовалютный рынок: новые рекорды и аресты хакеров
Экономика
1 день назад +4
Обсуждение возможностей роботов Tesla после их запуска в продажу
Технологии
7 часов назадЭксперты обсуждают будущее искусственного интеллекта на конференции AI Journey в Дубае
Технологии
1 день назад +4
Исследование нейронных сетей выявило особенности восприятия разных поколений
Технологии
2 часа назад +1
ChatGPT и Midjourney теперь доступны в Telegram
Технологии
1 день назадSamsung анонсировала разработку 24 ГБ GDDR7 с рекордной скоростью
Технологии
1 день назад +3