22 октября, 18:34

Anthropic представила обновленные модели Claude 3.5 Sonnet и Haiku с новыми функциями управления компьютером

Anthropic обновила модель Claude 3.5 Sonnet, выпустила быструю модель Claude 3.5 Haiku и добавила новые возможности работы с компьютером.  По бенчмаркам новый Claude 3.5 Sonnet превосходит GPT-4o от OpenAI в понимании языка  GPQA, MMLU  и математике  MATH     Самой сильной стороной Claude традиционно является написание кода  HumanEval .    Интересно, что Claude теперь умеет работать с компьютером: не просто запускает код, но может видеть экран, двигать курсор, нажимать на кнопки и печатать.    В   модель Claude 3.5 Sonnet уже обновлена.
AI и точка.
AI и точка.
Anthropic обновила модель Claude 3.5 Sonnet, выпустила быструю модель Claude 3.5 Haiku и добавила новые возможности работы с компьютером. По бенчмаркам новый Claude 3.5 Sonnet превосходит GPT-4o от OpenAI в понимании языка GPQA, MMLU и математике MATH Самой сильной стороной Claude традиционно является написание кода HumanEval . Интересно, что Claude теперь умеет работать с компьютером: не просто запускает код, но может видеть экран, двигать курсор, нажимать на кнопки и печатать. В модель Claude 3.5 Sonnet уже обновлена.
Video is not supported
Droider
Droider
Управление компьютером с помощью чат-бота! Anthropic провела масштабное обновление своей линейки ИИ-моделей. Компания представила улучшенный Claude 3.5 Sonnet, новый Claude 3.5 Haiku и интересную функцию управления компьютером. Claude 3.5 Sonnet значительно прокачался. Его показатели на тестах SWE-bench Verified выросли с 33.4% до 49% — это лучший результат среди всех публично доступных моделей, включая OpenAI. GitLab уже отметил 10-процентное улучшение в решении задач DevSecOps без потери скорости работы. Claude 3.5 Haiku — новая "быстрая" модель, которая при той же стоимости и скорости превосходит возможности Claude 3 Opus — предыдущего флагмана компании. На тех же тестах SWE-bench Verified она показала результат 40.6%, обойдя даже первую версию Sonnet и GPT-4o. Главной же инновацией стала функция управления компьютером для Claude 3.5 Sonnet – Computer use. Теперь ИИ может самостоятельно работать с интерфейсом как человек: перемещать курсор, нажимать кнопки, вводить текст. Особенность новой функции в том, что Claude обладает общими навыками работы с компьютером. Он может самостоятельно открывать браузер, проверять электронные таблицы, заполнять формы и выполнять множество других задач. Смотрите ролик, впечатляет! Запуск обновлённого Sonnet уже состоялся, Haiku появится до конца месяца. Computer use будет доступен через API Anthropic.
Video is not supported
GPT/ChatGPT/AI Central Александра Горного
GPT/ChatGPT/AI Central Александра Горного
Anthropic научил Claude 3.5 Sonnet управлять компьютером и выпустил новую модель Haiku Claude 3.5 Sonnet через API теперь может управлять курсором, нажимать кнопки и набирать текст на экране компьютера. Когда пользователь вводит запрос на выполнение какой-то задачи, нейросеть делает скриншот экрана, анализирует его и пошагово ее решает. Благодаря этому можно автоматизировать задачи, требующие десятков или сотен шагов для их выполнения. Кроме того, Claude 3.5 Sonnet получил всесторонние улучшения, особенно, в части генерации программного кода. Также анонсирована Claude 3.5 Haiku — новая самая быстрая модель Anthropic. В некоторых бенчмарках она превосходит самую большую модель компании Claude 3 Opus, а также оригинальные Claude 3.5 Sonnet и GPT-4o. Модель станет доступна через API в конце октября. — Claude Sonnet можно потестить в нашем сервисе доступа к нейросетям c.aiacademy.me.
Забирай эксклюзивное предложение для пользователей Tek.fm
        
        *Предложение ограничено
Tek.fm
Tek.fm
Забирай эксклюзивное предложение для пользователей Tek.fm *Предложение ограничено
Video is not supported
Denis Sexy IT 🤖
Denis Sexy IT 🤖
Antropic показал новые модели Sonnet 3.5 New — эта чуть лучше прошлой все равно вы ее для кода используете, на 5% лучше его пишет , Haiku 3.5 — эта их конкурент gpt4o-mini получше, но дороже . Тут у Игоря подробный разбор релиза. Мне же понравилось другое, они показали как примерно будет работать управление компьютером агентом — посмотрите видео, я их чуть обрезал. То есть через какое-то время, мышку можно будет не двигать, просто говорите компьютеру что хотите — и оно делает скриншотя экран – ну как в Sci-Fi фильмах только сегодня Уже доступно через апи, вот код из примера, а тут документация Ботоводы, наверное, потирают руки
Video is not supported
Двоичный кот
Двоичный кот
Anthropic показала обновлённые Claude-3.5 Sonnet и Haiku, которые могут управлять компьютером за вас «А может тебе дать ещё ключ от квартиры, где деньги лежат?» Способность новых моделек работать в качестве ИИ-агентов — это фича, говорящая сама за себя. И доступна она пока только по API: например, компаниям-партнёрам вроде разработчиков браузера Arc. Разумеется, она во всём превосходит GPT-4o — это логично, та ведь устарела. Но главное, что свежий Sonnet стал лучше в кодинге. Если у вас слишком прямые руки, то вот страница кода с демо-видео. А здесь доки, дабы изучить всё от корки до корки.
Сфера Блогинга
Сфера Блогинга
Anthropic выкатили новые модели — точнее, обновленную Sonnet 3.5 и новую версию самой маленькой модели Haiku 3.5. Sonnet стала еще круче в написании кода хотя она и так, по общему признанию, справлялась с этим лучше других моделей и получила новую способность — computer use. Эта способность позволяет LLM использовать физический компьютер так, как это сделал бы человек — смотреть на экран, управлять программами, заполнять формы. Пока она в бете, но можно её использовать через API. В API, кстати, уже доступна версия, помеченная сегодняшним числом, так что можно пробовать. Haiku оправдывает свое звание малой модели и работает очень быстро — при этом обходя по тестам Opus 3, а в задачах на работу с кодом — буквально вчерашнюю версию Sonnet и GPT-4o. Она будет доступна до конца месяца через API, пока только в текстовом виде. Поневоле задумаешься — а Opus 3.5 вообще выйдет?
Loading indicator gif