2 октября, 10:58

AMD анонсировала малую языковую модель AMD-135M с открытым исходным кодом

AMD представила малую ИИ-модель AMD-135M  В области искусственного интеллекта AMD делает ставку не только на аппаратные мощности, но и разрабатывает программное обеспечение для удовлетворения потребностей своих клиентов. Последним достижением компании в области ПО стал выпуск малой AI-модели AMD-135M.  Читать далее
DNS_Club
DNS_Club
AMD представила малую ИИ-модель AMD-135M В области искусственного интеллекта AMD делает ставку не только на аппаратные мощности, но и разрабатывает программное обеспечение для удовлетворения потребностей своих клиентов. Последним достижением компании в области ПО стал выпуск малой AI-модели AMD-135M. Читать далее
AMD выпустила первую языковую модель ИИ — AMD-135M  Новая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на работу в частном бизнесе.  Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач.  Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.  Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода.    PRO AI   ПОЛЕЗНЫЙ СОФТ   НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
PRO AI | ПОЛЕЗНЫЙ СОФТ | НОВОСТИ
AMD выпустила первую языковую модель ИИ — AMD-135M Новая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на работу в частном бизнесе. Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250. Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. PRO AI ПОЛЕЗНЫЙ СОФТ НОВОСТИ
🔥 Акция для пользователей Tek.fm

            *Нажми тут
Tek.fm
Tek.fm
🔥 Акция для пользователей Tek.fm *Нажми тут
Все о блокчейн, мозге и WEB 3.0 в России и мире
Все о блокчейн, мозге и WEB 3.0 в России и мире
AMD выпустила свою первую малую языковую модель SLM под названием AMD-135M, она open source Модель включает 2 версии: AMD-Llama-135M общая и AMD-Llama-135M-code для кода . Модель обучена с нуля на ускорителях AMD Instinct MI250 с 670 млрд токенов.
Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.  Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI  сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет . Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.  Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.
был бы ты человек - IT, digital
был бы ты человек - IT, digital
Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M. Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет . Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования. Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.