Сайт

Категория

Следующее приложение

DeepSpeed

Библиотека оптимизации глубокого обучения для обучения Больших Языковых Моделей (LLMs)

О DeepSpeed

DeepSpeed - это простой в использовании пакет для оптимизации глубокого обучения. Он позволяет выполнять обучение глубокого обучения и вывод для массивных моделей с миллиардами или триллионами параметров. Он также предлагает высокие системные производительность, масштабируемость до тысячи GPU и низкую задержку и высокую производительность для вывода. Кроме того, DeepSpeed предоставляет экстремальную сжатие для сокращения размера модели и снижения затрат.

DeepSpeed является неотъемлемой частью инициативы Microsoft AI at Scale, намеренной привнести следующее поколение AI-функциональности в первые ряды. Чтобы узнать больше об этом проекте, вы можете посетить их веб-сайт здесь.

.

Читать на английском