NVIDIA T4

Гибкая Архитектура,
Революционная производительность

 

Теперь доступно ускорение инференса нового поколения

Мы на пути к будущему, когда каждое взаимодействие с клиентом, каждый продукт и предлагаемая услуга будут изменены и улучшены с помощью искусственного интеллекта. Для осуществления этих перспектив необходима вычислительная платформа, которая может ускорять полный спектр задач современного искусственного интеллекта, позволяя компаниям переосмыслить работу с новыми клиентами. У компаний появится возможность определить, как соответствовать потребностям клиента и превосходить их, а также экономично масштабировать продукты и услуги на базе искусственного интеллекта.

GPU NVIDIA® T4 ускоряет различные задачи в облаке, в том числе высокопроизводительные вычисления, тренировку и инференс алгоритмов глубокого обучения, машинное обучение, анализ данных и работу с графикой. T4 создан на базе новой архитектуры NVIDIA Turing и заключен в компактный форм-фактор PCIe с уровнем энергопотребления 70 Вт. Графический ускоритель оптимизирован для основных вычислительных сред и оснащен тензорными ядрами Turing и новыми ядрами RT. T4 обеспечивает революционную масштабируемую производительность, так как объединен с ускоренным контейнеризованным ПО из NGC.

Новое партнерство нацелено на развитие гибридных облачных платформ для обеспечения современных рабочих нагрузок.

Революционная производительность

T4 представляет революционную технологию Turing с тензорными ядрами для операций с разной точностью, что позволяет выполнять различные задачи. T4 до 40 раз мощнее CPU и обеспечивает невероятную производительность любых операций от FP32 до FP16 и INT8, а также операций INT4 с точностью.

Невероятная производительность инференса

Современный инференс в реальном времени

Отзывчивость - основной критерий привлекательности для пользователя таких услуг, как коммуникативные сервисы с искусственным интеллектом, рекомендательные системы и визуальный поиск. Так как модели глубокого обучения становятся все более сложными, быстрый и правильный ответ требует существенно более высокой вычислительной мощности. Tesla T4 обеспечивает повышение производительности до 40 раз с минимальными задержками, позволяя обрабатывать больше запросов в реальном времени.

Производительность инференса T4

Система распознавания изображений Resnet50

Система распознавания речи DeepSpeech2

Система машинного перевода GNMT

Производительность транскодирования видео

Так как объем онлайн-видео увеличивается в геометрической прогрессии, продолжает расти потребность в решениях для эффективного поиска и извлечения знаний из видеоматериалов. Tesla T4 обеспечивает революционную производительность для видеоприложений на базе искусственного интеллекта благодаря специализированным аппаратным движкам для транскодирования, которые заключают в себе двухкратную производительность декодирования GPU предыдущего поколения. T4 обеспечивает повышение производительности до 40 раз, позволяя обрабатывать больше запросов в реальном времени.

Спецификации NVIDIA Tesla T4

 

Производительность

Тензорные ядра Turing
320

Ядра NVIDIA CUDA®
2560

Производительность операций с одинарной точноcтью (FP32)
8,1 Терафлопс

Операции со смешанной точностью (FP16/FP32)
65 Терафлопс

Операции INT8
130 тера-операций в секунду (TOPS)

Операции INT4
260 тера-операций в секунду (TOPS)

 
 

Внутреннее соединение

Gen3
x16 PCIe

 
 

Объем видеопамяти


16 ГБ GDDR6

Пропускная способность памяти
320+ Гбит/с или выше

 
 

Энергопотребление

70 Вт

 

Платформа NVIDIA для инференса искусственного интеллекта

Узнайте больше о самой инновационной в мире платформе для инференса.