В отличие от технологий, примененных в архитектуре Fermi, новая архитектура от NVIDIA разрабатывалась с нуля, для того, чтобы обеспечить конечного пользователя максимальным быстродействием. Видеоадаптеры, построенные на основе этой технологии, созданы для работы с параллельными исчислениями в высокопроизводительных системах типа HMC. Оглядываясь на все новшества, которые используются в видео решениях подобного рода, нельзя не согласиться с тем, что их выход стал новым витком в развитии графических ускорителей, да и графики в целом.
Структурная нотация
Tesla (K20X) = I [IO (PCI-E 3.0), P (GK110), (GDDR5) ].
- · Tesla — графический ускоритель NVidia Tesla;
- · IO — канал ввода-вывода
- · P — процессор
- · M — память
- · I — устройство управления
P (GK110) = {14SMX — Csh2} - 6.
- · P — процессор
- · SMX — потоковый мультипроцессор
- · Csh2 — кэш второго уровня
- · MC — контроллер памяти
SMX = { Cshi — 4{WP — 2Dispatch},, { 192CUDA, 64DP, 32SFU, 32LS } - 255Rg — {, Csh1, Cshro}, 16Tex }.
- · Cshi — кэш инструкций
- · WP — диспетчер «скачков»
- · Dispatch — регистр команд диспетчера
- · M — устройство памяти
- · I — устройство исполнения
- · CUDA — ядро CUDA
- · DP — устройство вычисления двойной точности
- · SFU — устройство вычисления трансцендентных функций
- · LS — устройство загрузки/хранения данных
- · Rg — регистр общего назначения
- · Сsh1 — кэш-память первого уровня
- · Cshro — кэш-память данных только для чтения
- · Tex — устройство обработки текстур