L3 - кеш-память последнего уровня (LLC)

У Intel кеш-память L3 обозначается как «кеш последнего уровня», т.е., LLC (Last Level Cache). В микроархитектуре Sandy Bridge кеш L3 распределён не только между процессорными ядрами, но, благодаря кольцевой шине, и между графическим ядром и системным агентом, в который входит модуль аппаратного ускорения графики и блок видеовыхода. Специальный трассировочный механизм упреждает возникновение конфликтов доступа между процессорными ядрами и графикой. Каждое из про-цессорных ядер имеет прямой доступ к «своему» сегменту кеша L3, а каждый сегмент кеша предоставля-ет половину ширины своей шины для доступа кольце-вой шины данных, а физи-ческая адресация всех 4-х сегментов кеша обеспечива-ется единой хэш-функцией.

►Каждый сегмент кеша L3 обладает собственным независимым контроллером доступа к кольцевой шине, он отвечает за обработку запросов по размещению физических адресов. Кроме того, контроллер кеша постоянно взаимодействует с системным агентом на предмет неудачных обращений к L3, контроля межкомпонентного обмена данными и некешируемых обращений.


1.3. Системный агент: контроллер памяти DDR3, PCU и другие

Ранее вместо System Agent в терминологии Intel фигурировало т.н. Uncore («неядро»), т.е. «всё, что не входит в Core» (●кеш L3, ●графика, ●контроллер памяти, ●контроллеры PCI Express и пр) - это элементы северного моста, перенесённые из чипсета в процессор.

 

►Т.о системный агент МА Sandy Bridge включает в себя: ● контроллер памяти DDR3, ● модуль управления питанием PCU (Power Control Unit), ● контроллеры PCI-Express 2.0, ● DMI, ● блок видеовыхода и пр. Как и все остальные элементы архитектуры, системный агент подклю-чен в общую систему высокопроизводительной кольцевой шиной.

 

►Двухканальный конт-роллер памяти DDR3 на кристалле будет обеспе-чивать значительно меньшую латентность.


 

►Системный агент Sandy Bridge подразумевает наличие 16 линий шины PCI-E 2.0 (2х8 или 1х8+2х4). ► Есть и расширение до 20 линий.

►Расположенный в системном агенте контроллер управления питанием отвечает за своевременное динамичное масштабирование напряжений питания и тактовых частот процессорных ядер, графического ядра, кешей, контроллера памяти и интерфейсов.

Что особенно важно подчеркнуть, управление питанием и тактовой частотой производится независимо для процессорных ядер и графического ядра.

►Совершенно новая версия технологии Turbo Boost 2.0 реализована благодаря контроллеру управления питанием. Дело в том, что, в зависимости от текущего состояния системы и сложности решаемой задачи, МА Sandy Bridge позволяет технологии Turbo Boost «разогнать» ядра процессора и встроенную графику до уровня, значительно превышающего TDP на достаточно долгое время.

Такая плотная интеграция системы управления напряжением питания и частотами позволила реализовать на практике гораздо более агрессивные сценарии работы технологии Turbo Boost, когда и графика, и все четыре ядра процессора при необходимости и соблюдении определённых условий могут разом работать на повышенных тактовых частотах со значительным превышением TDP, но без каких-либо побочных последствий.

Принцип работы новой версии технологии Turbo Boost, реализованной в процессорах Sandy Bridge, отлично описывается в мультимедийной презентации, показанной в сентябре 2010г. на Форуме Intel для разработчиков в Сан-Франциско. Представленный ниже видеоро-лик с записью этого момента презентации (6:50) расскажет вам о Turbo Boost быстрее и лучше, чем любой пересказ.

 


 

►Каждое из четырёх ядер Sandy Bridge может быть при необходимости независимо переведено в режим минимального энергопотребления, ● графическое ядро также можно перевести в очень экономичный режим. ● Кольцевая шина и кеш L3, в силу их распределения между другими ресурсами, не могут быть отключены, однако для кольцевой шины предусмотрен специальный экономичный ждущий режим, когда она не нагружена, а для ● кеш-памяти L3 применяется традиционная технология отключения неиспользуемых транзисторов. Т.о., эти МП в составе мобильных ПК обеспечивают длительную автономную работу при питании от аккумулятора.

 

►Модули видеовыхода и мультимедийного аппаратного декодирования также входят в число элементов системного агента. В отличие от предшественников, где аппаратное декодирование было возложено на графическое ядро, в новой архитектуре для декодирования мультимедийных потоковиспользуется отдельный, гораздо более производительный и экономичный модуль, и лишь в процессе кодирования (сжатия) мультимедийных данных используются возможности шейдерных блоков графического ядра и кеш L3.

 

►В соответствии с современными веяниями, в МП предусмотрены инструменты воспроизведения 3D-контента. Аппаратный модуль декодирования Sandy Bridge способен без труда обрабатывать сразу два независимых потока MPEG2, VC1 или AVC в разрешении Full HD.
Познакомимся с особенностями реализации и функционирования процессорных ядер Sandy Bridge, которых будет от 2 до 20.