Введение
В гордом одиночестве топовым сегментом рынка процессоров для десктопов правят чипы Intel Core i7 серии 900 для LGA-1366, противопоставить производительности которых никто и ничего не может. Если у вас есть средства, и вы собираете компьютер с прицелом на максимум производительности, сложно выбрать решение более мощное, чем разгонанный Core i7-950. Энтузиасты, которым реально необходимы возможности шести ядер, могут использовать Core i7-970, но придётся заплатить немало за право обладать таким процессором.
В то же время, в массовом сегменте рынка разворачиваются интереснейшие битвы. Не правда ли, забавно следить за тем, как здоровая конкуренция стимулирует агрессивную ценовую политику? Например, четырёхъядерные процессоры Intel Core i5-760, которые мы рекомендовали читателям в статье о новогодних подарках, предлагаются по неотразимой цене порядка $200, и столько же просит AMD за шестиядерные Phemon II X6 1075T. Или взять другой случай – процессоры AMD Black Edition, за счёт разблокированного множителя, покорили умы оверклокеров довольно давно, но вот и Intel, в начале 2010 года, представила линейку чипов K-серии, сломав тем самым собственную традицию продавать разблокированные процессоры только в виде моделей Extreme Edition, стоимостью в тысячу долларов.
http://www.thg.ru/cpu/sandy_bridge/images/cover_badges.jpg
5-го января, как раз в канун российских новогодних каникул, была официально представлена микроархитектура Sandy Bridge. Мы получили последние пресс-релизы и материалы по Sandy Bridge после полудня, с традиционным напоминанием, что завеса секретности снимается после девяти вечера по Москве. Интересно отметить, что выпуск Sandy Bridge идёт в обход привычных канонов - в прошлый раз, представляя новый дизайн процессоров, Intel запустила вначале топовые чипы Core i7 девятисотой серии, а затем уже, на основе этой архитектуры, появились более дешёвые модели для массового и бюджетного сегментов. В отличие от тех чипов, Sandy Bridge пришёл на рынок снизу-вверх, и в результате, мы увидим флагманские решения для LGA 2011, ориентированные на сегмент настоящих рабочих станций, только во второй половине 2011 года.

Intel здесь и сейчас
До второй половины 2011 года ещё нужно дожить, а пока LGA 1366 продолжит занимать топовую позицию в линейке, в то время как чипы под LGA 1155, с центровым нападающим в виде Sandy Bridge, должны захватить все остальные сегменты, благодаря заявленному Intel тридцатипроцентному приросту производительности над чипами на основе Lynnfield и Clarkdale.
Конечно, это создаст проблемы AMD, которой нечем парировать подобный прирост производительности, и которая продолжает выпускать более быстрые версии процессоров лишь на текущей архитектуре. Единственным способом нанести ответный удар для неё будет снижение цен, и можно предположить, что именно этот путь AMD выбирать ой как не хотела бы. Конечно, мы ожидаем выпуска процессоров Bulldozer, на основе собственной архитектуры AMD следующего поколения, где-то в 2011 году, но их ещё дождаться нужно.
http://www.thg.ru/cpu/sandy_bridge/images/roadmap.jpg
прочем, достанется не только AMD. Достаточно мощное ускорение, заложенное в микроархитектуре Sandy Bridge, сделает уязвимым и собственные чипы Intel Core i7 девятисотой серии. В настоящий момент, как минимум, пострадают решения в ценовой категории порядка $300 (например, Core i7-950), которые приходится устанавливать в заметно более дорогие матплаты с трёхканальной памятью. В целом, платформа X58 продолжит восседать на троне лидера в сегменте десктопов, но проанализировав результаты тестов Sandy Bridge, проведённых в Tom's Hardware, мы не удивимся, если дни X58 окажутся сочтены несколько ранее запланированного.

Sandy Bridge приготовил нам и другие сюрпризы, и не все будут смаковать их также, как ледяную водочку под хрустящий огурчик за новогодним столом. Например, разгон Intel-овских платформ стал совершенно другим, что заставит рвать на себе волосы экстремальных любителей жидкого азота. И ещё Intel делает большой упор на интегрированную графику, заранее называя её конкурентом дискретных решений начального уровня но, реалистично ли это в сегменте настольных ПК?
http://www.thg.ru/cpu/sandy_bridge/images/intel_clarkdale_corei5_661.jpghttp://www.thg.ru/cpu/sandy_bridge/images/intel_clarkdale_corei5_661.jpg
http://www.thg.ru/cpu/sandy_bridge/images/labeled_die.jpg
На другой чаше весов поддержка в Sandy Bridge блока логики с фиксированными функциями, предназначенного для ускорения кодирования видео. AMD и nVidia не смогут выставить достойного соперника, они отстают по технологии на год, следовательно сегодня, в задачах обработки видео, они окажутся повержены. Наконец, у нас есть несколько моделей чипов с разблокированным множителем, которые позволят процессорам Sandy Bridge, производимым по 32-нанометровой технологии, поиграть мускулами.

Тест
Intel заранее прислала в тестлаб Tom’s Hardware четыре модели процессоров из будущей линейки: Core i7-2600K, Core i5-2500K, Core i5-2400 и Core i3-2100. Мы прогнали все эти чипы через обновлённый тестовый процесс 2011 года, вместе с чипами на базе Bloomfield, Clarkdale и Yorkfield. Также, в тестировании приняли участие решения на основе Thuban и Deneb от AMD. Так что, пока россияне уходили в творческие отпуска, в самый канун праздников, наша калифорнийская тестовая лаборатория вовсю тестировала новые Sandy Bridge. Готовы взглянуть на эти результаты?

Если мельком взглянуть на приведённые выше схемы, микроархитектура Sandy Bridge выглядит как полный отход от конструкции предыдущих моделей процессоров Intel. Так, процессоры предыдущего поколения Core на основе Clarkdale состоят из двух физических чипов – первый, это двухядерный процессор, изготовленный по 32-нанометровому процессу, а второй - графическое ядро, интегрированный контроллер памяти и контроллер PCI Express, производимые по 45-нанометровому процессу. Глядя на схему Sandy Bridge мы видим процессор, целиком и полностью изготовленный по 32-нанометровым нормам, со всеми теми же компонентами, совмещёнными в едином кристалле кремния. Но если вглядеться получше, в глаза начинает бросаться много подобного в "конструкции", что приводит нас к мысли - изменения в архитектуре, всё же, правильнее называть эволюционными.
http://www.thg.ru/cpu/sandy_bridge/images/tick_tock.jpg
Интеграция – именно это слово нужно держать в голове, глядя на устройство Sandy Bridge. Intel стремится получить максимальную отдачу от каждого из почти 1 миллиарда транзисторов (если быть совсем точными, их в Sandy Bridge 995 миллионов).

Стоит отметить, что к моменту анонса Intel приготовила три разновидности кристалла Sandy Bridge. Отличаются они количеством ядер и сложностью графического чипа. Самый мощный четырёхъядерный вариант как раз и состоит из 995 миллионов транзисторов, имеет размер кристалла 216 мм2. Двуядерный чип с 12 исполнительными блоками, формирующими графическое ядро – в нём 624 миллиона транзисторов на кристалле размером 149 мм2. Наконец, самый простой вариант с двумя процессорными ядрами и шестью исполнительными блоками графической системы – всего 504 миллиона транзисторов на 131 квадратном миллиметре кремния. Чтобы было понятнее, следующая таблица:

                    Размеры кристаллов
Размер кристалла, мм2                       Число транзисторов (миллионов)
Sandy Bridge (4 ядра)                         216 995
Sandy Bridge (2 ядра, HD Graphics 3000) 149 624
Sandy Bridge (2 ядра, HD Graphics 2000) 131 504
Bloomfield (4 ядра)                                 263 731
Lynnfield (4 ядра)                                 296 774
Westmere (2 ядра)                              81 383
Gulftown (6 ядра)                                248 1168

Для сравнения, в микроархитектуре Lynnfield, послужившей основой для семейства серий Core i7-800 и i5-700, при 45-нанометровом технологическом процессе удалось вместить всего 774 миллиона транзисторов в кристалл площадью 296 квадратных миллиметров. Разработчики архитектур в Intel должны быть благодарны инженерам, которые отладили 32-нанометровое производство на Westmere, чтобы оно заработало в полную силу с Sandy Bridge, за то что им удалось столько всего втиснуть в маленький кристалл.

Ядра
Текущее поколение процессоров Sandy Bridge, в общих чертах, бывает трёх видов: четыре ядра с поддержкой Hyper-Threading (итого восемь потоков для операционной системы), четыре ядра без HT или два ядра с Hyper-Threading. Наши тесты показывают, что каждое из этих ядер, при равной частоте, мощнее ядер в процессорах Core на базе архитектуры Nehalem.
http://www.thg.ru/cpu/sandy_bridge/images/uop_cache.jpg
В процессоре по-прежнему есть 32 килобайта кэша инструкций и данных первого уровня (L1), вместе с 256 килобайтами кэша второго уровня (L2) у каждого ядра, хотя Sandy Bridge включает теперь и то, что Intel назвала кэшем инструкций нулевого уровня (L0), содержащим до 1500 декодированных микро-операций. Последнее обеспечивает двойной эффект – позволяет экономить энергию и улучшает пропускную способность инструкций. Если блок выборки обнаруживает нужную инструкцию в кэше, он может выключить декодеры до момента, когда они вновь не понадобятся. Intel также переработала блок предсказания ветвлений в Sandy Bridge, улучшив его точность.
http://www.thg.ru/cpu/sandy_bridge/images/lame_clock.png
http://www.thg.ru/cpu/sandy_bridge/images/itunes_clock.png
Мы использовали в роли синтетического теста кодирование звука в iTunes и Lame как пример работы однопоточных приложений, чтобы сравнить Sandy Bridge с Nehalem на базе Lynnfield при равной частоте. Конечно, для чистоты эксперимента технологии Turbo Boost и EIST были выключены. На графиках видно, что только одно изменение архитектуры уже оказывает существенное влияние на производительность Sandy Bridge в сравнении с предыдущим поколением процессоров.

Процессоры на базе Sandy Bridge являются первыми решениями с поддержкой улучшенных векторных расширений (Advandec Vector Extensions, AVX) – 256-битного набора инструкций к SSE. AMD также введёт поддержку AVX в будущих процессорах на базе микроархитектуры Bulldozer. Появление AVX стимулировал рынок высокопроизводительных вычислений, где приложениям, производящим интенсивный рассчёт с плавающей запятой требуется как никогда много мощи. По этой же причине влияние AVX именно на успешность массового Sandy Bridge, скорее всего, будет ограниченным. Intel, впрочем, ожидает, что приложения для обработки звука и видео будут, в конечном итоге, оптимизированы для использования AVX, равно как и сервисы финансового анализа, инженерное и производственное ПО – на которые эта технология и рассчитана. К несчастью, сейчас не существует реальных приложений, оптимизированных для AVX, и нам не на чем было провести замеры, чтобы оценить потенциал технологии.
http://www.thg.ru/cpu/sandy_bridge/images/sb_arch.jpg
Конечно, потребовалось немало проделать работы, чтобы включит поддержку AVX, и, в том числе, произвести переход к физическим регистрам. Во-первых, это позволило операндам храниться в регистровом файле, вместо того, чтобы путешествовать с микро-операциями сквозь блок внеочередного исполнения. Во-вторых, Intel удалось использовать обеспеченный новым физическим регистром уменьшенный размер кристалла и улучшенное энергосбережение для значительно увеличения буферов, более эффективно "питающих" данными усиленный движок рассчёта плавающей запятой.

Кэш
В результате усиления интеграции, Intel пришлось изменить работу с кэшем третьего, последнего, уровня. Во времена, когда потолком были четырёхядерные Bloomfield, Lynnfield и Clarkdale (и даже шестиядерные Westmere), каждому физическому ядру можно было обеспечить собственное соединение с этим общим кэшем. Технических проблем это не вызывало. Но уже чипы из серии Xeon 7500, продаваемые сегодня, и спроектированные как более масштабируемые, содержат до восьми физических ядер на процессор и будь они построены по прежнему принципу, возникало бы непомерное количество обращений между основным и последним уровнями кэш-памяти. Поэтому, Intel адаптировала и для новой микроархитектуры кольцевую шину (ring bus), что в промышленных решениях позволит наращивать количество ядер в процессоре и дальше, избегая выхода логистики обмена данными из под контроля.
http://www.thg.ru/cpu/sandy_bridge/images/beckton.jpg
Ранее специалистам THG удалось пообщаться с Сайлешем Коттапали, старшим ведущим инженером Intel, который утверждал, что ему удалось получить устойчивую полосу пропускания данных до 300 гигабайт в секунду на процессорах Intel серии Xeon 7500, поддерживающих кольцевую шину. К тому же, на Intel Developer Forum (IDF) представители компании подтвердили, что все разрабатывающиеся в настоящий момент процессоры будут использовать кольцевую шину. Можно достаточно смело предположить, что в будущем мы увидим развитие тенденции увеличения количества ядер в процессоре, а также, интеграции других компонентов прямо в кристалл.

Вот только мы не думаем, что Intel в этот раз сильно переживала насчёт количества ядер в массовых версиях процессоров на архитектуре Sandy Bridge - скорее, её инженеров волновало интегрированное графическое ядро, также сдвинутое в сторону архитектуры кольцевой шины, которая теперь соединяет графику, до четырёх ядер и системный агент (system agent, ранее известный как uncore) с остановкой в каждом домене. При такой архитектуре величина задержек плавает, поскольку каждый компонент работает по кратчайшему пути к шине, но в целом, они всегда должны быть ниже, чем у процессоров на базе Westmere. В общем, наибольшее влияние кольцевая шина должна будет оказывать на производительность в графических приложениях.

System Agent и Turbo Boost 2.0
Изменившись главным образом в названии, "системный агент" (system agent), ранее называвшийся uncore, объединяет в себе подсистемы, которые не могут быть сгруппированы с исполнительными ядрами (и включает в себя графическое ядро).
http://www.thg.ru/cpu/sandy_bridge/images/die_pieces.jpg
В списке компонентов "системного агента" - двухканальный контроллер памяти (официально поддерживающий скорость передачи до 1333 МТ/с), 16 линий PCI Express второго поколения, DMI и улучшенный блок управления энергопотреблением, отвечающий за работу Turbo Boost и некоторые другие процессы.

Sandy Bridge поддерживает технологию Turbo Boost второго поколения. Напомним, исторически принято считать временем появления Turbo Boost момент анонса процессоров Intel Core i7 девятисотой серии на базе Bloomfield, два года назад, но в них технология TB работала скорее на троттлинг, то есть не очень хорошо, а фактически, проявила себя в процессорах на базе Lynnfield только год спустя.

Предпосылкой для появления технологии Turbo Boost 1.0 в процессорах является тот факт, что в многоядерных чипах далеко не все имеющиеся ресурсы используются даже современными версиями приложений. Программы не слишком оптимизированные под многоядерность, такие как iTunes, например, могут использовать единовременно лишь одно ядро из множества доступных. Поскольку тепловой потолок чипа рассчитывается для ситуации наихудшего сценария, когда все ядра загружены под завязку, технология Turbo Boost может использовать возникающий "тепловой резерв". В таком случае, когда процессор исполняет однозадачное приложение, типа того же iTunes, для увеличения производительности активного ядра его частота увеличивается.
http://www.thg.ru/cpu/sandy_bridge/images/turbo_2.jpg
Turbo Boost первого поколения довольно умная технология – умеет поднимать частоту ядер, оперируя данными о температуре, токе, энергопотреблении чипа и состоянии операционной системы. Но она не сможет превысить заданный уровень энергопотребления, даже если остаётся изрядный тепловой резерв, чтобы разгонать ядра ещё сильнее.

На практике, процессор разгоревается не сразу же. Чтобы дойти из состояния покоя до ограничения теплового уровня, ему потребуется время. Технология Turbo Boost 2.0 позволяет чипу превышать заданный уровень энергопотребления до тех пор, пока не достигнут потолок температурного режима, после чего чип снижает энергопотребление для возвращения в запрограммированные пределы.

Но всё сказанное выше не означает, что процессор с Turbo Boost 2.0 будет превышать частоту ядер сверх указанной как максимальная для Turbo Boost. Если у вас, например, процессор Intel Core i7-2600K с базовой частотой 3.4ГГц и максимальной в режиме Turbo Boost 3.8 ГГц, то именно планка в 3.8 ГГц будет максимально достижимой в штатных условиях. Он просто будет оставаться на этой частоте дольше – до тех пор, пока процессор не превысит свой тепловой лимит, и только затем снизит частоту.

К сожалению, не так то просто оценить преимущества новой технологии. Лучшее что нам удалось выжать из Intel – это должно улучшать отзывчивость системы. В нашей калифорнийской лаборатории, на настольком компьютере, просто не удавалось почувствовать разницу, и как результат, Turbo Boost второго поколения показался нам больше рекламным шагом.

Справедливости ради, в ноутбуках, где базовые частоты намного ниже для экономии энергии, эта технология будет оказывать большее влияние, за счёт более высокой планки увеличения частоты. У нас есть ноутбук на базе Sandy Bridge в офисе и в этом месяце мы планируем выпустить его обзор.
http://www.thg.ru/cpu/sandy_bridge/images/turbo_sharing.jpg
Также, в сегменте мобильных решений, больше влияния на производительность будет оказывать возможность технологии Turbo Boost распределять термальный бюджет между графическим и процессорными ядрами. Чипы предыдущего поколения, на основе Arrandale, также умели это делать, применяя Turbo Boost к обеим компонентам. Процессоры с микроархитектурой Sandy Bridge позволяют делать то же самое на десктопных чипах. Intel отмечает, что в ресурсоёмких 3D-приложениях, блок контроля энергопотребления будет выделять больше ресурсов графическому ядру, так как именно его ускорение больше влияет на общую производительность, нежели разгон процессорных ядер.

Quick Sync - секретное оружие
Вы когда-нибудь слышали, чтобы Intel застала AMD и nVidia врасплох на рынке графики? И всё же, движок Quick Sync оставался тайной, сокрытой в стенах Intel, вплоть до IDF 2010. Можете ли вы поверить, что впервые эта концепция появилась пять лет назад? В то время, первые Blu-ray приводы только начинали продаваться, знаменуя переход от видео низкого разрешения к контенту высокой чёткости (HD), а рынок мобильных систем рос быстрее сегмента настольных компьютеров.

В Intel поняли, что ПК был и остаётся единственной платформой для создания контента, и что неприемлемо, если редактирование видео отнимает все выходные. Именно тогда инженеры в Intel решили повысить производительность кодирования и декодирования в Sandy Bridge – решив, тем самым, проблемы создателей контента. Они создали конвейер обработки видео в формате выделенной логики с фиксированными функциями, которая служит двум целям - во-первых, обеспечивает достойную производительность, во-вторых, сохраняет энергопотребление на минимальном уровне.

Название Quick Sync логика с фиксированными функциями получила позднее. Это чисто маркетинговое название для функции ускорения кодирования и декодирования видео.

Наши постоянные читатели могут возразить, указав что AMD и nVidia уже ускоряют эти вещи при помощи CUDA и Stream (нынче именуемой APP). Это действительно так. Но обе компании используют общецелевое, в каком-то смысле стандартное, железо для увеличения производительности за пределы того, что может быть достигнуто чисто программным путём. И пока нам прививали привычку думать, что вычисления на общецелевом GPU и есть будущее, по крайней мере, альтернативное ограниченному параллелизму, реализуемому на центральном процессоре, мы забывали о том, что задачи о которых мы говорим здесь не могут исполняться также быстро или также эффективно (с точки зрения энергопотребления) в общецелевых блоках, если сравнивать их со специализированными.

Итак, в чём же суть? Мы знаем что видео – не важно, идёт ли речь о воспроизведении или о кодировании, по сути обыденная вещь. Выделение ядер процессора для этих целей их нагружает и требует большого количества энергии. Мы долгие годы наблюдали как много нужно для этого ресурсов в многочисленных обзорах процессоров, опубликованных на THG (достаточно вспомнить результаты замеров в MainConcept и HandBrake). Разработчикам программ приходилось колдовать над параллелизмом своих приложений, чтобы обработка видео в них происходила быстрее. А это означало больше загрузки, больше расходуемой энергии, больше выделяемого тепла, и так далее. Мы имеем ввиду, что обработка видео – один из самых ресурсоёмких сценариев тестирования, которым мы систематически нагружали новые процессоры.
http://www.thg.ru/cpu/sandy_bridge/images/graphcis_core.jpg
Ответом Intel стало создание специального вычислительного блока в Sandy Bridge, который не занимается ничем другим, кроме видео. По словам доктора Хун Цзян, старшего инженера и главного медиа-архитектора Sandy Bridge, это решение было основано на концепции распространённости видео и связанных с его обработкой задач. Intel буквально поставила на то, что решить вопрос с обработкой видео важнее для большей части её клиентов, нежели потратить транзисторы на увеличение производительности в играх. Конечно, помогло и то, что работа с видео всегда была одним из козырей Intel. Инвестиции в Quick Sync идут гораздо дальше скромного выигрыша в 3D.

Что делает Quick Sync?
QuickSync предназначен для двух основных задач: ускорения кодирования и декодирования видео.
http://www.thg.ru/cpu/sandy_bridge/images/decoder.jpg
Intel уже имеет достаточный опыт в области реализации ускорения декодирования видео. Существующие процессоры с интегрированной графикой могут справиться с воспроизведением MPEG-2, VC-1 и AVC. Однако, компенсация движения (наиболее сложная часть в конвейере декодирования) и фильтрация артефактов (loop filtering в VC-1 и AVC) происходит у них в блоках общего назначения, что "съедает" больше мощности, чем необходимо. В Sandy Bridge эта проблема решена перемещением всего конвейера декодирования в эффективный многоформатный кодек с фиксированными функциями. Добавлена и поддержка MVC для воспроизведения 3D Blu-ray. Масштабирование видео, подавление шумов, деинтерлейсинг (процесс создания одного кадра из двух полукадров чересстрочного формата для дальнейшего вывода на монитор), улучшение цвета оттенков кожи, управление цветопередачей, улучшение контрастности – за все эти функции отвечают специализированные блоки логики в графическом процессоре.

Для ускорения кодирования предусмотрена логика с фиксированными функциями, которая работает совместно с программируемыми исполнительными блоками. К исполнительным блокам (EU) прикреплён блок медиа-сэмплирования (Intel называет его сопроцессором), обеспечивающий работу алгоритма предсказания движения, дополняя программируемую логику. Задачи декодирования, решаемые в процессе перекодирования, проходят через тот же конвейер с фиксированными функциями, о котором уже шла речь, что приводит к росту производительности. Вы можете подавать на вход поток MPEG-2, VC-1 или AVC, и получать MPEG-2 или AVC на выходе.
http://www.thg.ru/cpu/sandy_bridge/images/quick_sync.jpg

Quick Sync против APP и CUDA
Мы использовали несколько приложений для воспроизведения контента (декодеров) и несколько приложений для конверсии (кодирования/перекодирования) видео для экспериментов.
http://www.thg.ru/cpu/sandy_bridge/images/screen1.png
Приложение CyberLink MediaEspresso может использовать все преимущества технологии AMD Stream (которая теперь называется APP) и nVidia CUDA API. По сравнению с компьютером без аппаратного ускорения, используя CUDA и APP можно получить заметный прирост производительности. Но Sandy Bridge, благодаря оптимизации MediaEspresso под Quick Sync, оказывается в совершенно другой весовой категории. Всего 22 секунды заняло преобразование почти 500 мегабайтного исходного видео в разрешение 1024x768 для проигрывания на планшете Apple iPad.
http://www.thg.ru/cpu/sandy_bridge/images/screen2.png
С MediaConverter 7 всё оказалась сложнее. Пререлизная версия была оптимизирована и под Quick Sync, и поддерживала ускорение с помощью AMD Stream, а вот видеокарту GeForce GTX 570 она не распознала. Тогда мы решили использовать текущую доступную демо-версию, но и в ней не смогли включить CUDA. Однако, полученные результаты показывают, что ускорение действительно включено. У приложения Arcsoft есть дополнительное преимущество в виде индикатора используемых ресурсов.

Полученные результаты очень интересны. Без ускорения, кодирование видео с профилем для Apple iPad прошло за 1:35, при этом загрузка процессора Core i7-2600K составила около 30%. После установки видеокарты nVidia, нагрузка выросла до 50%, но задача была выполнена почти на 20 секунд быстрее. С видеокартой Radeon HD 6870 нагрузка снизилась а производительность возрасла. Но включение оптимизации под Quick Sync впечатляет больше всего: задача была выполнена за 41 секунду, а ядра процессора почти не нагружались.

К сожалению, чтобы в полной мере ощутить преимущество от технологии Quick Sync, вам придётся использовать интегрированное графическое ядро Intel. Ни MediaEspresso, ни MediaConverter не могут определить наличие конвейера Intel после установки в компьютер дискретной видеокарты. Если вы работаете с контентом на игровом компьютере, Quick Sync вам не поможет.

Воспроизведение Blu-ray и функционирование видео
После того, как мы обсудили оптимизацию кодирования и перекодирования (сжатия) видео, давайте разберемся с декодированием (просмотром) и постараемся оценить, какие усилия Arcsoft и CyberLink приложили к поддержке технологии Quick Sync.
http://www.thg.ru/cpu/sandy_bridge/images/cpu_utilization.jpg
Оказалось, что конвейер декодирования Sandy Bridge настолько полный, что даже декодирование AACS перенесено в блок с фиксированными функциями. Алгоритм AACS использует шифрование AES, которое может ускорить большинство процессоров на базе Sandy Bridge.

В идеальном сценарии, по утверждению представителей Arcsoft, когда закодированный поток Dolby TrueHD или DTS-HD Master Audio передаётся на внешний ресивер по HDMI 1.3 или 1.4 (процессор не занимается декодированием звука), загрузка процессора при воспроизведении Blu-ray будет нулевой.
http://www.thg.ru/cpu/sandy_bridge/images/dtshd.jpg
Мы использовали CyberLink PowerDVD 10 с передачей потокового звука на внешний ресивер и не получили столь ошеломляющих результатов. Однако, на ноутбуке с процессором Core i7-2820Q, при просмотре фильма "Квант милосердия/Quantum of Solace", закодированным в AVC, нагрузка на процессор держалась на уровне 10%.

HD Graphics для настольного ПК - Intel подтягивается
В предварительных обзорах графического ядра Sandy Bridge некоторые журналисты предполагали, что у Intel получится решение, способное заменить в играх дискретные видеокарты начального уровня. И конечно, цитаты из этих публикаций пресс-служба Intel вставила в материалы для продавцов, которые журналисты обычно не видят. Те кто ожидал от Sandy Bridge производительности десктопной видеокарты будут разочарованы по нескольким причинам.

Один гигантский шаг… для Intel
Давайте начнём с самого начала – с примеров графических ядер предыдущего поколения. Как известно, процессоры на основе Clarkdale, представленные год назад, стали первыми, продемонстрировавшими производственное лидерство Intel. Например, сами двухядерные процессоры изготавливались по технологии 32 нм, но в них же Intel использовал 45-нм литографию для второго кристалла в упаковке, содержащего контроллер памяти, контроллер PCI Express и графический движок Ironlake.

Это был очень серьезный шаг к интеграции ещё большего функционала на CPU, но решение не было идеальным. Да, графическая производительность оказалась выше, чем у интегрированных в чипсет ядер предыдущих поколений, но производительность памяти упала по сравнению с Lynnfield и Bloomfield, поскольку контроллер памяти был убран с кристалла.
http://www.thg.ru/cpu/sandy_bridge/images/graphics_integration.jpg
В Sandy Bridge вся эта логика была "склеена" вместе, что дало Intel возможность более эффективно контролировать её работу. Например, графическое ядро теперь получило доступ к кэшу последнего уровня, и у архитектуры появился механизм, предотвращающий задержки между ядрами и графическим движком. Как уже говорилось, при больших 3D-нагрузках блок управления потребляемой мощностью выделяет графическому ядру больший тепловой бюджет для работы на частотах до 1350 МГц.

Номенклатура, которую использует Intel, аналогична предыдущему поколению. Движок HD Graphics по-прежнему использует 12 скалярных исполнительных блоков (EU) и совместим с DirectX 10.1. Но есть несколько архитектурных улучшений, таких как более крупные регистры, интеграция mathbox и поддержка новых инструкций, которые должны удвоить пропускную способность инструкций по сравнению с GPU Ironlake у Clarkdale. Добавьте к этому серьёзный прирост тактовых частот, и вы получите потенциал для значительного повышения производительности.

История про два GPU
Теперь перейдем к плохим новостям. Есть две версии графического ядра с похожими названиями HD Graphics 3000 (GT2) и HD Graphics 2000 (GT1). У первого – 12 исполнительных блоков, у второго их всего шесть.

Все 15 мобильных процессоров на базе Sandy Bridge используют HD Graphics 3000. Некоторые работают на частоте 1300 МГц, другие – 1100 МГц, и еще два – 950 МГц. Окончательные спецификации, во многом, зависят от теплового пакета TDP.

Настольные ПК – это совсем другая история. Из 14 новых процессоров на базе Sandy Bridge только два оснащаются графическим ядром HD Graphics 3000. Самое смешное, что два этих чипа относятся к линейке K – только голову дадим на отсечение, энтузиасты вряд ли воспользуются встроенными графическими ядрами для выполнения 3D-задач. Остальные 12 моделей – как раз те, которые будут использоваться в массовых компьютерах в домах и офисах – получили HD Graphics 2000. Владельцы этих процессоров оценили бы экономию $50 за отказ от дискретной видеокарты. И они как раз получат урезанную версию графического ядра.

Энтузиасты, готовые заплатить на $20 больше за чип из линейки K, покупают дискретные видеокарты. Последний гвоздь в гроб мы забьём буквально через пару абзацев, когда вы узнаете, что чипсет H67, нужный для использования встроенной графики, не поддерживает разгон процессора. Нет никаких причин для комбинации K-процессора c чипсетом H67.

Есть большая вероятность того, что оценка результатов тестов Sandy Bridge в ноутбуках будет существенно отличаться, их ЖК-дисплеи, работающие в меньшем "родном" разрешении, хорошо дополняют более мощный движок HD Graphics 3000. Но ещё до анализа производительности десктопных решений можно сказать, что Intel упустила хорошую возможность проявить себя здесь.

Это просто игра чисел
Начнём тесты с игры, которая вполне соответствует графическому ядру процессоров Intel: World of Warcraft: Cataclysm. Мы использовали тестовый перелёт от Crushblow до Krazzworks в Twilight Highlands.
http://www.thg.ru/cpu/sandy_bridge/images/screen3.png
Графический движок HD Graphics 3000 очень хорош по сравнению с AMD Radeon HD 4550 512 MB – эта видеокарта стоит около $25. Ядро HD Graphics 2000 не выглядит столь же впечатляющим, даже на предпоследнем минимальном уровне качества картинки. Оно оказалось быстрее Clarkdale, в котором в два раза больше исполнительных ядер, что уже говорит кое о чём. Но всё же настольные процессоры Sandy Bridge вряд ли подходят для игр.

Для сравнения мы установили в тестовый стенд видеокарту Radeon HD 5550 с 1 Гбайт памяти DDR3 стоимостью около $55. Она обеспечивает более чем двукратный прирост производительности по сравнению с HD Graphics 3000, поэтому стоит её приобрести, если вы хотите поднять уровень детализации или запустить игру в разрешении 1920x1080.
http://www.thg.ru/cpu/sandy_bridge/images/screen4.png
Никто никогда не утверждал, что интегрированная графика способна достойно справиться с шутерами от первого лица, но CoD отличается невысокими требованиями к графике, поэтому мы дали шанс этому шутеру.

Еще раз надо признать, что HD Graphics 3000 достойно сражается с дискретной видеокартой самого начального уровня. Но HD Graphics 2000 хороша только для того, чтобы обойти графический движок Clarkdale Ironlake. Для сравнения, вполне доступная видеокарта Radeon HD 5550 даёт вполне приемлемую производительность в разрешении 1680x1050.
http://www.thg.ru/cpu/sandy_bridge/images/screen5.png
http://www.thg.ru/cpu/sandy_bridge/images/screen6.png
Результаты этих двух тестов можно было предсказать заранее: графическое ядро HD Graphics 3000 неплохо выглядит по сравнению с дискретной видеокартой AMD самого начального уровня, но если вы не рассчитываете тратиться на процессор линейки К и использовать его интегрированное ядро, обратите внимание на результаты HD Graphics 2000. Они чуть лучше, чем у графического ядра Clarkdale (которое, кстати, даже не смогло полностью выполнить тест игры Left 4 Dead 2).

В итоге - в сфере настольных ПК интегрированная графика сохраняет свой статус-кво. Её возможностей хватает для выполнения элементарных задач, но для игр она слишком слаба. Ничего не поделаешь.

Две новые платформы, впереди - следующие
Процессоры Sandy Bridge несовместимы с чипсетами Intel пятой серии. В этом нет проблем, поскольку вам всё равно придётся покупать новую материнскую плату из-за того, что LGA 1156 уходит в прошлое. Но для массового рынка ещё один апгрейд платформы пережить будет сложно, особенно для тех пользователей, у кого просто нет денег, чтобы тратиться на то, когда технологии будущего становятся настоящим днем.

В момент выхода процессоров Sandy Bridge есть два чипсета для настольных ПК, на которых эти процессоры можно использовать: P67 и H67. Первый предназначен для использования в паре с дискретными видеокартами. Кроме того, только P67 поддерживает распределение 16 линий контроллера PCIe среди нескольких видеокарт. Поэтому, Р67 подойдёт для энтузиастов. Второй чипсет H67 – единственный выбор для тех, кто хочет использовать преимущества интегрированного графического ядра Sandy Bridge.

Вас беспокоит производительность P67 с несколькими установленными видеокартами? Напрасно. Мы уже показывали в нашей статье, как вы можете получить производительность, близкую к Intel X58 от материнской платы P55, оснащённой мостом Nvidia NF200, причём даже с тройкой видеокарт Radeon HD 5870.
http://www.thg.ru/cpu/sandy_bridge/images/p67.jpg
Оба чипсета поддерживают целых 14 портов USB 2.0, ни один при этом не поддерживает USB 3.0. Ещё они поддерживают до шести портов SATA, два из которых могут работать со скоростью передачи 6 Гбит/с (четыре других ограничены скоростью 3 Гбит/с). Ни один из чипсетов не поддерживает старую шину PCI.

Оба чипсета перешли на сигнальную скорость 5 GT/s, что обеспечивает поток на линию до 500 Мбайт/с в любом направлении. P67 и H67 содержат восемь линий, как и чипсеты P55/H57. Хорошо было бы добавить дополнительные контроллеры USB 3.0 и SATA 6 Гбит/с, но в спецификациях Intel всё ещё указано, что интерфейс DMI поддерживает 1 Гбайт/с в любом направлении, что может потенциально привести к перегрузкам.

                     Сравнение чипсетов
                                                    H67 Express         P67 Express                   P55 Express
Интерфейс сокета                     LGA 1155           LGA 1155                            LGA 1156
Каналы памяти/DIMM на канал          2/2                    2/2                               2/2
USB 2.0                                         14                          14                                14
Всего портов SATA (из них 6 Гбит/с) 6 (2)                        6 (2)                               6 (0)
Число линий PCIe                      8 (5 GT/s)               8 (5 GT/s)                   8 (2.5 GT/s)
Поддержка слотов PCI                  Нет                          Нет                                 4
Независимые выходы на дисплей   2                           0                                 0
Защищённый путь аудио/видео          Да                          Нет                                Нет
Технология Rapid Storage                  Да                           Да                                 Да
Разгон                      Только графическое ядро Только множитель процессора Множитель процессора/ BCLK

Чипсет Intel H67 – единственный, который может использовать графическое ядро Sandy Bridge, поэтому он отличается соответствующими функциями. Его PCH поддерживает два независимых выхода на дисплей. Кроме того, он обеспечивает защиту пути прохождения аудио/видео – необходимая функция для воспроизведения Blu-ray и передачи звука высокого разрешения в закодированном виде на внешний ресивер. Наконец, H67 позволяет вручную разгонять интегрированное графическое ядро.
http://www.thg.ru/cpu/sandy_bridge/images/h67.jpg
Какие ограничения есть у H67? H67 не поддерживает разгон процессора. Если вы заплатили чуть больше за модель из линейки K, чтобы получить более скоростной графический движок, то будете ограничены частотным потолком Turbo Boost. Чипсет H67 также заблокирован по ограничениям памяти и энергопотребления Sandy Bridge. Чтобы снять блокировку по ядру, энергопотреблению и памяти, вам необходимо использовать P67.
http://www.thg.ru/cpu/sandy_bridge/images/overclocking.jpg
В 2011 году Intel выпустит чипсет под названием Z68, который позволит выполнять разгон и вычислительных ядер, и графического ядра на одной плате. Его не следует путать с X78 – следующим флагманом Intel на замену X58.

Разгон - Sandy Bridge меняет правила игры
Как мы уже писали, в Sandy Bridge существенно изменён подход к разгону. Получить на нём выигрыш от хорошо масштабируемой архитектуры, как это удавалось с Nehalem, нельзя, но некоторые варианты существуют.

Суть проблемы хорошо известна. Чтобы упростить дизайн (что действительно имеет смысл с инженерной точки зрения), Intel интегрировала тактовый генератор в чипсеты 6-й серии. Теперь одна частота влияет на параметры всей системы, то есть вы не сможете независимо выставлять частоты разных подсистем, таких как PCI Express и DMI.

К сожалению, шина PCI Express неохотно работает за пределами своих спецификаций, так что любое значительное отклонение за уровень 100 МГц по частоте BCLK приводит к проблемам. Конечно, несколько процентов выжать можно, но прошли те дни, когда 133-МГц частоту BCLK у процессоров Nehalem можно было повышать до уровня 200 МГц и выше. Оверклокеры потеряли одну из двух переменных, которые ранее влияли на производительность процессора. Однако Intel всё же старается работать в этом направлении.

Во-первых, в мае 2010 года года была выпущена линейка процессоров Intel Core серии K с разблокированным множителем. У них максимальный множитель составляет 57x, то есть можно получать частоты до 5,7 ГГц, не затрагивая BCLK. Intel утверждает, что множитель 57x выбран по "соображениям дизайна", что бы это ни значило. Хорошая новость для хардкорных оверклокеров заключается в том, что компания работает над BIOS, который позволит получать более высокий множитель – и это будет верно для уже вышедших CPU. Кроме того, у чипов линейки K "разблокирован" множитель памяти DDR3, который на самом деле не разблокирован, но позволяет выставлять частоту памяти до DDR3-2133 (это выше, чем могут обеспечить большинство нынешних комплектов памяти). Ограничения по энергопотреблению и току тоже можно настраивать.
http://www.thg.ru/cpu/sandy_bridge/images/k_overclock.jpg
В случае с Sandy Bridge пока выпущено только два процессора из линейки K: Core i7-2600K и Core i5-2500K. Разблокированный i7 стоит на $23 дороже частично заблокированной версии того же чипа, а i5 обойдётся на $11 дороже менее гибкого варианта. Если учесть, что по умолчанию Core i5-2500K работает на частоте 3,3 ГГц, а Turbo Boost увеличивает частоту до 3,8 ГГц, по сравнению с Core i5-760 на 2,8 ГГц, то разблокированный чип Sandy Bridge за дополнительные $11 кажется очень привлекательным.
http://www.thg.ru/cpu/sandy_bridge/images/limited_overclock.jpg
Если вы не купите чип из линейки K, а выберите модель Core i7-2600, Core i5-2500, 2400 или 2300 (вместе с материнской платой P67), то получите доступ к "ограниченному разгону". Это означает, что вы сможете выставлять тактовую частоту вплоть до четырёх ступенек выше максимальной тактовой частоты Turbo Boost при любом уровне загрузки процессора.

Возьмём в качестве примера Core i7-2600. Базовая частота чипа составляет 3,3 ГГц. Когда активны четыре ядра, то частота увеличивается на одну ступеньку – до 3,4 ГГц. Четыре ступеньки выше – это частота 3,8 ГГц. Когда активны два ядра, то технология Turbo Boost повышает производительность на две ступеньки – до 3,5 ГГц. В таком случае ограниченный разгон составит 3,9 ГГц. В оптимальной ситуации активно только одно ядро. Turbo Boost увеличит частоту на четыре ступеньки, что даст 3,7 ГГц, а схема разгона Intel позволяет выжать частоту до 4,1 ГГц.

Любой процессор из линейки K даст вам возможности для приличного уровня разгона даже при воздушном охлаждении. В двух лабораториях Tom’s Hardware мы смогли разогнать процессоры Core i7-2600K до частоты 4,7 ГГц при напряжении 1,35 В – и они стабильно проработали под нагрузкой весь день. Модели i5 и i7 для массового рынка позволяют выжать дополнительные 400 МГц из своих чипов. Однако покупатели процессоров по цене от $100 и $150 (где AMD предлагает свои наиболее привлекательные решения) могут считать себя проигравшими. Единственные два чипа Sandy Bridge дешевле $175 – это Core i3-2100 и i3-2120 с тактовой частотой 3,1 и 3,3 ГГц, соответственно. У них нет Turbo Boost, нет возможности менять BCLK, нет "ограниченного" разгона – то есть данные чипы буквально заблокированы.

Как и в случае с интегрированной графикой, наши калифорнийские коллеги по Tom's Hardware считают, в связи со всем сказанным выше, что Intel упустила поезд, пытаясь использовать оверклокинг как способ дифференцировать процессоры. Камрады, сумевшие преодолеть барьер в 7 ГГц, в нашем недавнем оверклокерском совревновании на западном THG, упёрлись в искусственный порог. Пользователям, покупающим процессоры нижнего сегмента массового рынка, не дана возможность менять настройки BCLK или множителя. Пока вы не приобрели один из двух процессоров линейки K, вам придётся довольствоваться Turbo Boost и потолком добавления частоты в 400 МГц.

Надеемся, компания AMD внимательно следит за ситуацией. Большинство новейших 45-нм процессоров компании не дают существенный потенциал по разгону, но переход на 32-нм техпроцесс, чуть позже в этом году, должен привести к тому, что более гибкие процессоры Bulldozer будут весьма привлекательны для всех пользователей-оверклокеров, которые считают, что Intel ограничивает их возможности как в сегменте low-end, так и high-end.

Sandy Bridge | Встречаем процессоры Intel Core второго поколения

Новые названия
В день официального запуска Sandy Bridge компания Intel объявила о 14 новых настольных процессорах (кроме того, вышли 15 мобильных моделей). Торговые марки Core i3, i5 и i7 сохранились, соответствуя процессорам начального уровня, массового рынка и сегмента энтузиастов. Однако числа-модификаторы изменились. Да и Intel стала более активно использовать суффиксы в конце названий моделей.

                     i7-2600K i7-2600 i5-2500K i5-2500 i5-2400 i5-2300 i3-2120 i3-2100
Цена                 $317          $294   $216 $205 $184 $177 $138 $117
Тепловой пакет 95 Вт          95 Вт   95 Вт   95 Вт   95 Вт   95 Вт   65 Вт   65 Вт
Ядра/потоки 4/8          4/8            4/4           4/4            4/4          4/4           2/4            2/4
Базовая частота3,4 ГГц 3,4 ГГц    3,3 ГГц 3,3 ГГц   3,1 ГГц 2,8 ГГц 3,3 ГГц   3,1 ГГц
Макс. частота
Turbo         3,8 ГГц 3,8 ГГц   3,7 ГГц 3,7 ГГц   3,4 ГГц   3,1 ГГц    Н/Д    Н/Д
Память (MT/s) 1333          1333   1333   1333   1333   1333 1333           1333
Кэш L3      8 Мбайт 8 Мбайт 6 Мбайт 6 Мбайт 6 Мбайт 6 Мбайт 3 Мбайт 3 Мбайт
HD Graphics 3000          2000 3000 2000 2000 2000 2000          2000
Макс. частота
графического ядр1350 МГц1350 МГц 1100 МГц 1100 МГц 1100 МГц 1100 МГц 1100 МГц 1100 МГц
Hyper-Threading Да    Да           Нет           Нет           Нет    Нет            Да             Да
Поддержка AVX Да    Да         Да           Да           Да           Да            Да             Да
Поддержка
Quick Sync         Да    Да            Да           Да           Да           Да            Да             Да
Поддержка AES-NI Да    Да            Да           Да           Да           Да           Нет            Нет
Интерфейс LGA        1155 LGA 1155 LGA 1155 LGA 1155 LGA 1155 LGA 1155 LGA 1155 LGA 1155

В названии новых моделей везде присутствует двойка. Это означает второе поколение процессоров Intel Core, и, самое забавное, перед нами единственный компонент в названии, который что-то означает на самом деле. Три цифры, которые идут следом, указывают на относительную производительность – к этому вы должны уже привыкнуть, начиная с эпохи Nehalem. Intel использует для дифференциации процессоров тактовую частоту, размер кэша L3, поддержку Hyper-Threading и Turbo Boost. Вполне логично предположить, что процессор -2600 будет быстрее -2500 и так далее.

Номера некоторых моделей содержат только четыре цифры. Другие заканчиваются суффиксом K, S или T. Мы уже знаем, что в процессорах Core i7-875K и Core i5-655K суффикс "K" означает разблокированный множитель. Intel представила два процессора серии "K" – Core i7-2600K и Core i5-2500K, оба из которых стоят дороже версий "не-K". Если вы энтузиаст, занимающийся разгоном, то процессоры "K" явно оправдывают прибавку к стоимости.

С линейкой "S" тоже всё понятно. Мы уже видели, как Intel "играет" с суффиксом "S" в прошлом, снижая производительность Core i5-750S, чтобы уместиться в пределах теплового пакета 82 Вт, и вместе с тем повышая цену. До объявления новых процессоров компания не объявила цены на модели линейки "S", утверждая, что эти процессоры будут ориентированы только на канал, то есть в рознице мы их не увидим. Эти процессоры обладают меньшим тепловым пакетом 65 Вт, но достигают тех же максимальных уровней Turbo Boost, если есть потенциал по увеличению температуры.

Новый суффикс "T" относится к экономичным настольным процессорам с тепловым пакетом 35 и 45 Вт, которые работают на пониженном напряжении и базовой тактовой частоте, чтобы сохранять более агрессивный температурный профиль. Единственная модель с новым суффиксом – это Intel Core i5-2390T, которая не использует четыре ядра, как можно было бы подумать из наличия в названии i5, но оснащена двумя ядрами с поддержкой Hyper-Threading. Почему эту модель не назвали просто Core i3 - непонятно.

ПРОДОЛЖЕНИЕ СЛЕДУЕТТТ