Обзор Core i7-4770K Haswell | Предварительный обзор
Недавно в нашу лабораторию поступил образец процессора Core i7-4770K на новой микроархитектуре Intel Haswell. Это ещё не окончательная версия, но по сравнению с предыдущими степпингами (и ранними драйверами), этот чип позволил нам нормально проверить его производительность и сравнить с CPU на архитектурах Ivy Bridge и Sandy Bridge.
Всю базовую информацию о самой архитектуре Haswell мы получили на прошлогодней выставке Developer Forum в Сан-Франциско. Но чем ближе к официальной премьере, тем больше поступает подробностей о том, каким именно Haswell окажется на полках магазинов. К счастью для нас, первые CPU на базе новой архитектуры Intel будут нацелены на энтузиастов.
Четвёртое поколение настольных процессоров Intel Core (Haswell) | |||||||||||
Ядер /потоков | TDP (Вт) | Тактовая частота, ГГц | 1-е ядро, ГГц | 2-е ядро, ГГц | 3-е ядро, ГГц | 4-е ядро, ГГц | Кэш L3, Мбайт | GPU | Макс, частота GPU, ГГц | TSX | |
i7-4770K | 4 / 8 | 84 | 3,5 | 3,9 | 3,9 | 3,8 | 3,7 | 8 | GT2 | 1,25 | нет |
i7-4770 | 4 / 8 | 84 | 3,4 | 3,9 | 3,9 | 3,8 | 3,7 | 8 | GT2 | 1,2 | да |
i5-4670K | 4 / 4 | 84 | 3,4 | 3,8 | 3,8 | 3,7 | 3,6 | 6 | GT2 | 1,2 | нет |
i5-4670 | 4 / 4 | 84 | 3,4 | 3,8 | 3,8 | 3,7 | 3,6 | 6 | GT2 | 1,2 | да |
i5-4570 | 4 / 4 | 84 | 3,2 | 3,6 | 3,6 | 3,5 | 3,4 | 6 | GT2 | 1,15 | да |
i5-4430 | 4 / 4 | 84 | 3 | 3,2 | 3,2 | 3,1 | 3 | 6 | GT2 | 1,1 | нет |
i7-4770S | 4 / 4 | 65 | 3,1 | 3,9 | 3,8 | 3,6 | 3,5 | 8 | GT2 | 1,2 | да |
i5-4570S | 4 / 4 | 65 | 2,9 | 3,6 | 3,5 | 3,3 | 3,2 | 6 | GT2 | 1,15 | да |
i5-4670S | 4 / 4 | 65 | 3,1 | 3,8 | 3,7 | 3,5 | 3,4 | 6 | GT2 | 1,2 | да |
i5-4430S | 4 / 4 | 65 | 2,7 | 3,2 | 3,1 | 2,9 | 2,8 | 6 | GT2 | 1,1 | нет |
i7-4770T | 4 / 4 | 45 | 2,5 | 3,7 | 3,6 | 3,4 | 3,1 | 8 | GT2 | 1,2 | да |
i5-4670T | 4 / 4 | 45 | 2,3 | 3,3 | 3,2 | 3 | 2,9 | 6 | GT2 | 1,2 | да |
i7-4765T | 4 / 4 | 35 | 2 | 3 | 2,9 | 2,7 | 2,6 | 8 | GT2 | 1,2 | да |
i5-4570T | 2 / 4 | 35 | 2,9 | 3,6 | 3,3 | – | – | 4 | GT2 | 1,15 | да |
Согласно нынешним планам Intel скоро мы увидим двух- и четырёхъядерные модели на LGA 1150 с GPU GT2, оснащённым 20-ю исполнительными блоками. Для сегмента мобильных систем также будут двух- и четырёхъядерные модели для процессорного разъёма rPGA и с такой же графической подсистемой. Однако все процессоры в таблице выше рассчитаны под LGA 1150. Все они поддерживают двухканальную память DDR3-1600 1,5 В. Также они могут похвастаться 16-канальным контроллером PCI Express 3.0, поддержкой AVX2 и AES-NI. Любопытно, но новая технология Intel Transactional Synchronization Extensions (TSX) представлена только в четырёх моделях. Нам не совсем понятно, почему Intel хочет дифференцировать свою продукцию посредством наличия этой простой функции, предназначенной для повышения эффективности, но похоже, именно так и происходит.
Долгожданный графический движок GT3 с 40 исполнительными блоками будет выпускаться только в чипах BGA, то есть апгрейд таких систем будет пользователям недоступен. Intel выпустит четырёхъядерные версии с GT3, четырёхъядерные версии с GT2 и двухъядерные версии с GT2 в вышеупомянутой корпусировке. GT3 также появится в многочиповых BGA-корпусах, включающих чипсет Lynx Point. Однако это будет двухъядерный процессор.
Кроме новых процессоров Intel через несколько месяцев планирует представить чипы Platform Controller Hub восьмой серии, сейчас он носит название Lynx Point. Наиболее полнофункциональная версия чипа Lynx Point будет поддерживать шесть портов SATA 6 Гбит/с, 14 портов USB (шесть их которых USB 3.0), восемь линий PCIe 2.0 и вывод VGA.
Физически восьмая версия чипсетов будет меньше чем предыдущая (23×22 миллиметра для настольных ПК вместо 27×27) и контактов у неё меньше. Это связано с более глубокой интеграцией функционала в сам CPU. Раньше процессор и PCH соединяли восемь линий Flexible Display Interface. Несмотря на то, что кристалл процессора имел встроенный контроллер DisplayPort, такие компоненты как VGA, LVDS, цифровые интерфейсы дисплея и аудио размешались в чипсете. Сейчас в процессоре может быть до трёх цифровых портов, наряду с аудиовыходом и встроенным DisplayPort. LVDS вместе с шестью линиями FDI вообще исчезли.
Обзор Core i7-4770K Haswell | Результаты тестов
Sandra 2013
Хотя тест Dhrystone не совсем соответствует реальной производительности, отсутствие оптимизированного ПО для AVX2 заставляет нас использовать бенчмарки SiSoftware, чтобы понять, как поддержка набора команд у Haswell может повлиять на скорость вычислений общего назначения в специально оптимизированных приложениях.
Тестовый модуль Whetstone использует SSE3, поэтому результаты Haswell по сравнению с Ivy Bridge улучшились лишь немного.
Бенчмарк Sandra Multimedia генерирует изображение фрактала Mandelbrot Set в разрешении 640×480, использующего 255 повторов для каждого пикселя, который представляет векторизованный код, работающий как можно ближе к идеальной параллели.
На новом Core i7-4770K на архитектуре Haswell целочисленный тест использует набор инструкций AVX2, в то время как процессоры Ivy Bridge и Sandy Bridge ограничены поддержкой AVX. Судя по диаграмме (красная полоса), Haswell справляется почти вдвое быстрее.
Производительность работы с плавающей запятой также заметно улучшилась по сравнению с первой версией FMA3 (AMD Bulldozer поддерживает FMA4, а Piledriver – версии с тремя и четырьмя операндами). Процессоры Ivy Bridge и Sandy Bridge используют ветки кода, оптимизированные под AVX, и на одинаковой частоте немного отстают от новинки.
Почему на Haswell вычисления с двойной точностью ускорились сильнее, чем обычные вычисления с плавающей запятой? Выполнение код для FMA3 на самом деле сильно зависит от задержек. Если мы вообще отключим поддержку FMA3 в опциях Sandra и будем использовать AVX, масштабирование становится более предсказуемым.
Все три чипа поддерживает шифрование AES-NI. Из прошлых обзоров нам известно, что наши платформы обрабатывают инструкции с той скоростью, с которой они посылаются из памяти, поскольку Sandra работает исключительно с аппаратной частью. Core i7-4770K немного отстаёт в тесте AES256, что говорит о заниженной пропускной способности, но сейчас можно сослаться на незрелость тестовой системы.
В тесте SHA2-256 проверяется вычислительная производительность каждого ядра. Поэтому увеличение количества выполняемых в Haswell инструкций за такт позволяет новому процессору обойти архитектуру Ivy Bridge, которая, в свою очередь, быстрее Sandy Bridge.
Результаты тестового модуля memory bandwidth подтверждают показатели бенчмарка Cryptography. Все три платформы работают с модулями DDR3-1600, но системе на базе Haswell, похоже, необходимо дополнительная настройка.
Исходя из информации, обсуждаемой на прошлогоднем IDF, мы знаем, что Intel настраивала подсистему памяти Haswell на максимальную производительность. Поэтому, как мы и ожидали в тесте пропускной способности кэша (Sandra cache bandwidth), производительность кэша данных первого уровня объёмом 32 Кбайт выросла почти вдвое.
Однако прирост в кэше L2 оказался ниже, чем мы думали. Мы рассчитывали, что цифра увеличится вдвое, учитывая пропускную способность 64 байт/такт (теоретически, L2 может обеспечить более 900 Гбайт/с). Полоса пропускания кэша немного снизилась, скорее всего, это связано с раздельным диапазоном изменения тактовой частоты.
До сих пор не ясно где проблема: в тестовом образце CPU или в самих тестах. В любом случае, это предсерийный чип, поэтому мы воздерживаемся от каких-либо выводов.
Производительность OpenCL
Intel включает поддержку OpenCL 1.1 на процессорах Ivy Bridge посредством HD Graphics 4000 и 2500, давая разработчикам возможность использовать исполнительные блоки графического ядра для задач общего назначения. Сегодня популярные настольные приложения типа WinZip и Photoshop часто демонстрируют весомый прирост производительности на платформах способных распараллеливать задачи, которые раньше обрабатывались на одном-двух процессорных ядрах. Haswell поддерживает OpenCL версии 1.2.
Разницу между процессорами с поддержкой OpenCL и без неё лучше всего демонстрирует тест на базе Photoshop CS6. Core i7-2700K обрабатывает задачу с помощью четырёх ядер с технологией Hyper-Threading, а Core i7-3770K и Core i7-4770K вовлекают в процесс графическое ядро HD Graphics.
Благодаря комбинации дополнительных исполнительных блоков, пропускной способности памяти и большего количества выполняемый инструкций за такт, Core i7-4770K на базе Haswell обгоняет предшественника на 11 секунд.
Тест WinZip мы прогнали с активным и неактивным OpenCL на всех процессорах, как видите, разница здесь не такая большая как в Photoshop. Объяснить это очень просто: WinZip 17 хорошо работает с параллельными потоками (гораздо лучше версии 16.5). Таким образом, ядра CPU нагружаются полнее. При активации OpenCL, WinZip облегчает процесс сжатия только для файлов размером более чем 8 Мбайт. Поэтому, если папка, скажем, размером 1,3 Гбайт забита документами, презентациями PowerPoint, PDF и музыкальными файлами, особого ускорения вы не получите.
У Core i7-4770K и Core i7-3770K наблюдается небольшое ускорение, однако при включении OpenCL на 2700K система, напротив, только замедляется. Каков вывод? OpenCL даёт преимущество лишь в тех задачах, которые оптимизированы для гетерогенных вычислений. Photoshop и WinZip в этом случае демонстрируют две стороны медали.
LuxMark 2.0 оценивает преимущество перехода с HD Graphics 4000 на 4600 и одновременно демонстрирует, что Core i7-2700K сам по себе в приложениях, поддерживающих OpenCL, не боец. Хотим отметить, что AMD A10-5800K в этом тесте набрал 225 000 семплов в секунду, это чуть меньше, чем у Core i7-3770K.
Учитывая всё вышесказанное, возникает вопрос, всегда ли OpenCL обеспечивает прирост производительности? Не обязательно. Модуль Sandra 2013 GP Processing показывает, что вычисления FP32 происходят намного быстрее на GPU Intel HD Graphics, чем на ядрах x86. Однако двойную точность приходится имитировать на всех трёх процессорах, причём лучший результат показывает Core i7-2700K на микроархитектуре Sandy Bridge. Получается, что мощные ядра Intel x86 при имитации дают более высокие результаты, чем GPU у чипов Ivy Bridge или Haswell.
Производительность на такт и многопоточные приложения
Производительность на такт
Сначала давайте рассмотрим, как Haswell противостоит Ivy Bridge и Sandy Bridge на фиксированной частоте 3,5 ГГц с выключенными функциями энергосбережения и Turbo Boost.
При конвертации аудиофайла в однопоточной программе LAME, Haswell всего на 3% быстрее, чем Ivy Bridge и на 5% быстрее, чем Sandy Bridge.
Производительность в многопоточных приложениях
Теперь проведём тест при всех активных функции чипа, а к числу участников добавим ещё и флагманский процессор на базе Sandy Bridge-E.
В тесте Blender 2.64 четырёхъядерный процессор Haswell обгоняет Core i7-3770K более чем на 7%, а Core i7-2700K – на 14%. В тоже время не разогнанный Core i7-3970X быстрее Core i7-4770K на 23%. Если вы надеялись, что Haswell предложит дешёвую замену архитектуре Sandy Bridge-E, которая, кстати, старше на два поколения, можем вас разочаровать, похоже, шестиядерные чипы на этой архитектуре по-прежнему являются отличным вариантом для мощной рабочей станции.
Тест компиляции проекта Chrome с помощью Visual Studio подтверждает предыдущие результаты. Кажется, что показатели Core i7-3770K и 2700K слишком близки? Мы сначала тоже так подумали, пока не вспомнили результаты этого теста в обзоре Core i7-3770K. По сравнению с предыдущим поколением у Haswell огромный прирост производительности, закрывающий большую дыру между Sandy Bridge и Sandy Bridge-E. Шестиядерный чип по-прежнему предпочтительнее для задач рабочей станции, тем не менее, более чем 13%-ный прирост производительности у Core i7-4770K по сравнению с Core i7-3770K игнорировать не возможно.
Более распространённые настольные приложения
Core i7-4770K закрепился между четырёхъядерным Core i7-3770K и шестиядерным Core i7-3970X.
В тесте распознавания символов более активное распараллеливание снова выводит процессор Haswell вперёд, однако до флагмана на базе Sandy Bridge-E ему далеко.
Как и LAME, бенчмарк iTunes – однопоточный. Однако в этом тесте Turbo Boost мы не выключали. Более высокая скорость исполнение инструкций на такт обеспечила Core i7-4770K лидирующую позицию. Процессору Core i7-3970X (Sandy Bridge-E) в этой ситуации шесть ядер не помогают, и он уходит на третье место. Флагман обгоняет Core i7-2700K лишь за счёт более высокой тактовой частоты в режиме Turbo Boost.
Haswell определённо быстрее, чем Ivy Bridge и Sandy Bridge, однако Core i7-4770K сравниться с Core i7-3970X в бенчмарке, использующем все доступные ресурсы, не может.
Core i7-3970X снова доказывает жизнеспособность старой конфигурации Sandy Bridge-E в многопоточных программах. Более дешёвые модели тянутся далеко позади.
HD Graphics 4600 в Hitman и DiRT
Когда Intel представила архитектуру Ivy Bridge на IDF 2011, инженеры компании сделали акцент на модульности архитектуры графического ядра, намекнув, что увеличение производительности системы будет осуществляться путём простого увеличения числа соответствующих блоков на чипе.
Исходя из ранней документации, Intel сейчас располагает двумя конфигурациями GPU Haswell: GT2 и GT3. Вероятно, есть и GT1, хотя мы не видели упоминаний об этом GPU в отношении чипов с разъёмами Intel LGA, rPGA или BGA. Core i7-4770K оснащён версией GT2 с 20 исполнительными блоками (у Core i7-3770K было 16). Новый GPU называется HD Graphics 4600.
Хотя прирост скорости по сравнению с HD Graphics 4000 значительный, его не достаточно для нормальной игры в Hitman: Absolution. На выставке CES 2013 Intel многих заинтересовала системой оснащённой GPU GT3, данная версия демонстрировала более высокий результат. Тем не менее, HD Graphics 4600 даёт менее заметный прирост скорости. Дальше графические настройки снижать некуда, и даже на 1366×768 производительности для плавной игры просто не хватает.
AMD A10-5800K (Trinity) в среднем обеспечивает 20,39 FPS на разрешении 1920×1080, обгоняя Core i7-4770K в текущей версии.
В DiRT Showdown результат уже лучше, здесь игра хорошо идёт на HD Graphics 4600 при средних настройках графики на разрешении 1366×768. Однако на 1920×1080 играть всё равно не возможно.
Мы думали, что разница между новым GPU и HD Graphics 4000 в Core i7-3770K будет больше. Тем не менее, мы использовали последние бета-версии драйверов Intel для Haswell и Ivy Bridge, а HD Graphics 3000 работал на последних официальных драйверах.
Со средним результатом 35,8 кадров в секунду на разрешении 1920×1080, A10-5800K снова оказывается быстрее Core i7-4770K с драйверами бета-версии.
HD Graphics 4600 в Skyrim и WoW
Несмотря на незрелость аппаратного и программного обеспечения, вполне вероятно, что с HD Graphics 4600 играть в игры на разрешении 1920×1080 будет не очень комфортно. В Skyrim на разрешении 1366×768 играть можно даже на более слабых, чем Core i7-4770K чипах. Почти 30%-й прирост скорости определённо заслуживает похвалы, особенно если учесть 25%-е увеличение графических ресурсов (и частоты) по сравнению с GT2 у Ivy Bridge.
В любом случае, на данный момент A10-5800K на базе Trinity быстрее. В этом тесте APU достигает более 45 FPS на разрешении 1920×1080.
Хотя WoW часто высмеивают за возраст и мультяшную графику – это по-прежнему очень популярная игра. На разрешении 1366х768 процессор Core i7-3770K справляется с ней весьма неплохо, средняя частота кадров составляет почти 70 FPS. На таких же настройках Core i7-4770K примерно на 16% быстрее, для комфортного геймплея этого определённо достаточно.
Играть можно даже на 1920×1080, но хотим предупредить, что впечатления будут не такие как при постоянных 50 FPS. К тому же замеры сделаны во время полёта в Pandaria. Во время рейдов ситуация может существенно ухудшаться. AMD A10-5800K, набирающий в среднем 60 FPS на 1920×1080, для этой игры подходит лучше.
Небольшое примечание по графике
Как эти результаты повлияют на наше следующе сравнение процессоров Intel и APU от AMD на базе Richland? Первое, на что стоит обратить внимание, это цена Core i7-4770K, которая, вероятнее всего, будет выше $300 (покупателями, наверняка будут энтузиасты, использующие дискретную графику вместо встроенной). Таким образом, несмотря на то, что графическое ядро GT2 архитектуры Haswell может достигнуть уровня производительности Trinity, по крайней мере, в таких непривередливых к графической системе играх как Skyrim и WoW, не стоит забывать, что модели с конкурентоспособной ценой будут не так быстры как Core i7-4770K.
Прежде чем сравнивать новый процессор Intel с чипами AMD нам бы хотелось дождаться окончательной версии “камня” и драйверов, но если опираться на уже полученные результаты, весьма вероятно, что процессоры на базе Haswell, оснащённые GPU GT2, покажут не самые высокие результаты в сравнении с самыми быстрыми настольными APU от AMD.
Но почти наверняка чипы с GT3 с удвоенным количеством исполнительных блоков и 128 Мбайтами кэш-памяти L4/eDRAM на частоте 1,2 ГГц, с лёгкостью обгонят Trinity в играх. При сравнении Haswell с Richland вряд ли многое изменится, и, похоже, нам придётся ждать до 2014 года, когда на позиции AMD повлияет выход Kaveri.
Обзор Core i7-4770K Haswell | Вкус грядущих перемен среди настольных систем
Итак, теперь у энтузиастов есть общее представление того, как Haswell выглядит в сравнении с лучшими процессорами семейств Sandy Bridge, Sandy Bridge-E и Ivy Bridge. Вы, наверное, и сами догадались по результатам тестов, но всё же стоит отметить, что предсерийный образец Core i7-4770K в современных многопоточных приложениях даёт прирост скорости приблизительно 7 – 13% по сравнению с Core i7-3770K. Это соответствует приросту скорости при переходе с Sandy Bridge на Ivy Bridge, даже не смотря на то, что флагманский процессор на базе Haswell сумел удержаться в пределах теплового пакета 84 Вт.
Процессоры с GPU Intel HD Graphics 4600 обещают значительно более высокую графическую производительность, чем у HD Graphics 4000, хотя большинство покупателей разблокированных процессоров серии K могут этого даже не заметить. Четыре дополнительных исполнительных блока и максимальная динамическая частота, увеличенная по сравнению с Core i7-3770K на 100 МГц, повышает частоту кадров, но этого не достаточно, чтобы стать альтернативой дискретной видеокарте (такое ощущение, что мы делаем такой вывод с каждым новым поколением). Как и прежде, для любимых игр геймеры будут покупать дискретные видеокарты.
Усилия Intel ярче всего должны проявиться в сфере мобильных систем. Мы считаем, что на этом рынке у компании есть хорошая возможность дать отпор GPU начального уровня от AMD и Nvidia. Однако процессоры с графическим ядром GT3 будут поставляться только в корпусе BGA (как раз для мобильных платформ).
Каковы будут выводы для продвинутых пользователей настольных систем? В их распоряжении будут двух- и четырёхъядерные процессоры Haswell, оснащённые GT2 и двумя каналами памяти. Внедрение процессорного разъёма LGA 1150 означает, что вам придётся покупать новую системную плату с чипсетом восьмой серии. Хорошо, что новая платформа даёт шесть портов SATA 6 Гбит/с и шесть разъёмов USB 3.0 (всего 14 разъёмов, включая USB 2.0). Всё остальное, по крайней мере, с точки зрения энтузиаста не изменилось.
Несомненно, большинство энтузиастов решение о покупке будут основывать на возможностях разгона. Многие оверклокеры предполагали, что 22-нанометровые процессоры на Ivy Bridge будут разгоняться лучше, чем чипы Sandy Bridge с техпроцессом 32 нм. Когда предположения не подтвердились, многие пользователи заявили, что они предпочли остаться с процессорами Core второго поколения на частоте 4,4 и 4,5 ГГц. Мы не разгоняли тестируемый Core i7-4770K, поскольку нам придётся его возвращать. Но нам очень интересно, как более зрелый техпроцесс повлияет на масштабируемость архитектуры.
Пробивая дорогу в мобильный сегмент
Из разговоров с производителями системных плат на выставке CES нынешнего года, мы знаем, что процессоры Haswell сделаны под разъём LGA 1150, однако чипы последующей архитектуры Broadwell будут поставляться только в корпусах BGA (то есть чипы будут припаяны к материнским платам). Вполне возможно, что с микроархитектурой Skylake, которая последует за Broadwell, Intel снова представит интерфейс с возможностью последующего апгрейда. Тем не менее, прежде чем появится менее гибкая архитектура, Core i7-4770K сосредоточит на себе много внимания, прежде всего как новая флагманская модель.
Сейчас наблюдается тенденция постепенного перехода настольных архитектур в сегмент компактных вычислительных устройств. Это уже происходит с чипами Ivy Bridge и продолжится в моделях Intel Y-series и AMD Kabini. Сейчас многие энтузиасты жалуются, что возможность широкого конфигурирования ПК постепенно пропадает. Однако всё не так плохо, и мы пока не собираемся отказываться именовать себя энтузиастами. Наоборот, в будущем нам ещё предстоит делать обзоры Ivy Bridge-E, Surface на базе Haswell и консолей x86 следующих поколений.