|
Обзор Core i7-4770K Haswell | Предварительный обзор
Недавно в нашу лабораторию поступил образец процессора Core i7-4770K на новой микроархитектуре Intel Haswell. Это ещё не окончательная версия, но по сравнению с предыдущими степпингами (и ранними драйверами), этот чип позволил нам нормально проверить его производительность и сравнить с CPU на архитектурах
Всю базовую информацию о самой
Четвёртое поколение настольных процессоров Intel Core (Haswell) | |||||||||||
Ядер /потоков | TDP (Вт) | Тактовая частота, ГГц | 1-е ядро, ГГц | 2-е ядро, ГГц | 3-е ядро, ГГц | 4-е ядро, ГГц | Кэш L3, Мбайт | GPU | Макс, частота GPU, ГГц | TSX | |
i7-4770K | 4 / 8 | 84 | 3,5 | 3,9 | 3,9 | 3,8 | 3,7 | 8 | GT2 | 1,25 | нет |
i7-4770 | 4 / 8 | 84 | 3,4 | 3,9 | 3,9 | 3,8 | 3,7 | 8 | GT2 | 1,2 | да |
i5-4670K | 4 / 4 | 84 | 3,4 | 3,8 | 3,8 | 3,7 | 3,6 | 6 | GT2 | 1,2 | нет |
i5-4670 | 4 / 4 | 84 | 3,4 | 3,8 | 3,8 | 3,7 | 3,6 | 6 | GT2 | 1,2 | да |
i5-4570 | 4 / 4 | 84 | 3,2 | 3,6 | 3,6 | 3,5 | 3,4 | 6 | GT2 | 1,15 | да |
i5-4430 | 4 / 4 | 84 | 3 | 3,2 | 3,2 | 3,1 | 3 | 6 | GT2 | 1,1 | нет |
i7-4770S | 4 / 4 | 65 | 3,1 | 3,9 | 3,8 | 3,6 | 3,5 | 8 | GT2 | 1,2 | да |
i5-4570S | 4 / 4 | 65 | 2,9 | 3,6 | 3,5 | 3,3 | 3,2 | 6 | GT2 | 1,15 | да |
i5-4670S | 4 / 4 | 65 | 3,1 | 3,8 | 3,7 | 3,5 | 3,4 | 6 | GT2 | 1,2 | да |
i5-4430S | 4 / 4 | 65 | 2,7 | 3,2 | 3,1 | 2,9 | 2,8 | 6 | GT2 | 1,1 | нет |
i7-4770T | 4 / 4 | 45 | 2,5 | 3,7 | 3,6 | 3,4 | 3,1 | 8 | GT2 | 1,2 | да |
i5-4670T | 4 / 4 | 45 | 2,3 | 3,3 | 3,2 | 3 | 2,9 | 6 | GT2 | 1,2 | да |
i7-4765T | 4 / 4 | 35 | 2 | 3 | 2,9 | 2,7 | 2,6 | 8 | GT2 | 1,2 | да |
i5-4570T | 2 / 4 | 35 | 2,9 | 3,6 | 3,3 | - | - | 4 | GT2 | 1,15 | да |
Согласно нынешним планам Intel скоро мы увидим двух- и четырёхъядерные модели на LGA 1150 с GPU GT2, оснащённым 20-ю исполнительными блоками. Для сегмента мобильных систем также будут двух- и четырёхъядерные модели для процессорного разъёма rPGA и с такой же графической подсистемой. Однако все процессоры в таблице выше рассчитаны под LGA 1150. Все они поддерживают двухканальную память DDR3-1600 1,5 В. Также они могут похвастаться 16-канальным контроллером PCI Express 3.0, поддержкой AVX2 и AES-NI. Любопытно, но новая технология Intel Transactional Synchronization Extensions (TSX) представлена только в четырёх моделях. Нам не совсем понятно, почему Intel хочет дифференцировать свою продукцию посредством наличия этой простой функции, предназначенной для повышения эффективности, но похоже, именно так и происходит.
Долгожданный графический движок GT3 с 40 исполнительными блоками будет выпускаться только в чипах BGA, то есть апгрейд таких систем будет пользователям недоступен. Intel выпустит четырёхъядерные версии с GT3, четырёхъядерные версии с GT2 и двухъядерные версии с GT2 в вышеупомянутой корпусировке. GT3 также появится в многочиповых BGA-корпусах, включающих чипсет Lynx Point. Однако это будет двухъядерный процессор.
Кроме новых процессоров Intel через несколько месяцев планирует представить чипы Platform Controller Hub восьмой серии, сейчас он носит название Lynx Point. Наиболее полнофункциональная версия чипа Lynx Point будет поддерживать шесть портов SATA 6 Гбит/с, 14 портов USB (шесть их которых USB 3.0), восемь линий PCIe 2.0 и вывод VGA.
Физически восьмая версия чипсетов будет меньше чем предыдущая (23x22 миллиметра для настольных ПК вместо 27x27) и контактов у неё меньше. Это связано с более глубокой интеграцией функционала в сам CPU. Раньше процессор и PCH соединяли восемь линий Flexible Display Interface. Несмотря на то, что кристалл процессора имел встроенный контроллер DisplayPort, такие компоненты как VGA, LVDS, цифровые интерфейсы дисплея и аудио размешались в чипсете. Сейчас в процессоре может быть до трёх цифровых портов, наряду с аудиовыходом и встроенным DisplayPort. LVDS вместе с шестью линиями FDI вообще исчезли.
Обзор Core i7-4770K Haswell | Результаты тестов
Sandra 2013
Хотя тест Dhrystone не совсем соответствует реальной производительности, отсутствие оптимизированного ПО для AVX2 заставляет нас использовать бенчмарки SiSoftware, чтобы понять, как поддержка набора команд у Haswell может повлиять на скорость вычислений общего назначения в специально оптимизированных приложениях.
Тестовый модуль Whetstone использует SSE3, поэтому результаты Haswell по сравнению с
Бенчмарк Sandra Multimedia генерирует изображение фрактала Mandelbrot Set в разрешении 640x480, использующего 255 повторов для каждого пикселя, который представляет векторизованный код, работающий как можно ближе к идеальной параллели.
На новом Core i7-4770K на архитектуре Haswell целочисленный тест использует набор инструкций AVX2, в то время как процессоры
Производительность работы с плавающей запятой также заметно улучшилась по сравнению с первой версией FMA3 (AMD Bulldozer поддерживает FMA4, а Piledriver – версии с тремя и четырьмя операндами). Процессоры
Почему на Haswell вычисления с двойной точностью ускорились сильнее, чем обычные вычисления с плавающей запятой? Выполнение код для FMA3 на самом деле сильно зависит от задержек. Если мы вообще отключим поддержку FMA3 в опциях Sandra и будем использовать AVX, масштабирование становится более предсказуемым.
Все три чипа поддерживает шифрование AES-NI. Из прошлых обзоров нам известно, что наши платформы обрабатывают инструкции с той скоростью, с которой они посылаются из памяти, поскольку Sandra работает исключительно с аппаратной частью. Core i7-4770K немного отстаёт в тесте AES256, что говорит о заниженной пропускной способности, но сейчас можно сослаться на незрелость тестовой системы.
В тесте SHA2-256 проверяется вычислительная производительность каждого ядра. Поэтому увеличение количества выполняемых в Haswell инструкций за такт позволяет новому процессору обойти архитектуру
Результаты тестового модуля memory bandwidth подтверждают показатели бенчмарка Cryptography. Все три платформы работают с модулями DDR3-1600, но системе на базе Haswell, похоже, необходимо дополнительная настройка.
Исходя из информации, обсуждаемой на прошлогоднем IDF, мы знаем, что Intel настраивала подсистему памяти Haswell на максимальную производительность. Поэтому, как мы и ожидали в тесте пропускной способности кэша (Sandra cache bandwidth), производительность кэша данных первого уровня объёмом 32 Кбайт выросла почти вдвое.
Однако прирост в кэше L2 оказался ниже, чем мы думали. Мы рассчитывали, что цифра увеличится вдвое, учитывая пропускную способность 64 байт/такт (теоретически, L2 может обеспечить более 900 Гбайт/с). Полоса пропускания кэша немного снизилась, скорее всего, это связано с раздельным диапазоном изменения тактовой частоты.
До сих пор не ясно где проблема: в тестовом образце CPU или в самих тестах. В любом случае, это предсерийный чип, поэтому мы воздерживаемся от каких-либо выводов.