РЕКЛАМА
ИНФОРМАЦИЯ
ПОЛЕЗНЫЕ ССЫЛКИ
Проект 5 ГГц: охлаждение процессора с помощью жидкого азота

Жажда скорости: Pentium 4 с 200 МГц FSB и чипсет i875P с двухканальной памятью DDR400

Новые конкуренты Intel 875P: производительные чипсеты SiS 655TX и VIA PT880 для Pentium 4

Rambler's Top100 Рейтинг@Mail.ru

ПРОЦЕССОРЫ

Новое оружие Intel: Pentium 4 Prescott, Pentium 4 3,4 ГГц и Pentium 4 Extreme Edition 3,4 ГГц
Краткое содержание статьи: С задержкой на несколько месяцев Intel всё же начала переход с техпроцесса 130 нм на 90 нм. Однако новый чип, к частоте которого добавилась приставка "E", на данный момент будет поставляться только в версии 3,2E ГГц, а версия 3,4E ГГц появится позднее. Лидирующую позицию занял Pentium 4 Extreme Edition на 3,4 ГГц, за которым следует обычная версия 3,4 ГГц.

Новое оружие Intel: Pentium 4 Prescott, Pentium 4 3,4 ГГц и Pentium 4 Extreme Edition 3,4 ГГц


Редакция THG,  2 февраля 2004
Назад
Вы читаете страницу 2 из 9
1 2 3 4 5 6 7 8 9
Далее


Intel Pentium 4 или Prescott в деталях

Intel Pentium 4 или Prescott в деталях

Процессор похож на миллион других моделей Pentium 4, но у него есть новые черты: кэш L2 в 1 Мбайт, кэш L1 для данных в 16 кбайт и инструкции SSE3 - четвёртый набор инструкций, который Intel добавляет к семейству Pentium (MMX, SSE, SSE2).

Intel Pentium 4 или Prescott в деталях

Выход Prescott был запланирован еще на осень 2003 года, но затем был отложен на конец зимы. Возникли ли у Intel проблемы с выпуском 90-нм процессоров, или это просто стратегическое решение компании?

Мы полагаем, что в этом повинны проблемы производства, но они, скорее всего, были связаны с самим дизайном Prescott, а не с 90-нм техпроцессом Intel. В пользу нашего предположения говорят два факта. С одной стороны, процессоры Prescott оказываются гораздо "горячее", чем процессоры Northwood на той же тактовой частоте. Если измерять температуру на кулере Zalman, то мы получаем разницу в 4 градуса между ядром Northwood и ядром Prescott, а на кристалле разница увеличивается не менее чем в два раза. С другой стороны, Intel решила пока не поставлять процессоры на Prescott с частотой 3,4E ГГц.

Номенклатура Intel очень проста - компания решила просто добавить букву "E" к значению тактовой частоты, и процессор с ядром Prescott с частотой 3 ГГц будет называться Pentium 4 3,0E ГГц. Хотя подобное наименование читается не слишком корректно, данный подход, безусловно, имеет право на существование.

Помимо трёх версий, которые мы смогли включить в наше тестирование (2,8E /3,0E /3,2E ГГц), Intel также выпустила "урезанную" версию Prescott 2,8A ГГц со 133-МГц FSB и без поддержки Hyper-Threading. Эта модель вряд ли будет интересна для розничного рынка и позиционируется на корпоративный сегмент.

Установка Prescott не составит особого труда: процессор, по-прежнему, вставляется в Socket 478, поэтому Intel просто обновила спецификации. Но не следует недооценивать этот шаг, поскольку TDP (термопакет процессора) вышел на рекордный уровень: он составляет 103 ватта для версий 3,4E и 3,2E ГГц.

Ещё более интересен TDP нового P4 Extreme Edition на 3,4 ГГц: при 102,9 Вт процессор вряд ли можно назвать экономичным. Хотя TDP отражает максимально возможное тепловыделение процессора, мы смогли почувствовать (!) и измерить разницу в тепловыделении между Extreme Edition 3,4 и 3,2E ГГц - и не в пользу Prescott.

Больше кэша: 1 Мбайт L2 и 16 кбайт L1/данные

Больше кэша: 1 Мбайт L2 и 16 кбайт L1/данные

Поскольку уменьшение техпроцесса позволяет изготавливать меньшие по площади чипы, Intel смогла легко увеличить объём кэша L2. Вместо 512 кбайт у Northwood, Prescott может использовать кэш в 1 Мбайт. Несмотря на рост числа транзисторов, площадь ядра уменьшилась со 127 до 112 мм². На частоте 3,4E ГГц Prescott имеет максимальную пропускную способность кэша 108 Гбайт/с.

Кроме того, Intel удвоила размер кэша L1 для данных с 8 до 16 кбайт. Давайте вернёмся в 2000 год, когда Intel выпустила Pentium 4 Willamette: тогда кэш L1 пришлось уменьшить до 8 кбайт, чтобы сохранить задержку в два такта. Увеличение задержки доступа к кэшу ещё бы сильнее увеличило отставание от Pentium III при равных тактовых частотах. Сегодня быстрый кэш не менее важен, поскольку оба AGU (блока формирования адреса) часто к нему обращаются.

Больше инструкций: SSE3

После довольно успешного выхода инструкции SSE2 с Pentium 4 (Streaming SIMD Extensions, 144 инструкции), инструкции SSE3, как мы полагаем, являются реакцией на пожелания и просьбы больших софтверных компаний. Однако на этот раз жизнь программистов облегчают лишь 13 новых инструкций:

  • fisttp: преобразование fp в int
  • addsubps, addsubpd, movsldup, movshdup, movddup: сложная арифметика
  • lddqu: кодирование видео
  • haddps, hsubps, haddpd, hsubpd: графика (SIMD FP/AOS)
  • monitor, mwait: синхронизация потоков

Посмотрим, что смогут сделать инструкции SSE3. Пока что мы смогли обнаружить только одно приложение, поддерживающее SSE3: Mainconcept MPEG Encoder 1.4.1 (см. раздел тестов).

Архитектура NetBurst: конвейер с 31 ступенью


Архитектура NetBurst: конвейер с 31 ступенью

Блок-схема Prescott не отличается от схем Northwood или Willamette, поскольку фундаментальных изменений не произошло.

Большой размер кэша и дополнительные инструкции не всегда делают процессор быстрее, поэтому давайте детально рассмотрим изменения, внесённые Intel.

Сначала давайте рассмотрим, что происходит внутри Pentium 4: инструкции поступают в процессор по системной шине шириной 64 бита, с частотой 200 МГц и пропускной способностью 6,4 Гбайт/с. Затем они проходят кэш L2. Блок предварительной выборки анализирует инструкции и активирует BTB (Branch Target Buffer, буфер целей ветвления), чтобы осуществить предсказания ветвлений, где это необходимо, а также определить, какие данные потребуются следующими. Модифицированный набор инструкций проходит блок декодирования, где инструкции x86 превращаются в микрооперации.

Инструкции x86 могут быть довольно сложными и часто используют циклы, именно поэтому Intel решила не применять классический кэш инструкций L1, а ещё с Pentium 4 Willamette перешла на кэш микроопераций (Execution Trace Cache). Он содержит микрооперации и находится за блоком декодирования инструкций, что довольно разумно, - при этом исчезает необходимость в повторном декодировании. Кэш микроопераций хранит и реорганизует цепочки микроопераций, чтобы наиболее эффективно выдавать их на исполнительный движок (Rapid Execution Engine).

Первые заметные изменения касаются BTB и блока декодирования инструкций. Если BTB не обеспечит предсказание ветвления, то декодер инструкций осуществит статическое предсказание, которое должно привести к незначительному падению производительности в случае ошибки. Причём, это незначительное падение должно компенсироваться улучшенным процессом определения циклов. Динамическое предсказание также было обновлено, и умножение целых чисел сейчас осуществляется в выделенном блоке.

Ключевым элементом для обеспечения высокой производительности является предсказание ветвлений. Если процессор знает (или догадывается), какой путь в коде будет принят далее, то он сможет наиболее эффективно использовать ресурсы своего конвейера. При удлинении конвейера с 20 до 31 ступени предсказание ветвлений начинает играть ещё более важную роль. Удлинение конвейера позволило Intel уменьшить сложность каждого этапа, обеспечив, таким образом, возможность дальнейшего роста тактовой частоты. Но за это приходится платить: ошибочные предсказания ветвлений у Prescott обходятся процессору намного дороже.

Теперь становится вполне очевидным, почему Intel решила увеличить размер всех кэшей. В случае ошибочных предсказаний ветвлений обеспечение процессора необходимыми данными становится, как никогда, важным. Для заполнения конвейера процессор должен иметь под рукой все необходимые данные. Для этого кэш L1 теперь работает с восемью входами (8-way associative).

Число кристаллов на пластину и цены

Нажмите для увеличения картинки

Нажмите для увеличения картинки.

В отличие от 200-мм подложек, используемых AMD, Intel применяет 300-мм подложки размером с пиццу, которые обеспечивают большую площадь. Мы решили проанализировать количество процессоров, которые можно получить с каждой подложки, что позволяет нам сделать выводы о доступности, ценах и, в итоге, об успешности процессора.

Количество процессоров, которые можно получить с одной подложки, вас либо огорчит, либо порадует (всё зависит от вашей точки зрения). Теоретический предел составляет 588 процессоров для ядра Prescott (учитывая 300-мм подложку Intel) и 148 процессоров Opteron/Athlon 64 FX (учитывая 200-мм подложку AMD). Даже если выход годных кристаллов у Intel составляет всего 40%, компания получит в два раза большее число процессоров с подложки, чем у AMD при выходе в 60%. К тому же, не следует забывать, что число клиентов у Intel обычно намного больше, чем у AMD. Не говоря о числе заводов, конечно.

Реальные проценты выхода годных кристаллов всегда хранятся в секрете. В полупроводниковом производстве возможно достижение до 85%, и так иногда и происходит, но обычно на заводах массового производства полупроводников даже выход в 70% считается хорошим. Когда полупроводниковый завод начинает выпускать новый продукт, то процент выхода годных кристаллов обычно намного ниже, чем потом, после доводки и совершенствования процесса производства.

Поскольку Intel не стала бы рисковать, выпуская новый продукт, если бы не смогла обеспечить его наличие в должных количествах, предположим, что выход процессоров Prescott составляет не меньше 50%. К тому же, мы опираемся на тот факт, что в последних планах Intel по-прежнему присутствует выпуск 4-ГГц процессоров в этом году.

Чтобы максимально гладко осуществить выход Prescott, Intel выбрала самую простую ценовую модель, какую только можно придумать. Нет, компания не собирается раздавать процессоры бесплатно, зато они не будут стоить дороже Northwood вообще. На следующих страницах вы обнаружите, насколько интересным будет это предложение.
Назад
Вы читаете страницу 2 из 9
1 2 3 4 5 6 7 8 9
Далее


СОДЕРЖАНИЕ

Обсуждение в Клубе Экспертов THG Обсуждение в Клубе Экспертов THG


РЕКЛАМА
РЕКОМЕНДУЕМ ПРОЧЕСТЬ!

История мейнфреймов: от Harvard Mark I до System z10 EC
Верите вы или нет, но были времена, когда компьютеры занимали целые комнаты. Сегодня вы работаете за небольшим персональным компьютером, но когда-то о таком можно было только мечтать. Предлагаем окунуться в историю и познакомиться с самыми знаковыми мейнфреймами за последние десятилетия.

Пятнадцать процессоров Intel x86, вошедших в историю
Компания Intel выпустила за годы существования немало процессоров x86, начиная с эпохи расцвета ПК, но не все из них оставили незабываемый след в истории. В нашей первой статье цикла мы рассмотрим пятнадцать наиболее любопытных и памятных процессоров Intel, от 8086 до Core 2 Duo.

ССЫЛКИ
Реклама от YouDo