|
Влияние задержек памяти на производительность
Мы проводили тесты с базовой частотой HTT 290 МГц и коэффициентом деления частоты памяти 2/3. В итоге частота памяти составила 193 МГц - то есть DDR386. Эта частота сравнима с 290 МГц (DDR580) почти так же, как DDR400 относится к DDR600.
Различные режимы задержек показали хорошее масштабирование в SuperPI, в то время как в 3DMark01 средние три результата находятся в пределах погрешности. Результаты Everest выглядят вполне нормально, а SiSoft Sandra, похоже, вообще никак не реагирует на задержки.
Конечно, интереснее всего сравнить самые больше задержки памяти с самыми маленькими. При сохранении задержек и изменении частоты памяти от 200 до 290 МГц мы смогли получить на 5,2% и 3,5% лучшую производительность в SuperPI и 3DMark01. Затем, сохраняя частоту памяти на уровне 193 МГц и переходя от режима CL3,0-4-4-7 до CL2,0-2-2-6 (эти задержки вы будете использовать, если выставите частоты на уровне памяти DDR600 и DDR400, соответственно), мы получили разницу 5,1% и 5,7%. Что интересно, разница между худшим и лучшим результатами в SuperPI составляет 19 секунд в обоих случаях.
Похоже, что 3DMark01 на увеличение задержек реагирует меньше, чем на уменьшение частоты памяти. В любом случае, CL2,0-2-2-6 при DDR386 даёт меньшую производительность, чем CL2,5-4-3-7 при DDR580. Возможно, определённую роль здесь играют синхронные частоты HTT и шины памяти при использовании DDR580.
Указанные задержки можно получить лишь с модулями 2x 512 или 2x 256 Мбайт. Что же касается модулей 2x 1 Гбайт, то, скорее всего, вам придётся использовать задержки CL3,0-3-3-7 или CL3,0-4-4-8.
Низкие задержки или высокие тактовые частоты?
Пытаясь сравнить память с низкими задержками (Winbond) с памятью, обладающей большими задержками и высокой тактовой частотой (Samsung), мы запустили тесты в режимах CL2,0-2-2-6 и CL3,0-4-4-7 на разных тактовых частотах. И обнаружили весьма странные результаты масштабирования производительности при использовании множителя CPU 9x и разных делителей частоты памяти. Результаты не давали кривую, поэтому мы перешли на множитель CPU 7x, то есть частота работы процессора составляет 2030 МГц.
Как можно видеть, при разных частотах памяти низкие задержки обгоняют большие задержки на уровень от 3,2% до 4,1% в SuperPI и на уровень от 2,3% до 4,4% в 3DMark01. К сожалению, частота процессора 2030 МГц при увеличении частоты памяти становится "узким местом", нивелируя преимущество от уменьшения задержек.
При частоте 1450 МГц для ядра и 193 МГц для памяти разница между низкими и высокими задержками в 3DMark01 составляет 1,9%, при частоте 2030 МГц - 2,3%, а при частоте 2610 МГц - 5,7%. Вполне разумно предположить, что если мы увеличим тактовую частоту с 2030 до 3190 МГц (вместо 2610 МГц), то разница составит где-то 8-12% при сохранении прежней частоты памяти.
Ниже мы представили кривые масштабирования на основе результатов наших тестов.
Именно так предположительно выглядит график масштабирования SuperPI. Что ж, позвольте дать некоторые пояснения. График гипотетический, поэтому при низких тактовых частотах производительность должна быть хуже.
Для создания логарифмической кривой мы использовали Excel. В основу графика легли пять измерений как при низких, так и при высоких задержках. Мы использовали частоты 145, 169, 184 и 203 МГц - максимум, что мы смогли достичь в обоих режимах. Но с высокими задержками мы смогли получить результат ещё и для 290 МГц.
Мы добавили предположительный результат при 290 МГц и низких задержках, учитывая 4,6% прирост при переходе с 203 до 290 МГц и высоких задержках (частота CPU 2030 МГц). Практический результат при 290 МГц и низких задержках может быть как больше, так и меньше, в зависимости от того, насколько тактовая частота CPU становится "узким местом", как мы уже указывали выше.
Как показывают первые тесты масштабирования, при низкой тактовой частоте CPU преимущество перехода на низкие задержки составляет меньше 4,6%.
Если же оценивать только реальные измерения, при 290 МГц различие составит только 2,1%, а 320 МГц в режиме CL3,0-4-4-7 обойдёт 270 МГц при CL2,0-2-2-6 на 3 секунды. Впрочем, наши измерения всё же слишком далеки от точек с высокими тактовыми частотами, чтобы уверенно говорить о них, да и кривая строилась всего по четырём точкам.
При высокой тактовой частоте CPU значение частоты памяти оказывается важнее как в SuperPI, так и в 3DMark01. В SuperPI прирост от снижения задержек (при частоте памяти 203 МГц) составил 3,2% (частота CPU 2030 МГЦ). А при 2610 МГц CPU - 5,1%. В 3DMark01 прирост оказался 2,3% и 5,7%, соответственно.
Прирост производительности SuperPI при переходе от 203 до 290 МГц составил 4,6% при частоте CPU 2030 МГц и 5,2% при 2610 МГц CPU. Что же касается 3DMark01, то прирост составил 3,5% и 5,7%. Для наглядности мы привели следующую диаграмму.
Заключение по ней можно сделать следующее: SuperPI больше любит низкие задержки, а 3DMark01 - высокие тактовые частоты.