THG.RU | Поиск Поиск Поиск | Новости | Видеокарты | Процессоры | Материнские платы | Мониторы | Аудио/видео | HDD и CD/DVD | Собери сам | Игры | Софт | Домашний ПК

РЕКЛАМА
ПОИСК И ЦЕНЫ
Поиск по сайту THG.ru


Поиск по ценам в Price.ru




ИНФОРМАЦИЯ
ДРУЗЬЯ THG

Exler : авторский проект
iXBT.com : коллеги
BenchmarkHQ
G-Class.ru : Гелики
Avto.ru : автомобили
КомпьютерПресс
Radeon.ru : поддержка
PCNews : новости IT
NV World : Мир nVidia
iPhoneRoot : новости
Kraftway : серверы
SLY : компьютеры

ПОЛЕЗНЫЕ ССЫЛКИ

nVidia GeForce GTX 260 и 280: новое поколение видеокарт

Rambler's Top100 Рейтинг@Mail.ru
bigmir)net TOP 100

ВИДЕОКАРТЫ

RSS
nVidia CUDA: вычисления на видеокарте или смерть CPU?
Краткое содержание статьи: Когда графические процессоры видеокарт стали программируемыми, появился соблазн использовать их для вычислений. Действительно, те задачи, которые хорошо распараллеливаются, выполняются на GPU намного быстрее, чем на центральных процессорах. Это и обработка видео, и матричные вычисления, и научные расчёты. nVidia вышла полтора года с инициативой CUDA, которая к настоящему моменту уже достаточно хорошо отработана, доступна вторая версия API. Мы решили подробнее рассмотреть CUDA и провести тесты на собственноручно написанной программе.

nVidia CUDA: вычисления на видеокарте или смерть CPU?

Редакция THG,  22 июня 2008
Страница: Назад  1 2 3 4 5 6 Далее


Введение

Позвольте обратиться к истории - вернуться в 2003 год, когда Intel и AMD участвовали в совместной гонке за самый мощный процессор. Всего за несколько лет в результате этой гонки тактовые частоты существенно выросли, особенно после выхода Intel Pentium 4.

Но гонка быстро приближалась к пределу. После волны огромного прироста тактовых частот (между 2001 и 2003 годами тактовая частота Pentium 4 удвоилась с 1,5 до 3 ГГц), пользователям пришлось довольствоваться десятыми долями гигагерц, которые смогли выжать производители (с 2003 до 2005 тактовые частоты увеличились всего с 3 до 3,8 ГГц).

Введение

Даже архитектуры, оптимизированные под высокие тактовые частоты, та же Prescott, стали испытывать трудности, причём на этот раз не только производственные. Производители чипов просто упёрлись в законы физики. Некоторые аналитики даже предрекали, что закон Мура перестанет действовать. Но этого не произошло. Оригинальный смысл закона часто искажают, однако он касается числа транзисторов на поверхности кремниевого ядра. Долгое время повышение числа транзисторов в CPU сопровождалось соответствующим ростом производительности - что и привело к искажению смысла. Но затем ситуация усложнилась. Разработчики архитектуры CPU подошли к закону сокращения прироста: число транзисторов, которое требовалось добавить для нужного увеличения производительности, становилось всё большим, заводя в тупик.

nVidia CUDA

Нажмите на картинку для увеличения.

Пока производители CPU рвали на голове последние волосы, пытаясь найти решение своих проблем, производители GPU продолжали замечательно выигрывать от преимуществ закона Мура.

Введение

Почему же они не зашли в тот же тупик, как разработчики архитектуры CPU? Причина очень простая: центральные процессоры разрабатываются для получения максимальной производительности на потоке инструкций, которые обрабатывают разные данные (как целые числа, так и числа с плавающей запятой), производят случайный доступ к памяти и т.д. До сих пор разработчики пытаются обеспечить больший параллелизм инструкций - то есть выполнять как можно большее число инструкций параллельно. Так, например, с Pentium появилось суперскалярное выполнение, когда при некоторых условиях можно было выполнять две инструкции за такт. Pentium Pro получил внеочередное выполнение инструкций, позволившее оптимизировать работу вычислительных блоков. Проблема заключается в том, что у параллельного выполнения последовательного потока инструкций есть очевидные ограничения, поэтому слепое повышение числа вычислительных блоков не даёт выигрыша, поскольку большую часть времени они всё равно будут простаивать.

Напротив, работа GPU относительно простая. Она заключается в принятии группы полигонов с одной стороны и генерации группы пикселей с другой. Полигоны и пиксели независимы друг от друга, поэтому их можно обрабатывать параллельно. Таким образом, в GPU можно выделить крупную часть кристалла на вычислительные блоки, которые, в отличие от CPU, будут реально использоваться.

nVidia CUDA

Нажмите на картинку для увеличения.

GPU отличается от CPU не только этим. Доступ к памяти в GPU очень связанный - если считывается тексель, то через несколько тактов будет считываться соседний тексель; когда записывается пиксель, то через несколько тактов будет записываться соседний. Разумно организуя память, можно получить производительность, близкую к теоретической пропускной способности. Это означает, что GPU, в отличие от CPU, не требуется огромного кэша, поскольку его роль заключается в ускорении операций текстурирования. Всё, что нужно, это несколько килобайт, содержащих несколько текселей, используемых в билинейных и трилинейных фильтрах.

nVidia CUDA

Нажмите на картинку для увеличения.


Страница: Назад  1 2 3 4 5 6 Далее


СОДЕРЖАНИЕ

Отзывы об nVidia CUDA в Клубе экспертов THG [ 30 отзывов] Отзывы об nVidia CUDA в Клубе экспертов THG [ 30 отзывов]


Свежие статьи
RSS
HDD Hitachi 4 Тбайт: обзор жёстких дисков большой ёмкости Radeon HD 7970 3 Гбайт: обзор и тест пяти разогнанных видеокарт Prology iMap-565A3G: обзор 3G-навигатора Corsair, Crucial, OCZ и Plextor: тесты SSD на контроллере Marvell Killer Wireless-N 1103: Qualcomm против Centrino
HDD Hitachi 4 Тбайт Radeon HD 7970 3 Гбайт Prology iMap-565A3G SSD Corsair, Crucial, OCZ и Plextor Killer Wireless-N 1103

Копирование и распространение информации, упомянутой на страницах THG.ru возможно только при наличии у вас письменного разрешения руководства издания. По вопросам использования наших статей обращайтесь по электронной почте.

THG.ru ("Русский Tom's Hardware Guide") входит в международную сеть изданий Best of Media
РЕКЛАМА
РЕКОМЕНДУЕМ ПРОЧЕСТЬ!
Лучший SSD: апрель 2012
Лучший SSD: апрель 2012

Цены на SSD продолжают снижаться и чтобы показать изменения, мы обновили список наших рекомендаций. В этом месяце лучшие предложения находятся в ценовом диапазоне $200-350. Обратите особое внимание на накопители объёмом 240 Гбайт, цена которых уже составляет почти $1/Гбайт, такого мы ещё не видели.
Блоки питания: конструкция, форм-факторы и спецификации
Блоки питания: конструкция, форм-факторы и спецификации

THG.ru в сотрудничестве с Que Publishing публикует четыре главы из 20-го издания книги Скотта Мюллера 'Апгрейд и ремонт ПК' (Scott Mueller, Upgrading And Repairing PCs, 20th Edition), посвящённые блокам питания.
Почему Wi-Fi плохо работает и как это исправить. Часть 2
Почему Wi-Fi плохо работает и как это исправить. Часть 2

В первой части мы объяснили вам, что может происходить не так с сигналами Wi-Fi и как точки доступа могут работать для улучшения производительности ваших беспроводных устройств. Пора провести проверку в реальных условиях. Мы 'бросили' шестерых кандидатов 'на баррикады' против 65 клиентов и некоторого количества жутких помех. Кто же 'выжил' в этой 'битве'?
Обзор 24' мониторов: Acer S242HL, Dell U2412M и Samsung T24A550
Обзор 24' мониторов: Acer S242HL, Dell U2412M и Samsung T24A550

Мы вновь предлагаем нашим читателям тест мониторов. На этот раз в лабораторию THG попали три 24' модели и на это есть причины. Если 27 дюймов - слишком много (или слишком дорого), а 22 дюйма - слишком мало, то наш новый материал позволит выбрать подходящую модель. Мы пропустили три монитора через наш стандартный набор тестов, чтобы выявить победителя.

История мейнфреймов: от Harvard Mark I до System z10 EC
Верите вы или нет, но были времена, когда компьютеры занимали целые комнаты. Сегодня вы работаете за небольшим персональным компьютером, но когда-то о таком можно было только мечтать. Предлагаем окунуться в историю и познакомиться с самыми знаковыми мейнфреймами за последние десятилетия.

Пятнадцать процессоров Intel x86, вошедших в историю
Компания Intel выпустила за годы существования немало процессоров x86, начиная с эпохи расцвета ПК, но не все из них оставили незабываемый след в истории. В нашей первой статье цикла мы рассмотрим пятнадцать наиболее любопытных и памятных процессоров Intel, от 8086 до Core 2 Duo.

ОБРАТНАЯ СВЯЗЬ
Дизайн!
У вас есть что сказать по поводу нашего дизайна? Советы или рекомендации? Направляйте критику и комментарии по электронной почте.
ССЫЛКИ
Только в магазинах фирмы «RENMAG» Вы сможете приобрести запчасти для Renault Espace 4 по таким привлекательным ценам, и это всем известный факт.