Компьютер-Информ || Архив || Рубрики || Поиск || Подписка || Работа || О "КИ" || Карта
Материал любезно предоставлен сайтом iXBT.com
У ATI RADEON 8500 (чип R200):
1.Более высокая тактовая частота ядра и памяти.
2.Более высокая предельная частота первичного RAMDAC R200 400 МГц, а также наличие вторичного, внешнего RAMDAC c частотой 240 МГц, что дает хорошие возможности по выводу видеосигнала на 2 приемника.
3.Схожая с NV20 организация внутренней архитектуры чипа 4 конвейера закраски, по 2 текстурных блока на каждом. Однако у R200 результаты их работы могут накапливаться 2 раза, в результате чего можно комбинировать до 6 текстур за один проход. Разумеется, с двумя штрафными тактами для 6 и одним для 4-х текстур как минимум (так же как и у NV20).
4.Поддержка пиксельных шейдеров 1.4 и, следовательно, более гибкий механизм выборки значений текстур. Так как реально шейдеры транслируются в настройки конвейеров выборки и комбинации, это выразилось в увеличении до 8 стадий конвейера выборки текстур и расширении его возможностей.
5.Комбинационные конвейеры обоих чипов имеют 8 стадий и поддерживают все декларированные DirectX 8.1 операции.
6.Увеличено число констант, которые можно задействовать в вершинных шейдерах до 192 против 96 у NV20. Это позволит реализовывать более сложные алгоритмы блендинга и обработки вершин.
7.Несмотря на большее время доступа (3.6 нс против 3.5 нс у GeForce3 Ti 500), память RADEON 8500 успешно работает на более высокой частоте, причем без радиаторов. Само по себе это еще не говорит о более грамотной или скоростной организации работы с памятью подходы R200 и NV20 в вопросах работы с памятью существенно разнятся. NV20 предпочитает мелкие блоки и эффективный кроссбар контроллер, R200 крупные блоки и интенсивное кэширование. Но R200 поступает с памятью более гуманно, и это может дать дополнительный потенциал для разгона.
8.R200 опережает NV20 в наборе реализованных возможностей DirectX 8.1, но NV20 имеет прекрасный OpenGL 1.3 драйвер. Сегодняшний OpenGL драйвер R200 рапортует о версии 1.2 и по результатам тестов не столь эффективен.
9.R200 может задать 6 произвольных плоскостей отсечения. У NV20 текущие драйверы рапортуют, что плоскостей отсечения нет, а на поверку оказывается, что они работают. Но ведь решение о поддержке подобных возможностей, как правило, принимается программами на основе сообщаемой драйверами информации. Надеемся, что NVIDIA не забудет вернуть потерявшиеся плоскости отсечения в ближайших версиях драйверов.
10.R200 имеет аппаратную поддержку N-Patches, а NV20 нет.
11.Текущие драйверы NV20 перестали поддерживать аппаратную тесселяцию гладких поверхностей (RT-Patches).
12.R200 может осуществлять индексированный матричный блендинг, используя палитру из 57 матриц (одновременно по-прежнему задействуются 4). Впрочем, при наличии вершинных шейдеров это преимущество не столь важно шейдеры позволяют организовать любые схемы блендинга со значительно большим числом одновременно используемых матриц. Но так ли быстр блендинг с помощью шейдеров, как обычный аппаратный?
13.R200 не поддерживает Multisampling.
14.R200 не поддерживает Mip-mapping (следовательно, и трилинейную фильтрацию) для карт отражения и объемных текстур.
15.В DirectX оба ускорителя не позволяют делать Mip-mapping и анизотропную фильтрацию одновременно, т.е. трилинейная + анизотропная фильтрация невозможна. Но NV20 поддерживает этот режим в OpenGL, а DirectX приложения пока не позволяют включать в них трилинейную фильтрацию.
16.Максимальная степень анизотропии у R200 вдвое выше.
17.Пиксельные шейдеры R200 могут оперировать значениями, превышающими 1.0 (т.е. 255) а именно от 0 до 8.0. Это так называемый OverBright подход. Сложные вычисления могут иметь дополнительный запас точности, можно реализовать накопление каких-либо величин, например, для более адекватной передачи яркого освещения.
18.Поддерживается почти одинаковый набор форматов текстур. Но если R200 поддерживает нескольких экзотических форматов для использования в шейдерах дополнительных данных (карт нормалей и смещений) с повышенной точностью передачи компонент (11 и 16 бит V16U16, W11V11U10), то NV20 позволяет использовать текстуры с форматом буфера глубины (D32, D24S8, D16, D24X8), необходимые для реализации алгоритмов класса буфера теней (Shadow Buffer).
19.Поддерживаются все форматы сжатых текстур, однако если R200 позволяет сжимать теми же форматами и 3D-текстуры, то NV20 нет. Учитывая существенные размеры 3D-текстур, это заметный недостаток драйверов или чипа. А NVIDIA в OpenGL успешно использует собственный формат сжатия 3D-текстур.
20.В DirectX R200 поддерживает все разновидности тумана, кроме табличного.
На сайте ixBT приведен список расширений OpenGL, поддерживаемых текущими драйверами
Radeon 8500.
Итак, технологическое преимущество налицо, но оно не столь подавляюще, как это было в случае R100 и NV15 (GeForce2). Зато при сходной конфигурации конвейеров потенциальная производительность чипа должна быть выше, чем у конкурента, вследствие более высокой тактовой частоты.
Старшая модель игровой карты ATI имеет то же название, что и графический процессор. Плата имеет AGP x2/x4 интерфейс, 64МБ DDR SDRAM памяти, размещенной в 8 микросхемах на лицевой и оборотной сторонах PCB. В целом компоновка очень схожа с RADEON 64MB DDR.
Микросхемы памяти произведены компанией Hynix (бывшая Hyundai Semiconductor) и имеют время выборки 3.6 ns, т.е. чипы памяти рассчитаны на рабочую частоту 277 (554) МГц. Память функционирует на частоте 275 (550) МГц, т.е. практически в номинальном режиме. Работающие на столь высоких частотах микросхемы лишены охлаждения это особенность всей серии RADEON 7500/8500. Если видеокарты на базе процессоров последнего поколения от NVIDIA требуют обязательного охлаждения микросхем памяти, а также понижения частоты работы памяти заметно ниже номинала, то следует признать, что чип ATI Technologies снабжен прекрасным и экологичным контроллером памяти.
Сравним дизайн RADEON 7500 (сверху) и 8500 (снизу).
На первый взгляд они похожи, особенно в правой части. Однако при одинаковом размере PCB отличия есть. Расположение гнезд DVI и VGA у плат разное плюс наличие у 8500 модуля RAGE THEATER, который отвечает за VIVO (Video In Video Out).
ATI
обеспечивает охлаждение видеопроцессора наклеиванием на него кулера, а не крепежа
к PCB. Поэтому в случае поломки вентилятора надо отламывать его от чипа (с риском
для последнего и карты в целом), искать также термоклей и зачищать поверхность
чипа от остатков прежнего клея, что может привести к стиранию всех надписей
с GPU (рис. 4, слева). На чипе можно увидеть полную маркировку, в том числе
и ревизию A13. Впрочем,
о ревизии сообщает утилита. RADEON 8500 комплектуется сопроцессором RAGE THEATER,
отвечающим за мультимедийные функции. У этого чипсета необычная роль. Карта
полноценно поддерживает мультимониторность, т.е. предоставляет все возможности
7500, в том числе и TV-выход, полноценно работающий отдельно от монитора. Однако
если 7500 реализует эту функцию с помощью самого графического процессора, то
у RADEON 8500 за ТВ-выход отвечает RAGE THEATER.
Как известно, большинство видеопотоков записано в Interlaced режиме, то есть
вначале четные, а затем нечетные строки. При этом на мониторах и телевизорах
сперва рисуется первая часть,
а потом, во время второго прохода развертки вторая. Но на современных мониторах
никто так не делает, отсюда нужда в деинтерлейсинге перегоне в обычное нечередующееся
изображение. Стандартно для этого используются 2 метода BOB и Weave. Первый
предусматривает выполнение двух кадров: один из нечетных, второй из четных.
При этом приходится тупо копировать каждую строку 2 раза. Этот метод хорош для
видеозаписей с интенсивным движением. Пример метода BOB:

Второй, Weave, пригоден для остановленных кадров. В нем чередуют строки. Получается только один кадр, но с реальным удвоенным вертикальным разрешением. Пример Weave:

ATI нам предлагает свой метод попиксельного деинтерлейсинга, улучшающий качество
картинки:

Качество ТВ-выхода и воспроизведения видео у RADEON 8500 действительно одно
из лучших.
Как и RADEON 7500, карта может выводить изображение на 2 приемника, поскольку
чип имеет 2 интегрированных CRTC модуля (плюс трансмиттер для цифровых мониторов).
В некоторых материалах ATI значится, что RADEON 8500 имеет 2 интегрированных
400 МГц RAMDAC, однако второй RAMDAC (на фотографии карты его можно увидеть
между GPU и RAGE THEATER) внешний 10-битный чип с максимальной частотой 240МГц.
То есть не 2 полноценных RAMDAC
по 350 МГц, как у RADEON 7500, однако и такая частота работы второго RAMDAC
позволяет
на втором мониторе получить разрешение 1600х1200 при 100 Гц. Поэтому двухмониторность
у RADEON 8500 полноценная. Всеми особенностями работы RADEON 7500, в том числе
и технологией HydraVision, 8500 обладает.
В поставку входят руководство пользователя; диск с ПО (драйверы и утилиты); диски с играми и демопродуктами; переходники S-Video-to-RCA и DVI-to-VGA; кабели S-Video, RCA.
При наличии дополнительного охлаждения карта стабильно работала при частотах ядра и памяти 310/295(590) МГц соответственно. Новый чип ATI имеет в этом смысле хороший потенциал. Разгон памяти, уже работающей на своем номинале, оказался не столь велик по сравнению с полученными ранее приростами по частотам у схожей по времени выборки памяти. Тем не менее, учитывая хорошую сбалансированность карты, увеличение частоты GPU наиболее приоритетно.
Конфигурация тестовых стендов:
Компьютер на базе AMD Athlon 1400 МГц, системная плата Chaintech 7KJD
(AMD760); ОП 512 МБ DDR SDRAM PC2100; НЖМД IBM DTLA 45 ГБ;
Компьютер на базе Pentium 4 1500 МГц; системная плата ASUS P4T (i850);
ОП 512 МБ RDRAM PC800; НЖМД Quantum FB AS 20 ГБ.
В обоих случаях ОС Windows 98 SE.
Использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").
Тестирование проводилось на версии 7.191 драйверов от ATI, для сравнительного
анализа были использованы тесты видеокарт на базе процессоров от NVIDIA, полученные
на драйверах NVIDIA версии 21.85. А состязались с RADEON 8500 следующие карты:
NVIDIA GeForce3 Ti 500 (240/250 (500) МГц, 64 МБ DDR;
NVIDIA GeForce3 Ti 200 (175/200 (400) МГц, 64 МБ DDR);
ABIT Siluro GF3 VIO (GeForce3, 200/230 (460) МГц, 64 МБ DDR).
При снятии результатов тестов VSync был отключен в драйверах у всех карт.
Использовались модифицированные для большего удобства и контроля примеры из пререлиза последней версии DirectX SDK.
Optimized Mesh
Этот тест на практический предел пропускной способности ускорителя по треугольникам.
Для этого используется несколько одновременно выводимых в небольшом окне моделей,
каждая из которых состоит из 50000 треугольников. Текстурирование отсутствует.
Каждый треугольник не превышает 1 пиксел. Результат этого теста, разумеется,
недостижим для реальных приложений, где размеры треугольников значительны, присутствуют
текстуры и освещение. Использовались 3 модели оптимизированная для оптимальной
скорости вывода (в том числе с учетом размера кэша вершин на чипе) Optimized,
не оптимизированная исходная Unoptimized и она же, выводимая в виде одного Triangle
Strip Strip.
Для оптимизированной модели оба ускорителя показывают более 30 млн полигонов
в секунду, причем преимущество RADEON 8500 ниже ожидаемого благодаря разнице
частот. Далее мы увидим, как хороший баланс чипа смог кардинально изменить картину
в мало-мальски реальной (а не предельной) сцене. С неоптимизированной моделью
RADEON получил двукратное преимущество. Сказались, вероятно, большие размеры
вершинных кэшей.
С неоптимизированной Strip моделью RADEON проиграл. А вот у GeForce 3 Ti 500
Strip практически равен Optimized, как качественно, так и количественно.
Отметим существенное преимущество GeForce 3 в случае принудительной активации программного расчета геометрии. Причина FastWrites механизм позволяет напрямую передавать геометрические данные из процессора в ускоритель, минуя системную память.
Производительность блока вершинного шейдера
В этом тесте для определения предельной производительности блока вершинных шейдеров
вычисляются видовые преобразования и геометрические функции. Тест выполнялся
в минимальном разрешении, дабы минимизировать влияние закраски. Z-буфер был
отключен, и HSR таким образом также не мог влиять на результаты.
Удивительно, но в случае аппаратного исполнения вершинного шейдера Ti 500 практически
вдвое опережает RADEON. Нас смутило поразительное совпадение результатов программного
и аппаратного исполнения шейдеров на GeForce 3. Закралось подозрение: не выполняются
ли все шейдеры на GeForce3 программно? Для проверки мы снизили тактовую частоту
Pentium 4
до 1000 МГц. На сей раз расхождение программного и аппаратного результата увеличилось,
программный упал до ~1200 а аппаратный остался практически на том же уровне,
т.е. обмана нет. Можно поздравить NVIDIA и отметить поразительный результат
RADEON в случае программной эмуляции.
Вершинный матричный блендинг
Эта возможность T&L используется для правдоподобной анимации и скиннинга
моделей. Мы протестировали блендинг с использованием двух матриц, как в жестком
аппаратном варианте, так и с использованием вершинного шейдера, выполняющего
ту же функцию. Кроме того, мы подстраховались результатами, полученными в
режиме программной эмуляции T&L .
Налицо значительное преимущество Ti 500, особенно в случае полностью аппаратной реализации блендинга. Отметим также повсеместное превосходство аппаратного исполнения над программным задача умножения матриц для ускорителя привычна и удобна, чего не скажешь о процессоре подобной работе по последовательному исполнению команд вершинного шейдера.
Поможет ли превосходство различных блоков GeForce 3 в реальных приложениях, где важна не только скорость отдельных блоков чипа, но и правильная организация взаимодействия между ними (и в первую очередь, отсутствие узких мест) узнаем далее.
Производительность пиксельных шейдеров
Мы использовали модифицированный пример MFCPixelShader, измерив производительность
карт в высоком разрешении при выполнении 5 различных по сложности шейдеров для
билинейно фильтрованных текстур.
В случае самого простого, не использующего текстуры шейдера, ATI немного лидирует, а далее, сохраняя небольшое отставание в случае двух текстур, RADEON просто проваливается при 4. И дело тут, как видно, не в сложности самого шейдера, а в числе используемых им текстур. Остается надеяться, что это исправимо на уровне драйверов.
Продолжение следует
Рубрики || Работа
|| Услуги || Поиск
|| Архив || Дни
рождения
О "КИ" || График
выхода || Карта сайта || Подписка
Рассылка анонсов газеты по электронной почте
Сайт газеты "Компьютер-Информ" является зарегистрированным электронным СМИ.
Свидетельство Эл 77-4461 от 2 апреля 2001 г.
Перепечатка материалов
без письменного согласия редакции запрещена.
При использовании материалов газеты в Интернет гиперссылка обязательна.
Телефон редакции (812) 718-6666, 718-6555.
Адрес: 196084, СПб, ул.Заставская, д.23, БЦ "Авиатор", 3-й этаж, офис 307
e-mail: editor@ci.ru
Для пресс-релизов и новостей news@ci.ru