Компьютер-Информ || Архив || Рубрики || Поиск || Подписка || Работа || О "КИ" || Карта
Материал любезно предоставлен сайтом iXBT.com
Окончание, начало в КИ 21/2001
Oтметим, что карта выполняет шейдеры версии 1.4. В комплекте с RADEON 8500 поставляется демо-программа, которая позволяет увидеть визуальную разницу между реализациями PS1.1 и PS1.4 (сверху 1.1, снизу 1.4).


Производительность версии 1.4 адекватна производительности предыдущих версий на аналогичных задачах. Шейдеры 1.4 гораздо более гибки при выборке значений из текстур, и существует класс эффектов, которые с ними реализуются проще либо вообще нереализуемы без них. Впрочем, несмотря на очевидное архитектурное превосходство, потребность сравнивать скорость выполнения новой версии шейдеров в предельных тестах не возникнет у нас никогда NVIDIA не планирует поддерживать шейдеры 1.4, а следующий продукт ATI будет уже совместим с DirectX 9 и, как следствие, c пиксельными шейдерами версии 2.0.


Этот тест измеряет падение производительности при использовании наложения карт отражения (Environment) и рельефа на основе карт отражения (EMBM Environment Bump). Для тестирования использовалось разрешение 1280х1024, т.к. именно при нем различия между картами и разными режимами текстурирования выражены наиболее резко.
В тесте Environment + Bump виден небольшой проигрыш RADEON 8500, несмотря на превосходство в обычном текстурировании и наложении карт среды. Судя по всему, последняя стадия EMBM пертурбация (смещенная выборка значений из текстуры) выполняется чипом неуверенно.
Так как пока нет приложений, в которых можно было бы нормально протестировать
зависимость производительности аппаратной реализации N-Patches от уровня детализации,
мы попросили автора RADEON Screen Saver Филиппа Герасимова модифицировать его
программу (одна из загружаемых сцен которой демонстрирует N-Patches), добавив
туда возможность регулировать детализацию. Так мы получили следующую тестовую
сцену (на двух представленных скриншотах
1 без N-Patches, 2
с использованием технологии Truform).
Очевидно, что практическое использование N-Patches возможно только с числом разбиений порядка 2 или менее. В случае одного разбиения (треугольник превращается в 4) это легко, но уже в случае 2 мы наблюдаем двукратное падение производительности. Большие уровни детализации практически бессмысленны: скорость падает почти на порядок. В защиту RADEON отметим, что этот тест несколько синтетичен. В реальных приложениях N-Patches, как правило, используются только с моделями, в то время как вся окружающая сцена выводится обычным образом, да и уровень детализации 2 уже сам по себе существенно сглаживает модель. Данная технология позволяет воплотить в трехмерных объектах образы, уже очень близкие по форме к человеку:


А ведь это лицо прекрасной девушки состоит из неимоверного числа полигонов (уже после отработки TruForm):

Подытожим предельные тесты. Несколько раз отдельные блоки GeForce3 демонстрировали подавляющее преимущество над RADEON 8500, а несколько раз и RADEON как минимум вдвое опережал GeForce 3.
Для того чтобы оценить эффективность реализации HSR, применен тест с большим уровнем OverDraw VillageMark v.1.17.
График 2. Результаты со включенным и отключенным HSR
Очевидно, что эффективность HSR у RADEON существенно выше, но с ростом разрешения выигрыш от включения HyperZ II падает быстрее, нежели в случае Ti 500. Итак, у RADEON 8500 налицо добротная реализация HSR.
Скорость закраски
Измерялась только для 32-битной глубины цвета.
Мы выбрали разрешение 1600х1200, чтобы минимизировать зависимость от других видов производительности чипа (например, геометрической). Наибольший результат этого теста всегда достигается при максимальном разрешении здесь чипу остается только красить бескрайние поля экрана. Напомним, что теоретические пределы для данного теста (также изображены на диаграмме) составляют 960 млн пикселей в секунду для Ti 500 и 1100 для RADEON 8500 соответственно. Последний наиболее близко подобрался к своему потолку, продемонстрировав отличную организацию кэширования и работы с памятью, а также прекрасную сбалансированность архитектуры (рис. 4).
И в случае максимального использования мультитекстурирования (4 текстуры для Ti 500 и 6 текстур для RADEON 8500) все повторяется. Теоретические пределы в этом тесте составили соответственно 1920 для Ti 500 и 2200 для RADEON 8500. Нет сомнений в совершенстве архитектуры RADEON, особенно если вспомнить успешную и холодную работу с более медленной формально, нежели у Ti 500, памятью на более высоких частотах.
Этот тест мы проводили в небольшом разрешении, дабы снизить влияние закраски на полученные результаты.
При наличии одного источника света результат RADEON не только значительно (более чем на разницу частот) превосходит Ti 500, но и (что более важно) вплотную приблизился к практическому пределу пропускной способности по треугольникам, полученному ранее с помощью Optimized Mesh из DX8.1 SDK, в отличие от GeForce 3, существенно сдавшей в более реальном тесте.
В случае с 8 источниками света производительность RADEON упала втрое. Но у Ti 500 еще хуже. В играх будущего (например, Next Doom), вероятно интенсивное использование большого числа аппаратных источников света. Именно в таких приложениях RADEON сможет продемонстрировать свое архитектурное преимущество над семейством GeForce3.
Этот тест проводился в разрешении 1024х768, наиболее характерном для современных игр. Ведь слишком маленькое разрешение чревато заметной зависимостью от геометрической производительности карты, а слишком большое от пропускной полосы шины памяти.
Более медленная по скорости закраски Ti 500 справилась с этим тестом существенно лучше, даже в сравнении с разогнанной RADEON. Это и предвещал предельный тест EMBM производительности из DirectX SDK. Недостатки реализации EMBM в 8500 налицо. Перейдем к DOT3 рельефу.
GeForce3 лучше. Остается посетовать на потенциальные драйверные проблемы RADEON, которые не дают полностью раскрыть частотный запас в этих тестах. Однако с приходом пиксельных шейдеров эти 2 теста начинают терять свою важность ибо с помошью шейдеров можно реализовать много различных методов рельефного текстурирования, в том числе с попиксельным расчетом освещения.
Мы приводим результаты этого теста в нескольких разрешениях.
Если производительность Ti500 медленно падает с ростом разрешения, что говорит
о зависимости от геометрической производительности чипа, то RADEON явно упирается
не столько в собственный интерпретатор шейдеров, сколько в скорость закраски.
То есть даже интенсивный синтетический тест не смог застать программируемый
TCL блок RADEON врасплох его производительность всегда оставалась достаточной.
Остается пожелать создателям 3DMark2001 усовершенствовать этот тест, сделав
его более тяжелым для геометрического блока ускорителя, и констатировать как
минимум двукратное преимущество RADEON над Ti 500. Вспомнив полученные ранее
на предельный тестах из DirectX SDK результаты, отметим, что в менее синтетической
сцене из 3D Mark 2001, RADEON показывает завидную производительность в условиях
реальной сцены.
Проведем этот тест в привычном 1024х768.
Преимущество RADEON фактически коррелирует с разницей в тактовых частотах соперников и чуть ниже ожидаемого из этих соображений результата. Это подтверждает полученные ранее на предельном тесте MFCPixelShader результаты. Впрочем, общий баланс чипа удовлетворителен: нет потенциально возможного двукратного проигрыша RADEON.
Приведем наименьшее разрешение, т.к. в остальных взаимная картина не меняется.
RADEON существенно обыгрывает Ti 500, в основном благодаря геометрической производительности. Закраска плоских спрайтов крайне проста, скорость их вывода все время упирается в геометрический аспект спрайтов очень много, и перед закраской надо преобразовать множество координат.
Подытожив синтетические тесты из 3D Mark 2001, отметим, что при переходе от предельных тестов SDK к более реальным, но все же синтетическим сценам 3D Mark, RADEON, как правило, получает преимущество благодаря хорошо сбалансированной архитектуре.
3DMark2001, DirectX 8.0
Общие результаты
Перманентнаяпобеда RADEON 8500 над NVIDIA GeForce3 Ti 500! Означает ли это, что в DirectX играх RADEON станет полновластным лидером? Рассмотрим по отдельности каждый игровой тест, входящий в 3DMark2001, попутно отметив, что при переходе с Pentium4-1500 на Athlon-1400 производительность обеих карт практически не изменилась.
Окончание следует
Рубрики || Работа
|| Услуги || Поиск
|| Архив || Дни
рождения
О "КИ" || График
выхода || Карта сайта || Подписка
Рассылка анонсов газеты по электронной почте
Сайт газеты "Компьютер-Информ" является зарегистрированным электронным СМИ.
Свидетельство Эл 77-4461 от 2 апреля 2001 г.
Перепечатка материалов
без письменного согласия редакции запрещена.
При использовании материалов газеты в Интернет гиперссылка обязательна.
Телефон редакции (812) 718-6666, 718-6555.
Адрес: 196084, СПб, ул.Заставская, д.23, БЦ "Авиатор", 3-й этаж, офис 307
e-mail: editor@ci.ru
Для пресс-релизов и новостей news@ci.ru