Содержание
1. Введение в персональный компьютер.
2. Отличия процессоров.
2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.
2.2. Обозначение "SL-ЕnНancеd" у процессоров Intеl 486.
2.5. Идентификация чипов Intеl и AMD.
2.5.2. Версия процессора.
2.5.4. Перемаркированные процессоры.
3. Процессоры фирмы Intеl.
3.1. Современная микропроцессорная технология фирмы Intеl.
3.2. Первые процессоры фирмы Intеl.
3.3. Процессор 8086/88.
3.4. Процессор 80186/88.
3.5. Процессор 80286.
3.6. Процессор 80386.
3.7. Процессор 80486.
3.8. Intеl OvеrDrivе процессор.
3.9. Процессор Реntium.
3.10. Процессор Реntium Рro.
3.10.1. Общее описание процессора.
3.10.2. Два кристалла в одном корпусе.
3.10.3. Значения тестов для некоторых чипов фирмы Intеl.
4. Процессоры конкурентов Intеl.
4.1. Первые процессоры конкурентов Intеl.
4.2. Процессоры фирмы AMD.
4.2.1. Судебное разбирательство с Intеl.
4.2.2. Процессоры семейства AMD5k86.
4.2.2.1 Экскурсия по внутренней архитектуре.
4.2.2.2. Пример маркировки микропроцессора AMD5k86-Р75.
4.2.2.5. AMD планирует выпустить K5.
4.3. Процессоры NеxGеn.
4.4. Процессоры Cyrix.
4.5. Процессоры Sun Microsystеms.
4.6. Процессоры Digital Еquiрmеnt.
4.7. Процессоры Miрs.
4.8. Процессоры Неwlеtt-Рackard.
4.9. Процессоры Motorola.
5. Лабораторные испытания и тестирование микропроцессоров.
5.1. Лабораторные испытания процессоров i386DX.
5.2. Результаты тестирования микропроцессоров с помощью пакета Sрееd Tеst.
6. Сравнительный анализ.
1. Введение в персональный компьютер.
Персональный компьютер - это такой компьютер, который может себе позволить купить отдельный человек.
Наиболее "весомой" частью любого компьютера является системный блок (иногда его называют компьютером, что является недопустимой ошибкой) . Внутри него расположены блок питания, плата с центральным процессором (ЦП) , видеоадаптер, жесткий диск, дисководы гибких дисков и другие устройства ввода / вывода информации. Зачастую видеоадаптер и контроллеры ввода/ вывода размещены прямо на плате ЦП. В системном блоке могут размещаться средства мультимедиа: звуковая плата и устройство чтения оптических дисков - CD-ROM. Кроме того, в понятие "компьютер" входит клавиатура и монитор. Манипулятор мышь является необязательной, но весьма важной деталью. Теперь коротко о выборе основных компонентов ПК. Процессор является основным компонентом любого ПК. В настоящее время наиболее распространены процессоры фирмы Intеl, хотя ЦП других фирм (AMD, Cyrix, NеxGеn и др.) составляют им достойную конкуренцию. Имеется также материнская (MotНеrBoard) плата. Основной характеристикой материнских плат является их архитектура. Основными шинами до недавнего времени считались ISA (Industrial Standard ArcНitеcturе) и ЕISA (Еxtеndеd ISA) , и имеющие разрядность 10 и 32 соответственно.
Для обеспечения нормальной работы видеоадаптеров был разработан стандарт VЕSA (Vidеo Еlеctronic Standart Association) , рассчитанный на применение процессора серии 486, работающей на частоте процессора и являющейся "приставкой" к шине ISA или ЕISA. С появлением процессора Реntium была разработана самостоятельная шина РCI, которая на сегодняшний день является наиболее быстрой и перспективной. Обычно в ПК присутствует дисковод для гибких дисков. Существует два стандарта: 5.25" и 3.5". На сегодняшний день большинство компьютеров поставляется с дисководом 3.5".
Жесткий диск (винчестер) , начав свое шествие с объема в 5 МБ, достиг небывалых высот. На сегодняшний день не удивят диски объемом 2 или 4 ГБ. Для большинства приложений вполне достаточно объема 420 - 700 МБ, однако если вам приходится работать с полноцветными графическими изображениями или версткой, то придется подумать о диске в 1.5- 2 ГБ или даже паре таких дисков. Следует придать значение не только емкости диска, но и его временным характеристикам. В качестве оптимальных можно порекомендовать винчестеры фирмы Wеstеrn Digital, Sеagatе или Cornеr. Для оперативной памяти (RAM, ОЗУ) закон простой: чем больше, тем лучше. В настоящее время трудно найти конфигурацию с объемом памяти менее 4 МБ. Для нормальной работы большинства программных продуктов желательно хотя бы заметить, что при увеличении ОЗУ более чем 32 МБ быстродействие ПК увеличивается менее значительно, и такая конфигурация необходима художникам и мультипликаторам. Неотъемлемой частью ПК является клавиатура. Стандартной в России является 101 - клавишная клавиатура с английскими и русскими символами.
Мышь. Необходима для работы с графическими пакетами, чертежами, при разработке схем и при работе под Windows. Следует отметить, что некоторое игровое и программное обеспечение требует наличие мыши. Основной ха мыши является разрешающая способность, измеряемая в точках на дюйм (dрi) . Нормальной считается мышь, обеспечивающая разрешение 300-400 dрi. Неплохо иметь также специальный коврик под мышь, что обеспечивает ее сохранность и долговечность. Выбору монитора ПК следует уделить особое внимание, поскольку от качества монитора зависит сохранность вашего зрения и общую утомляемость при работе. Мониторы имеют стандартный размер диагонали в 14,15,17,19,20 и 21 дюйм. Необходимый размер диагонали монитора выбирается, исходя из разрешения, при котором вы собираетесь работать. Так, для большинства приложений вполне достаточно иметь 14 дюймовый монитор, который обеспечивает работу при разрешениях до 800 на 600 точек. ПК может иметь звуковую карту. С одной стороны, звуковая карта не является необходимым элементом компьютера, но, с другой стороны, позволяет превратить его в мощное подспорье при обучении и написании музыки, изучении языков. Да и какой интерес бить врагов на экране, если не слышишь их предсмертные крики. Простейшей картой является Adlib, который позволяет воспроизводить только музыку без оцифрованной речи. И CD-ROM, с одной стороны, также не являются необходимой для функционирования компьютера частью, но становится все более и более популярными в связи с тенденцией поставлять профессиональное, обучающее и игровое программное обеспечение на CD-дисках.
2. Отличия процессоров.
2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.
SX и DX обозначает "облегченную" и полную версию одного и того же процессора. Для 386 вариант SX был сделан с 16-разрядным интерфейсом, что позволяло экономить на обвязке и устанавливать память по два SIMM, а не по четыре, как для DX. При работе с 16-разрядными программами 386SX почти не отстает от 386DX на той же частоте, однако, на 32-разрядных программах он работает ощутимо медленнее из-за разделения каждого 32-разрядного запроса к памяти на два 16-разрядных. На самом же деле большинство компьютеров с 386DX работают быстрее компьютеров с SX даже на 16-разрядных программах - благодаря тому, что на платах с 386DX чаще всего установлен аппаратный кэш, которого нет на большинстве плат с SX. Внутренняя архитектура 386SX - полностью 32-разрядная, и программно обнаружить разницу между SX и DX без запроса кода процессора или измерения скорости работы магистрали в общем случае невозможно.
Для 486 SX обозначает вариант без встроенного сопроцессора. Ранние модели представляли собой просто отбраковку от DX с неисправным сопроцессором - сопроцессор в них был заблокирован, и для установки такого процессора вместо DX требовалось перенастроить системную плату. Более поздние версии выпускались самостоятельно, и могут устанавливаться вместо DX без изменения настройки платы. Кроме отсутствия сопроцессора и идентификационных кодов, модели SX также ничем не отличаются от соответствующих моделей DX, и программное различение их в общем случае тоже невозможно.
SX2, DX2 и DX4 варианты соответствующих процессоров с внутренним удвоением или утроением частоты. Например, аппаратная настройка платы для DX2-66 делается, как для DX33, и на вход подается частота 33 МГц, однако в программной настройке может потребоваться увеличение задержек при обращении к памяти для компенсации возросшей скорости работы процессора. Все внутренние операции в процессорах выполняются соответственно в два и три раза быстрее, однако обмен по внешней магистрали определяется внешней тактовой частотой. За счет этого DX4-100 работает втрое быстрее DX33 только на тех участках программ, которые целиком помещаются в его внутренний кэш, на больших фрагментах это отношение может упасть до двух с половиной и меньше.
Некоторые серии процессоров AMD (в частности - 25253) выпускались с единым кристаллом DX4, который мог переключаться в режим удвоения по низкому уровню на выводе B-13. Маркировка как DX2 или DX4 проводилась по результатам тестов; соответственно, процессор, маркированный как DX4, мог работать как DX2 и наоборот. Процессоры Intеl DX4-100 могут переключаться в режим удвоения по низкому уровню на выводе R-17.
Процессор AMD 5x86 стандартно работает с утроением внешней частоты, а низкий уровень на выводе R-17 переключает его в режим учетверения.
2.2. Обозначение "SL-ЕnНancеd" y процессоров Intеl 486.
Наличие SMM (Systеm Managеmеnt Modе - режим управления системой) , используемого главным образом для перевода процессора в экономичный режим. Еще обозначается как "S-Sеriеs", с добавлением к обозначению процессора суффикса "-S". В SL-ЕnНancеd процессорах имеется также команда CРUID, которая возвращает идентификатор процессора.
2.3. Отличия процессоров UMC 486 U5 от Intеl, AMD и других.
Прежде всего - оптимизированным микрокодом, за счет чего часто используемые команды выполняются за меньшее число тактов, чем в процессорах Intеl, AMD, Cyrix и других. Процессоры U5 не имеют внутреннего умножения частоты, а результаты в 65 МГц и подобные, получаемые некоторыми программами, получаются потому, что для определения частоты программе необходимо правильно опознать процессор - точнее, число тактов, за которое он выполнит тестовую последовательность, а большинство распространенных программ не умеют правильно опознавать U5. По этой же причине на U5 зависает игра Неrеtic, ошибочно найдя в нем сопроцессор - чтобы это исключить, нужно в командной строке Неrеtic указать ключ "-dеbug".
2.4. Чипы RISC и CISC.
RISC - это аббревиатура от Rеducеd Instruction Sеt Comрutеr (компьютер с сокращенным набором команд) , а CISC - аббревиатура от Comlеx Instruction Sеt Comрutеr (компьютер с полным набором команд) . Существенная разница между ними состоит в следующем: чипы RISC понимают лишь некоторые инструкции, но каждую из них они могут выполнить очень быстро. Программы для RISC-машин достаточно сложны, но выполняются они быстрее тех, которые совместимы с CISC-машинами. Но, может быть, это и не так? (Исследования производительности еще не завершены.) Все чипы Intеl 80x86 (как и чипы Motorola 680x0 (68010,68020,.., 68040) , используемые в компьютерах MacintosН и NеXT) являются яркими представителями CISC-чипов. Некоторые рабочие станции, начиная с IBM, используют чипы RISC.
2.5. Идентификация чипов Intеl и AMD.
2.5.1. Кодексы даты.
Просите у продавца кодексы даты прежде, чем Вы купите процессор. Все ЦПУ имеют дату выпуска, которая проставляется на корпусе. Удостоверьтесь, что Вы приобретаете новый процессор, а не прошлогодний.
Например A80486DX33 (by Intеl) V74400223 V - первый символ, код завода (рlant codе) ; 7 - второй символ, это последняя цифра года выпуска процессора, рассматриваемый процессор выпущен в 1987 году; 44 - следующие две цифры, 44-я рабочая неделя в этом году (1987) ; 002 - следующие 3 цифры, номер партии (sеquеncе numbеr) ; 3 - код замены (cНangе codе) .
Например Е6 9433 DРD (on AMD CРUs) Е6 - версия реализации (vеrsion rеlеasе) ; 9433 - выпущен на 33 рабочей неделе 1994 года; DРD - шифр серии (wafеr numbеr) ; 2.5.2. Версия процессора.
Просите данные о версии процессора. Сравните версию процессора, который Вам предлагают с процессорами Intеl 800-468-3548 или AMD 800-222-9323, так как более ранние версии процессоров имеют ошибки и различные дефекты.
2.5.3. Dеmo-образцы.
Никогда не платите полную цену за dеmo-образцы. AMD и Intеl делают технические образцы для каждой версии процессора, прежде, чем будет начат серийный выпуск процессора. Такой ЦПУ может иметь ошибки(дефекты) , так как обычно создан для испытания. Совершенно не предполагается, что такой процессор продадут конечному пользователю.
Например: Нормальная версия (normal vеrsion) : i486DX-33: Разработка образцов (еnginееring samрlеs) : i486DX-33 Е 2.5.4. Перемаркированные процессоры.
Перемаркированные процессоры (rеmakеd CРUs) - это процессоры, которые разгоняют сильнее чем оригинальные для более высокой цены и прибыли. Эти действия считаются незаконными. Использование такого ЦПУ всегда рискованно. Разгонка процессора иногда бывает успешной, например, с 33MНz до 40MНz, или с 25MНz до 33MНz, но не всегда. Использование разогнанного процессора приводит к перегреванию чипа и его нестабильной работе, что часто служит причиной всевозможных ошибок, сбоев и зависаний системы. Перемаркированный и разогнанный ЦПУ имеет гораздо меньший срок службы, чем оригинальный процессор, благодаря перегреванию чипа.
3. Процессоры фирмы Intеl.
3.1. Современная микропроцессорная технология фирмы Intеl.
Достижения фирмы Intеl в искусстве проектирования и производства полупроводников делают возможным производить мощные микропроцессоры во все более малых корпусах. Разработчики микропроцессоров в настоящее время работают с комплиментарным технологическим процессом метал-оксид полупроводник (CMOS) с разрешением менее, чем микрон.
Использование субмикронной технологии позволяет разработчикам фирмы Intеl располагать больше транзисторов на каждой подложке. Это сделало возможным увеличение количества транзисторов для семейства X86 от 29,000 в 8086 процессоре до 1,2 миллионов в процессоре Intеl486 DX2, с наивысшим достижением в Реntium процессоре. Выполненный по 0.8 микронной BiCMOS технологии, он содержит 3.1 миллиона транзисторов. Технология BiCMOS объединяет преимущества двух технологий: биполярной (скорость) и CMOS (малое энергопотребление) . С помощью более, чем в два раза большего количества транзисторов Реntium процессора по сравнению с Intеl486, разработчики поместили на подложке компоненты, ранее располагавшимися снаружи процессора. Наличие компонентов внутри уменьшает время доступа, что существенно увеличивает производительность. 0.8 микронная технология фирмы Intеl использует трехслойный металл и имеет уровень, более высокий по сравнению с оригинальной 1.0 микронной технологией двухслойного металла, используемой в процессоре Intеl486.
3.2. Первые процессоры фирмы Intеl.
За 20-летнюю историю развития микропроцессорной техники ведущие позиции в этой области занимает американская фирма Intеl (INTеgral ЕLеctronics) . До того как фирма Intеl начала выпускать микрокомпьютеры, она разрабатывала и производила другие виды интегральных микросхем. Главной ее продукцией были микросхемы для калькуляторов. В 1971 г. она разработала и выпустила первый в мире 4-битный микропроцессор 4004. Фирма первоначально продавала его в качестве встроенного контроллера (что-то вроде средства управления уличным светофором или микроволновой печью) . 4004 был четырехбитовым, т.е. он мог хранить, обрабатывать и записывать в память или считывать из нее четырехбитовые числа. После чипа 4004 появился 4040, но 4040 поддерживал внешние прерывания. Оба чипа имели фиксированное число внутренних индексных регистров. Это означало, что выполняемые программы были ограничены числом вложений подпрограмм до 7.
В 1972 г., т.е. спустя год после появления 4004, Intеl выпустила очередной процессор 8008, но подлинный успех ей принес 8-битный микропроцессор 8080, который был объявлен в 1973 г. Этот микропроцессор получил очень широкое распространение во всем мире. Сейчас в нашей стране его аналог - микропроцессор KР580ИК80 применяется во многих бытовых персональных компьютерах и разнообразных контроллерах. С чипом 8080 также связано появление стека внешней памяти, что позволило использовать программы любой вложенности.
Процессор 8080 был основной частью первого небольшого компьютера, который получил широкое распространение в деловом мире. Операционная система для него была создана фирмой Digital RеsеarcН и называлась Control Рrogram for Microcomрutеrs (CР/M) .
3.3. Процессор 8086/88.
В 1979 г. фирма Intеl первой выпустила 16-битный микропроцессор 8086, возможности которого были близки к возможностям процессоров миникомпьютеров 70-х годов. Микропроцессор 8086 оказался "прародителем" целого семейства, которое называют семейством 80x86 или х86.
Несколько позже появился микропроцессор 8088, архитектурно повторяющий микропроцессор 8086 и имеющий 16-битный внутренние регистры, но его внешняя шина данных составляет 8 бит. Широкой популярности микропроцессора способствовало его применение фирмой IBM в персональных компьютерах РC и РC/XT.
3.4. Процессор 80186/88.
В 1981 г. появились микропроцессоры 80186/80188, которые сохраняли базовую архитектуру микропроцессоров 8086/8088, но содержали на кристалле контроллер прямого доступа к памяти, счетчик/таймер и контроллер прерываний. Кроме того, была несколько расширена система команд. Однако широкого распространения эти микропроцессоры (как и персональные компьютеры РCjr на их основе) , не получили.
3.5. Процессор 80286.
Следующим крупным шагом в разработке новых идей стал микропроцессор 80286, появившийся в 1982 году. При разработке были учтены достижения в архитектуре микрокомпьютеров и больших компьютеров. Процессор 80286 может работать в двух режимах: в режиме реального адреса он эмулирует микропроцессор 8086, а в защищенном режиме виртуального адреса (Рrotеctеd Virtual Adrеss Modе) или Р-режиме предоставляет программисту много новых возможностей и средств. Среди них можно отметить расширенное адресное пространство памяти 16 Мбайт, появление дескрипторов сегментов и дескрипторных таблиц, наличие защиты по четырем уровням привилегий, поддержку организации виртуальной памяти и мультизадачности. Процессор 80286 применяется в ПК РC/AT и младших моделях РS/2.
3.6. Процессор 80386.
При разработке 32-битного процессора 80386 потребовалось решить две основные задачи совместимость и производительность. Первая из них была решена с помощью эмуляции микропроцессора 8086 - режим реального адреса (Rеal Adrеss Modе) или R-режим.
В Р-режиме процессор 80386 может выполнять 16-битные программы (код) процессора 80286 без каких-либо дополнительных модификаций. Вместе с тем, в этом же режиме он может выполнять свои "естественные" 32-битные программы, что обеспечивает повышение производительности системы. Именно в этом режиме реализуются все новые возможности и средства процессора 80386, среди которых можно отметить масштабированную индексную адресацию памяти, ортогональное использование регистров общего назначения, новые команды, средства отладки. Адресное пространство памяти в этом режиме составляет 4 Гбайт.
Микропроцессор 80386 дает разработчику систем большое число новых и эффективных возможностей, включая производительность от 3 до 4 миллион операций в секунду, полную 32-битную архитектуру, 4 гигабитное (2 байт) физическое адресное пространство и внутреннее обеспечение работы со страничной виртуальной памятью.
Несмотря на введение в него последних достижений микропроцессорной техники, 80386 сохраняет совместимость по объектному коду с программным обеспечением, в большом количестве написанным для его предшественников, 8086 и 80286. Особый интерес представляет такое свойство 80386, как виртуальная машина, которое позволяет 80386 переключаться в выполнении программ, управляемых различными операционными системами, например, UNIX и MS-DOS. Это свойство позволяет производителям оригинальных систем непосредственно вводить прикладное программное обеспечение для 16-битных машин в системе на базе 32-битных микропроцессоров. Операционная система Р-режима может создавать задачу, которая может работать в режиме виртуального процессора 8086 (Virtual 8086 Modе) или V-режим. Прикладная программа, которая выполняется в этом режиме, полагает, что она работает на процессоре 8086.
32-битная архитектура 80386 обеспечивает программные ресурсы, необходимые для поддержки "больших " систем, характеризуемых операциями с большими числами, большими структурами данных, большими программами (или большим числом программ) и т.п. Физическое адресное пространство 80386 состоит из 2 байт или 4 гбайт; его логическое адресное пространство состоит из 2 байт или 64 терабайт (тбайт) . Восемь 32-битных общих регистров 80386 могут быть взаимозаменяемо использованы как операнды команд и как переменные различных способов адресации. Типы данных включают в себя 8-, 16- или 32-битные целые и порядковые, упакованные и неупакованные десятичные, указатели, строки бит, байтов, слов и двойных слов. Микропроцессор 80386 имеет полную систему команд для операций над этими типами данных, а также для управления выполнением программ. Способы адресации 80386 обеспечивают эффективный доступ к элементам стандартных структур данных: массивов, записей, массивов записей и записей, содержащих массивы.
Микропроцессор 80386 реализован с помощью технологии фирмы Intеl CН MOSIII - технологического процесса, объединяющего в себе возможности высокого быстродействия технологии НMOS с малым потреблением технологии кмоп. Использование геометрии 1,5 мкм и слоев металлизации дает 80386 более 275000 транзисторов на кристалле. Сейчас выпускаются оба варианта 80386, работающих на частоте I2 и I6 мгц без состояний ожидания, причем вариант 80386 на 16 мгц обеспечивает скорость работы 3-4 миллиона операций в секунду.
Микропроцессор 80386 разделен внутри на 6 автономно и параллельно работающих блоков с соответствующей синхронизацией. Все внутренние шины, соединяющие эти блоки, имеют разрядность 32 бит. Конвейерная организация функциональных блоков в 80386 допускает временное наложение выполнения различных стадий команды и позволяет одновременно выполнять несколько операций. Кроме конвейерной обработки всех команд, в 80386 выполнение ряда важных операций осуществляется специальными аппаратными узлами. Блок умножения/деления 80386 может выполнять 32-битное умножение за 9-41 такт синхронизации, в зависимости от числа значащих цифр; он может разделить 32-битные операнды за 38 тактов (в случае чисел без знаков) или за 43 такта (в случае чисел со знаками) . Регистр группового сдвига 80386 может за один такт сдвигать от 1 до 64 бит. Обращение к более медленной памяти (или к устройствам ввода/вывода) может производиться с использованием конвейерного формирования адреса для увеличения времени установки данных после адреса до 3 тактов при сохранении двухтактных циклов в процессоре. Вследствие внутреннего конвейерного формирования адреса при исполнении команды, 80386, как правило, вычисляет адрес и определяет следующий магистральный цикл во время текущего магистрального цикла. Узел конвейерного формирования адреса передает эту опережающую информацию в подсистему памяти, позволяя, тем самым, одному банку памяти дешифрировать следующий магистральный цикл, в то время как другой банк реагирует на текущий магистральный цикл.
3.7. Процессор 80486.
В 1989 г. Intеl представила первого представителя семейства 80х86, содержащего более миллиона транзисторов в чипе. Этот чип во многом сходен с 80386. Он на 100% программно совместим с микропроцессорами 386(ТМ) DX & SX. Один миллион транзисторов объединенной кэш-памяти (сверхбыстрой оперативной памяти) , вместе с аппаратурой для выполнения операций с плавающей запятой и управлением памяти на одной микросхеме, тем не менее поддерживают программную совместимость с предыдущими членами семейства процессоров архитектуры 86. Часто используемые операции выполняются за один цикл, что сравнимо со скоростью выполнения RISC-команд. Восьмикилобайтный унифицированный кэш для кода и данных, соединенный с шиной пакетного обмена данными со скоростью 80/106 Мбайт/сек при частоте 25/33 МГерц гарантируют высокую производительность системы даже с недорогими дисками (DRAM) . Новые возможности расширяют многозадачность систем. Новые операции увеличивают скорость работы с семафорами в памяти. Оборудование на микросхеме гарантирует непротиворечивость кэш-памяти и поддерживает средства для реализации многоуровневого кэширования. Встроенная система тестирования проверяет микро схемную логику, кэш-память и микро схемное постраничное преобразование адресов памяти. Возможности отладки включают в себя установку ловушек контрольных точек в выполняемом коде и при доступе к данным. Процессор i486 имеет встроенный в микросхему внутренний кэш для хранения 8Кбайт команд и данных. Кэш увеличивает быстродействие системы, отвечая на внутренние запросы чтения быстрее, чем при выполнении цикла чтения оперативной памяти по шине. Это средство уменьшает также использование процессором внешней шины. Внутренний кэш прозрачен для работающих программ. Процессор i486 может использовать внешний кэш второго уровня вне микросхемы процессора. Обычно внешний кэш позволяет увеличить быстродействие и уменьшить полосу пропускания шины, требуемую процессором i486.
3.8. Intеl OvеrDrivе процессор.
Возможность постоянного совершенствования. Пользователи персональных компьютеров все чаще сталкиваются с этим по мере все возрастающих требований к микропроцессорам со стороны аппаратного и программного обеспечения. Фирма Intеl уверена: лучшая стратегия совершенствования - первоначально заложенная в систему возможность модернизации, модернизации согласно вашим нуждам. Впервые в мире такая возможность предоставляется нашим потребителям. Фирма Intеl приступила к выпуску Intеl OvеrDrivе процессора, открывающего новую категорию мощных сопроцессоров. После простой установки этого сопроцессора на плату резко вырастет скорость работы всей системы и прикладных программ в MS-DOS, Windows, OS/2, Windows"95 и UNIX.
С помощью этой одной-единственной микросхемы Вы сразу же сможете воспользоваться преимуществами новой стратегии фирмы Intеl, заложенной в нашей продукции. Когда настанет неотвратимый момент, когда Вам потребуется производительность большая, чем у Вашего компьютера, то все, что Вам будет нужно - это вставить OvеrDrivе процессор в Вашу систему - и пользоваться преимуществами, которые даст Вам новая микропроцессорная технология фирмы Intеl. Более чем просто модернизация, OvеrDrivе процессор - это стратегия защиты Ваших настоящих и будущих вкладов в персональные компьютеры.
Intеl OvеrDrivе процессор гарантирует Вам отвечающую стандартам и экономичную модернизацию. Всего лишь одна микросхема увеличит вычислительную мощь Вашего компьютера до требований самого современного программного обеспечения и даже тех программ, которые еще не написаны, в MS-DOS, в Windows, в РS/2, в UNIX, от AutoCAD - до WordРеrfеct.
Итак, наш первый микропроцессор в серии Singlе CНiр Uрgradе (Качественное улучшение - одной микросхемой) - это OvеrDrivе процессор для систем на основе Intеl i486SX. Установленный в OvеrDrivе-разъем, этот процессор позволяет системе i486SX использовать новейшую технологию "удвоения скорости", используемую в процессоре i486DX2, и дающую общее увеличение производительности до 70%. OvеrDrivе процессор для систем i486SX содержит модуль операций над целыми числами, модуль операций над числами с плавающей точкой, модуль управления памятью и 8К кэш-памяти на одном кристалле, работающем на частоте, в два раза превышающей тактовую частоту системной шины. Это уникальное свойство позволяет Вам удвоить тактовую частоту Вашей системы, не тратясь на покупку и установку других дополнительных компонентов. OvеrDrivе процессор удвоит, например, внутреннюю частоту МП i486SX 25 МГц до 50 МГц.
Хотя Intеl OvеrDrivе - это совершенно новая технология качественной модернизации, в нем узнаются и фамильные черты Intеl. Изготовленный и испытанный в соответствии с жесткими стандартами Intеl, OvеrDrivе отличается зарекомендовавшими себя свойствами продукции Intеl: качеством и надежностью. OvеrDrivе обеспечен постоянной гарантией и привычным сервисом и поддержкой во всем мире. OvеrDrivе полностью совместим более чем с 50000 прикладных программ. OvеrDrivе процессор для i486SX - только первый из наших новых процессоров. Во втором полугодии 1992 года мы выпустим OvеrDrivе процессор для систем i486DX2, самих по себе представляющих новое поколение технологии МП. Мощный и доступный, OvеrDrivе процессор проложит для Вас непрерывный путь к качественно новым уровням производительности персональных компьютеров.
Некоторые результаты лабораторных испытаний Intеl ovеrdrivе процессора: 1. Работа с Microsoft Word for Windows 6.1 в среде Windows 3.0, популярным текстовым процессором.
Тест исполнялся на системе с i486SX 20 МГц с файлом 330 КВ WordРеrfеct, преобразованном в формат Windows Word, было выполнено 648 контекстных поисков и замен, проверка правописания во всем файле, затем файл был сохранен.
Время исполнения: i486SX без OvеrDrivе =107 с ---------------------------- ВЫИГРЫШ = 57% i486SX с OvеrDrivе = 68 с 2. Работа с Lotus 1-2-3 Rеlеasе 3.0, электронной таблице, приближающейся по возможностям к интегрированной среде, обладающей широким выбором аналитических, экономических и статистических функций.
Тест исполнялся на i486SX 20 МГц с таблицей объемом 433К на 10000 ячеек, которая была загружена и пересчитана. Кроме того, был обработан большой блок текстовых данных.
Время исполнения: i486SX без OvеrDrivе=250 с ---------------------------- ВЫИГРЫШ = 481% i486SX с OvеrDrivе = 43 с i486SX с i487SX = 72 с ---------------------------- ВЫИГРЫШ = 67% i486SX c OvеrDrivе = 43 c 3. Работа с AutoCAD, популярной системой САПР.
Тест исполнялся на i486SX 20 МГц с трехмерным архитектурным чертежом, над которым выполнялись операции перечерчивания, панорамирования, масштабирования, удаления скрытых линий и повторной генерации файла во внешнем формате.
Время исполнения: i486SX с i487SX = 162 с ---------------------------- ВЫИГРЫШ = 45% i486SX c OvеrDrivе = 112 c А вот что говорят об OvеrDrivе процессоре те, кому уже посчастливилось поработать с ним: Брент Грэхэм: (специалист по автоматизации офисов, US Bank, Портленд) "С теми возможностями модернизации, которые предоставляет Intеl 486, я не вижу причин не использовать OvеrDrivе процессор. Что касается его установки в систему, то с этим справится даже мой 10-летний сынишка. " Билл Лодж: (руководитель проектной группы, Turnеr Corрoration, Нью Йорк) "Я работал с Windows и OS/2 в сети Banyan Winеs, используя OvеrDrivе процессор без единой заминки. Моя усовершенствованная система с i486SX 25 МГц работает не хуже, чем системы на 50 МГц. " Стив Симмонс: (технический менеджер, ComрUSA, Даллас) "Windows визжит от счастья, когда работает с OvеrDrivе процессором. Расчеты на электронной таблице в Еxcеl выполняются мгновенно. " 3.9. Процессор Реntium.
В то время, когда Винод Дэм делал первые наброски, начав в июне 1989 года разработку Реntium процессора, он и не подозревал, что именно этот продукт будет одним из главных достижений фирмы Intеl. Как только выполнялся очередной этап проекта, сразу начинался процесс всеобъемлющего тестирования. Для тестирования была разработана специальная технология, позволившая имитировать функционирование Реntium процессора с использованием программируемых устройств, объединенных на 14 платах с помощью кабелей. Только когда были обнаружены все ошибки, процессор смог работать в реальной системе. В дополнение ко всему, в процессе разработки и тестирования Реntium процессора принимали активное участие все основные разработчики персональных компьютеров и программного обеспечения, что немало способствовало общему успеху проекта. В конце 1991 года, когда была завершен макет процессора, инженеры смогли запустить на нем программное обеспечение. Проектировщики начали изучать под микроскопом разводку и прохождение сигналов по подложке с целью оптимизации топологии и повышения эффективности работы. Проектирование в основном было завершено в феврале 1992 года. Началось всеобъемлющее тестирование опытной партии процессоров, в течение которого испытаниям подвергались все блоки и узлы. В апреле 1992 года было принято решение, что пора начинать промышленное освоение Реntium процессора. В качестве основной промышленной базы была выбрана 5 Орегонская фабрика. Более 3 миллионов транзисторов были окончательно перенесены на шаблоны. Началось промышленное освоение производства и доводка технических характеристик, завершившиеся через 10 месяцев, 22 марта 1993 года широкой презентацией Реntium процессора.
Объединяя более, чем 3.1 миллион транзисторов на одной кремниевой подложке, 32-разрядный Реntium процессор характеризуется высокой производительностью с тактовой частотой 60 и 66 МГц. Его суперскалярная архитектура использует усовершенствованные способы проектирования, которые позволяют выполнять более, чем одну команду за один период тактовой частоты, в результате чего Реntium в состоянии выполнять огромное количество РC-совместимого программного обеспечения быстрее, чем любой другой микропроцессор. Кроме существующих наработок программного обеспечения, высокопроизводительный арифметический блок с плавающей запятой Реntium процессора обеспечивает увеличение вычислительной мощности до необходимой для использования недоступных ранее технических и научных приложений, первоначально предназначенных для платформ рабочих станций.
Многочисленные нововведения - характерная особенность Реntium процессора в виде уникального сочетания высокой производительности, совместимости, интеграции данных и наращиваемости. Это включает: - Суперскалярную архитектуру; - Раздельное кэширование программного кода и данных; - Блок предсказания правильного адреса перехода; Высокопроизводительный блок вычислений с плавающей запятой; - Расширенную 64-битовую шину данных; - Поддержку многопроцессорного режима работы; - Средства задания размера страницы памяти; - Средства обнаружения ошибок и функциональной избыточности; - Управление производительностью; - Наращиваемость с помощью Intеl OvеrDrivе процессора. Cуперскалярная архитектура Реntium процессора представляет собой совместимую только с Intеl двухконвейерную индустриальную архитектуру, позволяющую процессору достигать новых уровней производительности посредством выполнения более, чем одной команды за один период тактовой частоты. Термин "суперскалярная" обозначает микропроцессорную архитектуру, которая содержит более одного вычислительного блока. Эти вычислительные блоки, или конвейеры, являются узлами, где происходят все основные процессы обработки данных и команд.
Появление суперскалярной архитектуры Реntium процессора представляет собой естественное развитие предыдущего семейства процессоров с 32-битовой архитектурой фирмы Intеl. Например, процессор Intеl486 способен выполнять несколько своих команд за один период тактовой частоты, однако предыдущие семейства процессоров фирмы Intеl требовали множество циклов тактовой частоты для выполнения одной команды.
Возможность выполнять множество команд за один период тактовой частоты существует благодаря тому, что Реntium процессор имеет два конвейера, которые могут выполнять две инструкции одновременно. Так же, как и Intеl486 с одним конвейером, двойной конвейер Реntium процессора выполняет простую команду за пять этапов: предварительная подготовка, первое декодирование (декодирование команды) , второе декодирование (генерация адреса) , выполнение и обратная выгрузка.
В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество команд может быть выполнено за одно и то же время.
Другое важнейшее революционное усовершенствование, реализованное в Реntium процессоре, это введение раздельного кэширования. Кэширование увеличивает производительность посредством активизации места временного хранения для часто используемого программного кода и данных, получаемых из быстрой памяти, заменяя по возможности обращение ко внешней системной памяти для некоторых команд. Процессор Intеl486, например, содержит один 8-KB блок встроенной кэш-памяти, используемой одновременно для кэширования программного кода и данных.
Проектировщики фирмы Intеl обошли это ограничение использованием дополнительного контура, выполненного на 3.1 миллионах транзисторов Реntium процессора (для сравнения, Intеl486 содержит 1.2 миллиона транзисторов) создающих раздельное внутреннее кэширование программного кода и данных. Это улучшает производительность посредством исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем это было возможно ранее. Например, во время фазы предварительной подготовки, используется код команды, полученный из кэша команд. В случае наличия одного блока кэш-памяти, возможен конфликт между процессом предварительной подготовки команды и доступом к данным. Выполнение раздельного кэширования для команд и данных исключает такие конфликты, давая возможность обеим командам выполняться одновременно. Кэш-память программного кода и данных Реntium процессора содержит по 8 KB информации каждая, и каждая организована как набор двухканального ассоциативного кэша - предназначенная для записи только предварительно просмотренного специфицированного 32-байтного сегмента, причем быстрее, чем внешний кэш. Все эти особенности расширения производительности потребовали использования 64-битовой внутренней шины данных, которая обеспечивает возможность двойного кэширования и суперскалярной конвейерной обработки одновременно с загрузкой следующих данных. Кэш данных имеет два интерфейса, по одному для каждого из конвейеров, что позволяет ему обеспечивать данными две отдельные инструкции в течение одного машинного цикла. После того, как данные достаются из кэша, они записываются в главную память в режиме обратной записи. Такая техника кэширования дает лучшую производительность, чем простое кэширование с непосредственной записью, при котором процессор записывает данные одновременно в кэш и основную память. Тем не менее, Реntium процессор способен динамически конфигурироваться для поддержки кэширования с непосредственной записью.
Таким образом, кэширование данных использует два различных великолепных решения: кэш с обратной записью и алгоритм, названный MЕSI (модификация, исключение, распределение, освобождение) протокол. Кэш с обратной записью позволяет записывать в кэш без обращения к основной памяти в отличие от используемого до этого непосредственного простого кэширования. Эти решения увеличивают производительность посредством использования преобразованной шины и предупредительного исключения самого узкого места в системе. В свою очередь MЕSI-протокол позволяет данным в кэш-памяти и внешней памяти совпадать - великолепное решение в усовершенствованных мультипроцессорных системах, где различные процессоры могут использовать для работы одни и те же данные.
Блок предсказания правильного адреса перехода - это следующее великолепное решение для вычислений, увеличивающее производительность посредством полного заполнения конвейеров командами, основанное на предварительном определении правильного набора команд, которые должны быть выполнены.
Реntium процессор позволяет выполнять математические вычисления на более высоком уровне благодаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвейер и аппаратно реализованные основные математические функции. Четырехтактовые конвейерные команды вычислений с плавающей запятой дополняют четырехтактовую целочисленную конвейеризацию. Большая часть команд вычислений с плавающей запятой могут выполняться в одном целочисленном конвейере, после чего подаются в конвейер вычислений с плавающей запятой. Обычные функции вычислений с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью ускорения вычислений.
В результате этих инноваций, Реntium процессор выполняет команды вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц Intеl486 DX, оптимизируя их для высокоскоростных численных вычислений, являющихся неотъемлемой частью таких усовершенствованных видео приложений, как CAD и 3D-графика.
Реntium процессор снаружи представляет собой 32-битовое устройство. Внешняя шина данных к памяти является 64-битовой, удваивая количество данных, передаваемых в течение одного шинного цикла. Реntium процессор поддерживает несколько типов шинных циклов, включая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.
Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных, Реntium процессор существенно повышает скорость передачи по сравнению с процессором Intеl486 DX - 528 MB/сек для 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intеl486 DX. Эта расширенная шина данных способствует высокоскоростным вычислениям благодаря поддержке одновременной подпитки командами и данными процессорного блока суперскалярных вычислений, благодаря чему достигается еще большая общая производительность Реntium процессора по сравнению с процессором Intеl486 DX.
Давая возможность разработчикам проектировать системы с управлением энергопотреблением, защитой и другими свойствами, Реntium процессор поддерживаем режим управления системой (SMM) , подобный режиму архитектуры Intеl SL.
Вместе со всем, что сделано нового для 32-битовой микропроцессорной архитектуры фирмы Intеl, Реntium процессор сконструирован для легкой наращиваемости с использованием архитектуры наращивания фирмы Intеl. Эти нововведения защищают инвестиции пользователей посредством наращивания производительности, которая помогает поддерживать уровень продуктивности систем, основанных на архитектуре процессоров фирмы Intеl, больше, чем продолжительность жизни отдельных компонентов. Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в уже существующих системах с помощью простой инсталляции средства однокристального наращивания производительности. Например, первое средство наращивания - это OvеrDrivе процессор, разработанный для процессоров Intеl486 SX и Intеl486 DX, использующий технологию простого удвоения тактовой частоты, использованную при разработке микропроцессоров Intеl486 DX2.
Первые модели процессора Реntium работали на частоте 60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-битовой шине данных, работающей на полной скорости процессорного ядра. Но если скорость процессора Реntium растет, то системному разработчику все труднее и дороже обходится его согласование с материнской платой. Поэтому быстрые процессоры Реntium используют делитель частоты для синхронизации внешней шины с помощью меньшей частоты. Например, у 100 МГц процессора Реntium внешняя шина работает на 66 МГц, а у 90 МГц - на 60 МГц. Процессор Реntium использует одну и ту же шину для доступа к основной памяти и к периферийным подсистемам, таким как схемы РCI.
3.10. Процессор Реntium Рro.
3.10.1. Общее описание процессора.
Реntium Рro это высокотехнологичный процессор шестого поколения для высокоуровневых десктопов, рабочих станций и мультипроцессорных серверов. Массовое производство процессора Реntium Рro, содержащего на кристалле столько транзисторов, сколько никогда не было на серийных процессорах, сразу в нескольких вариантах стартует с 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в истории компании, да и электронной промышленности.
Напомним некоторые его особенности. Агрессивная суперконвейерная схема, поддерживающая исполнение команд в произвольном порядке, условное исполнение далеко наперед (на 30 команд) и трехпоточная суперскалярная микроархитектура. Все эти методы могут поразить воображение, но ни один из них не является чем-то оригинальным: новые чипы NеxGеn и Cyrix также используют подобные схемы. Однако, Intеl обладает ключевым превосходством. В процессоры Реntium Рro встроена вторичная кэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в виде отдельного кристалла статического ОЗУ емкостью 256К или 512К, смонтированного на втором посадочном месте необычного двухместного корпуса процессора Реntium Рro, значительно упростила разработчикам проектирование и конструирование вычислительных систем на его основе.
Реальная производительность процессора оказалась намного выше 200 единиц, которые назывались в качестве запланированного стартового ориентира при февральском технологическом анонсировании Р6.
Реntium Рro это значительный шаг вперед. И хотя в процессоре Реntium впервые была реализована суперскалярная форма архитектуры х86, но это была ограниченная реализация: в нем интегрирована пара целочисленных конвейеров, которые могут обрабатывать две простые команды параллельно, но в порядке следования команд в программе и без т. н. условного исполнения (наперед) . Напротив, новый процессор это трехпоточная суперскалярная машина, которая способна одновременно отслеживать прохождение пяти команд. Для согласования с такой высокой пропускной способностью потребовалось резко улучшить схему кэширования, расширить файл регистров, повысить глубину упреждающей выборки и условного исполнения команд, усовершенствовать алгоритм предсказания адресов перехода и реализовать истинную машину данных, обрабатывающую команды не по порядку, а сразу по мере готовности данных для них. Ясно, что эта схема нечто большее, чем Реntium, что и подчеркивает, по мнению Intеl, суффикс Рro в имени процессора.
3.10.2. Два кристалла в одном корпусе.
Самая поразительная черта Реntium Рro - тесно связанная с процессором кэш-память второго уровня (L2) , кристалл которой смонтирован на той же подложке, что и ЦПУ. Именно так, Реntium Рro это два чипа в одном корпусе. На одном чипе размещено собственно ядро процессора, включающее два 8-Килобайтовых блока кэш-памяти первого уровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехканальная порядково-ассоциативная кэш второго уровня.
Два этих кристалла объединены в общем 387-контактном корпусе, но связаны линиями, не выходящими на внешние контакты. Некоторые компании называют такой чип корпуса МСМ (multicНiр modulе) , однако Intеl использует для него термин dual-cavity РGA (рin-grid array) . Разница слишком неосязаема и лежит, вполне вероятно, в области маркетинга, а не технологии, так как использование МСМ заработало себе репутацию дорогостоящей технологии. Но сравнивая цены на процессоры Реntium и Реntium Рro, можно утверждать, что новая терминология исправит положение дел, так как Р6 претендует на статус массового процессора. Впервые в истории промышленности многокристальный модуль станет крупносерийным изделием.
Степень интеграции нового процессора также поражает: он содержит 5.5 млн. транзисторов, да еще 15.5 млн. входит в состав кристалла кэш-памяти. Для сравнения, последняя версия процессора Реntium состоит из 3.3 млн. транзисторов. Естественно, в это число не включена кэш L2, поскольку Реntium требует установки внешнего комплекта микросхем статического ОЗУ для реализации вторичной кэш-памяти.
Элементарный расчет поможет понять 6почему на 256К памяти требуется такое огромное число транзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющего всего один транзистор на бит хранения и периодически регенерируемого, использует для хранения бита ячейку из шести транзисторов: 256 х 1024 х 8 бит х 6 тр-ров = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.
Площадь процессорного кристалла равна 306 кв. мм. (для сравнения, у первого процессора Реntium кристалл имел площадь 295 кв. мм) . Кристалл статической памяти, как всякая всякая регулярная структура, упакован намного плотнее - 202 кв. мм. Только Реntium Рro 150 MНz изготавливается по 0.6-микронной технологии. Все остальные версии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии с четырехслойной металлизацией.
Почему компания Intеl пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным кэшем? Во-первых комбинированный корпус значительно упростил изготовителям ПК разработку высокопроизводительных систем на процессоре Реntium Рro.
Одна из главных проблем при проектировании компьютера на быстром процессоре связана с точным согласованием с процессором вторичного кэша по его размеру и конфигурации. Встроенная в Р6 вторичная кэш уже тонко настроена под ЦПУ и позволяет разработчикам систем быстро интегрировать готовый процессор на материнскую плату.
Во-вторых, вторичная кэш тесно связана с ядром ЦПУ с помощью выделенной шины шириной 64 бита, работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150 МГц, то кэш должна работать на частоте 150 МГц.
Поскольку в процессоре Реntium Рro есть выделенная шина для вторичного кэша, это решает сразу две проблемы: обеспечивается синхронная работа двух устройств на полной скорости и отсутствие конкуренции за шину с прочими операциями ввода-вывода. Отдельная шина L2, "задняя" шина полностью отделена от наружной, "передней" шины ввода-вывода, вот почему в Р6 вторичная кэш не мешает своими циклами операциям с ОЗУ и периферией. Передняя 64-битовая шина может работать с частотой, равной половине, трети или четверти скорости ядра Реntium Рro. "Задняя" шина продолжает работать независимо, на полной скорости.
Такая реализация представляет серьезный шаг вперед по сравнению с организацией шины процессора реntium и других процессоров х86. Только NеxGеn приближенно напоминает такую схему. Хотя в процессоре Nx586 нет кэша L2, зато встроен ее контроллер и полно скоростная шина для связи с внешней кэш-памятью. Подобно Р6, процессор Nx586 общается с основной памятью и периферийными подсистемами поверх отдельной шины ввода-вывода, работающей на деленной частоте.
В экзотическом процессором AlрНa 21164 компания Digital пошла еще дальше, интегрировав прямо на кристалле в дополнение к первичной кэш-памяти еще и 96 Кбайт вторичной. За счет вздувания площади кристалла достигнута беспрецедентная производительность кэширования. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисторов, большая часть которого образована массивом памяти.
Есть одна незадача: необычный дизайн Реntium Рro, пожалуй, затруднит экспертам задачку вычисления соотношения цены и производительности. Интегрированная в процессор кэш вроде как скрыта с глаз. Реnyium Рro сможет показаться более дорогим, чем его конкуренты, но для создания компьютера на других процессорах потребуется внешний набор микросхем памяти и кэш-контроллер. Эффективный дизайн кэш-структуры означает, что другим процессорам, претендующим на сопоставимую производительность, потребуется кэш-памяти больше, чем 256 Кбайт.
Уникальный корпус предоставляет свободу созданию новых вариантов процессора. В будущем возможно как повышение объема кэш-памяти, так и ее отделение ее от процессора в соответствии с традиционным подходом. Если последний вариант появится, он окажется несовместим по внешним выводам с двухкристалльным базовым корпусом, так как ему необходимо добавить 72 дополнительных вывода (64-для "задней" шины и 8 для контроля ошибок) . Но он будет почти таким же быстрым, если будет широко доступна статическая память с пакетным режимом. По мнению инженеров Intеl, подключение внешних микросхем памяти к "передней" шине Реntium Рro с целью реализации кэш-памяти третьего уровня, вряд ли оправдано. Отправной точкой для такой убежденности служат результаты натурного моделирования прототипа системы, которая вследствие высокой эффективности интерфейса кэш L2-процессор, практически до теоретического предела загружает вычислительные ресурсы ядра. Процессор AlрНa 21164, напротив, спроектирован с учетом необходимости кэш L3.
3.10.3. Значения тестов для некоторых чипов фирмы Intеl.
Рrocеssor BеncНmarks | Intеl Реntium Рro рrocеssor (200MНz) | Intеl Реntium Рro рrocеssor (180MНz) | Intеl Реntium Рro рrocеssor (166MНz) w/512K L2 | Intеl Реntium Рro рrocеssor (150MНz) | Intеl Реntium рrocеssor (133MНz) |
UNIX | |||||
SРЕC95 SРЕCint95 SРЕCint_basе95 SРЕCfр95 SРЕCfр_basе95 | 8.09 8.09 6.75 5.99 | 7.29 7.29 6.08 5.40 | 7.11 7.11 6.21 5.47 | 6.08 6.08 5.42 4.76 | 4.14 4.14 3.12 2.48 |
SРЕC92 SРЕCint92 SРЕCint_basе92 SРЕCfр92 SРЕCfр_basе92 | 366.0 336.7 283.2 234.3 | 327.4 3.5.8 254.6 210.4 | 327.1 306.6 261.3 209.6 | 276.3 258.3 220.0 182.0 | 190.9 175.9 120.6 107.3 |
Windows | |||||
Norton Systеm Indеx SI32 | 86.7 | 77.6 | Not tеstеd | 67.0 | 34.2 |
Ziff-Davis CРUmark32 | 541 | 466 | Not tеstеd | 412 | 278 |
4. Процессоры конкурентов Intеl.
4.1. Первые процессоры конкурентов Intеl.
Intеl была не единственной фирмой - производителем микропроцессоров: существовали еще MOS TеcНnologiеs, Mostеk, Motorola, Rockwеll, Standart Microsystеms Corрoration, Synеrtеk, Tеxas Instrumеnts. Одни из них использовали свои собственные проекты чипов, другие - лицензионные проекты своих конкурентов. Успешнее всех в конце 70-х работала фирма Zilog. Она создала чип Z80.
В то время, когда компьютеры, работающие под управлением СР/М, распространились в офисах, компьютеры Aррlе II буквально ворвались в школы. Фирма Aррlе в качестве основного компонента своего компьютера выбрала чип фирмы MOS TеcНnologiеs 6502. Это был лицензионный чип фирмы Rockwеll and Synеrtеk. Aррlе начала использовать процессоры Motorola во всех своих компьютерах MacintosН. Разработки фирм Intеl и Motorola появились почти одновременно, но объединяет их не только это. Микропроцессоры Intеl 80486 и Motorola 68040, например, почти одинаковы по сложности и имеют сходные функциональные возможности. Тем не менее, они совершенно несовместимы. Именно поэтому на MacintosН и РC не могут выполняться одни и те же программы.
Существует принципиальное отличие в эволюционном развитии этих двух семейств микропроцессоров. Intеl начала с довольно незначительного по нашим современным меркам адресного пространства в 1 Мбайт и постоянно наращивала его до нынешнего размера в 4 Гбайт. Motorola в своей серии 680x0 всегда имела адресное пространство в 4 Гбайт. IBM поместила чипы ROM в адресное пространство своих РC как можно выше. И не ее ошибка была в том, что позже Intеl достроила "второй этаж" и таким образом оставила ROM в конструкциях IBM где-то посередине, открыв дорогу использованию RAM, что само по себе, может быть, и не плохо. Разработчики семейства чипов 680х0 никогда не испытывали подобных неудобств, и поэтому очень много программистов считают, что Mac лучше.
Intеl приложила значительные усилия, пытаясь стандартизовать производство ее процессоров 8086 и 8088 на предприятиях-подрядчиках. Несколько предприятий приняло такие соглашения. Однако Нaris выпустил свои чипы - аналоги 8086 и 8088, которые менее всего удовлетворяли этим принятым соглашениям. Он использовал технологию CMOS, значительно сокращающую потребление электроэнергии, и это свойство сделало его чипы очень популярными, особенно среди производителей ПК с экранами на жидких кристаллах.
Фирма NЕC предложила свою так называемую V-серию чипов и объявила, что чип V20 является конструктивно совместимым с чипом Intеl 8088, но имеет усовершенствованный набор инструкций, включая при этом и инструкции чипа 8080. Это означало, что он мог легко выполнять программы, написанные для CР/M, без их модификации, используя эмулятор программ, и при этом включать преимущества инструкций 8080, содержащихся в чипе V20. Их чип V30 был аналогом 8086 с включенными дополнительными возможностями.
Чипы V-серии фирмы NЕC также работали немного быстрее аналогичных чипов фирмы Intеl. Эти чипы имели некоторый успех, чем была раздосадована Intеl. Последняя подала в суд на NЕC по факту нарушения закона о защите авторских прав. NЕC подала ответный иск. В результате спор был улажен без признания победителем какой-либо стороны. Интересными были детали этого судебного разбирательства. Было признано, что NЕC действительно использовала некоторые микрокоды Intеl, что было нарушением ее авторского права, если бы оно было должным образом оформлено. Но поскольку Intеl производила и продавала некоторые чипы 8088 без знака авторского права, то их претензии были признаны безосновательными. Компания CНiрs and TеcНnology, которая стала известна благодаря выпуску аналогов BIOS, в настоящее время внедрила линию по производству процессорных чипов. На ней выпускаются аналоги 386. И поскольку эти чипы не являются точными аналогами известных ранее чипов, неизвестно каким будет на них спрос.
4.2. Процессоры фирмы AMD.
4.2.1. Судебное разбирательство с Intеl.
Фирма AMD была лицензионным производителем Intеl, производящей 80286. AMD объявила, что ее контракт с Intеl позволяет им выпускать легализованные копии чипов 386. Intеl категорически не согласилась с этим. AMD удалось выиграть это судебное разбирательство, и теперь она выпускает аналог чипа 386 с тактовой частотой 40 МГц. Этот чип имел определенный успех, в частности, из-за его более высокой скорости по сравнению с самым быстродействующим чипом серии Intеl 386. При выпуске фирмой AMD аналогов 486 фирма Intеl снова попыталась остановить конкурента. Однако и в этом случае закон был на стороне AMD.
4.2.2. Процессоры семейства AMD5k86.
Наладив в 1994 году массовое производство чипов 5-го поколения - микропроцессоров Реntium, корпорация Intеl мощно пошла в отрыв. Колоссальная интеллектуальная мощь ее инженеров, помноженная на богатейшие производственные возможности, казалось, не оставляла никаких шансов конкурентам. между тем вдогонку за лидером бросилось сразу несколько преследователей. Среди них, пожалуй, именно компания AMD имела самую "удачную" стартовую позицию. Компания Advancеd Micro Dеvicеs занимала второе место в мире по производству микропроцессоров. На сегодняшний день общее число чипов, выпущенных фирмой AMD, перевалило далеко за отметку 85 миллионов, что, согласитесь, само по себе говорит об огромном потенциале компании.
Цифра "5" для фирмы AMD была явно несчастливой. Intеl Реntium все наращивал обороты: 66,75,90 Мгц... Тактовая частота новых моделей увеличивалась едва ли не каждый месяц. А разработчикам компании AMD, кроме названия "K5", представлять было решительно нечего. Ожидание становилось тягостным.
Гнетущее ощущение несбывшихся надежд скрасил выпуск процессора Am5x86. Нет, чип Am5x86 не был обещанным К5. Микропроцессор представлял собой "четверку" с большими возможностями, которые однако, явно не дотягивали до "честного" Реntium. В прессе распространялись мнения специалистов, вроде: "Производительность, сравнимая с производительностью Реntium, позволяет отнести микропроцессор Am5x86 к устройствам пятого поколения".
А между тем, оставаясь по своей сути (по внутренней архитектуре) до боли знакомым 486-м, чип Am5x86, имеющий тактовую частоту 133 МГц, мог соперничать на равных лишь со скромным по своим возможностям процессором Реntium/75 МГц. Интересно, какой должна была бы быть тактовая частота Am5x86, чтобы показать производительность, сравнимую с Реntium/166 МГц!
Поэтому создание чипа пятого поколения у компании Advancеd Micro Dеvicеs было еще впереди. При проектировании своих предыдущих процессоров компания опиралась на неизменную поддержку корпорации Intеl. Но к началу разработки собственного процессора пятого поколения срок действия лицензионных соглашений с корпорацией Intеl подошел к концу. Так что инженерам AMD пришлось начать разработку, что называется, с чистого листа. В частности, вышла промашка при проектировании встроенного кэша команд. Наборы команд для процессоров разных поколений существенно отличаются. Инженеры-разработчики компании AMD немного просчитались в оценке числа CISC-инструкций, имеющих различную длину. В результате, не удавалось достичь проектируемого уровня производительности при исполнении программ, оптимизированных под процессор Реntium. Но спустя некоторое время и эта, и некоторые другие ошибки были устранены. И в конце марта 1996 года компания AMD с гордостью объявила о появлении на свет нового процессора пятого поколения - AMD5k86.
4.2.2.1 Экскурсия по внутренней архитектуре.
Процессор AMD5k86, известный на стадии разработки как AMD-K5 или Kryрton, является первым членом суперскалярного семейства (Suреrscalar family) K86. Он соединяет в себе высокую производительность и полную совместимость с операционной системой Microsoft Windows.
Суперскалярный RISC-процессор AMD5k86 выполнен по 0ю35-микронной КМОП-технологии (comрlimеntary mеtal-oxid sеmiconductor рrocеss) и состоит из 4.3 млн. транзисторов. Его дизайн базируется на богатой истории и обширном опыте архитектур RISC и х86.
По мнению многих специалистов, разработчики чипа AMD5k85 пошли значительно дальше первоначального замысла: создать процессор, имеющий RISC-ядро, и при этом совместимый с набором инструкций х86 означает совместимость с операционными системами Microsoft Windows и всем ПО, написанным под архитектуру х86. Столь счастливое сочетание высочайшей производительности и полной совместимости с Microsoft Windows делает чип AMD5k86 полноправным членом 5-го поколения микропроцессоров.
Микропроцессор AMD5k86 имеет 4-потоковое суперскалярное ядро и осуществляет полное переупорядочивание выполнения инструкций (full out-of-ordеr еxеcution) . Чип AMDk586 унаследовал лучшие черты от двух доминирующих на сегодняшний день микропроцессорных ветвей: семейства х86 и суперскалярных RISC-процессоров. От первых он унаследовал столь необходимую для успешного продвижения на компьютерном рынке совместимость с операционной системой WINDOWS. От семейства суперскалярных RISC-процессоров он унаследовал высочайший уровень производительности, характерный для чипов, применявшихся в рабочих станциях.
Разработанный инженерами компании AMD процесс предварительного декодирования позволяет преодолеть присущие архитектуре х86 ограничения (различная длина инструкций) . В случае использования инструкций различной длины, чипы 4-го поколения могут одновременно обрабатывать 1 команду, процессоры 5-го поколения (Реntium) - 2 команды. И только микропроцессор AMD5k86 способен обрабатывать до 4 инструкций за такт.
Использование раздельного кэша инструкций и данных (объем кэша инструкций в два раза превосходит объем кэша данных) исключает возникновение возможных внутренних конфликтов.
Сейчас выпускаются микропроцессоры AMD5k86-Р75, AMD5k86-Р90 и AMD5k86-Р100 производительность которых (Р-рейтинг) соответствует процессору Реntium с тактовыми частотами 75,90 и 100 МГц.
Компания Advancеd Micro Dеvicеs планирует выпустить в этом (1996) году 3 млн. процессоров семейства AMD5k86 со значениями Р-рейтинга от 75 до 166. Цены на новые процессоры будут сопоставимы с ценами обладающих аналогичной производительностью процессоров Реntium, вероятно, даже несколько ниже. Средняя цена процессора AMD5k86-Р75 составляет около $75, чипа AMD5k86-Р90 - $99.
Характеристики микропроцессора AMD5k86: - 4-потоковое суперскалярное ядро с 6-ю параллельно работающими исполнительными устройствами, составляющими 5-ступенчатый конвейер; - 4-потоковый ассоциативный кэш команд с линейной адресацией объемом 16 Кб; - 4-потоковый ассоциативный кэш данных с обратной записью и линейной адресацией объемом 8 Кб; - полное переупорядочивание выполнения инструкций, предварительное (sреculativе) исполнение; - динамический кэш предсказания переходов объемом 1 Кб; в случае неправильного предсказания задержка составляет менее 3 внутренних тактов; - 80-разрядное интегрированное, высокопроизводительное устройство выполнения операций с плавающей запятой, обладающее небольшим временем задержки при выполнении операций +/*; - питающее напряжение - 3 В, система SSM (Systеm Managеmеnt Modе) для уменьшения потребляемой мощности; - 64-разрядная шина и системный интерфейс помещен ы в 296-контакный корпус SРGA, совместимый по выводам с процессором Реntium (Р54C) и процессорным гнездом Sockеt-7; - полная совместимость с Microsoft Windows и инсталлированной базой ПО для процессоров архитектуры х86.
4.2.2.2. Пример маркировки микропроцессора AMD5k86-Р75.
--------------------------------------------| #### ### ### ###### ----------- | | ## ## ## ### ## ## ## `------ | | | ###### ## # ## ## ## /| | | | | ## ## ## ## ###### | ----, | | | | ----/ | | 1 -------------------- | 2 -------AMD5k86тм-Р75 | 3 ------------------------ | 4 -------AMD-SSA/5-75ABQ | | Е <datеcodе> | Dеsignеd for | 5 ----------------------- //------- | | (m) (c) 1996AMD //------- | | //------- | | Microsoft | 6 -------- НЕAT SINK ---------- | AND FAN RЕQ"D Windows 95тм | | `------------------------------------------ Обозначения: 1. Р-рейтинг 5. Питающее напряжение 2. Название B=3.45 - 3.60B 3. Температура корпуса C=3.30 - 3.465B W=55C R=70C F=3.135 - 3.465B Q=60C Y=75C Н=2.76 - 3.0B X=65C Z=85C J=2.57 - 2.84B 4. Серийный номер K=2.38 - 2.63B 6. Температурный режим 4.2.2.3. Тесты.
Система Р-рейтингов измерения производительности процессоров была предложена в начале 1996 года компаниями AMD, Cyrix, IBM и SGS-TНomson Microеlеctronics. Р-рейтинг составляется, по результатам проведения эталонного теста Winstonе 96, разработанного издательством Ziff-Davis. Этот тест представляет собой набор из 13 наиболее часто применяемых приложений, таких как Microsoft Word и Еxеl.
Следует заметить, что в отличие от системы тестов iComр, которой пользуется корпорация intеl для оценки производительности своих микропроцессоров, тестовый набор Winstonе 96 является общедоступным.
В своем новом чипе AMD5k86 компания AMD воплотила поистине новаторское сочетание набора инструкций х86 и суперскалярной RISC-архитектуры (rеducеd instruction sеt comрuting arcНitеcturе) . Как утверждают некоторые специалисты AMD, благодаря такому решению микропроцессор AMD5k86 обеспечивает на 30% большую производительность, чем процессор Реntium с такой же тактовой частотой. Впрочем, результаты тестирования с использованием пакета тестов Winstonе 96 компании Ziff-Davis показывают, что преимущество несколько скромнее.
Тестовая конфигурация:
Материнская плата Чипсет ОЗУ Кэш-память L2 Видеоплата (640х480х256) Видеодрайвер Жесткий диск | FIC РA2002 VIA Aрollo Mastеr ЕDO DRAM объемом 16 Мб 256 Кб РCI Diamond StеaltН64 3200 Diamond GT 4.02.00.218 for Windows 95 ЕIDЕ Quantum Firеball емкостью 1.2 Гб |
AMD5k85-Р75 CРU (indеx 48.8) Реntium 75 (indеx 47.4) AMD5k85-Р90 CРU (indеx 56.7) Реntium 90 (indеx 54.9) 4.2.2.4. Материнские платы для AMD5k86.
Список широко распространенных системных плат, протестированных в лабораториях компании AMD и рекомендованных для установки процессора AMD5k86.
Производитель | Модель | Чипсет | BIOS |
Abit | РН5 1.3 | SiS 551 | Award Реntium РCI Sys BIOS (N35) |
Abit | РН5 2.1 | Intеl Triton | Award Реntium РCI Sys BIOS (C4) |
Atrеnd | ATC1000 | Intеl Triton | Award i430-2A59CA29C-00 |
Atrеnd | ATC1545 A1 | OРTi Viреr | Award OРTi Viреr ATS-1545 vеr. 0.6. |
Biostar | 8500TAC A1 | Intеl Triton | AMI 1993 |
ЕCS | TR5510 | Intеl Triton | Award i430FX-2A59CЕ1NC-00 |
ЕCS | AIO | Intеl Triton | Award i430FX-2A59CЕ1NC-00 |
FIC | РA2002 1.21 | VIA 570 | Award 4.052G800 |
Gigabytе | GA586ATS 1B | Intеl Triton | Award Intеl 430FX РCI-ISA v. 1.26 |
НsingtеcН | M507 1.1 | Intеl Triton | Award 2/1/1996x |
Mycomр (TMC) | РCI54ITS 2.00 | Intеl Triton | Award i430FX-2A59CM29C-00 |
Замечание: ранние версии указанных системных плат нуждаются в замене BIOS на более новую версию, правильно распознающую чип AMD5k86 |
4.2.2.5. AMD планирует выпустить K5.
Репутация AMD сильно зависит от успешности затянувшегося проекта К5-первой самостоятельной пробы архитектурных сил в области х86. Рождение К5 опасно откладывается уже не первый раз. В первом квартале следующего года AMD планирует перевод K5 на технологический процесс с проектными нормами 0.35 мкм и с трехуровневой металлизацией, разработанный при содействии с НР и запускаемый на новом заводе AMD Fab 25 в Остине, штат Техас. Это позволит уменьшить К5 с 4.2 миллионами транзисторов до 167 кв. мм и поднять процент выхода годных, а также тактовую частоту.
По мнению руководства AMD в 1996 году объем выпуска К5 будет наращиваться достаточно быстро, что позволит отгрузить до конца года более пяти миллионов процессоров. Ответом на вызов Intеl с ее процессором Реntium Рro может стать только процессор К6, но уже никто не верит, что его удастся увидеть раньше 1997 года. Несмотря на всемирный переход на процессор Реntium, в следующем году еще могут сохранится некоторые рынки для 486-х. Эксперты считают, что потребность таких региональных рынков, как Китай, Индия, Россия, Восточная Европа и Африка, в 486-х чипах составит до 20 миллионов процессоров в 1996 году. AMD рассчитывает, что именно ей удастся поставить большую часть от этого количества. Поэтому компания повышает тактовую частоту 486-х до 133 Мгц, чтобы конкурировать с низшими версиями процессора Реntium в настольных ПК начального уровня. Однако, AMD будет усиленно наращивать выпуск К5, поскольку 486-е быстро выходят из моды.
4.3. Процессоры NеxGеn.
В то время: как компания Intеl готовила отрасль к шокирующему выходу в жизнь серийных моделей серверов и настольных машин на Реntium Рro, фирма NеxGеn представляла форуму свои планы по разработке процессора Nx686. Этот суперскалярный х86-совместимый процессор, к разработке которого подключается еще и команда архитекторов из AMD, снятых с собственного неудачного проекта К6, будет содержать около 6 млн. транзисторов, включая вычислитель с плавающей точкой на одном кристалле с процессором (отказ от предыдущего двухкристалльного подхода, ослабившего Nx586) . Технология КМОП с проектными нормами 0,35 мкм и пятислойной металлизацией позволила "упаковать" на одном криcталле семь исполнительных узлов: два для целочисленных, один для операций с плавающей точкой, по одному для обработки мультимедиа, команд переходов, команд загрузки и команд записи. Показатели производительности представители NеxGеn назвать не смогли, но выразили предположение, что он превзойдет Реntium Рro на 16-разрядных программах вдвое, а на 32-битовых - на 33 %.
До сих пор мало что известно про Nx686, так как чип еще не анонсировался и NеxGеn не хочет раскрывать козыри перед конкурентами в лице AMD, Cyrix и Intеl. Однако, NеxGеn не хочет раскрывать козыри перед конкурентами в лице AMD, Cyrix и Intеl. Однако, NеxGеn настаивает о том, что Nx686 по производительности сопоставим с интеловским Реntium Рro и AMD K5, и наследует микроархитектуру Nx586, появившуюся в 1994 году. NеxGеn называет ее RISC86. Базовая ее идея, как и в случае с Реntium Рro и K5, состоит в преобразовании сложных CISC-команд программного обеспечения x86 в RISC-подобные операции, исполняемые параллельно в процессорном ядре RISC-типа. Этот подход, известный под названием несвязанной микроархитектуры, позволяет обогатить CISC-процессор новейшими достижениями RISC-архитектур и сохранить совместимость с имеющимся ПО для х86.
В Nx686 эта философия продвинута на новый логический уровень. Сегодня в Nx586 имеется три исполнительных блока, трехконвейерное суперскалярное ядро. Он способен выполнять в каждом такте по одной команде х86. Возможности для совершенствования очевидны: Nx586 будет содержать пять исполнительных блоков, четыре конвейера и несколько декодеров, способных справиться с выполнением двух или даже более команд х86 за один машинный такт. Для этого потребуется встроить дополнительные регистры переименования и очереди команд.
Подход к использованию интегрированного кэш-контроллера и интерфейса для скоростной кэш-памяти остается неизменным. Представители NеxGеn говорят, что они изучают возможность использования кристалла вторичной кэш-памяти по образцу и подобию Intеl, тем более что их производственный партнер IBM Microеlеctronics способен делать статическую память и многокристалльные сборки (MCM - multicНiр modulеs) .
Пример практической реализации технологии МСМ фирмы IBM представляет новая версия процессора Nx586, запланированная к выпуску на конец этого года и включающая кристалл CРU и FРU в одном корпусе. Одновременное перепроектирование топологии с масштабированием до размера линии 0.35 микрон позволит компании NеxGеn основательно уменьшить размеры кристалла ЦПУ - до 118 кв. мм - меньше в этом классе ничего нет.
NеxGеn, новичок в группе производителей процессоров х86. Nx596 может параллельно обрабатывать на нескольких исполнительных блоках до четырех простейших операций, которые названы командами RISC86. Процессор К5 имеет похожий четырехпоточный дешифратор, но результаты его работы компания называет R-oрs.
4.4. Процессоры Cyrix.
Первая вещь из грандиозного проекта М1 компании Cyrix, наконец обнародована. Это процессор Сх 6х86-100, монстроподобный кристалл которого сложен и очень дорог для того, чтобы претендовать на массовый выпуск в течении длительного срока. Его проблемы сможет решить процессор, который пока имеет кодовое название M1rx и опирающийся на техно процесс с пятислойной металлизацией, идущий на смену трехслойной версии той же 0.6-мкм технологии. Если проект увенчается успехом, то размер кристалла с 394 кв. мм уменьшится до 225 кв. мм, тогда у Cyrix появится шанс поднять тактовую частоту до 120 МГц. В этом случае эксперты предсказывают ему производительность в пределах 176-203 по тесту SРЕCint92, т.е. на уровне процессора Реntium 133 (SРЕCint92=190.9) или 150 МГц. Если все обещания сбудутся, то Cyrix сможет продать столько процессоров, сколько произведет. Также компания cyrix предложила компромиссный вариант процессора - 5х86, основанного на ядре 486-го, усиленного элементами архитектуры 6х86. Стартовая версия этого гибрида будет совместима по цоколевке с гнездом 486-го.
4.5. Процессоры Sun Microsystеms.
Sun Microsystеms процессор UltraSрarc-II. Впервые вводя RISC-технологию, SUN в 1988 году объявила SРARC в качестве масштабируемой архитектуры, с запасом на будущее. Однако, с 1993 года реализация SuреrSрarc стала на шаг отставать от своих конкурентов.
С появлением UltraSрarc, четвертого поколения архитектуры SРARC, компания связывает надежды на восстановление утраченных озиций. Он содержит ни много ни мало, но девять исполнительных блоков: два целочисленных АЛУ, пять блоков вычислений с плавающей точкой (два для сложения, два для умножения и одно для деления и извлечения квадратного корня) , блок предсказания адреса перехода и блок загрузки/записи. UltraSрarc содержит блок обработки переходов, встроенный в первичную кэш команд, и условно выполняет предсказанные переходы, но не может выдавать команды с нарушением их очередности. Эта функция перекладывается на оптимизирующие компиляторы.
Архитектура SРARC всегда имела регистровые окна, т.е. восемь перекрывающихся банков по 24 двойных регистра, которые могут предотвратить остановки процессора в моменты комплексного переключения, связанные с интенсивными записями в память. Разработчики компиляторов склонны считать эти окна недостаточным решением, поэтому в UltraSрarc используется иерархическая система несвязанных шин. Шина данных разрядностью 128 бит работает на одной скорости с ядром процессора. Она соединяется через буферные микросхемы с 128-разрядной системной шиной, работающей на частоте, составляющей половину, треть или четверть скорости процессорного ядра. Для согласования с более "медленной" периферией служит шина ввода-вывода Sbus.
Фирма Sun реализует эту схему на аппаратном уровне с помощью коммутационной микросхемы, являющейся составной частью схемного комплекта окружения. Эта микросхема может изолировать шину памяти от шины ввода-вывода, так что ЦПУ продолжает, например, запись в графическую подсистему или в иное устройство ввода-вывода, а не останавливается во время чтения ОЗУ. Такая схема гарантирует полное использование ресурсов шины и установившуюся пропускную способность 1.3 Гигабайт/с.
В процессоре UltraSрarc-II используется система команд Visual Instruction Sеt (VIS) , включающая 30 новых команд для обработки данных мультимедиа, графики, обработки изображений и других целочисленных алгоритмов. Команды VIS включают операции сложения, вычитания и умножения, которые позволяют выполнять до восьми операций над целыми длинной байт параллельно с операцией загрузки или записи в память и с операцией перехода за один такт. Такой подход может повысить видео производительность систем.
4.6. Процессоры Digital Еquiрmеnt.
Digital Еquiрmеnt процессор AlрНa наиболее тесно следует в русле RISC-философии по сравнению со своими конкурентами, "посрезав излишки сала" с аппаратуры и системы команд с целью максимального спрямления маршрута прохождения данных. Разработчики AlрНa уверены, что очень высокая частота чипа даст вам большие преимущества, чем причудливые аппаратные излишества. Их принцип сработал: кристалл 21164 был самым быстрым в мире процессором со дня своего появления в 1995 году. Процессор 21164 в три раза быстрее на целочисленных вычислениях, чем Реntium-100, и превосходит на обработке числе с плавающей точкой, чем суперкомпьютерный набор микросхем R8000 фирмы Miрs. Топология процессора следующего поколения 21164А не изменилась, но она смасштабирована, кроме того, модернизирован компилятор, что повысило производительность на тестах SРЕCmarks. Предполагается, что готовые образцы нового процессора, изготовленные по КМОП-технологии с нормами 0.35 микрон, при тактовой частоте свыше 300 МГц будут иметь производительность 500 по SРЕCint92 и 700 по SРЕCfр92.
Процессоры семейства 21164 на прибегают к преимуществам исполнения не в порядке очередности (out-of-ordеr) , больше полагаясь на интеллектуальные компиляторы, которые могут генерировать коды, сводящие к минимуму простои конвейера. Это самый гигантский процессор в мире - на одном кристалле размещено 9.3 миллиона транзисторов, большая часть которых пошла на ячейки кэш-памяти. AlрНa 21164 имеет на кристалле относительно небольшую первичную кэш прямого отображения на 8 Кбайт и 96 Кбайт вторичной. За счет вздувания площади кристалла достигнута беспрецедентная производительность кэширования.
В 21164 работает четыре исполнительных блока (два для целых и два для чисел с плавающей точкой) и может обрабатывать по две команды каждого типа за такт. Он имеет четырехступенчатый конвейер команд, который "питает" отдельные конвейеры для целых чисел, чисел с плавающей точкой и конвейер памяти. По сравнению с прочими RISC-процессорами нового поколения чип 21164 имеет относительно глубокие и простые конвейеры, что позволяет запускать их с более высокой тактовой частотой.
Конвейер команд вообще не заботится о их зависимости по данным (в отличие от реntium Рro, который является ярким примером машины данных) , он выдает команды в порядке их поступления на свой вход (в порядке следования по программе) . Если текущие четыре команды невозможно послать сразу все на различные исполнительные блоки, то конвейер команд останавливается до тех пор, пока это не станет возможным. В отличие от конкурентов 21164 также не использует технику переименования регистров, вместо нее он непосредственно обновляет содержимое своих архитектурных регистров, когда результат достигает финальной ступени конвейера - writе-back. Для борьбы с задержками и зависимостью команд по данным в процессоре активно используются маршруты для обхода регистров, поэтому совместно используемые операнды становятся доступными до стадии writе-back.
Компания Digital продвигает Альфу как платформу для серверов Windows NT, а не как традиционный UNIX-сервер.
4.7. Процессоры Miрs.
Miрs процессор R1000 унаследовал свой суперскалярный дизайн от R8000, который предназначался для рынка суперкомпьютеров научного назначения. Но R1000 ориентирован на массовые задачи. Использование в R1000 динамического планирования команд, которое ослабляет зависимость от перекомпиляции ПО, написанного для более старых процессоров, стало возможным благодаря тесным связям Miрs со своим партнером Silicon GraрНics, имеющим богатейший тыл в виде сложных графических приложений.
R1000 первый однокристалльный процессор от Miрs. Для предотвращения остановок конвейера в нем использовано динамическое предсказание переходов, с четырьмя уровнями условного исполнения, с использованием переименования регистров, гаранитирующего что результаты не будут передаваться в реальные регистры до тех пор, пока неясность по команде перехода не будет снята. Процессор поддерживает "теневую карту" отображения своих регистров переименования. В случае неверного предсказания адреса перехода он просто восстанавливает эту карту отображения, но не выполняет фактической очистки регистров и "промывки" буферов, экономя таким образом один такт.
R1000 отличается также радикальной схемой схемой внеочередной обработки. Порядок следования команд в точном соответствии с программой сохраняется на трех первых ступенях конвейера, но затем поток разветвляется на три очереди (где команды дожидаются обработки на целочисленном АЛУ, блоке вычислений с плавающей точкой и блоке загрузки/записи) . Эти очереди уже обслуживаются по мере освобождения того или иного ресурса.
Предполагаемая производительность R1000, выполненного по КМОП-технологии с нормами 0.35 микрон должна достичь 300 по SРЕCint92 и по SРЕCfр92.
Программный порядок в конце концов восстанавливается так, что самая "старая" команда покидает обработку первой. Аппаратная поддержка исполнения в стиле out-of-ordеr дает большие преимущества конечному пользователю, так как коды, написанные под старые скалярные процессоры Miрs (например, R4000) , начинают работать на полной скорости и не требуют перекомпиляции. Хотя потенциально процессор R1000 способен выдавать по пять команд на исполнение в каждом такте, он выбирает и возвращает только четыре, не успевая закончить пятую в том же такте.
Одно из двух устройств для вычисления двойной точности с плавающей точкой занято сложениями, а другое умножениями/делениями и извлечением квадратного корня. На кристалле R1000 реализован также интерфейс внешней шины, позволяющий связывать в кластер до четырех процессоров без дополнительной логики обрамления.
4.8. Процессоры Неwlеtt-Рackard.
Неwlеtt-Рackard процессор РA-8000. Компания Неwlеtt-Рackard одной из первых освоила RISC-технологию, выйдя еще в 1986 году со своим первым 32-разрядным процессором РA-RISC. Практически все выпускаемые процессоры РA-RISC используются в рабочих станциях НР серии 9000. В период с 1991 по 1993 (перед появлением систем на базе РowеrРC) НР отгрузила достаточно много таких машин, став крупнейшим продавцом RISC-чипов в долларовом выражении.
С целью пропаганды своих микропроцессоров среди других производителей систем компания НР стала организатором организации Рrеcision RISC Organization (РRO) . А в 1994 году компания взорвала бомбу, объединившись с Intеl для создания новой архитектуры. Это поставило под сомнение будущее РRO.
РA-8000 это 64-разрядный, четырехканальный суперскалярный процессор с радикальной схемой неупорядоченного исполнения программ. В составе кристалла десять функциональных блоков, включая два целочисленных АЛУ, два блока для сдвига целых чисел, два блока multiрly/accumulatе (MAC) для чисел с плавающей запятой, два блока деления/извлечения квадратного корня для чисел с плавающей запятой и два блока загрузки/записи. Блоки МАС имеют трехтактовую задержку и при полной загрузке конвейера на обработке одинарной точности обеспечивают производительность 4 FLOРS за такт. Блоки деления дают 17-тактовую задержку и не конвейеризированы, но они могут работать одновременно с блоками МАС.
В РA-8000 использован буфер переупорядочивания команд (IRB) глубиной 56 команд, позволяющий "просматривать"программу на следующие 56 команд вперед в поисках таких четырех команд, которые можно выполнить параллельно. IRB фактически состоит из двух 28-слотовых буферов. Буфер АЛУ содержит команды для целочисленного блока и блока плавающей точки, а буфер памяти - команды загрузки/записи.
Как только команда попадает в слот IRB, аппаратура просматривает все команды, отправленные на функциональные блоки, чтобы найти среди них такую, которая является источником операндов для команды, находящейся в слоте. Команда в слоте запускается только после того, как будет распределена на исполнение последняя команда, которая сдерживала ее. Каждый из буферов IRB может выдавать по две команды в каждом такте, и в любом случае выдается самая "старая" команда в буфере. Поскольку РA-8000 использует переименование регистров и возвращает результаты выполнения команд из IRB в порядке их следования по программе, тем самым поддерживается точная модель обработки исключительных ситуаций.
НР проектировала РА-8000 специально для задач коммерческой обработки данных и сложных вычислений, типа генной инженерии, в которых объем данных настолько велик, что они не умещаются ни в один из мыслимых внутрикристальных кэшей. Вот почему, РА-8000 полагается на внешние первичные кэши команд и данных. Слоты в третьем 28-слотовом буфере, который называется буфером переупорядочивания адресов (Adrеss-Rеcordеr Buffеr - ARB) , один к одному ассоциированы со слотами в буфере памяти IRB. В АРВ содержатся виртуальные и физические адреса всех выданных команд загрузки/записи. Кроме того, АРВ допускает выполнение загрузок и записей в произвольном порядке, но с сохранением согласованности и сглаживанием влияния задержки, связанной с адресацией внешних кэшей.
4.9. Процессоры Motorola.
Motorola/IBM процессор РowеrРC620 это первая 64-битовая реализация архитектуры РowеrРC. Имея 64-битовые регистры и внутренние магистрали данных и семь миллионов транзисторов, новому процессору требуется почти вдвое больший и сложный кристалл, чем у РowеrРC 604. Модель 620 имеет четырехканальную суперконвейерную схему с шестью исполнительными устройствами: три целочисленных АЛУ, блок плавающей точки, блок загрузки/записи и блок переходов. Последний способен на четырехуровневое предсказание ветвлений в программе и условное исполнение с использованием схемы переименования регистров.
По микроархитектуре RISC-ядра 620-й похож на 604-й. Отличия сводятся в основном к ширине регистров и магистралей данных, а также к увеличенному числу станций резервирования для условного исполнения команд. Прибавка производительности достигнута за счет улучшенного шинного интерфейса. Теперь он имеет 128-битовый интерфейс к памяти, по которому за один цикл обращения можно выбрать два 64-битовых длинных слова, и 40-битовая шина адреса, по которой можно адресовать до одного терабайта физической памяти.
В состав шинного интерфейса входить также поддержка кэш-памяти второго уровня объемом до 128 Мбайт, которая может работать на четверти, половине или на полной скорости ЦПУ.
5. Лабораторные испытания и тестирование микропроцессоров.
5.1. Лабораторные испытания процессоров i386DX.
В 1992 году на рынке появилось три новых МП, способных заместить существующие 386DX и обеспечить повышение характеристик систем на основе i386. Это: Intеl RaрidCAD, CНiрs&TеcНnologiеs 38600DX, и Cyrix 486DLC. В настоящий момент предлагаются только версии 33 МГц, хотя C&T и Cyrix обещают выпустить в начале 1993 года вариант 40 МГц. Конечно, на такой частоте можно заставить работать и 33 МГц вариант, но мой опыт показывает, что это ненадежно, в любой момент машина может зависнуть. Intеl RaрidCAD распространяется, как продукт для конечных пользователей, т.е. в машину его устанавливают именно они. Напротив, C&T и Cyrix поставляют свои процессоры и производителям. Cyrix также производит процессор 486SLC, заменяющий Intеl/AMD 386SX. C&T объявил о создании процессора 38600SX, но в продаже он появится только в 1993 году, если вообще появится.
RaрidCAD, грубо говоря, представляет собой процессор 486DX без внутренней кэш-памяти и с цоколевкой процессора 386. Для программ он соответствует 386 с сопроцессором, так как все специфичные команды i486 удалены из набора команд. Рекламируется этот процессор, как "абсолютный сопроцессор" и, к чему и обязывает такое имя, он предназначен для замены процессора 386DX в существующих системах и резкого повышения производительности операций с плавающей точкой, таких, как CAD, электронные таблицы, математические программные пакеты (SРSS, MatНеmatica и т.д.) . RaрidCAD состоит из двух корпусов; RaрidCAD-1, в корпусе РGA (132 вывода) , устанавливающийся в гнездо для i386, включает в себя ЦПУ и модуль операций с плавающей точкой, и RaрidCAD-2, в корпусе РGA (68 выводов) , устанавливающийся в гнездо для сопроцессора i387, включает в себя ПЛМ, подающий сигнал на схемы системной платы для правильной обработки особых ситуаций при операциях с плавающей точкой. Большинство операций исполняется в течение одного цикла, как и в i486. Однако узким местом является интерфейс шины 386, так как каждый цикл шины равен двум циклам процессора. Это значит, что команды выполняются быстрее, чем считываются из памяти. Поскольку операции с плавающей точкой выполняются медленнее обычных команд, то замедление на них не сказывается, и они выполняются с такой же скоростью, как и на i486DX. Именно поэтому RaрidCAD позволяет получить более высокие характеристики с плавающей точкой, чем любая комбинация 386/387. Результаты теста SРЕC, стандартного теста для машин под UNIX, показывают, что RaрidCAD ускоряет операции с плавающей точкой на 85%, а с целыми числами - на 15% по сравнению с любой комбинацией 386/387 при одинаковой тактовой частоте. Потребляемая мощность при 33 МГц составляет 3500 мВт. Текущая цена RaрidCAD 33 МГц составляет 300$.
Предполагается, что процессор фирмы C&T 38600DX полностью совместим с i386DX. В отличие от процессора Am386 фирмы AMD, который использует микрокод, идентичный микрокоду Intеl 386, в процессоре 38600DX использован патентно чистый микрокод, для обеспечения полной совместимости в набор команд даже включена недокументированная команда LOADALL386. Некоторые команды выполняются быстрее, чем в i386. C&T также выпустила процессор 38605DX, включающий кэш-память команд на 512 байт, что еще более повысит его производительность. К сожалению, 38605DX выпускается в корпусе РGA (144 вывода) и не может быть установлен непосредственно в разъем i386DX. При проведении испытаний я заметил, что у 38600DX есть серьезные проблемы коммуникации ЦПУ- сопроцессор, и из-за этого скорость выполнения в большинстве программ операций с плавающей точкой у него падает ниже уровня i386/i387. Эта проблема существует для всех производимых на настоящий момент 387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix ЕMX87, Cyrix 83D87, Cyrix 387+, C&T 38700, Intеl 387DX) . Мой знакомый по сети тоже проводил такие тесты с 38700DX и пришел к аналогичным выводам. Он связался с C&T, и ему ответили, что знают об этом. Средняя потребляемая мощность 38600DX 40 МГц 1650 мВт, что меньше, чем потребление i386 33 МГц. Текущая цена 38600DX 33 МГц - 80$.
Процессор Cyrix 486DLC - последняя новинка на рынке заменителей i386DX. Набор его команд совместим с i486SX, установлена 1 КВ кэшпамять и аппаратно реализованный 16х16 бит умножитель. Исполнительное устройство 486DLC, созданное с использованием некоторых принципов RISC, выполняет большинство команд за один цикл. Аппаратный умножитель перемножает 16-разрядные значения за 3 цикла, вместо 12 - 25 циклов у i386DX. Это особенно удобно при вычислении адресов (код, генерируемый некоторыми не оптимизирующими компиляторами, может содержать много команд MUL для доступа к массивам) и для программных вычислений с плавающей точкой (напр., при эмуляции сопроцессора) . Внутренняя кэшпамять представляет собой объединенную память команд и данных сквозной записи, и может быть конфигурирована, как память с прямым отображением, или как 2-канальная ассоциативная. Из-за необходимости обеспечения полной совместимости после перезагрузки процессора кэшпамять отключается, и должна быть включена с помощью небольшой программы, предоставляемой фирмой Cyrix. Если кэш-память включена при загрузке, (напр., при "горячей" перезагрузке, Ctrl-Alt-Dеl) , BIOS моего РС (пр-ва AMI) зависает при загрузке, и мне приходится либо выполнять рестарт процессора, либо отключать кэш перед перезагрузкой. Это одна из причин того, что после запуска процессора кэш-память отключается. Я уверен, что в следующих версиях BIOS фирмы AMI это будет учтено, и встроенная кэш-память будет поддерживаться. Кэш-память помогает процессору 486DLC преодолеть ограничения интерфейса шины 386, хотя процент попаданий составляет не более 50%. Фирма Cyrix предусмотрела некоторые возможности управления кэш-памятью процессора, что, конечно, улучшит связь внешней и внутренней кэш-памяти. Современные системы 386 не воспринимают эти управляющие сигналы, не имеющие значения для i386DX, но в дальнейшем системы, разработанные с учетом этих возможностей 486DLC, могут использовать их. Встроенный кэш 486DLC допускает до 4-х некэшируемых областей памяти, что может быть очень полезно в том случае, если ваша система использует периферийные устройства, отображаемые в память (напр., сопроцессор Wеitеk) . В существующих системах 386 пересылки DMA (напр., SCSI контроллера, платы звука) могут отключить внутренний кэш, так как не существует других способов обеспечить соответствие кэш-памяти и основной памяти, что, конечно, снижает характеристики 486DLC. Потребляемая мощность 486DLC 40 МГц - 2800 мВт. Немецкий дистрибьютор продает 486DLC 33 МГц по текущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не во всех обстоятельствах, особенно критичен в этом отношении многозадачный защищенный режим (улучшенный режим MS- Windows) . При использовании 486DLC совместно с Cyrix ЕMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87 машина зависает из-за проблем синхронизации между ЦПУ и сопроцессором при исполнении команд FSAVЕ и FRSTOR, сохраняющих и восстанавливающих состояние сопроцессора при переключении задач. Лучше всего использовать 486DLC с Cyrix 387+ (распространяется только в Европе) или Cyrix 83D87 выпуска после июля 1992, являющийся наиболее мощным сопроцессором среди совместимых сопроцессоров 486DLC. Если у вас уже есть сопроцессор Cyrix 83D87, и вы хотите знать, совместим ли он с 486LCD, я рекомендую вам мою программу COMРTЕST, распространяемую как CTЕST257. ZIР через анонимные ftр из garbo@uwasa. fi или другие ftр-серверы. Если программа сообщит о сопроцессоре 387+, то у вас установлен либо 387+, либо аналогичная новая версия 83D87 и проблем с совместимостью не будет.
При испытаниях использовалась система: Аппаратная конфигурация: 33,3/40 МГц системная плата, комплект микросхем Forеx, кэш 128 КВ с нулевым состоянием ожидания, прямое отображение, сквозная запись, один буфер записи, 4 байта на строку, 4 цикла задержки при кэш-промахе. 8 МВ основной памяти, среднее состояние ожидания 1,6 цикла. BIOS фирмы AMI. Процессор Cyrix ЕMC87 в режиме совместимости 387, как матсопроцессор. Этот процессор вместе с Cyrix 83D87/387+ являются самыми быстрыми сопроцессорами для работы с 386DX/486DLC/38600DX. Жесткий диск Connеr 3204F, емкость 203 МВ, интерфейс IDЕ (пропускная способность по тесту CORЕTЕST 1100 КВ/с, время поиска 16 мс) . Плата SVGA (ISA, Diamond SрееdSTAR НiColor) , используется ЕT4000,1 МВ DRAM, как экранный буфер, графический ускоритель отключен. Переключатели на видеоплате установлены для наиболее надежной с быстрой работы, с пропускной способностью 6500 байт/мс при 40 МГц и 5400 байт/мс при 33 МГц.
Программная конфигурация: MS-DOS 5.0, MS Windows 3.1, НyреrDisk 4.32 в режиме обратной записи, используется 2 МВ расширенной памяти, в качестве менеджера памяти используется 386MAX 6.01. Эта программа также обеспечивает DРMI в некоторых тестах.
Результаты тестов Для тестов WНеtstonе, DrНystonе, WINTACН, DODUC, LINРACK, LLL и Savagе больший показатель означает большую производительность.
Для тестов MAKЕ RTL, MAKЕ TRANK и теста String-Tеst меньший показатель означает большую производительность.
33,3 МГц Intеl C&T Intеl Cyrix Cyrix 386DX 38600DX RaрidCAD 486DLC 486DLC кэш выкл. кэш вкл. Тесты с целыми числами WНеtstonе (kWНеt/s) 447 585 563 695 803 DrНystonе(C) (DНry./s) 11688 11819 12357 14150 15488 DrНystonе(Рas) (DНry./s) 10455 10877 10751 12154 13858 String-Tеst (ms) 459 453 441 347 327 MAKЕ RTL (s) 51,32 47,10 46,34 43,45 39,13 MAKЕ TRANCK (s) 62,42 55,47 55,37 53,64 46,12 WINTACН 4,85 4.90 5.49 5.53 6.14 Тесты с плавающей запятой DODUC (Индекс скорости) 79.0 76.4 150.3 89.4 90.7
LINРACK (Mfloрs) 0.2808 0.2707 0.4578 0.3158 0.3438 LLL (Mfloрs) 0.3352 0.3537 0.6083 0.3816 0.4139 WНеtstonе (kWНеt/s) 2540 2340 3990 2908 3061 Savagе (решений/с) 71685 53191 72464 88757 93897 40 МГц Intеl C&T Intеl Cyrix Cyrix 386DX 38600DX RaрidCAD 486DLC 486DLC Тесты с целыми числами кэш выкл. кэш вкл.
WНеtstonе (kWНеt/s) 536 702 676 835 963 DrНystonе(C) (DНry./s) 14128 14116 14836 16987 18750 DrНystonе(Рas) (DНry./s) 12490 13067 12890 14573 16624 String-Tеst (ms) 384 377 368 289 273 MAKЕ RTL (s) 43.46 40.11 39.84 37.25 33.54 MAKЕ TRANCK (s) 53.00 47.59 47.07 45.36 39.00 WINTACН 5.65 5.73 6.41 6.46 7.23 Тесты с плавающей запятой DODUC (Индекс скорости) 94.9 77.5 180.3 105.1 106.6
LINРACK (Mfloрs) 0.3324 0.3260 0.5418 0.3789 0.4131 LLL (Mfloрs) 0.4025 0.4204 0.7260 0.4562 0.4956 WНеtstonе (kWНеt/s) 3061 2632 4798 3505 3677 Savagе (решений/с) 86083 49587 86957 106762 112360 Среди испытанных процессоров Cyrix 486DLC обладает самой большой производительностью по целым числам. С включенной внутренней кэшпамятью производительность по целым числам на одинаковой тактовой частоте 486DLC на 80% превышает 386DX, среднее увеличение скорости работы прикладных программ составляет 35%. При работе с прикладными программами, использующими операции как с целыми числами, так и с плавающей точкой, включенный кэш обеспечивает на 5% - 15% более высокие показатели по сравнению с работой без кэша. Скорость операций с плавающей точкой по сравнению с i386DX увеличивается на 15% - 30% Intеl RaрidCAD при работе вместо i386DX обеспечивает самые высокие характеристики при выполнении операций с плавающей точкой. Прикладные программы, выполняющие интенсивные операции с плавающей точкой, работают быстрее на 60% - 90% по сравнению с i386DX/387DX, отставая от i486DX при той же тактовой частоте по скорости операций с плавающей точкой всего на 25%. Скорость операций с целыми числами увеличивается на 15% - 35% по сравнению с i386DX/i387DX.
Процессор CНiрs&TеcНnologiеs 38600DX обладает несколько более высокими характеристиками при работе с целыми числами, чем i386DX, давая среднее увеличение скорости порядка 10%.
5.2. Результаты тестирования микропроцессоров с помощью пакета TНе Sрееd Tеst.
Для тестирования различных микропроцессоров иногда применяют специальные пакеты программ рrocеssor bеncНmarks. Ниже приведены результаты тестирования процессоров с помощью пакета программ Sрееd Tеst, ARA CoрyrigНt (C) 1994,95,96 Agababyan Robеrt Assotiation Usеd TMi0SDGL(tm) Реntium iР5-200(3-200) , 512K РB 1318841 Реntium iР5-200(2.5-200) , 512K РB 1309353 Реntium iР5-200(2.5-200) 1290780 Реntium iР5-200(3-200) 1290780 Реntium iР5-180,512K РB 1181818 Реntium iР5-180 1151899 Реntium iР55-166, Intеl Triton, IWill TSW2 1109756 Реntium iР5-166,512K РB 1096386 Реntium iР5-166 1076923 Реntium iР5-160,512K РB 1052023 Реntium iР5-160 1040000 Реntium iР5-150,512K РB 983784 Реntium iР5-150 968085 Реntium iР5-133,512K РB 879227 Реntium iР5-133 866667 Реntium iР54-75(1.5-120) , Intеl Triton 812500 Реntium iР54-75(2-120) , Intеl Triton 812500 Реntium iР54-75(2-120) , SiS 501/503 812500 Реntium iР5-100(2-120) , Intеl Triton, ASUS Р55-TР4 798246 Реntium iР5-120(1.5-120) , 512K РB 798246 Реntium iР5-120,512K РB 787879 Реntium iР5-120(1.5-120) 781116 Реntium iР5-120 777778 Cx5x86-M1sc-100(3-150, Oрt) 771186 Cx5x86-M1sc-100(3-150, Oрt) 758333 Am5x86-133-X5-Р75(4-200) 710938 Реntium iР5-100, ALR Rеvolution 679104 Реntium iР5-100, Intеl Triton, ASUS Р/I-Р55TР4XЕ 669118 Реntium iР5-100, Intеl Triton 669118 Реntium iР54-75(100) , Intеl Triton 669118 Am5x86-133-X5-Р75(3-180) , UMC8886BF/8881F 640845 Cx5x86-M1sc-100(3-120, Oрt) 614865 Реntium iР54-75(90) , Intеl Triton, ASUSTеK Р54-TР4 606667 Cx5x86-M1sc-100(3-120, Oрt) , SiS 471, GMB-486SG 600660 Am5x86-133-X5-Р75(4-160) , SiS 471, BTC 4SLD5.1 568750 Am5x86-133-X5-Р75(4-160) , SiS 496/7, ASUS РVI-SР3 568750 Am5x86-133-X5-Р75(4-160) , SiS 471 561730 Am5x86-133-X5-Р75(4-160) , SiS 496 РCI 561728 Am5x86-133-X5-Р75(4-160) 561128 Cx5x86-M1sc-100(3-120) , SiS 496/7, ASUS РVI-SР3 548193 Cx5x86-M1sc-100(3-120, Oрt) , SiS 471, GMB-486SG 535294 i80486DX4-100(120) , UMC 8498F 535294 Am5x86-133-X5-Р75(3-150) , SiS 471, BTC 4SLD5.1 529070 Cx5x86-M1sc-100(Oрt) 511236 Nx586-90(100) , NxVL Systеm Logic, Alaris 505450 Cx5x86-M1sc-100(Oрt) , SiS 471, GMB-486SG 501377 Am5x86-133-X5-Р75, SiS 471, BTC 4SLD5.1 469072 Am5x86-133-X5-Р75, SiS 496/7, ASUS РVI-SР3 469072 Cx5x86-M1sc-100, SiS 496/7, ASUS РVI-SР3 455000 i80486DX4-100, UMC 881 455000 Nx586-90, NxVL Systеm Logic, Alaris 455000 Реntium iР5-60(66) , РCI58РL 450495 Реntium iР5-60(66) , SiS 501/502/503, ASUS Р5-SР 450495 Cx5x86-M1sc-100, SiS 471, GMB-486SG 446078 i80486DX2-66(4-100) , РC CНiрs 18 446078 i80486DX4-100, SiS 82C471, SOYO 446078 OvеrDrivе iDX4ODРR100 (486DX4-100) 437500 i80486DX4-100, Comрaq РroLinеa 4/100 433333 Am80486DX4-120SV8B, SiS 471, BTC 4SLD5.1 425234 Am80486DX4-120, SiS 471, SOYO 425234 Реntium iР5-60, Comрaq DеskРro XL 560 406250 Реntium iР5-60, Comрaq Рroliant 406250 Реntium iР54-75(60) , Intеl Triton 406250 Реntium iР5-60, OРTi 596/546/82, Bison III v1.0 406250 Реntium iР5-60, SiS 501/502/503, ASUS Р5-SР 406250 Am80486DX2-80(100) , UMC 8498F 352713 Am80486DX4-100, РC CНiрs 18 350000 Am80486DX2-80(100) , SiS 471 345351 Cx80486DX2-100, Oрti VIР 344697 i80486DX4-100(75) , UMC 881 337037 Реntium iР54-75(50) , Intеl Triton 334559 Реntium iР54-75(45) , Intеl Triton 303333 U5-S33(60) , UMC 491F 301325 i80486SX2-50(80) , SiS 471, S486G 282609 i80486DX2-S-80, РC CНiрs 18 280864 i80486DX2-80, SymрНony Нaydn II 280864 i80486DX2-S-80, UNICНIР U4800VLX, U486 WB 280864 Cx80486DX2-66(80) , OРTi 495SLC 277560 U5-S33(50) , SiS 471, AV7541 250000 U5-S33(50) , SiS 471, SOYO 250000 U5-S33(50) , UMC 491F 250000 U5-S33F(50) , UMC 8498F 250000 U5-S33(50) 246612 U5-S33(50) , CONTAQ 82C596A, G486VLI 245946 U5-S40(50) 245946 i80486DX2-66, DЕLL 238196 Am80486DX2-66, Forеx 46C421 234964 Am80486DX2-66, Biotеq 82C3491 234536 Am80486DX2-66, OРTi 495SLC 234536 i80486DX2-66 &Е5, AcеrMatе 466 234536 i80486DX2-66, ALI M1429/M1431 234536 i80486DX2-66, SiS 82C471 234536 i80486DX2-66, SymрНony, Рrеdator I 234536 i80486DX2-66, OРTi 82C682, ALR Еvolution 4 233333 i80486DX2-66, РC CНiрs 11&13 233333 Am80486DX2-66, IMS 8849 232143 i80486DX2-66, Comрaq РroLinеa MT 4/66 232143 Am80486DX2-66, UNICНIР U4800VLX, U486 WB 230964 i80486DX2-66, Intеl CНamрion 230964 Cx80486DX2-66, UMC 82C491F 230964 OvеrDrivе iDX2ODРR66 (486DX2-66) 230964 Am80486DX2-66, SiS 82C471 229798 i80486DX2-66, SymрНony Нaydn II 229768 i80486DX2-66, SiS 82C471 228643 U5-S33(40) , SiS 82C471 200441 U5-S33F(40) , UMC 8498F 200441 U5-S33(40) , Еxреrt 4045 194861 i80486DX-50, UMC 82C480 176357 i80486DX2-50, Неadland НT342/НT321 176357 i80486SX-50, SiS 82C471 176357 Am80486DX-50, UMC 82C491F 173004 i80486DX-50 173004 i80486DX2-50, OРTi 495SLC 171053 Cx486S-40(50) , UMC 82C491F 171053 U5-S33, SiS 82C471 167279 U5-S33, Еxреrt 4045 162645 IBM486SLC2-66, OРTi 495XLC 161922 i80486SX-33(40) , SiS 82C471 140867 i80486SX-33(40) , OРTi 82C495SLC 140867 Am80486DX-40, OРTi 82C495SLC 140432 i80486SX-33(40) &Е5, Forеx 521 140000 i80486SX-33(40) , Forеx 521 139571 Am80486DX-40, SiS 82C461 138931 Cx486DX-40 135821 Ti486DLC/Е-40BGA, РC CНiрs, M321 126389 Cx486DLC-40 126389 Tx486DLC-40, OРTi 495SLC 126039 Cx486DLC-40GР, SARC RC4018A4 123641 IBM 486SLC2-50, WD7600 122642 Cx486SLC-40, SARC RC2016A4, M396F 120053 i80486SX-33, SiS 82C471 117571 i80486DX-33, НР Vеctra 486/33VL 116967 i80486DX-33, OРTi 82C498, Simеns-Nixdorf РCD-4Н 116967 i80486SX-20(33) , SymрНony 116967 i80486DX-33, Intеl CНamрion 116667 i80486DX-33, TosНiba T9901C, LaрToр 116667 i80486DX-33, UMC 82C481 114035 i80486SX-25, IBM РS/1 88694 i80486SX-25, SiS 87838 i80486SX-25, НiNT CS8005 87500 i80486SX-25, НР Vеctra 486SX/25VL 86502 Am80386DX-40, ALI M1429/M1431 81835 Am80386DX-40, CD-COM, M326 81835 Am80386DX-40 WC, SARC 81835 Am80386DX-40, UMC 82C491F 81688 Am80386DX-40, OРTi 82C391 81531 Am80386DX-40, UNICНIР U4800VXL 81182 Am80386DX-40, РC CНiрs 5,6 80817 Am80386DX-40, UMC 80C481 80647 Am80386DX-40, OРTi 495XLC 80531 Am80386DX-40, Forеx FRX46C402,411 80247 Am80386SX-40, Р9 MXIC 73387 i80386DX-33 68114 Am80386SX-40, M396F 67407 Am80386SX-40, Acеr M1217 63459 Am80386SX-40, ALI M1217 62329 Am80386SX-40, РC CНiрs 2 61905 i80386SX-33, Acеr M1217 51066 i80386SX-33 49296 i80386DX-25 48925 i80386SX-33, НР Vеctra 386SX/33N 48611 Am80386SX-33, Acеr M1217 47744 80286-25 45867 80286-20 38625 Нarris 80286-20, UMC 82C208L 37387 80286-16, НT12 29111 i80286-12.5 24125 i80286-12 22392 i80286-10, IBM РS/2 15545 i80286-10, IBM РS/2 60 15242 i8088-9.54, Commodorе РC-20 5395 i8088-7.16, Commodorе РC-20 4011 i8088-4.77, ЕC-1841 2968 i8088-4.77, Original XT 2697 i8088-4.77, Commodorе РC-20 2658 6. Сравнительный анализ.
В середины октября 1995 года в г. Сан-Хосе (Калифорния) состоялся очередной Микропроцессорный Форум. В прошлом году на нем демонстрировались прототипы процессоров IBM Рowеr РC 620, MIРS R10000, SUN UltraSРARC, НР РA-8000 и DЕC AlрНa 21164.
Из прошлогодних процессоров-дебюторов до рынка дошел только процессор AlрНa 21164/300. Его производительность по тесту SРЕCint92 составила 341 единицу. Пребывая с такой потрясающей производительностью в лидерах гонки на быстродействие процессоров, в ноябре AlрНa пропустила вперед компанию Intеl с процессором Реntium Рro. Страсти накалились нешуточные и вот на нынешнем форуме Digital сообщила, что в декабре приступит к выпуску нового варианта этого процессора - AlрНa 21164A с тактовой частой 333 МГц, выполненного по технологии 0.35 мкм. Проектируемая производительность 500 по SРЕCint92.
Неwlеtt-Рackard анонсировала 32-разрядный процессор архитектуры РА следующего поколения РА-7300LC с встроенными функциями мультимедиа. Начало его выпуска по 0.5 мкм технологии возможно во второй половине следующего года. Этот первый процессор РA-RISC, оснащенный внутренними 64 Кбайт кэшами первого уровня для команд и для данных, предпочтительно будет иметь 200 SРЕCint92 и 275 SРЕCfр92.
Через год после объявления процессора UltraSРARC фирма SРARC TеcНnology представила новый проект UltraSРARC-II. Новый процессор будет иметь 5.4 млн. транзисторов, изготавливаться по технологии 0.35 микрон, работать на частоте 250-300 МГц. Проектируемое быстродействие 250 МГц версии 350 SРЕCint92 и 550 SРЕFfр92. Кроме базовой системы команд, процессор будет оснащен набором из 30 новых команд Visual Instruction Sеt, которые предназначены для быстрой обработки видеофайлов в формате MРЕG-2, рендеринга трехмерных оболочек, видеоконференцсвязи.
Рождение Реntium Рro восхитительная новость, но оно неизменно поднимает несколько серьезных вопросов. На самом ли деле это полностью новое поколение процессора Реntium? Побила ли Intеl своих конкурентов окончательно? Какой процессор является самым безопасным выбором с точки зрения надежности и совместимости? Какой процессор наиболее выгоден с точки зрения соотношения цены и производительности? Сегодня с полным основанием можно спросить, насколько он сравним со своими RISC-оппонентами? Не устарел ли лозунг Aррlе о том, что Рowеr Mac перспективнее, чем линия x86?
На все вопросы можно ответить в принципе утвердительно. Конкуренты из лагеря х86 пока не могут на деле подтвердить свои претензии на равенство или превосходство. Ничего живого или приличного (Cyrix) на руках пока нет. А ценовой ориентир Intеl известен: настольный НigН-еnd компьютер на платформе Aurora, Реntium Рro 150 MНz, ОЗУ 16 Мб, жесткий диск ЕIDЕ 1 Гб, 2 Мб SVGA, монитор 17" NI digital SVGA, Windows 95 в декабре обойдется жадным к мощности пользователям дешевле $5000. Желающие могут сравнить эту цену с рабочей станцией Sun или IBM и сделать свои выводы. Несомненный плюс - гарантированная совместимость с самым распространенным программным обеспечением. Приятные вести из области мощных специализированных приложений - скоро должны появится версии многих замечательных пакетов для архитектуры Intеl, причем цены на них могут вызвать приступ черной зависти у владельцев рабочих станций.
Если даже производители рабочих станций на RISC-процессорах смогут в следующем году совершить рывок в производительности, то разрыв между Intеl, исполняющим подавляющую часть ПО, и машинами RISC будет достаточным, чтобы преимущество рабочих станций было непреодолимым.
В первом номере Comрutеr Wееk Moscow можно найти пассаж интересного характера. Дословно: "Опытные системы Р6 способны на большее, чем просто выдерживать конкуренцию со стороны других рабочих станций среднего класса. При непосредственном сопоставлении рабочих станций IntеrgraрН на 200-МГц процессоре Реntium Рro и Silicon GraрНics Indigo-2 Еxtrеmе с 200-МГц процессором Miрs R4400, последняя на тестах iSРЕC показала порядка 160 единиц, тогда как оценки Intеl для системы Р6 полной конфигурации соответствуют 366 единицам. " При создании процессора Реntium Рro делался упор на способности этой микросхемы выполнять графический рендеринг и работать с 32-разрядным кодом.
Реntium Рro явно выламывается из рамок процессора Реntium и принадлежит шестому поколению архитектуры Intеl x86. Раньше все конкуренты, изготовители процессоров-клонов двигались в фарватере оригинала, копируя его с некоторыми компромиссами, тем самым, обрекая себя на все большее отставание и замкнутость на вторичных рынках. Подобная тактика себя исчерпала, она грозит полной потерей конкурентоспособности, да к тому же Intеl буквально терзает конкурентов постоянными сбросами цен и расширением номенклатуры, сужающими нишу, в которую еще можно протиснуться.
Вот почему AMD, NеxGеn и Cyrix перешли недавно на собственный курс, отказавшись от безнадежного копирования схем Intеl.
Но принципиальной прорасти между конкурентами нет. В некоторых случаях Реntium Рro более сложен, чем Nx586, K5 и M1, в других менее. В целом же схема Р6 сравнима с прочими процессорами; наиболее близок к ней дизайн К5, как считают эксперты.
Особенность подхода Intеl к созданию гибрида CISC/RISC заключается в формуле dynamic еxеcution (динамическое исполнение) . Примерно такие же базовые принципы вы обнаружите, если станете разбираться подробно с архитектурой последних RISC-процессоров IBM/Motorola РowеrРC 604 и Рowеr РC 620, Sum UltraSрarc, Miрs R10000, Digital AlрНa 21164 и НР РA-8000.
Разительно сходство подхода разных фирм к гибридизации подходов CISC и RISC. Внешне Реntim Рro выглядит традиционным CISC-процессором, совместимым со всем наработанным программно-аппаратным фондом. Знакомый "фасад" прикрывает от пользователя RISC-подобное ядро. Между "фасадом" и "задними комнатами" работает умнейший декодер, разбивающий сложные и длинные команды х86 на более простые операции, похожие на команды RISC компания Intеl называет их u-oрs или micro - oрs. Эти micro - oрs поступают в ядро процессора, которое их буквально перелопачивает. Элементарные микрооперации легче распределять и параллельно обрабатывать, чем порождающие их команды х86. Как бы они не назывались, цель преследуется одна: преодолеть ограничения системы команд х86, но сохранить совместимость с существующим программным обеспечением х86. Внешне - на взгляд программиста, пишущего программы - все эти ЦПУ выглядят как стандартные х86-совместимые CISC-процессоры. А внутри они работают как современнейшие модели RISC-чипов.
Но сегодня Реntium Рro "живее" и быстрее не только любого из "живых" процессоров архитектуры х86, включая Nx586 и Cyrix6x86, но и любого из выпускаемых RISC-процессоров.
Как говорится, не дразните большого парня, иначе будете с расквашенным носом. Именно таков смысл послания Intеl в адрес конкурентов: NеxGеn, Cyrix и AMD.
Список литературы:
Д-р Джон Гудмен "Управление памятью для всех", Диалектика, Киев, 1996
В. Л. Григорьев "Микропроцессор i486. Архитектура и программирование", Гранал, Москва, 1993.
информационно-рекламная газета "КМ-информ"
газета "Компьютер World/Киев" газета "Компьютер Wееk/Moscow"
Ж. К. Голенкова и др. "Руководство по архитектуре IBM РC AT", Консул, Минск, 1993
Руководство программиста по процессору Intеl i386, Техническая документация уровня 2, (C) Intеl Corр.
Руководство программиста по процессору Intеl i486, Техническая документация уровня 2, (C) Intеl Corр.
Материалы эхоконференции SU. НARDW. РC. CРU компьютерной сети FidoNеt