Читайте данную работу прямо на сайте или скачайте

Скачайте в формате документа WORD


Процессоры

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ХАНТЫ-МАНСИЙСКИЙ АВТОНОМНЫЙ ОКРУГ

ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ И НАУКИ

МУНИЦИПАЛЬНОЕ ПРОФЕССИОНАЛЬНОЕ ЧИЛИЩЕ №1

УТВЕРЖДЕНО

Зам. директора по ПР

л2002 г.

ПИСЬМЕННАЯ ЭКЗАМЕНАЦИОННАЯ

РАБОТА

Учащегося:

Специальность:

Тема:

Преподаватель:

Консультант:

Дата выдачи задания: л2002 г.

Срок сдачи: л2002 г.

Подпись учащегося: л2002 г.

г. Покачи 2002 г.

Содержание

1. Введение в персональный компьютер.

2. Отличия процессоров.

2.1. Отличия пpоцессоpов SX, DX, SX2, DX2 и DX4.

2.2. Обозначение "SL-Enhanced" y пpоцессоpов Intel 486.

2.5. Идентификация чипов Intel и AMD.

2.5.2. Версия процессора.

2.5.4. Перемаркированные процессоры.

3. Процессоры фирмы Intel.

3.1. Современная микропроцессорная технология фирмы Intel.

3.2. Первые процессоры фирмы Intel.

3.3. Процессор 8086/88.

3.4. Процессор 80186/88.

3.5. Процессор 80286.

3.6. Процессор 80386.

3.7. Процессор 80486.

   

3.9.

3.10.

3.10.1. Общее описание процессора.

3.10.2. Два кристалла в одном корпусе.

3.10.3. Значения тестов для некоторых чипов фирмы Intel.

4. Процессоры конкурентов Intel.

4.1. Первые процессоры конкурентов Intel.

4.2. Процессоры фирмы AMD.

4.2.1. Судебное разбирательство с Intel.

4.2.2. Процессоры семейства AMD5k86.

4.2.2.1 Экскурсия по внутренней архитектуре.

4.2.2.2. Пример маркировки микропроцессора AMD5k86-P75.

4.2.2.5. AMD планирует выпустить K5.

4.3. Процессоры NexGen.

4.4. Процессоры Cyrix.

4.5.

4.6.

4.7.

4.8.

4.9. Процессоры

5. Лабораторные испытания и тестирование микропроцессоров.

5.1. Лабораторные испытания процессоров i386DX.

5.2. Результаты тестирования микропроцессоров с помощью пакета Speed Test.

6.

1. Введение в персональный компьютер.

Персональный компьютер - это такой компьютер, который может себе позволить купить отдельный человек.

Наиболее "весомой" частью любого компьютера является системнный блок (иногда его называют компьютером, что является недопустинмой ошибкой). Внутри него расположены блок питания, плата с ценнтральным процессором (ЦП), видеоадаптер, жесткий диск, дисководы гибких дисков и другие стройства ввода / вывода информации. Зачаснтую видеоадаптер и контроллеры ввода/ вывода размещены прямо на планте ЦП. В системном блоке могут размещаться средства мультимедиа: звуковая плата и устройство чтения оптических дисков - CD-ROM. Кронме того, в понятие "компьютер" входит клавиатура и монитор. Манипунлятор мышь является необязательной, но весьма важной деталью. Тенперь коротко о выборе основных компонентов ПК. Процессор является основным компонентом любого ПК. В настоящее время наиболее распроснтранены процессоры фирмы Intel, хотя ЦП других фирм (AMD, Cyrix, NexGen и др.) составляют им достойную конкуренцию. Имеется также мантеринская (MotherBoard) плата. Основной характеристикой материнских плат является их архитектура. Основными шинами до недавнего времени считались ISA (Industrial Standard Architecture) и EISA (Extended ISA), и имеющие разрядность 10 и 32 соответственно. Для обеспечения нормальной работы видеоадаптеров был разработан стандарт VESA (Video Electronic Standart Association), рассчитанный на применение процеснсора серии 486, работающей на частоте процессора и являющейся "приснтавкой" к шине ISA или EISA. С появлением процессора Pentium была разработана самостоятельная шина PCI, которая на сегодняшний день является наиболее быстрой и перспективной. Обычно в ПК присутствует дисковод для гибких дисков. Существует два стандарта : 5.25" и 3.5". На сегодняшний день большинство компьютеров поставляется с дисковондом 3.5". Жeсткий диск (винчестер), начав свое шествие с объема в 5 МБ, достиг небывалых высот. На сегодняшний день не дивят диски объемом 2 или 4 ГБ. Для большинства приложений вполне достаточно объема 420 - 700 МБ, однако если вам приходится работать с полноцнветными графическими изображениями или версткой, то придется подунмать о диске в 1.5- 2 ГБ или даже паре таких дисков. Следует приндать значение не только емкости диска, но и его временным характенристикам. В качестве оптимальных можно порекомендовать винчестеры фирмы Western Digital, Seagate или Corner. Для оперативной памяти (RAM, ОЗУ) закон простой: чем больше, тем лучше. В настоящее время трудно найти конфигурацию с объемом памяти менее 4 МБ. Для норнмальной работы большинства программных продуктов желательно иметь хотя бы заметить, что при величении ОЗУ более чем 32 МБ быстродейнствие ПК увеличивается менее значительно, и такая конфигурация необнходима художникам и мультипликаторам. Hеотъемлемой частью ПК являетнся клавиатура. Стандартной в России является 101 - клавишная клавиантуры с английскими и русскими символами. Мышь. Необходима для рабонты с графическими пакетами, чертежами, при разработке схем и при ранботе под Windows. Следует отметить, что некоторое игровое и прогнраммное обеспечение требует наличие мыши. Основной ха мыши является разрешающая способность, измеряемая в точках на дюйм (dpi). Норнмальной считается мышь, обеспечивающая разрешение 300-400 dpi. Непнлохо иметь также специальный коврик под мышь, что обеспечивает ее сохранность и долговечность. Выбору монитора ПК следует делить осонбое внимание, поскольку от качества монитора зависит сохранность ваншего зрения и общую томляемость при работе. Мониторы имеют стандарнтный размер диагонали в 14,15,17,19,20 и 21 дюйм. Необходимый разнмер диагонали монитора выбирается исходя их разрешения, при котонром вы собираетесь работать. Так, для большинства приложений вполне достаточно иметь 14 дюймовый монитор, который обеспечивает работу при разрешениях до 800 на 600 точек. ПК может иметь звуковую карту. С одной стороны, звуковая карта не является необходимым элементом компьютера, но, с другой стороны, позволяет превратить его в мощное подспорье при обучении и написании музыки, изучении языков. Да и канкой интерес бить врагов на экране, если не слышишь их предсмертные крики. Простейшей картой является Adlib, который позволяет воспроизнводить только музыку без оцифрованной речи. И CD-ROM, с одной сторонны, также не являются необходимой для функционирования компьютера частью, но становится все более и более популярными в связи с теннденцией поставлять профессиональное, обучающее и игровое програмнмное обеспечение на CD-дисках.

2. Отличия процессоров.

2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.

SX и DX обозначает "облегченную" и полную версию одного и того же процессора. Для 386 вариант SX был сделан с 16-pазpядным интерфейсом, что позволяло экономить на обвязке и станавливать панмять по два SIMM, не по четыре, как для DX. Пpи работе с 16-pазpядными программами 386SX почти не отстает от 386DX на той же частоте, однако на 32-pазpядных программах он работает ощутимо меднленнее из-за разделения каждого 32-pазpядного запроса к памяти на два 16-pазpядных. Hа самом же деле большинство компьютеров с 386DX работают быстрее компьютеров с SX даже на 16-pазpядных программах - благодаря

Для 486 SX обозначает вариант без встроенного сопроцессора. Ранние модели представляли собой просто отбраковку от DX с неисправным сопроцессором - сопроцессор в них был заблокирован, и для станновки такого процессора вместо DX требовалось перенастроить системнную плату. Более поздние версии выпускались самостоятельно, и могут устанавливаться вместо DX без изменения настройки платы. Кроме отнсутствия сопроцессора и идентификационных кодов, модели SX также нинчем не отличаются от соответствующих моделей DX, и программное различение их в общем случае тоже невозможно.

SX2, DX2 и DX4 - варианты соответствующих процессоров с внутренним двоением или троением частоты. Hапpимеp, аппаратная настройка платы для DX2-66 делается, как для DX33, и на вход подаетнся частота 33 Гц, однако в программной настройке может потребоваться величение задержек при обращении к памяти для компенсации возросшей скорости работы процессора. Все внутренние операции в процессорах выполняются соответственно в два и три раза быстрее, однанко обмен по внешней магистpали определяется внешней тактовой частонтой. За счет этого DX4-100 работает втрое быстрее DX33 только на тех частках программ, которые целиком помещаются в его внутренний кэш, на больших фрагментах это отношение может упасть до двух с половинной и меньше.

Hекотоpые серии процессоров AMD (в частности - 25253) выпуснкались с единым кристаллом DX4, который мог переключаться в режим двоения по низкому ровню на выводе B-13. маркировка как DX2 или DX4 проводилась по результатам тестов; соответственно, процессор, маркированный как DX4, мог работать как DX2 и наоборот. Процессоры Intel DX4 Ц 100 могут переключаться в режим двоения по низкому ровню на выводе R - 17.

процессор AMD 5x86 стандартно работает с троением внешней частоты, низкий ровень на выводе R - 17 переключает его в режим учетвеpения.

2.2. Обозначение "SL - Enhanced" у процессоров Intel 486.

Hаличие SMM (System Management Mode - режим управления сиснтемой), используемого главным образом для перевода процессора в эконномичный режим. Еще обозначается как "S - Series", с добавлением к обозначению процессора суффикса "ЦS". В SL - Enhanced процессорах имеется также команда CPUID, которая возвращает идентификатор процессора.

2.3. Отличия процессоров UMC 486 U5 от Intel, AMD и других.

Прежде всего - оптимизированным микрокодом, за счет чего часто используемые команды выполняются за меньшее число тактов, чем в процессорах Intel, AMD, Cyrix и других. Пpоцессоpы U5 не имеют внутреннего множения частоты, результаты в 65 Гц и подобные, понлучаемые некоторыми программами, получаются потому, что для определения частоты программе необходимо правильно опознать процессор - точнее, число тактов, за которое он выполнит тестовую последовантельность, а большинство распространенных программ не меют правильно опознавать U5. По этой же причине на U5 зависает игра Heretic, ошибочно найдя в нем сопроцессор - чтобы это исключить, нужно в командной строке Heretic казать ключ "- debug".

2.4. Чипы RISC и CISC.

RISC - это аббревиатура от Reduced Instruction Set Computer (компьютер с сокращенным набором команд), CISC - аббревиатура от Comlex Instruction Set Computer (компьютер с полным набором команд). Существенная разница между ними состоит в следующем: чипы RISC понинмают лишь некоторые инструкции, но каждую из них они могут выполннить очень быстро. Программы для RISC-машин достаточно сложны, но выполняются они быстрее тех, которые совместимы с CISC-машинами. Hо, может быть, это и не так? (Исследования производительности еще не завершены.)

Все

(68010,68020,..,68040), используемые в компьютерах Macintosh и NeXT) являются яркими представителями CISC-чипов. Hекоторые рабочие станнции, начиная с IBM, используют чипы RISC.

2.5. Идентификация чипов Intel и AMD.

2.5.1. Кодексы даты

Просите у продавца кодексы даты прежде, чем Вы купите пронцессор. Все ЦПУ имеют дату выпуска, которая проставляется на корпунсе. достоверьтесь, что Вы приобретаете новый процессор, а не прошнлогодний.

Например

V74400223

V

7 - второй символ, это последняя цифра года выпуска процессора, рассматриваемый процессор выпущен в 1987 году;

44 - следующие две цифры, 44-я рабочая неделя в этом году (1987); 002 - следующие 3 цифры, номер партии (sequence number);

H

E6

9433 - выпущен на 33 рабочей неделе 1994 года;

DPDа

2.5.2. Версия процессора.

Просите данные о версии процессора. Сравните версию процеснсора, который Вам предлагают с процессорами Intel 800-468-3548 или AMD 800--9323, так как более ранние версии процессоров имеют ошибки и различные дефекты.

2.5.3. Demo-образцы.

Никогда не платите полную цену за demo-образцы. AMD и Intel делают технические образцы для каждой версии процессора, прежде, чем будет начат серийный выпуск процессора. Такой ЦПУ может иметь ошибнки(дефекты), так как обычно создан для испытания. Совершенно не предполагается, что такой процессор продадут конечному пользователю.

Hапример:

Нормальная версия (normal version): i486DX-33:

Разработка

2.5.4. Перемаркированные процессоры.

Перемаркированные процессоры (remaked CPUs) - это процессонры, которые разгоняют сильнее, чем оригинальные для более высокой ценны и прибыли. Эти действия считаются незаконными. Использование танкого ЦПУ всегда рискованно. Разгонка процессора иногда бывает успешнной, например, с 33MHz до 40MHz, или с 25MHz до 33MHz, но не всегда. Использование разогнанного процессора приводит к перегреванию чипа и его нестабильной работе, что часто служит причиной всевозможных ошинбок, сбоев и зависаний системы. Перемаркированный и разогнанный ЦПУ имеет гораздо меньший срок службы, чем оригинальный процессор, блангодаря перегреванию чипа.

3. Процессоры фирмы Intel.

3.1. Современная микропроцессорная технология фирмы Intel.

Достижения фирмы Intel в искусстве проектирования и произнводства полупроводников делают возможным производить мощные микропнроцессоры в все более малых корпусах. Разработчики микропроцессоров в настоящее время работают с комплиментарным технологическим процессом метал - оксид полупроводник (CMOS) с разрешением менее, чем микрон.

Использование субмикронной технологии позволяет разработчинкам фирмы Intel располагать больше транзисторов на каждой подложке. Это сделало возможным величение количества транзисторов для сенмейства X86 от 29, в 8086 процессоре до 1,2 миллионов в процессонре Intel486 DX2, с наивысшим достижением в Pentium процессоре. Вынполненный по 0.8 микронной BiCMOS технологии, он содержит 3.1 милнлиона транзисторов. Технология BiCMOS объединяет преимущества двух технологий: биполярной (скорость) и CMOS ( малое энергопотребление ). С помощью более, чем в два раза большего количества транзисторов Pentium процессора по сравнению с Intel486, разработчики поместили на подложке компоненты, ранее располагавшимися снаружи процессора. Наличие компонентов внутри меньшает время доступа, что существенно величивает производительность. 0.8 микронная технология фирмы Intel использует трехслойный металл и имеет ровень, более высокий по сравнению с оригинальной 1.0 микронной технологией двухслойного менталла, используемой в процессоре Intel486.

3.2. Первые процессоры фирмы Intel.

За 20-летнюю историю развития микропроцессорной техники, вендущие позиции в этой области занимает американская фирма Intel (INTegral ELectronics). До того как фирма Intel начала выпускать микрокомпьютеры, она разрабатывала и производила другие виды интегнральных микросхем. Главной ее продукцией были микросхемы для калькунляторов. В 1971 г. она разработала и выпустила первый в мире 4-битнный микропроцессор 4004. Фирма первоначально продавала его в качеснтве встроенного контроллера (что-то вроде средства правления личнным светофором или микроволновой печью). 4004 был четырехбитовым, т.е. он мог хранить, обрабатывать и записывать в память или считынвать из нее четырехбитовые числа. После чипа 4004 появился 4040, но 4040 поддерживал внешние прерывания. Оба чипа имели фиксированное число внутренних индексных регистров. Это означало, что выполняемые программы были ограничены числом вложений подпрограмм до 7.

В 1972 г., т.е. спустя год после появления 4004, Intel вынпустила очередной процессор 8008, но подлинный успех ей принес 8-битный микропроцессор 8080, который был объявлен в 1973 г. Этот микропроцессор получил очень широкое распространение во всем мире. Сейчас в нашей стране его аналог - микропроцессор KP58ИК80 применняется во многих бытовых персональных компьютерах и разнообразных контроллерах. С чипом 8080 также связано появление стека внешней панмяти, что позволило использовать программы любой вложенности.

Процессор 8080 был основной частью первого небольшого комнпьютера, который получил широкое распространение в деловом мире. Операционная система для него была создана фирмой Digital Research и называлась Control Program for Microcomputers (CP/M).

3.3. Процессор 8086/88.

В 1979 г. фирма Intel первой выпустила 16-битный микропронцессор 8086, возможности которого были близки к возможностям процеснсоров миникомпьютеров 70-х годов. Микропроцессор 8086 оказался "пранродителем" целого семейства, которое называют семейством 80x86 или х86.

Hесколько позже появился микропроцессор 8088, архитектурно повторяющий микропроцессор 8086 и имеющий 16-битный внутренние ренгистры, но его внешняя шина данных составляет 8 бит. Широкой попунлярности микропроцессора способствовало его применение фирмой IBM в персональных компьютерах PC и PC/XT.

3.4. Процессор 80186/88.

В 1981 г. появились микропроцессоры 80186/80188, которые сохраняли базовую архитектуру микропроцессоров 8086/8088, но содернжали на кристалле контроллер прямого доступа к памяти, счетчик/тайнмер и контроллер прерываний. Кроме того, была несколько расширена система команд. Однако широкого распространения эти микропроцессоры (как и персональные компьютеры PCjr на их основе), не получили.

3.5. Процессор 80286.

Следующим крупным шагом в разработке новых идей стал микропнроцессор 80286, появившийся в 1982 году. При разработке были чтены достижения в архитектуре микрокомпьютеров и больших компьютеров. Процессор 80286 может работать в двух режимах: в режиме реального адреса он эмулирует микропроцессор 8086, в защищенном режиме вирнтуального адреса (Protected Virtual Adress Mode) или P-режиме прендоставляет программисту много новых возможностей и средств. Среди них можно отметить расширенное адресное пространство памяти 16 Мбайт, появление дескрипторов сегментов и дескрипторных таблиц, нанличие защиты по четырем ровням привилегий, поддержку организации виртуальной памяти и мультизадачности. Процессор 80286 применяется в ПК PC/AT и младших моделях PS/2.

3.6. Процессор 80386.

При разработке 32-битного процессора 80386 потребовалось реншить две основные задачи - совместимость и производительность.

В- режиме процессор 80386 может выполнять 16-битные прогнраммы (код) процессора 80286 без каких-либо дополнительных модификанций. Вместе с тем, в этом же режиме он может выполнять свои "естеснтвенные" 32-битные программы, что обеспечивает повышение производинтельности системы. Именно в этом режиме реализуются все новые вознможности и средства процессора 80386, среди которых можно отметить масштабированную индексную адресацию памяти, ортогональное использонвание регистров общего назначения, новые команды, средства отладки. Адресное пространство памяти в этом режиме составляет 4 Гбайт.

Микропроцессор 80386 дает разработчику систем большое число новых и эффективных возможностей, включая производительность от 3 до 4 миллион операций в секунду, полную 32-битную архитектуру, 4 гиганбитное (2 байт) физическое адресное пространство и внутреннее обеснпечение работы со страничной виртуальной памятью.

Несмотря на введение в него последних достижений микропронцессорной техники, 80386 сохраняет совместимость по объектному коду с программным обеспечением, в большом количестве написанным для его предшественников, 8086 и 80286. Особый интерес представляет такое свойство 80386, как виртуальная машина, которое позволяет 80386 пенреключаться в выполнении программ, правляемых различными операциоыми системами, например, UNIX и MS-DOS. Это свойство позволяет производителям оригинальных систем непосредственно вводить прикладнное программное обеспечение для 16-битных машин в системе на базе 32-битных микропроцессоров. Операционная система P-режима может созндавать задачу, которая может работать в режиме виртуального процеснсора 8086 (Virtual 8086 Mode) или V-режим. Прикладная программа, конторая выполняется в этом режиме, полагает, что она работает на пронцессоре 8086.

32-битная архитектура 80386 обеспечивает программные ресурнсы, необходимые для поддержки "больших " систем, характеризуемых операциями с большими числами, большими структурами данных, большинми программами (или большим числом программ) и т.п. Физическое аднресное пространство 80386 состоит из 2 байт или 4 Гбайт; его логинческое адресное пространство состоит из 2 байт или 64 терабайт (Тбайт). Восемь 32-битных общих регистров 80386 могут быть взаимозанменяемо использованы как операнды команд и как переменные различных способов адресации. Типы данных включают в себя 8-, 16- или 32-битнные целые и порядковые, пакованные и неупакованные десятичные, канзатели, строки бит, байтов, слов и двойных слов. Микропроцессор 80386 имеет полную систему команд для операций над этими типами даых, также для правления выполнением программ. Способы адресации 80386 обеспечивают эффективный доступ к элементам стандартных струкнтур данных: массивов, записей, массивов записей и записей, содержанщих массивы.

Микропроцессор 80386 реализован с помощью технологии фирмы Intel CH MOS - технологического процесса, объединяющего в себе возможности высокого быстродействия технологии HMOS с малым потребнлением технологии кмоп. Использование геометрии 1,5 мкм и слоев менталлизации дает 80386 более 275 транзисторов на кристалле. Сейнчас выпускаются оба варианта 80386, работающих на частоте I2 и I6 Гц без состояний ожидания, причем вариант 80386 на 16 Гц обеспечинвает скорость работы 3-4 миллиона операций в секунду.

Микропроцессор 80386 разделен внутри на 6 автономно и паралнлельно работающих блоков с соответствующей синхронизацией. Все внутнренние шины, соединяющие эти блоки, имеют разрядность 32 бит. Конвенйерная организация функциональных блоков в 80386 допускает времеое наложение выполнения различных стадий команды и позволяет одновнременно выполнять несколько операций. Кроме конвейерной обработки всех команд, в 80386 выполнение ряда важных операций осуществляется специальными аппаратными злами. Блок умножения/деления 80386 может выполнять 32-битное множение за 9-41 такт синхронизации, в зависинмости от числа значащих цифр; он может разделить 32-битные операнды за 38 тактов (в случае чисел без знаков) или за 43 такта (в случае чисел со знаками). Регистр группового сдвига 80386 может за один такт сдвигать от 1 до 64 бит. Обращение к более медленной памяти (инли к стройствам ввода/вывода) может производиться с использованием конвейерного формирования адреса для величения времени становки данных после адреса до 3 тактов при сохранении двухтактных циклов в процессоре. Вследствие внутреннего конвейерного формирования адреса при исполнении команды, 80386, как правило, вычисляет адрес и опренделяет следующий магистральный цикл во время текущего магистральнонго цикла. зел конвейерного формирования адреса передает эту оперенжающую информацию в подсистему памяти, позволяя, тем самым, одному банку памяти дешифрировать следующий магистральный цикл, в то время как другой банк реагирует на текущий магистральный цикл.

3.7. Процессор 80486.

В 1989 г. Intel представила первого представителя семейнства 80х86, содержащего более миллиона (а точнее, 1,2 миллиона)а

3.7.1.Процессор i486SX

Появление нового микропроцессора i486SX фирмы Intel  вполне можно считать одним из важнейших событий 1991 года. же

предварительные испытания показали, что компьютеры на базе i486SX с тактовой частотой

3.8. Intel OverDrive

Возможность постоянного совершенствования. Пользователи пернсональных компьютеров все чаще сталкиваются с этим по мере все вознрастающих требований к микропроцессорам со стороны аппаратного и программного обеспечения. Фирма Intel верена: лучшая стратегия сонвершенствования - первоначально заложенная в систему возможность мондернизации, модернизации согласно вашим нуждам. Впервые в мире танкая возможность предоставляется нашим потребителям. Фирма Intel приступила к выпуску Intel OverDrive процессора, открывающего новую категорию мощных сопроцессоров. После простой становки этого сопронцессора на плату резко вырастет скорость работы всей системы и прикнладных программ в MS-DOS, Windows, OS/2, Windows'95 и UNIX.

С помощью этой одной-единственной микросхемы Вы сразу же сможете воспользоваться преимуществами новой стратегии фирмы Intel, заложенной в нашей продукции. Когда настанет неотвратимый момент, когда Вам потребуется производительность большая, чем у Вашего комнпьютера, то все, что Вам будет нужно - это вставить OverDrive пронцессор в Вашу систему - и пользоваться преимуществами, которые даст Вам новая микропроцессорная технология фирмы Intel. Более чем проснто модернизация, OverDrive процессор - это стратегия защиты Ваших настоящих и будущих вкладов в персональные компьютеры.

Intel OverDrive процессор гарантирует Вам отвечающую станндартам и экономичную модернизацию. Всего лишь одна микросхема велинчит вычислительную мощь Вашего компьютера до требований самого совнременного программного обеспечения и даже тех программ, которые еще не написаны, в MS-DOS, в Windows, в PS/2, в UNIX, от AutoCAD - до WordPerfect.

Итак, наш первый микропроцессор в серии Single Chip Upgrade (Качественное лучшение - одной микросхемой) - это OverDrive процеснсор для систем на основе Intel i486SX. становленный в OverDrive - разъем, этот процессор позволяет системе i486SX использонвать новейшую технологию "удвоения скорости", используемую в процеснсоре i486DX2, и дающую общее величение производительности до 70%. OverDrive процессор для систем i486SX содержит модуль операций над целыми числами, модуль операций над числами с плавающей точкой, мондуль правления памятью и К кэш-памяти на одном кристалле, работаюнщем на частоте, в два раза превышающей тактовую частоту системной шины. Это никальное свойство позволяет Вам двоить тактовую частонту Вашей системы, не тратясь на покупку и становку других дополнинтельных компонентов. OverDrive процессор двоит, например, внутреюю частоту МП i486SX 25 Гц до 50 Гц.

Хотя Intel OverDrive - это совершенно новая технология канчественной модернизации, в нем знаются и фамильные черты Intel. Изготовленный и испытанный в соответствии с жесткими стандартами Intel, OverDrive отличается зарекомендовавшими себя свойствами прондукции Intel: качеством и надежностью. OverDrive обеспечен постояой гарантией и привычным сервисом и поддержкой во всем мире. OverDrive полностью совместим более чем с 5 прикладных программ. OverDrive процессор для i486SX - только первый из наших новых пронцессоров. Во втором полугодии 1992 года мы выпустим OverDrive пронцессор для систем i486DX2, самих по себе представляющих новое поконление технологии МП. Мощный и доступный, OverDrive процессор пролонжит для Вас непрерывный путь к качественно новым ровням производинтельности персональных компьютеров.

Hекоторые результаты лабораторных испытаний Intel

1.

3.0, популярным текстовым процессором.

Тест исполнялся на системе с i486SX 20 Гц с файлом 330 КВ. WordPerfect, преобразованном в формат Windows Word, было выполнено 648 контекстных поисков и замен, проверка правописания во всем файнле, затем файл был сохранен.

Время исполнения:

i486SX без OverDrive =107 с

----------------------------

i486SX

2. Работа с Lotus 1-2-3 Release 3.0, электронной таблице, приближающейся по возможностям к интегрированной среде, обладающей широким выбором аналитических, экономических и статистических фуннкций.

Тест исполнялся на i486SX 20 Гц с таблицей объемом 43К на 1 ячеек, которая была загружена и пересчитана. Кроме того, был обработан большой блок текстовых данных.

Время исполнения:

i486SX без OverDrive=250 с

----------------------------

i486SX

i486SX

----------------------------

i486SX c OverDrive =

3. Работа с AutoCAD, популярной системой САПР.

Тест исполнялся на i486SX 20 Гц с трехмерным архитектурным чертежом, над которым выполнялись операции перечеркивания, панораминрования, масштабирования, даления скрытых линий и повторной генеранции файла во внешнем формате.

Время исполнения:

i486SX с i487SX =а

----------------------------

i486SX c OverDrive =

вот что говорят об OverDrive процессоре те, кому же поснчастливилось поработать с ним:

Брент Грэхэм: (специалист по автоматизации офисов, US Bank, Портленд) "С теми возможностями модернизации, которые предоставляет Intel 486, я не вижу причин не использовать OverDrive процессор. Что касается его становки в систему, то с этим справится даже мой 10-летний сынишка."

Билл

Corporation, Нью - Йорк) "Я работал с Windows и OS/2 в сети Banyan Wines, используя OverDrive процессор без единой заминки. Моя соверншенствованная система с i486SX 25 Гц работает не хуже, чем системы на 50 Гц."

Стива

"Windows визжит от счастья, когда работает с OverDrive процессором. Расчеты на электронной таблице в Excel выполняются мгновенно."

3.9. Процессор Pentium.

В то время, когда Винод Дэм делал первые наброски, начав в июне 1989 года разработку Pentium процессора, он и не подозревал, что именно этот продукт будет одним из главных достижений фирмы Intel. Как только выполнялся очередной этап проекта, сразу начиналнся процесс всеобъемлющего тестирования. Для тестирования была разранботана специальная технология, позволившая имитировать функциониронвание Pentium процессора с использованием программируемых стройств, объединенных на 14 платах с помощью кабелей. Только когда были обнанружены все ошибки, процессор смог работать в реальной системе. В донполнение ко всему, в процессе разработки и тестирования Pentium пронцессора принимали активное частие все основные разработчики персоннальных компьютеров и программного обеспечения, что немало способнствовало общему спеху проекта. В конце 1991 года, когда была заверншен макет процессора, инженеры смогли запустить на нем программное обеспечение. Проектировщики начали изучать под микроскопом разводку и прохождение сигналов по подложке с целью оптимизации топологии и повышения эффективности работы. Проектирование в основном было занвершено в феврале 1992 года. Началось всеобъемлющее тестирование опытной партии процессоров, в течение которого испытаниям подверганлись все блоки и злы. В апреле 1992 года было принято решение, что пора начинать промышленное освоение Pentium процессора. В качестве основной промышленной базы была выбрана 5 Орегонская фабрика. Более 3 миллионов транзисторов были окончательно перенесены на шаблоны. Началось промышленное освоение производства и доводка технических характеристик, завершившиеся через 10 месяцев, 22 марта 1993 года широкой презентацией Pentium процессора.

Объединяя более, чем 3.1 миллион транзисторов на одной кремнниевой подложке, 32-разрядный Pentium процессор характеризуется вынсокой производительностью с тактовой частотой 60 и 66 Гц. Его сунперскалярная архитектура использует совершенствованные способы проектирования, которые позволяют выполнять более, чем одну команду за один период тактовой частоты, в результате чего Pentium в состояннии выполнять огромное количество PC-совместимого программного обеснпечения быстрее, чем любой другой микропроцессор. Кроме существующих наработок программного обеспечения, высокопроизводительный арифнметический блок с плавающей запятой Pentium процессора обеспечивает величение вычислительной мощности до необходимой для использования недоступных ранее технических и научных приложений, первоначально предназначенных для платформ рабочих станций.

Многочисленные

Pentium процессора в виде никального сочетания высокой производинтельности, совместимости, интеграции данных и наращиваемости. Это включает:

- Суперскалярную архитектуру;

- Раздельное кэширование программного кода и данных;

- Блок предсказания правильного адреса перехода;

- Высокопроизводительный блок вычислений с плавающей занпятой;

- Расширенную 64-битовую шину данных;

- Поддержку многопроцессорного режима работы;

- Средства задания размера страницы памяти;

- Средства обнаружения ошибок и функциональной избыточнности;

- правление производительностью;

- Наращиваемость с помощью

собой совместимую только с Intel двухконвейерную индустриальную арнхитектуру, позволяющую процессору достигать новых ровней производинтельности посредством выполнения более, чем одной команды за один период тактовой частоты. Термин "суперскалярная" обозначает микропнроцессорную архитектуру, которая содержит более одного вычислинтельного блока. Эти вычислительные блоки, или конвейеры, являются злами, где происходят все основные процессы обработки данных и конманд.

Появление суперскалярной архитектуры Pentium процессора представляет собой естественное развитие предыдущего семейства пронцессоров с 32-битовой архитектурой фирмы Intel. Например, процессор Intel486 способен выполнять несколько своих команд за один период тактовой частоты, однако предыдущие семейства процессоров фирмы Intel требовали множество циклов тактовой частоты для выполнения однной команды.

Возможность выполнять множество команд за один период тактонвой частоты существует благодаря тому, что Pentium процессор имеет два конвейера, которые могут выполнять две инструкции одновременно. Так же, как и Intel486 с одним конвейером, двойной конвейер Pentium процессора выполняет простую команду за пять этапов: предваринтельная подготовка, первое декодирование ( декодирование команды ), второе декодирование ( генерация адреса ), выполнение и обратная выгрузка.

В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество конманд может быть выполнено за одно и то же время.

Другое важнейшее революционное совершенствование, реализонванное в Pentium процессоре, это введение раздельного кэширования. Кэширование величивает производительность посредством активизации места временного хранения для часто используемого программного кода и данных, получаемых из быстрой памяти, заменяя по возможности обранщение ко внешней системной памяти для некоторых команд. Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти, используемой одновременно для кэширования программного кода и данных.

Проектировщики фирмы Intel обошли это ограничение использонванием дополнительного контура, выполненного на 3.1 миллионах траннзисторов Pentium процессора ( для сравнения, Intel486 содержит 1.2 миллиона транзисторов ) создающих раздельное внутреннее кэширование программного кода и данных. Это лучшает производительность посреднством исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем это было возможно ранее. Например, во время фанзы предварительной подготовки, используется код команды, полученный из КШа команд. В случае наличия одного блока кэш-памяти, возможен конфликт между процессом предварительной подготовки команды и достунпом к данным. Выполнение раздельного кэширования для команд и даых исключает такие конфликты, давая возможность обеим командам вынполняться одновременно. Кэш-память программного кода и данных Pentium процессора содержит по 8 KB информации каждая, и каждая орнганизована как набор двухканального ассоциативного КШа - предназнанченная для записи только предварительно просмотренного специфициронванного 32-байтного сегмента, причем быстрее, чем внешний кэш. Все эти особенности расширения производительности потребовали использонвания 64-битовой внутренней шины данных, которая обеспечивает вознможность двойного кэширования и суперскалярной конвейерной обработки одновременно с загрузкой следующих данных. Кэш данных имеет два иннтерфейса, по одному для каждого из конвейеров, что позволяет ему обеспечивать данными две отдельные инструкции в течение одного маншинного цикла. После того, как данные достаются из КШа, они записынваются в главную память в режиме обратной записи. Такая техника кэнширования дает лучшую производительность, чем простое кэширование с непосредственной записью, при котором процессор записывает данные одновременно в кэш и основную память. Тем не менее, Pentium процеснсор способен динамически конфигурироваться для поддержки кэшированния с непосредственной записью.

Таким образом, кэширование данных использует два различных великолепных решения: кэш с обратной записью и алгоритм, названный MESI (модификация, исключение, распределение, освобождение) протонкол. Кэш с обратной записью позволяет записывать в кэш без обращенния к основной памяти в отличие от используемого до этого непосреднственного простого кэширования. Эти решения величивают производинтельность посредством использования преобразованной шины и предупрендительного исключения самого узкого места в системе. В свою очередь MESI-протокол позволяет данным в кэш-памяти и внешней памяти совпандать - великолепное решение в усовершенствованных мультипроцессорнных системах, где различные процессоры могут использовать для рабонты одни и те же данные.

Блок предсказания правильного адреса перехода - это следуюнщее великолепное решение для вычислений, величивающее производинтельность посредством полного заполнения конвейеров командами, оснонванное на предварительном определении правильного набора команд, конторые должны быть выполнены.

Pentium процессор позволяет выполнять математические вычиснления на более высоком ровне благодаря использованию совершенствонванного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвейер и аппаратно реализованные основные математические функции. Четырехтактовые конвейерные команды вычисленний с плавающей запятой дополняют четырехтактовую целочисленную коннвейеризацию. Большая часть команд вычислений с плавающей запятой монгут выполняться в одном целочисленном конвейере, после чего подаются в конвейер вычислений с плавающей запятой. Обычные функции вычисленний с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью скорения вычислений.

В результате этих инноваций, Pentium процессор выполняет конманды вычислений с плавающей запятой в пять раз быстрее, чем 33-Гц Intel486 DX, оптимизируя их для высокоскоростных численных вычисленний, являющихся неотъемлемой частью таких совершенствованных виндеоприложений, как CAD и 3D-графика.

Pentium процессор снаружи представляет собой 32-битовое снтройство. Внешняя шина данных к памяти является 64-битовой, дваинвая количество данных, передаваемых в течение одного шинного цикла. Pentium процессор поддерживает несколько типов шинных циклов, вклюнчая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.

Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенно повышает сконрость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 Гц, по сравнению со 160 MB/сек для 50 Гц процессора Intel486 DX. Эта расширенная шина данных способствует высокоскороснтным вычислениям благодаря поддержке одновременной подпитки команданми и данными процессорного блока суперскалярных вычислений, благоданря чему достигается еще большая общая производительность Pentium процессора по сравнению с процессором Intel486 DX.

Давая возможность разработчикам проектировать системы с пнравлением энергопотреблением, защитой и другими свойствами, Pentium процессор поддерживаем режим правления системой (SMM), подобный ренжиму архитектуры Intel SL.

Вместе со всем, что сделано нового для 32-битовой микропронцессорной архитектуры фирмы Intel, Pentium процессор сконструирован для легкой наращиваемости с использованием архитектуры наращивания фирмы Intel. Эти нововведения защищают инвестиции пользователей поснредством наращивания производительности, которая помогает поддержинвать ровень продуктивности систем, основанных на архитектуре пронцессоров фирмы Intel, больше, чем продолжительность жизни отдельных компонентов. Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в же существующих системах с помощью простой инсталляции средства одннокристального наращивания производительности. Например, первое средство наращивания - это OverDrive процессор, разработанный для процессоров Intel486 SX и Intel486 DX, использующий технологию проснтого удвоения тактовой частоты, использованную при разработке микнропроцессоров Intel486 DX2.

Первые модели процессора Pentium работали на частоте 60 и 66 Гц и общались со своей внешней кэш-памятью второго ровня по 64-бинтовой шине данных, работающей на полной скорости процессорного ядра. Hо если скорость процессора Pentium растет, то системному разработнчику все труднее и дороже обходится его согласование с материнской платой. Поэтому быстрые процессоры Pentium используют делитель часнтоты для синхронизации внешней шины с помощью меньшей частоты. Hапнример, у 100 Гц процессора Pentium внешняя шина работает на 66 Гц, у 90 Гц - на 60 Гц. Процессор Pentium использует одну и ту же шину для доступа к основной памяти и к периферийным подсистемам, таким как схемы PCI.

3.10.

3.10.1. Общее описание процессора.

Pentium Pro это высокотехнологичный процессор шестого поконления для высокоуровневых десктопов, рабочих станций и мультипроцеснсорных серверов. Массовое производство процессора Pentium Pro, сондержащего на кристалле столько транзисторов, сколько никогда не бынло на серийных процессорах, сразу в нескольких вариантах стартует с 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в истории компании, да и электронной промышленности.

Hапомним некоторые его особенности. Агрессивная суперконвейнерная схема, поддерживающая исполнение команд в произвольном поряднке, словное исполнение далеко наперед (на 30 команд) и трехпоточнная суперскалярная микроархитектура. Все эти методы могут поразить воображение, но ни один из них не является чем-то оригинальным: нонвые чипы NexGen и Cyrix также используют подобные схемы. Однако, Intel обладает ключевым превосходством. В процессоры Pentium Pro встроена вторичная кэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в виде отдельного кристалла статического ОЗУ емкостью 25К или 51К, смонтированного на втором посадочном месте необычного двухместного корпуса процессора Pentium Pro, значительно простила разработчикам проектирование и конструирование вычислинтельных систем на его основе.

Реальная производительность процессора оказалась намного вынше 200 единиц, которые назывались в качестве запланированного старнтового ориентира при февральском технологическом анонсировании P6.

Pentium Pro это значительный шаг вперед. И хотя в процессонре Pentium впервые была реализована суперскалярная форма архитектунры х86, но это была ограниченная реализация: в нем интегрирована панра целочисленных конвейеров, которые могут обрабатывать две простые команды параллельно, но в порядке следования команд в программе и без т.н. словного исполнения (наперед). Hапротив, новый процессор это трехпоточная суперскалярная машина, которая способна одновремео отслеживать прохождение пяти команд. Для согласования с такой вынсокой пропускной способностью потребовалось резко улучшить схему кэнширования, расширить файл регистров, повысить глубину упреждающей выборки и словного исполнения команд, совершенствовать алгоритм предсказания адресов перехода и реализовать истинную машину данных, обрабатывающую команды не по порядку, сразу по мере готовности данных для них. Ясно, что эта схема нечто большее, чем Pentium, что и подчеркивает, по мнению Intel, суффикс Pro в имени процессора.

3.10.2. Два кристалла в одном корпусе.

Самая поразительная черта Pentium Pro - тесно связанная с процессором кэш-память второго ровня (L2), кристалл которой смонтинрован на той же подложке, что и ЦПУ. Именно так, Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственно ядро пронцессора, включающее два 8-Килобайтовых блока кэш-памяти первого уровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехканнальная порядково - ассоциативная кэш второго ровня.

Два этих кристалла объединены в общем 387-контактном корпунсе, но связаны линиями, не выходящими на внешние контакты. Hекотонрые компании называют такой чип корпуса МСМ (multichip module), одннако Intel использует для него термин dual - cavityа

Степень интеграции нового процессора также поражает: он сондержит 5.5 млн. транзисторов, да еще 15.5 млн. входит в состав криснталла кэш-памяти. Для сравнения, последняя версия процессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это число не вклюнчена кэш L2, поскольку Pentium требует становки внешнего комплекта микросхем статического ОЗУ для реализации вторичной кэш-памяти.

Элементарный расчет поможет понять 6почему на 25К памяти, требуется такое огромное число транзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющего всего один транзистор на бит хранения и периодически регенерируемого, использует для храннения бита ячейку из шести транзисторов:

256 x 1024 х 8 бит х 6 пр - рова

Площадь процессорного кристалла равна 306 кв. мм. (для сравннения, у первого процессора Pentium кристалл имел площадь 295 кв. мм). Кристалл статической памяти, как всякая регулярная структура, пакован намного плотнее - 202 кв. мм. Только Pentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальные версии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии с четырехслойной металлизацией.

Почему компания Intel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным КШем? Во - первых комбинированный корнпус значительно простил изготовителям ПК разработку высокопроизвондительных систем на процессоре Pentium Pro.

Одна из главных проблем при проектировании компьютера на быстром процессоре связана с точным согласованием с процессором втонричного КШа по его размеру и конфигурации. Встроенная в Р6 вторичнная кэш же тонко настроена под ЦПУ и позволяет разработчикам сиснтем быстро интегрировать готовый процессор на материнскую плату.

Во-вторых, вторичная кэш тесно связана с ядром ЦПУ с понмощью выделенной шины шириной 64 бита, работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150 Гц, то кэш должна работать на частоте 150 Гц.

Поскольку в процессоре Pentium Pro есть выделенная шина для вторичного КШа, это решает сразу две проблемы: обеспечивается синнхронная работа двух стройств на полной скорости и отсутствие конкунренции за шину с прочими операциями ввода-вывода. Отдельная шина L2, "задняя" шина полностью отделена от наружной, "передней" шины ввода-вывода, вот почему в P6 вторичная кэш не мешает своими цикланми операциям с ОЗУ и периферией. Передняя 64-битовая шина может ранботать с частотой, равной половине, трети или четверти скорости яднра Pentium Pro. "Задняя" шина продолжает работать независимо, на полной скорости.

Такая реализация представляет серьезный шаг вперед по сравннению с организацией шины процессора pentium и других процессоров х86. Только NexGen приближенно напоминает такую схему. Хотя в пронцессоре Nx586 нет КШа L2, зато встроен ее контроллер и полноскороснтная шина для связи с внешней кэш-памятью. Подобно Р6, процессор Nx586 общается с основной памятью и периферийными подсистемами понверх отдельной шины ввода-вывода, работающей на деленной частоте.

В экзотическом процессором Alpha 21164 компания Digital пошнла еще дальше, интегрировав прямо на кристалле в дополнение к пернвичной кэш-памяти еще и 96 Кбайт вторичной. За счет вздувания площанди кристалла достигнута беспрецедентная производительность кэшированния. Транзисторный бюджет Альфы составляет 9.3 миллиона транзистонров, большая часть которого образована массивом памяти.

Есть одна незадача: необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычисления соотношения цены и производинтельности. Интегрированная в процессор кэш вроде как скрыта с глаз. Pen

Уникальный корпус предоставляет свободу созданию новых ванриантов процессора. В будущем возможно как повышение объема кэш-панмяти, так и ее отделение ее от процессора в соответствии с традинционным подходом. Если последний вариант появится, он окажется, ненсовместим по внешним выводам с двухкристалльным базовым корпусом, так как ему необходимо добавить 72 дополнительных вывода (64-для "задней" шины и 8 для контроля ошибок). Hо он будет почти таким же быстрым, если будет широко доступна статическая память с пакетным режимом. По мнению инженеров Intel, подключение внешних микросхем памяти к "передней" шине Pentium Pro с целью реализации кэш-памяти третьего ровня, вряд ли оправдано. Отправной точкой для такой бежнденности служат результаты натурного моделирования прототипа систенмы, которая в следствии высокой эффективности интерфейса кэш L2-пронцессор, практически до теоретического предела загружает вычислинтельные ресурсы ядра. Процессор Alpha 21164, напротив, спроектиронван с учетом необходимости кэш L3.

3.10.3. Значения тестов для некоторых чипов фирмы Intel.

Processor

Benchmarks

Intel

Pentium

Pro

Processor

(200MHz)

Intel

Pentium

Pro

Processor

(180MHz)

Intel

Pentium

Pro

Processor

(166MHz)

w/512K L2

Intel

Pentium

Pro

Processor

(150MHz)

Intel

Pentium

Processor

(133MHz)

UNIX

SPEC95

SPECint95

SPECint_base95

SPECfp95

SPECfp_base95

8.09

8.09

6.75

5.99

7.29

7.29

6.08

5.40

7.11

7.11

6.21

5.47

6.08

6.08

5.42

4.76

4.14

4.14

3.12

2.48

SPEC92

SPECint92

SPECint_base92

SPECfp92

SPECfp_base92

366.0

336.7

283.2

234.3

327.4

3.5.8

254.6

210.4

327.1

306.6

261.3

209.6

276.3

258.3

220.0

182.0

190.9

175.9

120.6

107.3

Windows

Norton System Index

SI32

86.7

77.6

Not

tested

67.0

34.2

Ziff-Davis

CPUmark32

541

466

Not

tested

412

278

4. Процессоры конкурентов Intel.

4.1. Первые процессоры конкурентов Intel.

Intel была не единственной фирмой - производителем микропронцессоров: существовали еще MOS Technologies, Mostek, Motorola, Rockwell, Standart Microsystems Corporation, Synertek, Texas Instruments. Одни из них использовали свои собственные проекты чинпов, другие - лицензионные проекты своих конкурентов. спешнее всех в конце 70-х работала фирма Zilog. Она создала чип Z80.

В то время, когда компьютеры, работающие под правлением СР/М, распространились в офисах, компьютеры Apple II буквально ворнвались в школы. Фирма Apple в качестве основного компонента своего компьютера выбрала чип фирмы MOS Technologies 6502. Это был лиценнзионный чип фирмы Rockwell and Synertek. Apple начала использовать процессоры Motorola во всех своих компьютерах Macintosh. Разработки фирм Intel и Motorola появились почти одновременно, но объединяет их не только это. Микропроцессоры Intel 80486 и Motorola 68040, напринмер, почти одинаковы по сложности и имеют функциональные сходные возможности. Тем не менее, они совершенно несовместимы. Именно поэнтому на Macintosh и PC не могут выполняться одни и те же программы.

Существует принципиальное отличие в эволюционном развитии этих двух семейств микропроцессоров. Intel начала с довольно незнанчительного по нашим современным меркам адресного пространства в 1 Мбайт и постоянно наращивала его до нынешнего размера в 4 Гбайт. Motorola в своей серии 680x0 всегда имела адресное пространство в 4 Гбайт. IBM поместила чипы ROM в адресное пространство своих PC как можно выше. И не ее ошибка была в том, что позже Intel достроила "второй этаж" и таким образом оставила ROM в конструкциях IBM где-то посередине, открыв дорогу использованию RAM, что само по себе, монжет быть, и не плохо. Разработчики семейства чипов 680х0 никогда не испытывали подобных неудобств, и поэтому очень много программистов считают, что Mac лучше.

Intel приложила значительные усилия, пытаясь стандартизонвать производство ее процессоров 8086 и 8088 на предприятиях-подряднчиках. Hесколько предприятий приняло такие соглашения. Однако Haris выпустил свои чипы - аналоги 8086 и 8088, которые менее всего довнлетворяли этим принятым соглашениям. Он использовал технологию CMOS, значительно сокращающую потребление электроэнергии, и это свойство сделало его чипы очень популярными, особенно среди производителей ПК с экранами на жидких кристаллах.

Фирма NEC предложила свою так называемую V-серию чипов и объявила, что чип V20 является конструктивно совместимым с чипом Intel 8088, но имеет совершенствованный набор инструкций, включая при этом и инструкции чипа 8080. Это означало, что он мог легко вынполнять программы, написанные для CP/M, без их модификации, иснпользуя эмулятор программ, и при этом включать преимущества инструкнций 8080, содержащихся в чипе V20. Их чип V30 был аналогом 8086 с включенными дополнительными возможностями.

Чипы V-серии фирмы NEC также работали немного быстрее аналонгичных чипов фирмы Intel. Эти чипы имели некоторый спех, чем была раздосадована Intel. Последняя подала в суд на NEC по факту нарушенния закона о защите авторских прав. NEC подала ответный иск. В рензультате спор был улажен без признания победителем какой-либо сторонны. Интересными были детали этого судебного разбирательства. Было признано, что NEC действительно использовала некоторые микрокоды Intel, что было нарушением ее авторского права, если бы оно было должным образом оформлено. Hо поскольку Intel производила и продаванла некоторые чипы 8088 без знака авторского права, то их претензии были признаны безосновательными. Компания Chips and Technology, конторая стала известна благодаря выпуску аналогов BIOS, в настоящее время внедрила линию по производству процессорных чипов. Hа ней вынпускаются аналоги 386. И поскольку эти чипы не являются точными ананлогами известных ранее чипов, неизвестно каким будет на них спрос.

 

 

 

 

4.2. Процессоры фирмы AMD.

4.2.1. Судебное разбирательство с Intel.

Фирма AMD была лицензионным производителем Intel, производянщей 80286. AMD объявила, что ее контракт с Intel позволяет им выпуснкать легализованные копии чипов 386. Intel категорически не согласинлась с этим. AMD далось выиграть это судебное разбирательство, и теперь она выпускает аналог чипа 386 с тактовой частотой 40 Гц. Этот чип имел определенный спех, в частности, из-за его более высонкой скорости по сравнению с самым быстродействующим чипом серии Intel 386. При выпуске фирмой AMD аналогов 486 фирма Intel снова понпыталась остановить конкурента. Однако и в этом случае закон был на стороне AMD.

4.2.2. Процессоры семейства AMD5k86.

Наладив в 1994 году массовое производство чипов 5-го поколенния - микропроцессоров Pentium, корпорация Intel мощно пошла в отнрыв. Интеллектуальная колоссальная мощь ее инженеров, помноженная на богатейшие производственные возможности, казалось, не оставляла нинкаких шансов конкурентам. между тем вдогонку за лидером бросилось сразу несколько преследователей. Среди них, пожалуй, именно компанния AMD имела самую "удачную" стартовую позицию. Компания Advanced Micro Devices занимала второе место в мире по производству микропронцессоров. На сегодняшний день общее число чипов, выпущенных фирмой AMD, перевалило далеко за отметку 85 миллионов, что, согласитесь, само по себе говорит об огромном потенциале компании.

Цифра "5" для фирмы AMD была явно несчастливой. Intel Pentium все наращивал обороты: 66, 75, 90 Мгц... Тактовая частота новых моделей величивалась едва ли не каждый месяц. А разработчинкам компании AMD, кроме названия - "K5", представлять было решинтельно нечего. Ожидание становилось тягостным.

Гнетущее ощущение несбывшихся надежд скрасил выпуск процеснсора Am5x86. Нет, чип Am5x86 не был обещанным К5. Микропроцессор представлял собой "четверку" с большими возможностями, которые однанко, явно не дотягивали до "честного" Pentium. В прессе распространянлись мнения специалистов, вроде: "Производительность, сравнимая с производительностью Pentium, позволяет отнести микропроцессор Am5x86 к стройствам пятого поколения".

между тем, оставаясь по своей сути (по внутренней архитекнтуре) до боли знакомым 486-м, чип Am5x86, имеющий тактовую частоту 133 Гц, мог соперничать на равных лишь со скромным по своим возможнностям процессором Pentium/75 Гц. Интересно, какой должна была бы быть тактовая частота Am5x86, чтобы показать производительность, сравнимую с Pentium/166 Гц!

Поэтому создание чипа пятого поколения у компании Advanced Micro Devices было еще впереди. При проектировании своих предыдущих процессоров компания опиралась на неизменную поддержку корпорации Intel. Но к началу разработки собственного процессора пятого поколенния срок действия лицензионных соглашений с корпорацией Intel подоншел к концу. Так что инженерам AMD пришлось начать разработку, что называется, с чистого листа. В частности, вышла промашка при проекнтировании встроенного КШа команд. Наборы команд для процессоров разных поколений существенно отличаются. Инженеры-разработчики комнпании AMD немного просчитались в оценке числа CISC-инструкций, имеюнщих различную длину. В результате, не давалось достичь проектируенмого ровня производительности при исполнении программ, оптимизиронванных под процессор Pentium. Но спустя некоторое время и эта, и ненкоторые другие ошибки были странены. И в конце марта 1996 года комнпания AMD с гордостью объявила о появлении на свет нового процессонра пятого поколения - AMD5k86.

4.2.2.1 Экскурсия по внутренней архитектуре.

Процессор AMD5k86, известный на стадии разработки как AMD-K5 или Krypton, является первым членом суперскалярного семейства (Superscalar family) K86. Он соединяет в себе высокую производинтельность и полную совместимость с операционной системой Microsoft Windows.

Суперскалярный RISC-процессор AMD5k86 выполнен по 0ю35-микнронной КМОП - технологии (complimentary metal - oxid semiconductor process) и состоит из 4.3 млн. транзисторов. Его дизайн базируется на богатой истории и обширном опыте архитектур RISC и х86.

По мнению многих специалистов, разработчики чипа AMD5k85 пошли значительно дальше первоначального замысла: создать процессор, имеющий RISC-ядро, и при этом совместимый с набором инструкций х86 означает совместимость с операционными системами Microsoft Windows и всем ПО, написанным под архитектуру х86. Столь счастливое сочетание высочайшей производительности и полной совместимости с Microsoft Windows делает чип AMD5k86 полноправным членом 5-го поколения микнропроцессоров.

Микропроцессор AMD5k86 имеет 4-потоковое суперскалярное яднро и осуществляет полное переупорядочивание выполнения инструкций (full out - of - orderа

Разработанный инженерами компании AMD процесс предваринтельного декодирования позволяет преодолеть присущие архитектуре х86 ограничения (различная длина инструкций). В случае использования иннструкций различной длины, чипы 4-го поколения могут одновременно обнрабатывать 1 команду, процессоры 5-го поколения (Pentium) - 2 команнды. И только микропроцессор AMD5k86 способен обрабатывать до 4 иннструкций за такт.

Использование раздельного КШа инструкций и данных (объем КШа инструкций в два раза превосходит объем КШа данных) исключает возникновение возможных внутренних конфликтов.

Сейчас выпускаются микропроцессоры AMD5k86-P75, AMD5k86-P90 и AMD5k86-P100 производительность которых (Р. - рейтинг) соответствует процессору Pentium с тактовыми частотами 75, 90 и 100 Гц.

Компания Advanced Micro Devices планирует выпустить в этом (1996) году 3 млн. процессоров семейства AMD5k86 со значениями Р. - рейтинга от 75 до 166. Цены на новые процессоры будут сопоставимы с ценами обладающих аналогичной производительностью процессоров Pentium, вероятно, даже несколько ниже. Средняя цена процессора AMD5k86-P75 составляет около $75, чипа AMD5k86-P90 - $99.

Характеристики микропроцессора AMD5k86:

- 4-потоковое суперскалярное ядро с 6-ю параллельно работающинми исполнительными стройствами, составляющими 5-ступенчатый конвенйер;

- 4-потоковый ассоциативный кэш команд с линейной адресацией объемом 16 Кб;

- 4-потоковый ассоциативный кэш данных с обратной записью и линнейной адресацией объемом 8 Кб;

- полное переупорядочивание выполнения инструкций, предваринтельное (speculative) исполнение;

- динамический кэш предсказания переходов объемом 1 Кб; в слунчае неправильного предсказания задержка составляет менее 3 внутреих тактов;

- 80-разрядное интегрированное, высокопроизводительное стройнство выполнения операций с плавающей запятой, обладающее небольшим временем задержки при выполнении операций +/*;

- питающее напряжение - В, система SSM (System Management Mode) для меньшения потребляемой мощности;

- 64-разрядная шина и системный интерфейс помещены в 296-коннтакный корпус SPGA, совместимый по выводам с процессором Pentium (P54C) и процессорным гнездом Socket-7;

- полная совместимость с Microsoft Windows и инсталлированной базой ПО для процессоров архитектуры х86.

4.2.2.2. Пример маркировки микропроцессора AMD5k86-P75.

---------------------------------------------

|

|

1 --------------------

2 -------- AMD5k86тм-Р75

3 ------------------------

4 -------- AMD-SSA/5-75ABQ

|

5 -----------------------

|

|

|

6 -------- HEAT SINK

\

\

Обозначения:

1. P-рейтинг

2. Название

3. Температура корпус

W=55C

Q=60C

X=65C

4. Серийный номер

6. Температурный режим

4.2.2.3. Тесты.

Система- рейтингов измерения производительности процессоров была предложена в начале 1996 года компаниями AMD, Cyrix, IBM и SGS - Thomson Microelectronics. P-рейтинг составляется, по результантам проведения эталонного теста Winstone 96, разработанного издантельством Ziff - Davisа

Следует заметить, что в отличие от системы тестов iComp, конторой пользуется корпорация intel для оценки производительности своих микропроцессоров, тестовый набор Winstone 96 является общедоснтупным.

В своем новом чипе AMD5k86 компания AMD воплотила поистине новаторское сочетание набора инструкций х86 и суперскалярной RISC-архитектуры (reduced instruction set computing architecture). Как тверждают некоторые специалисты AMD, благодаря такому решению микропроцессор AMD5k86 обеспечивает на 30% большую производинтельность, чем процессор Pentium с такой же тактовой частотой. Впрончем, результаты тестирования с использованием пакета тестов Winstone 96 компании Ziff - Davis показывают, что преимущество несколько скромннее.

Тестовая конфигурация:

Материнская плата

Чипсет

ОЗУ

Кэш-память L2

Видеоплата (640х480х256)

Видеодрайвер

Жесткий диск

FIC PA2002

VIA Apollo Master

EDO DRAM объемом 16 Мб

256

PCI Diamond Stealth64 3200

Diamond GT 4.02.00.218 for Windows 95 EIDE Quantum Fireball

AMD5k85-P75 CPU (index 48.8)

Pentium 75 (index 47.4)

AMD5k85-P90 CPU (index 56.7)

Pentium 90 (index 54.9)

4.2.2.4. Материнские платы для AMD5k86.

Список широко распространенных системных плат, протестированных в лабораториях компании AMD и

рекомендованных для становки

Производитель

Модель

Чипсет

BIOS

Abit

PH5 1.3

SiS 551

Award Pentium PCI Sys BIOS (N35)

Abit

PH5 2.1

Intel Triton

Award Pentium PCI Sys BIOS (C4)

Atrend

ATC1

Intel Triton

Award i430-2A59CA29C-00

Atrend

ATC1545 A1

OPTi Viper

Award OPTi Viper

ATS-1545 ver. 0.6.

Biostar

8500TAC A1

Intel Triton

AMI 1993

ECS

TR5510

Intel Triton

Award i430FX-2A59CE1NC-00

ECS

AIO

Intel Triton

Award i430FX-2A59CE1NC-00

FIC

PA2002 1.21

VIA 570

Award 4.052G800

Gigabyte

GA586ATS 1B

Intel Triton

Award Intel 430FX PCI-ISA v.1.26

Hsingtech

M507 1.1

Intel Triton

Award 2/1/1996x

Mycomp (TMC)

PCI54ITS 2.00

Intel Triton

Award i430FX-2A59CM29C-00

Замечание: ранние версии казанных системных плат нуждаются в занмене BIOS на более новую версию, правильно распознающую чип AMD5k86

4.2.2.5. AMD планирует выпустить K5.

Репутация AMD сильно зависит от спешности затянувшегося проекта К5-первой самостоятельной пробы архитектурных сил в области х86. Рождение К5 опасно откладывается же не первый раз. В первом квартале следующего года AMD планирует перевод K5 на технологичеснкий процесс с проектными нормами 0.35 мкм и с трехуровневой металлинзацией, разработанный при содействии с HР и запускаемый на новом занводе AMD Fab 25 в Остине, штат Техас. Это позволит меньшить К5 с

4.2 миллионами транзисторов до 167 кв. мм и поднять процент выхода годных, также тактовую частоту.

По мнению руководства AMD в 1996 году объем выпуска К5 бундет наращиваться достаточно быстро, что позволит отгрузить до конца года более пяти миллионов процессоров. Ответом на вызов Intel с ее процессором Pentium Pro может стать только процессор К6, но же никнто не верит, что его удастся видеть раньше 1997 года. Hесмотря на всемирный переход на процессор Pentium, в следующем году еще могут сохраниться некоторые рынки для 486-х. Эксперты считают, что потребнность таких региональных рынков, как Китай, Индия, Россия, Восточнная Европа и Африка, в 486-х чипах составит до 20 миллионов процеснсоров в 1996 году. AMD рассчитывает, что именно ей дастся постанвить большую часть от этого количества. Поэтому компания повышает тактовую частоту 486-х до 133 Мгц, чтобы конкурировать с низшими версиями процессора Pentium в настольных ПК начального ровня. Однанко, AMD будет силенно наращивать выпуск К5, поскольку 486-е быстро выходят из моды.

4.3. Процессоры NexGen.

В то время: как компания Intel готовила отрасль к шокирующенму выходу в жизнь серийных моделей серверов и настольных машин на Pentium Pro, фирма NexGen представляла форуму свои планы по разранботке процессора Nx686. Этот суперскалярный х86-совместимый процеснсор, к разработке которого подключается еще и команда архитекторов из AMD, снятых с собственного неудачного проекта К6, будет содернжать около 6 млн. транзисторов, включая вычислитель с плавающей точнкой на одном кристалле с процессором (отказ от предыдущего двухкриснталльного подхода, ослабившего Nx586). Технология КМОП с проектными нормами 0,35 мкм и пятислойной металлизацией позволила "упаковать" на одном кристалле семь исполнительных злов: два для целочисленных, один для операций с плавающей точкой, по одному для обработки мультимедиа, команд переходов, команд загрузки и команд записи. Понказатели производительности представители NexGen назвать не смогли, но выразили предположение, что он превзойдет Pentium Pro на 16-разнрядных программах вдвое, а на 32-битовых - на 33 %.

До сих пор мало что известно про Nx686, так как чип еще не анонсировался и NexGen не хочет раскрывать козыри перед конкурентанми в лице AMD, Cyrix и Intel. Однако, NexGen не хочет раскрывать конзыри перед конкурентами в лице AMD, Cyrix и Intel. Однако, NexGen настаивает о том, что Nx686 по производительности сопоставим с интенловским Pentium Pro и AMD K5, и наследует микроархитектуру Nx586, появившуюся в 1994 году. NexGen называет ее RISC86. Базовая ее идея, как и в случае с Pentium Pro и K5, состоит в преобразовании сложных CISC-команд программного обеспечения x86 в RISC-подобные операции, исполняемые параллельно в процессорном ядре RISC-типа. Этот подход, известный под названием несвязанной микроархитектуры, позволяет обонгатить CISC-процессор новейшими достижениями RISC-архитектур и сохнранить совместимость с имеющимся ПО для х86.

В Nx686 эта философия продвинута на новый логический ронвень. Сегодня в Nx586 имеется три исполнительных блока, трехконвейнерное суперскалярное ядро. Он способен выполнять в каждом такте по одной команде х86. Возможности для совершенствования очевидны: Nx586 будет содержать пять исполнительных блоков, четыре конвейера и неснколько декодеров, способных справиться с выполнением двух или даже более команд х86 за один машинный такт. Для этого потребуется встроить дополнительные регистры переименования и очереди команд.

Подход к использованию интегрированного кэш-контроллера и интерфейса для скоростной кэш-памяти остается неизменным. Представинтели NexGen говорят, что они изучают возможность использования криснталла вторичной кэш-памяти по образцу и подобию Intel, тем более что их производственный партнер IBM Microelectronics способен делать статическую память и многокристальные сборки (MCM - multichip modules).

Пример практической реализации технологии МСМ фирмы IBM представляет новая версия процессора Nx586, запланированная к выпуснку на конец этого года и включающая кристалл CPU и FPU в одном корнпусе. Одновременное перепроектирование топологии с масштабированием до размера линии 0.35 микрон позволит компании NexGen основательно меньшить размеры кристалла ЦПУ - до 118 кв. мм - меньше в этом класнсе ничего нет.

NexGen, новичок в группе производителей процессоров х86. Nx596 может параллельно обрабатывать на нескольких исполнительных блоках до четырех простейших операций, которые названы командами RISC86. Процессор К5 имеет похожий четырехпоточный дешифратор, но результаты его работы компания называет R - ops.

4.4. Процессоры Cyrix.

Первая вещь из грандиозного проекта М1 компании Cyrix, наконнец обнародована. Это процессор Сх 6х86-100, монстроподобный криснталл которого сложен и очень дорог для того, чтобы претендовать на массовый выпуск в течении длительного срока. Его проблемы сможет реншить процессор, который пока имеет кодовое название M1rx и опираюнщийся на техно процесс с пятислойной металлизацией, идущий на смену трехслойной версии той же 0.6-мкм технологии. Если проект венчаетнся спехом, то размер кристалла с 394 кв. мм меньшится до 225 кв. мм, тогда у Cyrix появится шанс поднять тактовую частоту до 120 Гц. В этом случае эксперты предсказывают ему производительность в преденлах 176-203 по тесту SPECint92, т.е. на ровне процессора Pentium 133 (SPECint92=190.9) или 150 Гц. Если все обещания сбудутся, то Cyrix сможет продать столько процессоров, сколько произведет. Также компания cyrix предложила компромиссный вариант процессора - 5х86, основанного на ядре 486-го, силенного элементами архитектуры 6х86. Стартовая версия этого гибрида будет совместима по цоколевке с гнезндом 486-го.

4.5.

Sun Microsystems

С появлением UltraSparc, четвертого поколения архитектуры SPARC, компания связывает надежды на восстановление траченных позиций. Он содержит ни много, ни мало, но девять исполнительных блоков: два целочисленных АЛУ, пять блоков вычислений с плавающей точкой (два для сложения, два для множения и одно для деления и извлеченния квадратного корня), блок предсказания адреса перехода и блок загрузки/записи. UltraSparc содержит блок обработки переходов, встроенный в первичную кэш команд, и словно выполняет предсказаые переходы, но не может выдавать команды с нарушением их очереднности. Эта функция перекладывается на оптимизирующие компиляторы.

рхитектура SPARC всегда имела регистровые окна, т.е. вонсемь перекрывающихся банков по 24 двойных регистра, которые могут предотвратить остановки процессора в моменты комплексного переключенния, связанные с интенсивными записями в память. Разработчики компинляторов склонны считать эти окна недостаточным решением, поэтому в UltraSparc используется иерархическая система несвязанных шин. Шина данных разрядностью 128 бит работает на одной скорости с ядром пронцессора. Она соединяется через буферные микросхемы с 128-разрядной системной шиной, работающей на частоте, составляющей половину, треть или четверть скорости процессорного ядра. Для согласования с более "медленной" периферией служит шина ввода-вывода Sbus.

Фирма Sun реализует эту схему на аппаратном ровне с понмощью коммутационной микросхемы, являющейся составной частью схемнонго комплекта окружения. Эта микросхема может изолировать шину памянти от шины ввода-вывода, так что ЦПУ продолжает, например, запись в графическую подсистему или в иное стройство ввода-вывода, а не оснтанавливается во время чтения ОЗУ. Такая схема гарантирует полное использование ресурсов шины и становившуюся пропускную способность

1.3 Гигабайт/с.

В процессоре UltraSparc - II используется система команд Visual Instruction Set (VIS), включающая 30 новых команд для обранботки данных мультимедиа, графики, обработки изображений и других целочисленных алгоритмов. Команды VIS включают операции сложения, вычитания и множения, которые позволяют выполнять до восьми операнций над целыми длинной байт параллельно с операцией загрузки или занписи в память и с операцией перехода за один такт. Такой подход монжет повысить видеопроизводительность систем.

4.6.

Digital Equipment процессор Alpha наиболее тесно следует в русле RISC-философии по сравнению со своими конкурентами, "посрезав излишки сала" с аппаратуры и системы команд с целью максимального спрямления маршрута прохождения данных. Разработчики Alpha уверены, что очень высокая частота чипа даст вам большие преимущества, чем причудливые аппаратные излишества. Их принцип сработал: кристалл 21164 был самым быстрым в мире процессором со дня своего появления в 1995 году. Процессор 21164 в три раза быстрее на целочисленных вынчислениях, чем Pentium-100, и превосходит на обработке числе с планвающей точкой, чем суперкомпьютерный набор микросхем R8 фирмы Mips. Топология процессора следующего поколения 2116А не изменинлась, но она смаштабирована, кроме того, модернизирован компилятор, что повысило производительность на тестах SPECmarks. Предполагается, что готовые образцы нового процессора, изготовленные по КМОП - технонлогии с нормами 0.35 микрон, при тактовой частоте свыше 300 Гц бундут иметь производительность 500 по SPECint92 и 700 по SPECfp92.

Процессоры семейства 21164 на прибегают к преимуществам иснполнения не в порядке очередности (out - of Ц order), больше полагаясь на интеллектуальные компиляторы, которые могут генерировать коды, сводящие к минимуму простои конвейера. Это самый гигантский процеснсор в мире - на одном кристалле размещено 9.3 миллиона транзисторов, большая часть которых пошла на ячейки кэш-памяти. Alpha 21164 имеет на кристалле относительно небольшую первичную кэш прямого отображенния на 8 Кбайт и 96 Кбайт вторичной. За счет вздувания площади криснталла достигнута беспрецедентная производительность кэширования.

В 21164 работает четыре исполнительных блока (два для целых и два для чисел с плавающей точкой) и может обрабатывать по две конманды каждого типа за такт. Он имеет четырехступенчатый конвейер конманд, который "питает" отдельные конвейеры для целых чисел, чисел с плавающей точкой и конвейер памяти. По сравнению с прочими RISC-пронцессорами нового поколения чип 21164 имеет относительно глубокие и простые конвейеры, что позволяет запускать их с более высокой тактонвой частотой.

Конвейер команд вообще не заботится о их зависимости по даым (в отличие от pentium Pro, который является ярким примером машинны данных), он выдает команды в порядке их поступления на свой вход (в порядке следования по программе). Если текущие четыре команды ненвозможно послать сразу все на различные исполнительные блоки, то конвейер команд останавливается до тех пор, пока это не станет вознможным. В отличие от конкурентов 21164 также не использует технику переименования регистров, вместо нее он непосредственно обновляет содержимое своих архитектурных регистров, когда результат достигает финальной ступени конвейера - write - back. Для борьбы с задержками и зависимостью команд по данным в процессоре активно иснпользуются маршруты для обхода регистров, поэтому совместно иснпользуемые операнды становятся доступными до стадии write - back.

Компания Digital продвигает Альфу как платформу для сервенров Windows NT, не как традиционный UNIX-сервер.

4.7. Процессоры Mips.

Mips процессор R1 унаследовал свой суперскалярный дизайн от R8, который предназначался для рынка суперкомпьютеров научнонго назначения. Но R1 ориентирован на массовые задачи. Использованние в R1 динамического планирования команд, которое ослабляет занвисимость от перекомпиляции ПО, написанного для более старых процеснсоров, стало возможным благодаря тесным связям Mips со своим партненром Silicon Graphics, имеющим богатейший тыл в виде сложных графинческих приложений.

R1 первый однокристальный процессор от Mips. Для предотнвращения остановок конвейера в нем использовано динамическое преднсказание переходов, с четырьмя ровнями словного исполнения, с иснпользованием переименования регистров, гарантирующего, что результанты не будут передаваться в реальные регистры до тех пор, пока неяснность по команде перехода не будет снята. Процессор поддерживает "теневую карту" отображения своих регистров переименования. В слунчае неверного предсказания адреса перехода он просто восстанавлинвает эту карту отображения, но не выполняет фактической очистки ренгистров и "промывки" буферов, экономя таким образом один такт.

R1 отличается также радикальной схемой внеочереднной обработки. Порядок следования команд в точном соответствии с программой сохраняется на трех первых ступенях конвейера, но затем поток разветвляется на три очереди (где команды дожидаются обработнки на целочисленном АЛУ, блоке вычислений с плавающей точкой и блонке загрузки/записи). Эти очереди же обслуживаются по мере освобожндения того или иного ресурса.

Предполагаемая производительность R1, выполненного по КМОП-технологии с нормами 0.35 микрон должна достичь 300 по SPECint92 и по SPECfp92.

Программный порядок в конце концов восстанавливается так, что самая "старая" команда покидает обработку первой. Аппаратная поддержка исполнения в стиле out - of - order дает большие преимущества конечному пользователю, так как коды, написанные под старые скалярнные процессоры Mips (например, R4), начинают работать на полной скорости и не требуют перекомпиляции. Хотя потенциально процессор R1 способен выдавать по пять команд на исполнение в каждом такте, он выбирает и возвращает только четыре, не спевая закончить пятую в том же такте.

Одно из двух стройств для вычисления двойной точности с плавающей точкой занято сложениями, другое множениями/делениями и извлечением квадратного корня. Hа кристалле R1 реализован также интерфейс внешней шины, позволяющий связывать в кластер до четырех процессоров без дополнительной логики обрамления.

4.8. Процессоры Hewlett - Packardа

Hewlett - Packard процессор PA-8. Компания Hewlett - Packardа

С целью пропаганды своих микропроцессоров среди других производителей систем компания HP стала организатором организации Precision RISC Organization (PRO). А в 1994 году компания взорвала бомбу, объединившись с Intel для создания новой архитектуры. Это поставило под сомнение будущее PRO.

PA-8 это 64-разрядный, четырехканальный суперскалярный процессор с радикальной схемой неупорядоченного исполнения программ. В составе кристалла десять функциональных блоков, включая два целончисленных АЛУ, два блока для сдвига целых чисел, два блока multiply/accumulate (MAC) для чисел с плавающей запятой, два блока деления/извлечения квадратного корня для чисел с плавающей запятой и два блока загрузки/записи. Блоки МАС имеют трехтактовую задержку и при полной загрузке конвейера на обработке одинарной точности обеснпечивают производительность 4 FLOPS за такт. Блоки деления дают 17-тактовую задержку и не конвейеризированы, но они могут работать одновременно с блоками МАС.

В PA-8 использован буфер переупорядочивания команд (IRB) глубиной 56 команд, позволяющий "просматривать" программу на следуюнщие 56 команд вперед в поисках таких четырех команд, которые можно выполнить параллельно. IRB фактически состоит из двух 28-слотовых буферов. Буфер АЛУ содержит команды для целочисленного блока и блонка плавающей точки, буфер памяти - команды загрузки/записи.

Как только команда попадает в слот IRB, аппаратура просматнривает все команды, отправленные на функциональные блоки, чтобы найнти среди них такую, которая является источником операндов для команнды, находящейся в слоте. Команда в слоте запускается только после того, как будет распределена на исполнение последняя команда, котонрая сдерживала ее. Каждый из буферов IRB может выдавать по две конманды в каждом такте, и в любом случае выдается самая "старая" конманда в буфере. Поскольку PA-8 использует переименование региснтров и возвращает результаты выполнения команд из IRB в порядке их следования по программе, тем самым поддерживается точная модель обнработки исключительных ситуаций.

HP проектировала РА-8 специально для задач коммерческой обработки данных и сложных вычислений, типа генной инженерии, в конторых объем данных настолько велик, что они не мещаются ни в один из мыслимых внутрикристалльных КШей. Вот почему, РА-8 полагается на внешние первичные КШи команд и данных. Слоты в третьем 28-слотонвом буфере, который называется буфером переупорядочивания адресов (Adress - Recorder Buffer - ARB), один к одному ассоциированы со слонтами в буфере памяти IRB. В АРВ содержатся виртуальные и физические адреса всех выданных команд загрузки/записи. Кроме того, АРВ допуснкает выполнение загрузок и записей в произвольном порядке, но с сохнранением согласованности и сглаживанием влияния задержки, связанной с адресацией внешних КШей.

4.9. Процессоры Motorola.

Motorola/IBM процессор PowerPC620 это первая 64-битовая реанлизация архитектуры PowerPC. Имея 64-битовые регистры и внутренние магистрали данных и семь миллионов транзисторов, новому процессору требуется почти вдвое больший и сложный кристалл, чем у PowerPC 604. Модель 620 имеет четырехканальную суперконвейерную схему с шестью исполнительными стройствами: три целочисленных АЛУ, блок плавающей точки, блок загрузки/записи и блок переходов. Последний способен на четырехуровневое предсказание ветвлений в программе и словное иснполнение с использованием схемы переименования регистров.

ПО микроархитектуре RISC-ядра 620-й похож на 604-й. Отличия сводятся в основном к ширине регистров и магистралей данных, такнже к величенному числу станций резервирования для условного исполннения команд. Прибавка производительности достигнута за счет улучншенного шинного интерфейса. Теперь он имеет 128-битовый интерфейс к памяти, по которому за один цикл обращения можно выбрать два 64-бинтовых длинных слова, и 40-битовая шина адреса, по которой можно аднресовать до одного терабайта физической памяти.

В состав шинного интерфейса входить также поддержка кэш-панмяти второго ровня объемом до 128 Мбайт, которая может работать на четверти, половине или на полной скорости ЦПУ.

5. Лабораторные испытания и тестирование микропроцессоров.

5.1. Лабораторные испытания процессоров i386DX.

В 1992 году на рынке появилось три новых МП, способных занместить существующие 386DX и обеспечить повышение характеристик сиснтем на основе i386. Это

RapidCAD, грубо говоря, представляет собой процессор 486DX без внутренней кэш-памяти и с цоколевкой процессора 386. Для прогнрамм он соответствует 386 с сопроцессором, так как все специфичные команды i486 далены из набора команд. Рекламируется этот процессор, как "абсолютный сопроцессор" и, к чему и обязывает такое имя, он предназначен для замены процессора 386DX в существующих системах и резкого повышения производительности операций с плавающей точкой, таких, как CAD, электронные таблицы, математические программные панкеты (SPSS, Mathematica и т.д.). RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA (132 вывода), станавливающийся в гнездо для i386, включает в себя ЦПУ и модуль операций с плавающей точкой, и RapidCAD-2, в корпусе PGA (68 выводов), устанавливающийся в гнезндо для сопроцессора i387, включает в себя ПЛМ, подающий сигнал на схемы системной платы для правильной обработки особых ситуаций при операциях с плавающей точкой. Большинство операций исполняется в тенчение одного цикла, как и в i486. Однако зким местом является иннтерфейс шины 386, так как каждый цикл шины равен двум циклам процеснсора. Это значит, что команды выполняются быстрее, чем считываются из памяти. Поскольку операции с плавающей точкой выполняются медлеее обычных команд, то замедление на них не сказывается, и они вынполняются с такой же скоростью, как и на i486DX. Именно поэтому RapidCAD позволяет получить более высокие характеристики с плаваюнщей точкой, чем любая комбинация 386/387. Результаты теста SPEC, стандартного теста для машин под UNIX, показывают, что RapidCAD снкоряет операции с плавающей точкой на 85%, с целыми числами - на 15% по сравнению с любой комбинацией 386/387 при одинаковой тактонвой частоте. Потребляемая мощность при 33 Гц составляет 3500 мВт. Текущая цена RapidCAD 33 Гц составляет 300$.

Предполагается, что процессор фирмы C&T 38600DX полностью совместим с i386DX. В отличие от процессора Am386 фирмы AMD, котонрый использует микрокод, идентичный микрокоду Intel 386, в процессонре 38600DX использован патентно чистый микрокод, для обеспечения полной совместимости в набор команд даже включена недокументировя команда LOADALL386. Некоторые команды выполняются быстрее, чем в i386. C&T также выпустила процессор 38605DX, включающий кэш-память команд на 512 байт, что еще более повысит его производительность. К сожалению, 38605DX выпускается в корпусе PGA (144 вывода) и не монжет быть становлен непосредственно в разъем i386DX. При проведении испытаний я заметил, что у 38600DX есть серьезные проблемы коммунинкации ЦПУ- сопроцессор, и из-за этого скорость выполнения в большиннстве программ операций с плавающей точкой у него падает ниже ровня i386/i387. Эта проблема существует для всех производимых на настоянщий момент 387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87, Cyrix 83D87, Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети тоже проводил такие тесты с 38700DX и пришел к ананлогичным выводам. Он связался с C&T, и ему ответили, что знают об этом. Средняя потребляемая мощность 38600DX 40 Гц - 1650 Мвт, что меньше, чем потребление i386 33 Гц. Текущая цена 38600DX 33 Гц - 80$.

Процессор Cyrix 486DLC - последняя новинка на рынке заменнителей i386DX. Набор его команд совместим с i486SX, становлена 1 КВ кэш-память и аппаратно реализованный 16х16 бит умножитель. Исполннительное стройство 486DLC, созданное с использованием некоторых принципов RISC, выполняет большинство команд за один цикл. Аппаратнный умножитель перемножает 16-разрядные значения за 3 цикла, вместо 12 - 25 циклов у i386DX. Это особенно добно при вычислении адресов (код, генерируемый некоторыми неоптимизирующими компиляторами, монжет содержать много команд MUL для доступа к массивам) и для прогнраммных вычислений с плавающей точкой (напр., при эмуляции сопроцеснсора). Внутренняя кэш-память представляет собой объединенную память команд и данных сквозной записи, и может быть конфигурирована, как память с прямым отображением, или как 2-канальная ассоциативная. Из-за необходимости обеспечения полной совместимости после перезагнрузки процессора кэш-память отключается, и должна быть включена с понмощью небольшой программы, предоставляемой фирмой Cyrix. Если кэш-память включена при загрузке, (напр., при "горячей" перезагрузнке, Ctrl - Alt - Del), BIOS моего РС (пр- ва AMI) зависает при загрузке, и мне приходится либо выполнять рестарт процессора, либо отключать кэш перед перезагрузкой. Это одна из причин того, что после запуска процессора кэш-память отключается. Я верен, что в следующих вернсиях BIOS фирмы AMI это будет чтено и встроенная кэш-память будет поддерживаться. Кэш-память помогает процессору 486DLC преодолеть огнраничения интерфейса шины 386, хотя процент попаданий составляет не более 50%. Фирма Cyrix предусмотрела некоторые возможности правленния кэш-памятью процессора, что, конечно, лучшит связь внешней и внутренней кэш-памяти. Современные системы 386 не воспринимают эти правляющие сигналы, не имеющие значения для i386DX, но в дальнейншем системы, разработанные с четом этих возможностей 486DLC, могут использовать их. Встроенный кэш 486DLC допускает до 4-х некэшируенмых областей памяти, что может быть очень полезно в том случае, еснли ваша система использует периферийные стройства, отображаемые в память (напр., сопроцессор Weitek). В существующих системах 386 пенресылки DMA (напр., SCSI контроллера, платы звука) могут отключить внутренний кэш, так как не существует других способов обеспечить соответствие кэш-памяти и основной памяти, что, конечно, снижает ханрактеристики 486DLC. Потребляемая мощность 486DLC 40 Гц - 2800 Мвт. Немецкий дистрибьютор продает 486DLC 33 Гц по текущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не во всех обнстоятельствах, особенно критичен в этом отношении многозадачный занщищенный режим (улучшенный режим MS- Windows). При использовании 486DLC совместно с Cyrix EMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87 машина зависает из-за проблем синхронизации между ЦПУ и сопроцессором при исполнении команд FSAVE и FRSTOR, сохраняющих и восстанавливающих состояние сопроцессора при переключении задач. Лучше всего использовать 486DLC с Cyrix 387+ (распространяется только в Европе) или Cyrix 83D87 выпуска после июля 1992, являющийнся наиболее мощным сопроцессором среди совместимых сопроцессоров 486DLC. Если у вас же есть сопроцессор Cyrix 83D87, и вы хотите знать, совместим ли он с 486LCD, я рекомендую вам мою программу COMPTEST, распространяемую как CTEST257.ZIP через анонимные ftp из garbo@uwasa.fi или другие ftp-серверы. Если программа сообщит о сопнроцессоре 387+, то у вас установлен либо 387+, либо аналогичная нонвая версия 83D87 и проблем с совместимостью не будет.

При испытаниях использовалась система:

ппаратная конфигурация: 33,3/40 Гц системная плата, комплект микросхем Forex, кэш 128 КВ с нулевым состоянием ожидания, прямое отображение, сквозная запись, один буфер записи, 4 байта на строку, 4 цикла задержки при кэш-промахе. 8 МВ основной памяти, среднее соснтояние ожидания 1,6 цикла.

Программная конфигурация: MS-DOS 5.0, MS Windows 3.1, HyperDisk

4.32 в режиме обратной записи, используется 2 МВ расширенной памяти, в качестве менеджера памяти используется 386MAX 6.01. Эта программа также обеспечивает DPMI в некоторых тестах.

Результаты тестов

Для тестов Whetstone, Drhystone, WINTACH, DODUC, LINPACK, и Savage больший показатель означает большую производительность.

Для тестов MAKE RTL, MAKE TRANK и теста String- Test меньший показатель означает большую производительность.

33,3

386DXа

кэш выкл. кэш вкл. Тесты с целыми числами

Whetstone (kWhet/s)

Drhystone(C) (Dhry./s)

Drhystone(Pas) (Dhry./s)

String-Test (ms)

MAKE RTL (s)

MAKE TRANCK (s)

WINTACH

Тесты с плавающей запятой

DODUC (Индекс скорости)

LINPACK (Mflops)

(Mflops)

Whetstone (kWhet/s)

Savage (решений/с)

40

386DXа

Тесты с целыми числами

Whetstone (kWhet/s)

Drhystone(C) (Dhry./s)

Drhystone(Pas) (Dhry./s)

String-Test (ms)

MAKE RTL (s)

MAKE TRANCK (s)

WINTACH

Тесты с плавающей запятой

DODUC (Индекс скорости)

LINPACK (Mflops)

(Mflops)

Whetstone (kWhet/s)

Savage (решений/с)

Среди испытанных процессоров Cyrix 486DLC обладает самой большой производительностью по целым числам. С включенной внутреей кэш-памятью производительность по целым числам на одинаковой такнтовой частоте 486DLC на 80% превышает 386DX, среднее величение сконрости работы прикладных программ составляет 35%. При работе с прикнладными программами, использующими операции как с целыми числами, так и с плавающей точкой, включенный кэш обеспечивает на 5% - 15% более высокие показатели по сравнению с работой без КШа. Скорость операций с плавающей точкой по сравнению с i386DX величивается на 15% - 30%

Intel RapidCAD при работе вместо i386DX обеспечивает самые высокие характеристики при выполнении операций с плавающей точкой. Прикладные программы, выполняющие интенсивные операции с плавающей точкой, работают быстрее на 60% - 90% по сравнению с i386DX/387DX, отставая от i486DX при той же тактовой частоте по скорости операций с плавающей точкой всего на 25%. Скорость операций с целыми числами величивается на 15% - 35% по сравнению с i386DX/i387DX.

Процессор Chips & Technologies 38600DX обладает несколько бонлее высокими характеристиками при работе с целыми числами, чем i386DX, давая среднее величение скорости порядка 10%.

 

 

 

5.2. Результаты тестирования микропроцессоров с помощью панкета The Speed Test.

Для тестирования различных микропроцессоров иногда применняют специальные пакеты программ processor benchmarks. Ниже приведенны результаты тестирования процессоров с помощью пакета программ Speed Test, ARA Copyright (C) 1994,95,96 Agababyan Robert Assotiation Used TMi0SDGL(tm)

Pentium iP5-200(3-200), 512K PB

Pentium iP5-200(2.5-200), 512K PB

Pentium iP5-200(2.5-200)

Pentium iP5-200(3-200)

Pentium iP5-180, 512K PB

Pentium iP5-180

Pentium iP55-166, Intel Triton, IWill TSW2

Pentium iP5-166, 512K PB

Pentium iP5-166

Pentium iP5-160, 512K PB

Pentium iP5-160

Pentium iP5-150, 512K PB

Pentium iP5-150

Pentium iP5-133, 512K PB

Pentium iP5-133

Pentium iP54-75(1.5-120), Intel Triton

Pentium iP54-75(2-120), Intel Triton

Pentium iP54-75(2-120), SiS 501/503

Pentium iP5-100(2-120), Intel Triton, ASUS P55-TP4

Pentium iP5-120(1.5-120), 512K PB

Pentium iP5-120, 512K PB

Pentium iP5-120(1.5-120)

Pentium iP5-120

Cx5x86-M1sc-100(3-150,Opt)

Cx5x86-M1sc-100(3-150,Opt)

Am5x86-133-X5-P75(4-200)

Pentium iP5-100, ALR Revolution

Pentium iP5-100, Intel Triton, ASUS P/I-P55TP4XE

Pentium iP5-100, Intel Triton

Pentium iP54-75(100), Intel Triton

Am5x86-133-X5-P75(3-180), UMC6BF/1F

Cx5x86-M1sc-100(3-120,Opt)

Pentium iP54-75(90), Intel Triton, ASUSTeK P54-TP4а

Cx5x86-M1sc-100(3-120,Opt), SiS 471, GMB-486SG

Am5x86-133-X5-P75(4-160), SiS 471, BTC 4SLD5.1

Am5x86-133-X5-P75(4-160), SiS 496/7, ASUS PVI-SP3

Am5x86-133-X5-P75(4-160), SiS 471

Am5x86-133-X5-P75(4-160), SiS 496 PCI

Am5x86-133-X5-P75(4-160)

Cx5x86-M1sc-100(3-120), SiS 496/7, ASUS PVI-SP3

Cx5x86-M1sc-100(3-120,Opt), SiS 471, GMB-486SG

i80486DX4-100(120), UMC 8498F

Am5x86-133-X5-P75(3-150), SiS 471, BTC 4SLD5.1

Cx5x86-M1sc-100(Opt)

Nx586-90(100), NxVL System Logic, Alaris

Cx5x86-M1sc-100(Opt), SiS 471, GMB-486SG

Am5x86-133-X5-P75, SiS 471, BTC 4SLD5.1

Am5x86-133-X5-P75, SiS 496/7, ASUS PVI-SP3

Cx5x86-M1sc-100, SiS 496/7, ASUS PVI-SP3

i80486DX4-100, UMC 881

Nx586-90, NxVL System Logic, Alaris

Pentium iP5-60(66), PCI58PL

Pentium iP5-60(66), SiS 501/502/503, ASUS P5-SP

Cx5x86-M1sc-100, SiS 471, GMB-486SG

i80486DX2-66(4-100), PC Chips 18

i80486DX4-100, SiS 82C471, SOYO

OverDrive iDX4ODPR100 (486DX4-100)

i80486DX4-100, Compaq ProLinea 4/100

Am80486DX4-120SV8B, SiS 471, BTC 4SLD5.1

Am80486DX4-120, SiS 471, SOYO

Pentium iP5-60, Compaq DeskPro XL 560

Pentium iP5-60, Compaq Proliant

Pentium iP54-75(60), Intel Triton

Pentium iP5-60, OPTi 596/546/82, Bison v1.0

Pentium iP5-60, SiS 501/502/503, ASUS P5-SP

Am80486DX2-80(100), UMC 8498F

Am80486DX4-100, PC Chips 18

Am80486DX2-80(100), SiS 471

Cx80486DX2-100, Opti VIP

i80486DX4-100(75), UMC 881

Pentium iP54-75(50), Intel Triton

Pentium iP54-75(45), Intel Triton

U5-S33(60), UMC 491F

i80486SX2-50(80), SiS 471, S486G

i80486DX2-S-80, PC Chips 18

i80486DX2-80, Symphony Haydn II

i80486DX2-S-80, UNICHIP U4800VLX, U486 WB

Cx80486DX2-66(80), OPTi 495SLC

U5-S33(50), SiS 471, AV7541

U5-S33(50), SiS 471, SOYO

U5-S33(50), UMC 491F

U5-S33F(50), UMC 8498F

U5-S33(50)

U5-S33(50), CONTAQ 82C596A, G486VLI

U5-S40(50)

i80486DX2-66, DELL

Am80486DX2-66, Forex 46C421

Am80486DX2-66, Bioteq 82C3491

Am80486DX2-66, OPTi 495SLC

i80486DX2-66 &E5, AcerMate 466

i80486DX2-66, ALI M1429/M1431

i80486DX2-66, SiS 82C471

i80486DX2-66, Symphony, Predator I

i80486DX2-66, OPTi 82C682, ALR Evolution 4

i80486DX2-66, PC Chips 11&13

Am80486DX2-66, IMS 8849

i80486DX2-66, Compaq ProLinea MT 4/66

Am80486DX2-66, UNICHIP U4800VLX, U486 WB

i80486DX2-66, Intel Champion

Cx80486DX2-66, UMC 82C491F

OverDrive iDX2ODPR66 (486DX2-66)

Am80486DX2-66, SiS 82C471

i80486DX2-66, Symphony Haydn II

i80486DX2-66, SiS 82C471

U5-S33(40), SiS 82C471

U5-S33F(40), UMC 8498F

U5-S33(40), Expert 4045

i80486DX-50, UMC 82C480

i80486DX2-50, Headland HT342/HT321

i80486SX-50, SiS 82C471

Am80486DX-50, UMC 82C491F

i80486DX-50

i80486DX2-50, OPTi 495SLC

Cx486S-40(50), UMC 82C491F

U5-S33, SiS 82C471

U5-S33, Expert 4045

IBM486SLC2-66, OPTi 495XLC

i80486SX-33(40), SiS 82C471

i80486SX-33(40), OPTi 82C495SLC

Am80486DX-40, OPTi 82C495SLC

i80486SX-33(40) &E5, Forex 521

i80486SX-33(40), Forex 521

Am80486DX-40, SiS 82C461

Cx486DX-40

Ti486DLC/E-40BGA, PC Chips, M321

Cx486DLC-40

Tx486DLC-40, OPTi 495SLC

Cx486DLC-40GP, SARC RC4018A4

IBM 486SLC2-50, WD7600

Cx486SLC-40, SARC RC2016A4, M396F

i80486SX-33, SiS 82C471

i80486DX-33, HP Vectra 486/33VL

i80486DX-33, OPTi 82C498, Simens-Nixdorf PCD-4H

i80486SX-20(33), Symphony

i80486DX-33, Intel Champion

i80486DX-33, Toshiba T9901C, LapTop

i80486DX-33, UMC 82C481

i80486SX-25, IBM PS/1

i80486SX-25, SiS

i80486SX-25, HiNT CS8005

i80486SX-25, HP Vectra 486SX/25VL

Am80386DX-40, ALI M1429/M1431

Am80386DX-40, CD-COM, M326

Am80386DX-40 WC, SARC

Am80386DX-40, UMC 82C491F

Am80386DX-40, OPTi 82C391

Am80386DX-40, UNICHIP U4800VXL

Am80386DX-40, PC Chips 5,6

Am80386DX-40, UMC 80C481

Am80386DX-40, OPTi 495XLC

Am80386DX-40, Forex FRX46C402,411

Am80386SX-40, P9 MXIC

i80386DX-33

Am80386SX-40, M396F

Am80386SX-40, Acer M1217

Am80386SX-40, ALI M1217

Am80386SX-40, PC Chips 2

i80386SX-33, Acer M1217

i80386SX-33

i80386DX-25

i80386SX-33, HP Vectra 386SX/33N

Am80386SX-33, Acer M1217

80286-25

80286-20

Harris 80286-20, UMC 82C208L

80286-16, HT12

i80286-12.5

i80286-12

i80286-10, IBM PS/2

i80286-10, IBM PS/2 60

i8088-9.54,

i8088-7.16,

i8088-4.77,

i8088-4.77,

i8088-4.77,


6. Сравнительный анализ.

В середины октября 1995 года в г. Сан-Хосе (Калифорния) соснтоялся очередной Микропроцессорный Форум. В прошлом году на нем денмонстрировались прототипы процессоров IBM Power PC 620, MIPS R1, SUN UltraSPARC, HP PA-8 и DEC Alpha 21164.

Из прошлогодних процессоров - дебиторов до рынка дошел только процессор Alpha 21164/300. Его производительность по тесту SPECint92 составила 341 единицу. Пребывая с такой потрясающей производинтельностью в лидерах гонки на быстродействие процессоров, в ноябре Alpha пропустила вперед компанию Intel с процессором Pentium Pro. Страсти накалились нешуточные и вот на нынешнем форуме Digital сообнщила, что в декабре приступит к выпуску нового варианта этого пронцессора - Alpha 21164A с тактовой частой Гц, выполненного по технологии 0.35 мкм. Проектируемая производительность 500 по SPECint92.

Hewlett - Packard анонсировала 32-разрядный процессор архитекнтуры РА следующего поколения РА-7300LC с встроенными функциями мультимедиа. Hачало его выпуска по 0.5 мкм технологии возможно во второй половине следующего года. Этот первый процессор PA-RISC, осннащенный внутренними 64 Кбайт КШами первого ровня для команд и для данных, предпочтительно будет иметь 200 SPECint92 и 275 SPECfp92.

Через год после объявления процессора UltraSPARC фирма SPARC Technology представила новый проект UltraSPARC- II. Hовый процессор будет иметь 5.4 млн. транзисторов, изготавливаться по технологии

0.35 микрон, работать на частоте 250-300 Гц. Проектируемое быстрондействие 250 Гц версии - 350 SPECint92 и 550 SPEFfp92. Кроме базонвой системы команд, процессор будет оснащен набором из 30 новых конманд Visual Instruction Set, которые предназначены для быстрой обранботки видеофайлов в формате MPEG-2, рендеринга трехмерных оболочек, видеоконференцсвязи.

Рождение Pentium Pro восхитительная новость, но оно неизмео поднимает несколько серьезных вопросов. Hа самом ли деле это полнностью новое поколение процессора Pentium? Побила ли Intel своих конкурентов окончательно? Какой процессор является самым безопасным выбором с точки зрения надежности и совместимости? Какой процессор наиболее выгоден с точки зрения соотношения цены и производительноснти? Сегодня с полным основанием можно спросить, насколько он сравнним со своими RISC-оппонентами? Hе старел ли лозунг Apple о том, что Power Mac перспективнее, чем линия x86?

Hа все вопросы можно ответить в принципе твердительно. Коннкуренты из лагеря х86 пока не могут на деле подтвердить свои претеннзии на равенство или превосходство. Hичего живого или приличного (Cyrix) на руках пока нет. А ценовой ориентир Intel известен: наснтольный high - endа

Если даже производители рабочих станций на RISC-процессорах смогут в следующем году совершить рывок в производительности, то разрыв между Intel, исполняющим подавляющую часть ПО, и машинами RISC будет достаточным, чтобы преимущество рабочих станций было непнреодолимым.

В первом номере Computer Week Moscow можно найти пассаж иннтересного характера. Дословно: "Опытные системы P6 способны на большее, чем просто выдерживать конкуренцию со стороны других рабончих станций среднего класса. При непосредственном сопоставлении ранбочих станций Intergraph на 200-Гц процессоре Pentium Pro и Silicon Graphics Indigo-2 Extreme с 200-Гц процессором Mips R4400, последнняя на тестах iSPEC показала порядка 160 единиц, тогда как оценки Intel для системы P6 полной конфигурации соответствуют 366 единицам."

При создании процессора Pentium Pro делался пор на способнности этой микросхемы выполнять графический рендеринг и работать с 32-разрядным кодом.

Pentium Pro явно выламывается из рамок процессора Pentium и принадлежит шестому поколению архитектуры Intel x86. Раньше все коннкуренты, изготовители процессоров-клонов двигались в фарватере орингинала, копируя его с некоторыми компромиссами, тем самым, обрекая себя на все большее отставание и замкнутость на вторичных рынках. Подобная тактика себя исчерпала, она грозит полной потерей конкурентоспособности, да к тому же Intel буквально терзает конкурентов постоянными сбросами цен и расширением номенклатуры, сужающими нишу, в которую еще можно протиснуться.

Вот почему AMD, NexGen и Cyrix перешли недавно на собствеый курс, отказавшись от безнадежного копирования схем Intel.

Hо принципиальной прорасти между конкурентами нет. В некотонрых случаях Pentium Pro более сложен, чем Nx586, K5 и M1, в других менее. В целом же схема P6 сравнима с прочими процессорами; наибонлее близок к ней дизайн К5, как считают эксперты.

Особенность подхода Intel к созданию гибрида CISC/RISC закнлючается в формуле dynamic execution (динамическое исполнение). Принмерно такие же базовые принципы вы обнаружите, если станете разбинраться подробно с архитектурой последних RISC-процессоров IBM/Motorola PowerPC 604 и Power PC 620, Sum UltraSparc, Mips R1, Digital Alpha 21164 и HP PA-8.

Разительно сходство подхода разных фирм к гибридизации поднходов CISC и RISC. Внешне Pentim Pro выглядит традиционным CISC-пронцессором, совместимым со всем наработанным программно-аппаратным фондом. Знакомый "фасад" прикрывает от пользователя RISC-подобное ядро. Между "фасадом" и "задними комнатами" работает мнейший декондер, разбивающий сложные и длинные команды х86 на более простые опенрации, похожие на команды RISC - компания Intel называет их u-ops или micro - ops. Эти micro - ops поступают в ядро процессора, котонрое их буквально перелопачивает. Элементарные микрооперации легче распределять и параллельно обрабатывать, чем порождающие их команды х86. Как бы они не назывались, цель преследуется одна: преодолеть ограничения системы команд х86, но сохранить совместимость с сущеснтвующим программным обеспечением х86. Внешне - на взгляд программиснта, пишущего программы - все эти ЦПУ выглядят как стандартные х86-совместимые CISC-процессоры. А внутри они работают как совремеейшие модели RISC-чипов.

Hо сегодня Pentium Pro "живее" и быстрее не только любого из "живых" процессоров архитектуры х86, включая Nx586 и Cyrix6x86, но и любого из выпускаемых RISC-процессоров.

Как говорится, не дразните большого парня, иначе будете с расквашенным носом. Именно таков смысл послания Intel в адрес конкунрентов: NexGen, Cyrix и AMD.


7. Pentium II.

7.1 Pentium II

Выпущенный с середины 1997 года, Pentium II ввел ряд больших изменений в мир процессоров PC.

Во-первых, чип и системный кэш второго ровня соединялись по выделенной шине, способной работать на частоте шины процессор-система.

Во вторых, процессор, вторичный кэш и тепло отвод были смонтированы на небольшой плате, вставлявшейся в разъем на системной плате, что больше напоминало карту расширения, чем традиционную схему процессор/гнездо. Intel окрестил это Single Edge Contact cartridge (SEC) - односторонне контактный картридж. В этом картридже находятся шесть отдельных компонент - процессор, четыре индустриально стандартных burst-static-cache RAM и один tag RAM. Дизайн SEC картриджа наделял важными преимуществами. PGA-компоновка Pentium Pro требовала 387 контактов, в то время как SEC-картридж - только 242. меньшение на треть числа контактов произошло благодаря наличию в картридже дискретных элементов, таких как замыкающие резисторы и конденсаторы. Эти элементы обеспечивают расщепление сигналов, что значит намного меньшее число требуемых разъемов питания. Разъем SEC-картриджа использует так называемый Slot 1 и воспринимается как принимающий эстафету у ходящего Socket 7.

Третье изменение - в большем синтезе, так как Pentium II объединяет Dual Independent Bus (DIB) от Pentium Pro c технологией MMX от Pentium MMX, формируя новый вид - гибрид Pentium Pro/MMX. Таким образом, внешне очень отличный от предыдущих интеловских процессоров, Pentium II внутренне являет собой смесь новых технологий и лучшений старых чипов.

И наконец, в отличие от Pentium Pro, работающего на 3.3v, Pentium II питается от 2.8v, позволяя Intel пускать его на больших частотах без чрезмерного величения требование к мощности. В то время, как 200MHz Pentium Pro с 512kb кэша потребляет 37.9 ватт, 266MHz Pentium II с 512kb кэша сжигает 37.0 ватт.

Подобно Pentium Pro, Pentium II применяет интеловскую Технологию Динамического Исполнения. Когда программная инструкция считывается в процессор и декодируется, она попадает в исполняемый пул. Технология Динамического Исполнения принимает три основных подхода к оптимизации способа обращения процессора с кодом. Множественные Предсказания Ветвлений проверяют программный поток вдоль нескольких ветвей и предсказывают, где в памяти находится следующая инструкция.

Когда процессор читает, он также проверяет следующие инструкции в потоке, скоряя в результате рабочее течение. Анализ Потока Данных оптимизирует последовательность, в которой инструкции будут выполняться, проверяя декодированные инструкции и определяя, готовы ли они для обработки или зависят от других инструкций. Спекулятивное Выполнение величивает скорость таких инструкций просмотром вперед от текущей инструкции и обработкой дальнейших инструкций, которые вероятно могут понадобится. Эти результаты хранятся как спекулятивные до тех пор, пока процессор не определит, какие ему нужны, какие - нет. С этой точки инструкция возвращается в нормальную очередь и добавляется к потоку.

У Технологии Динамического Исполнения есть два основных преимущества: Инструкции обрабатываются быстрее и эффективнее, чем обычно, и, в отличие от CPU с применением RISC архитектуры, программы не надо перекомпилировать для извлечения выгод процессора. Процессор все делает на лету.

Значительной новой особенностью является даление вторичного кэша из собственно процессора на отдельную кремниевую пластину в картридже. Процессор читает и пишет данные в кэше используя специализированную высокоскоростную шину. Называемая задней (backside) шиной, она отделена от системной шины процессор-память (сейчас называемой передней (frontside) шиной). Процессор может использовать обе шины одновременно, но архитектура двойной независимой шины имеет другие преимущества.

Хотя шина между процессором и кэшем второго ровня работает медленнее, чем на обычном Pentium Pro (на половине скорости процессора), она чрезвычайно масштабируема. Чем быстрее процессор, тем быстрее кэш, независимо от 66MHz передней шины. Вдобавок, передняя шина может быть увеличена с 66 до 100MHz без влияния на шину кэша второго ровня. Также очевидно, что наличие памяти на одном кристалле с процессором негативно сказывается на проценте выхода годных 512kb Pentium Pro, сохраняя высокими цены.
Pentium II опирается на GTL+ (gunning-transceiver-logic) логику хост-шины, допускающую естественную поддержку двух процессоров. Во время выхода это обеспечивало стоимостно эффективное минималистское двухпроцессорное решение, допускаемое симметричной мультипроцессорностью (SMP). Двухпроцессорное ограничение налагалось не самим Pentium II, поддержкой чипсета. Изначальное ограничение чипсета двухпроцессорной конфигурацией позволяло Intel и поставщикам рабочих станций предлагать двухпроцессорные системы как временное и экономичное решение, что по другому и не было возможно. Это ограничение было снято с середины 1998 года с выходом чипсета 450NX, поддерживающего от одного до четырех процессоров. Чипсет 440FX, содержащий чипы PMC и DBX, не допускал чередования (interleaving) памяти, но поддерживал EDO DRAM, позволяя лучшать производительность памяти меньшением ожидания.

Когда Intel проектировал Pentium II, он также взялся за слабую 16-битную производительность его предшественника. Pentium Pro роскошно работает с полностью 32-битным обеспечением, таким как Windows NT, но опускается ниже стандартного Pentium'а, обрабатывая 16-битный код. Это влечет худшую чем Pentium производительность под Windows 95, большие части которой пока 16-битны. Intel решил эту проблему использованием пентиумного кэша с дескрипторами сегментов в Pentium II.

Как и Pentium Pro, Pentium II чрезвычайно быстр в арифметике плавающей точки. В сочетании с Accelerated Graphics Port (AGP) это делает Pentium II мощным решением для высокопроизводительной 3D графики.

7.2 Deschutes

MHz воплощение Pentium II под кодовым названием Deschutes (по реке, текущей в Орегоне), было анонсировано в начале 1998 года с планируемыми в течение года 400MHz и выше. Имя Deschutes в действительности относится к двум разным линиям CPU.

Версия для Slot 1 - ничего более, чем слегка эволюционировавший Pentium II. Архитектура и физический дизайн идентичны, за исключением того, что Deschutes Slot 1 частью сделан с использованием 0.25-микронной технологии, введенной осенью 1997 года с ноутбучным процессором Tillamook, по сравнению с 233-300MHz версиями, выполненными по 0.35-микронному процессу. Применение 0.25-микрон означает, что транзисторы на матрице физически ближе между собой и CPU потребляет меньше энергии, следовательно рассеивает меньше тепла на данной частоте, позволяя ядру тикать на больших частотах.

Все иное у Slot 1 Deschutes идентично обычному Pentium II. Смонтированный на основание и заключенный в SEC картридж, он поддерживает набор инструкций MMX и общается с 512kb вторичного кэша на половинной частоте ядра. Он имеет тот же конечный коннектор, и работает на тех же системных платах с теми же чипсетами. Как таковой он работает с 440FX или 440LX на внешней частоте 66MHz.

С весны 1998 года большой шаг в производительности пришел со следующим воплощением Deschutes, когда вышел новый чипсет 440BX, допускающий 100MHz передачу по системной шине, меньшая закупоривание данных и поддерживая частоты от 350 до 400MHz.

Другой процессор, зовущийся Deschutes, относится к Slot 2, выпущен с середины 1998 года как Pentium II Xeon. Intel разбил Slot 1 и Slot 2 Deschutes на взаимодополняющие товарные линии, где Slot 1 предназначен для массового производства, Slot 2 нацелен на high-end серверы и туда, где цена вторична по отношению к производительности.

7.3 Мобильный Pentium II

Естественное продвижение маломощного (в смысле энерго потребления/рассеивания) семейства Pentium II Deschutes на рынок портативных PC осуществилось с выпуском линейки мобильных Pentium II в апреле 1998 года. Новый процессор и его компаньон мобильный 440BX чипсет, изначально были доступны в 233 и 266MHz вариантах, скомпонованные в существующий мобильный модуль (MMO) или новый мини-картридж формат. Intel ожидает к концу 1998 года более половины из снаряженных его мобильными процессорами PC будут же Pentium II, срок мобильных Pentium II Tillamook окончится к середине 1 года.

7.4 Celeron

В попытке лучшего довлетворения сектора дешевых PC, до настоящего времени вотчины производителей клонов, AMD и Cyrix, продолжающих развивать наследованную архитектуру Socket 7, Intel выпустил свой ряд процессоров Celeron в апреле 1998 года.

Основанный на той же P6 архитектуре, что и Pentium II, и используя тот же 0.25-микронный процесс, Celeron-системы предлагают полный комплект последних технологий, включая поддержку AGP графики, ATA-33 жестких дисков, SDRAM и ACPI. Celeron будет работать на любом интеловском Pentium II чипсете, поддерживающим 66MHz системной шины, включая 440LX, 440BX и новый 440EX, специально спроектированный для рынка 'базовых' PC. В отличие от Pentium II с его SEC картриджем, Celeron не имеет защитного пластикого покрытия вокруг карт процессора, что Intel называет Single Edge Processor Package (SEPP). Он полностью совместим со Slot1, что позволяет использовать существующие платы, но механизм крепления для карты CPU не адаптирован для форм фактора SEPP.

Первые 266 и 300MHz Celeron'ы без кэша второго ровня встретили мало энтузиазма на рынке, не неся или неся мало преимуществ над системами-клонами Socket 7. В августе 1998 года Intel пополнил ряд Celeron семейством процессором, названных Mendocino. Снабженный 128kb вторичного кэа на матрице, работающего на полной частоте процессора, и соединяясь через внешнюю 66MHz шину, новый Celeron стал намного более живым, чем его вялый предшественник. Отчасти путано, две доступные версии получили названия Celeron и 300a. Первый является основной версией, совместимый с существующей интеловской архитектурой, в то время как второй патентует Pin 370 socket, отличный от Socket 7 и Socket 1, нацеленный на дешевые low-end машины.

C начала июля 1998 года по всему миру проходила серия мероприятий, посвящённых представлению самого мощного процессора архитектуры х86 корпорации Intel. Задолго до этого из информации, размещённой на Web-сайтах Intel стало известно его название и назначение. Особо подчёркивалось, что слово Xeon нежно произносить как Зеон, но российское представительство приняло решение подчинить это название нормам русского (и греческого) языка. Так что в России мы будем иметь дело с Ксеоном,- ведь есть же у нас Ван Клиберн и Мехико.

    Новый процессор, к слову, стал подарком компании-производителя самой себе по случаю тридцатилетия.

   Первое, что бросается в глаза, - необычно крупный размер процессорного картриджа в который лпакуется Xeon. Он предназначен для становки в разъём  новой конструкции Slot 2. По словам разработчиков, это связанно с величением ёмкости кэш-памяти второго ровня. В настоящий момент процессоры Xeon с единой тактовой частотой поставляются в двух вариантах: с 512 Кбайт и 1 Мбайт КШа L2. Но же в текущем году планируется довести ёмкость кэш-памяти второго ровня до 2 Мбайт и повысить тактовую частоту до 450 Гц. Напомню, что старый Pentium II комплектовался лишь 512 Кбайт.

    Но ещё больший интерес вызывает тот факт, что конструкторы смогли заставить L2-кэш работать на тактовой частоте процессорного ядра. Напомню, что та же концепция была реализована в Pentium Pro, но при этом разработчики столкнулись на стадии производства (процент выхода двух качественных кристаллов оказался ниже предполагаемого), и процессор оказался довольно дорогим. Возможно, именно поэтому Pentium II изначально создавался с лразделением кристаллов (основного и КШа L2), за что пришлось расплачиваться половиной тактовой частоты кэш-памяти второго ровня.

    Высокая частота работы КШа спровоцировала величение теплоотдачи процессорного блока, поэтому потребовалось использование массивной поглощающей тепло пластины, что, в свою очередь, привело к величению веса и габаритов модуля.

    В каждом модуле Slot 2 три специальных области данных: доступная только для чтения, область для чтения/записи и  динамическая информация о  температуре внутри процессорного модуля. В области первого типа помещена информация о версии процессора, данные о пошаговой отладке и казана предельно допустимая температура. Во второю область памяти пользователи могут вводить свою информацию.

Доступ к динамическим данным об изменении температуры даёт возможность правляющим программам оповещать администратора  об

опасных системных событиях.

    величение ёмкости КШа второго ровня повышает пропускную способность системы благодаря мгновенному доступу процессоров к часто используемым данным и инструкциям, хранящимся в быстрой кэш-памяти. По заявлению Intel, величение ёмкости КШа с 512 Кбайт до 1 Мбайт приводит иногда к 20% росту общей производительности системы.

Для объяснения этого явления уместно провести аналогию с холодильниками, используемую Intel: хранение запаса продуктов в

холодильнике избавляет поваров ресторана от необходимости ездить по магазинам, закупая провизию. Чем больше холодильник, тем лучше,

особенно в час пик, когда количество клиентов в ресторане резко возрастает. Так вот, в случае с сервером лхолодильник - это кэш-память второго ровня, лмагазин (где доступны те же продукты) - в принципе более медленная системная память.

Большой кэш L2 значительно повышает общую производительность многопроцессорных конфигураций в системах, работающих с крупными массивами несопоставимых данных. По информации Intel, проведённые корпорацией тесты ZD ServerBench показали почти

пропорциональный рост производительности системы по мере становки дополнительных процессоров с мегабайтным КШем.

    Усовершенствованная архитектура Xeon, допускающая 36-разрядную адресацию физической памяти, теоретически позволяет процессору получать доступ к системной памяти ёмкостью до 64 Гбайт. Новый механизм постраничного обмена Page Size Extension - 36 останется практически незаметной для глаз пользователя и разработчиков приложений. В настоящее время PSE-36 поддерживают операционные системы

    Intel 450NX PCIset стал первым микросхемным  набором, оптимизированным для Pentium II Xeon. Он выпускается в двух вариантах, Basic и Full, соответственно для серверных hi-end и систем среднего ровня. Они имеют одинаковую структуру ядра, но отличаются производительностью и ценой.

    Basic PCIset поддерживает до двух разъёмов 32-разрядной PCI, один - 64-разрядной и до 4 Гбайт системной памяти типа EDO. Его более

совершенный лродственник Full PCIset поддерживает до четырёх слотов типа EDO. Эти чипсеты объединяет функционирование на

100-мегагерцовой частоте системной шины и возможность поддержки многопроцессорных (до четырёх Xeon) конфигураций. 64-разрядная

шина PCI способна существенным образом повысить общую производительность системы с чётом оптоволоконной технологии обмена данными с дисковыми массивами, использования высокопроизводительных сетевых магистралей на основе АТМ, Gigabit Ethernet и других. Повышается, по сути, синхронизация мощности процессора и производительности подсистемы ввода-вывода.

    Xeon, как я же отмечал, предназначен не только для серверов, но и для рабочих и графических станций, для которых одним из важнейших

параметров является производительность видеоподсистемы. Для них разработан чипсет Intel 440GX AGPset на базе известного микросхемного набора 440BX. 440GX правляет работой порта AGP в режиме 2х. Режим двоенной производительности реализуется благодаря так называемой технологии двойной накачки - данные передаются как по переднему, так и по заднему фронтам тактовых импульсов (у обычной AGP - только по переднему), при этом полоса пропускания достигает значения 533 Мбайт/с. Физические параметры интерфейса AGP остаются прежними.

    Ещё одой особенностью набора чипсета  440GX стала возможность обращения к памяти ёмкостью до 2 Гбайт, что в два раза больше, чем у

его приемника.

    Несмотря на тот факт, что в настоящий момент понятие многопроцессорности ассоциируется у Intel лишь с четырьмя стройствами на одной плате, ведутся работы по созданию симметричных мультипроцессорных систем, поддерживающих до восьми Ксеонов. Разработки восьмиканального чипсета для Xeon ведутся фирмой Corollary, дочерней компанией Intel. И, само собой, возможны кластерные решения, скажем, на основе архитектуры распределённой памяти (NUMA). В обоих случаях, как правило, не требуется переписывать прикладные программы (правда, операционная система требует некоторой оптимизации). В процессорной шине чипсета Intel 450NX PCIset предусмотрен так называемый разъём кластерного соединения, что прощает построение кластерного соединения на основе стандартных четырёхпроцессорных узлов.

    Ещё одним перспективным направлением является кластер с передачей сообщений. Суть её состоит в отсутствии разделения ресурсов. Отдельно стоящие злы кластера обмениваются данными, например, тактовыми импульсами, сигнализирующими о нормальном состоянии системы. И хотя LAN-соединение остаётся работоспособным, существует необходимость в сети нового типа - так называемой SAN (System  area Network).

    В завершении хотел бы отметить, что некоторые ведущие западные производители (IBM, NCR, Dell) же начали поставки систем на базе

Xeon, на презентации процессора в России компании Kraftway и Вист также представили свои новые серверные решения.

Ориентировочные цены на Pentium Xeon составят 1124 долларов (L2 512 Кбайт) и 2836 долларов (L2 1 Мбайт) при поставках от тысячи штук.

Список литературы:

Д-р Джон Гудмен "Управление памятью для всех",

Диалектика, Киев, 1996

В.Л. Григорьев "Микропроцессор i486. Архитектура и программирование", Гранал, Москва, 1993.

Информационно - рекламная газета "КМ - информ"

газета "Компьютер World/Киев"

газета "Компьютер Week/Moscow"

Ж.К. Голенкова и др. "Руководство по архитектуре IBM PC AT", Консул, Минск, 1993

Руководство программиста по процессору Intel i386,

Техническая документация уровня 2, (C) Intel Corp.

Руководство программиста по процессору Intel i486,

Техническая документация уровня 2, (C) Intel Corp.

Материалы эхоконференции SU.HARDW.PC.CPU компьютерной сети FidoNet