Учебное пособие предназначено для студентов очной и заочной форм обучения специальности 351400 «Прикладная информатика ( в сфере сервиса )»
Вид материала | Учебное пособие |
Содержание2.5. Процессоры для высокопроизводительных вычислительных машин и систем |
- Учебное пособие Ростов-на-Дону 2003 Печатается по решению кафедры экономической информатики, 494.94kb.
- Пособие предназначено для студентов специальности «Прикладная информатика (в экономике)», 1911.82kb.
- Практикум для студентов очной и заочной форм обучения по специальностям 080801., 2139.66kb.
- Учебное пособие для студентов очной, очно-заочной и заочной форм обучения (дистанционное, 929.04kb.
- С. В. Чувиков Метрология и сертификация программного обеспечения Учебное пособие, 1298.56kb.
- Учебное пособие для студентов заочной формы обучения Санкт-Петербург, 1247.83kb.
- Учебное пособие канд экон наук, доцент кафедры управления О. А. Соловьева Троицк 2008, 2909.51kb.
- Учебно-методический комплекс для студентов заочного обучения специальности Прикладная, 81.9kb.
- Учебное пособие 28365942 Москва 2008 ббк 66., 2986.28kb.
- Лекции по нейроанатомии учебное пособие Для студентов очной и заочной форм обучения, 1482.86kb.
2.5. Процессоры для высокопроизводительных
вычислительных машин и систем
В сфере разработки и применения процессоров для высокопроизводительных вычислительных машин и систем в последние годы произошли значительные стратегические изменения. До середины 1980-х годов высокопроизводительные вычислительные машины и системы (МВК, суперкомпьютеры) создавались как единичные экземпляры специализированного назначения, для которых проектировались уникальные архитектуры дорогостоящих многокомпонентных векторно-конвейерных процессоров, собираемых из большого количества микросхем. К настоящему времени высокопроизводительные вычислительные машины и системы переходят в разряд серийно выпускаемых и относительно широко востребуемых изделий. Поэтому разработчикам таких систем экономически целесообразнее использовать в своей продукции серийно выпускаемые микроэлектронные компоненты, тем более что прогресс в их характеристиках и производстве превратил микропроцессоры, микросхемы памяти и адаптеры внешних устройств со стандартными интерфейсами в доступные и эффективные устройства. В свою очередь применение серийных компонентов позволило относительно легко масштабировать МВК до значительного числа процессоров (см. раздел 13). Ориентация на массовый рынок изделий микроэлектроники, выпуск которых достаточно хорошо освоен промышленностью, также дает возможность значительно сократить сроки и стоимость производства МВК, сконцентрировав при этом основные усилия на совершенствовании и разработке новых архитектурных решений вычислительных комплексов в целом.
На рынке процессоров для высокопроизводительных вычислительных машин и систем (особенно в сегменте самых мощных из них) до последнего времени преобладали традиционные для этой сферы применения процессоры, такие как Alpha корпорации DEC, UltraSPARC корпорации Sun Microsystems, PA-RISC корпорации Hewlett-Packard, Power корпорации IBM, MIPS корпорации SGL. Однако лидирующие позиции на нем начинают занимать производители х86-процессоров, которым удалось практически полностью занять средний и нижний ценовые сегменты. И AMD, и Intel пользуются на этом рынке примерно той же стратегией, что и на мобильном. Они предлагают адаптированные для данных условий процессоры своих модельных рядов, доля продаж которых применительно к высокопроизводительным вычислительным машинам и системам благодаря относительно невысокой цене и большому количеству программного обеспечения для х86-архитектуры непрерывно увеличивается. Intel предлагает серию процессоров Хеоn двух модификаций. Первая из этих модификаций – Хеоn DP для рабочих станций и двухпроцессорных серверов – представляет собой практически полный аналог Pentium 4 с поддержкой многопроцессорности. Другая модификация – многопроцессорная версия Хеоn МP – оснащается кэш-памятью третьего уровня, объем которой составляет 1 или 2 Мбайт. Эти процессоры чаще всего используются в четырехпроцессорных конфигурациях, они имеют 400-МГц системную шину и оснащены средствами Hyper-Threading. AMD для высокопроизводительных вычислительных машин и систем до недавнего времени предлагала серию процессоров Athlon MP, представляющих собой полный аналог Athlon ХP, но способных работать в двухпроцессорных конфигурациях. Athlon MP смог завоевать немалую популярность благодаря выгодному сочетанию цена/производительность.
Дальнейшее усиление позиций корпораций Intel и AMD связано с внедрением 64-разрядных процессоров. Самые производительные вычислительные системы уже давно строятся на базе 64-разрядных RISC-процессоров, таких, например, как вышеупомянутые процессоры Alpha, Power, UltraSPARC, PA-RICS. Переход на 64 разряда дает то же, что в свое время дал переход от 8 к 16 и затем от 16 к 32 разрядам: значительное увеличение объема прямоадресуемой памяти и повышение скорости и/или точности некоторых вычислений. Intel и AMD при проектировании 64-разрядных процессоров используют почти прямо противоположные подходы. Создаваемая Intel архитектура не является продолжением х86. Хотя возможность использования программного обеспечения для х86 остается, делать это нецелесообразно, так как достигаемый при этом уровень производительности невысок. AMD же, наоборот, предлагает 64-разрядное расширение архитектуры х86, способное эффективно работать как на 32-, так и на 64-разрядных задачах. 64-разрядная архитектура IA-64 разрабатывается Intel с 1994 года при активном участии корпорации Hewlett-Packard. Эта архитектура имеет идеологию VLIW и реализована в ее усовершенствованном варианте EPIC. Архитектура IA-64 впервые была применена Intel в 2001 году в процессоре Itanium с ядром Merced. Это сложный и дорогой процессор, содержащий 325 млн транзисторов: 25 млн в процессорном ядре, включая кэш-память первого и второго уровней объемом 32 и 96 Кбайт соответственно, и по 75 млн в каждой из четырех дополнительных микросхем, составляющих в сумме кэш-память третьего уровня объемом 4 Мбайт. Itanium поддерживает до 4 включенных параллельно процессоров (для их большего количества необходим соответствующий мост). На этом процессоре удалось достичь тактовой частоты 800 МГц и не более. Следующим шагом стал выпуск в 2002 году процессора Itanium 2 на базе ядра McKinley. По сравнению с Merced он быстрее, компактнее и намного лучше по всем основным параметрам. В Itanium 2 кэш-память второго уровня увеличена до 256 Кбайт, кэш-память третьего уровня ( до 3 Мбайт) интегрирована в процессорное ядро.
Предлагаемое AMD 64-разрядное решение х86-64 реализуется в архитектуре Hammer, относящейся к восьмому поколению процессоров х86. Архитектура Hammer достаточно близка к архитектуре процессора Athlon, то есть является ее 64-разрядным расширением. Также имеется девять исполнительных блоков и конвейер длиной 12 стадий (конвейер увеличен на две стадии для увеличения предельных тактовых частот). Длина регистров увеличена до 64 бит, добавлено несколько новых регистров. Введено некоторое количество новых 64-разрядных инструкций. Поддерживается новый и весьма эффективный набор операций с плавающей точкой, использующий 16 новых 128-разрядных регистров. Объем кэш-памяти второго уровня – до 1 Мбайт.
64-разрядный процессор AMD Opteron представлен в 2003 году. Он стартовал с частоты 1400 МГц. Opteron имеет много преимуществ как перед 64-разрядными серверными процессорами Intel, так и перед традиционными 64-разрядными процессорами Alpha, Power PC, UltraSPARC, MIPS. Основной плюс Opteron: при относительно невысоких значениях цены и тепловыделения эти процессоры обладают высокой производительностью. Важным моментом следует признать и то, что разработка корпорации AMD, несмотря на 64-разрядную архитектуру, уже сейчас обеспечена достаточным количеством программного обеспечения. В первую очередь это заслуга архитектуры х86-64, которая благодаря своей обратной совместимости с 32-разрядной системой команд х86 позволяет без потерь и даже с выигрышем в быстродействии исполнять обычный 32-битный программный код.
Основные технические и технологические характеристики процессоров для высокопроизводительных вычислительных машин и систем представлены в табл. 2.2.
Таблица 2.2
Основные технические и технологические характеристики процессоров для высокопроизводительных вычислительных машин и систем
Модель процессора | Кодовое наименование процессорного ядра | Тактовая частота процессора, ГГц | Частота системной шины, MГц | Кэш-память L2, Кбайт | Норма тех- процесса, мкм | Типичное тепловыделение, Вт |
Intel Xeon DP | Gallatin Nocona Irwindale | 3,2 3,6 3,6 | 533 800 800 | 512 512 2048 | 0,13 0,09 0,09 | 70–75 70–75 70–75 |
Intel Xeon MP | Gallatin Potomac Cranford | 3,0 3,33 3,66 | 400 400 400 | 512 1024 1024 | 0,13 0,09 0,09 | 67–74 67–74 67–74 |
Intel Itanium 2 | McKinley Madison Deerfield Madison 9M | 1,0 1,6 1,6 1,6 | 400 533 667 800 | 256 256 256 256 | 0,18 0,13 0,13 0,09 | 100 120 120 120 |
Intel Pentium D | Prescott | 3,2 | 800 | 2048 | 0,09 | 69 |
AMD Opteron | SledgeHammer Venus/Troy/Athens Denmark/Italy | 2,4 2,6 2,2 | 800 1000 1000 | 1024 1024 2048 | 0,13 0,09 0,09 | 55–95 55–95 55–95 |
IBM Power4+, Power5 | – | 1,9 | 800 | 2048 | 0,13 | 140 |
Резюме
Центральный процессор (или просто – процессор) является основным вычислительным устройством ВМ, в задачу которого входит исполнение находящейся в памяти машины программы. В состав процессора входят арифметико-логическое устройство, устройство управления и набор устройств локальной памяти процессора (регистры памяти). АЛУ осуществляет функции арифметической и логической обработки информации. УУ выполняет функции управления вычислительным процессом и осуществляет автоматическое исполнение программы. Регистры памяти используются для хранения данных, необходимых для выполнения текущих операций. В состав современных процессоров также входит некоторый набор дополнительных буферных запоминающих устройств, называемых кэш-памятью. Эту память процессор использует для временного (промежуточного) хранения текущей и наиболее часто востребуемой информации.
Главным показателем эффективности работы и технического совершенства процессора является его производительность, которая зависит от параметров самого процессорного ядра, подсистемы памяти, процессорной шины. Разрядность регистров процессора определяет диапазон допустимых значений операндов (длину слова). Одним из основных путей увеличения тактовой частоты работы процессоров является снижение проектных норм технологического процесса, определяющих размеры элементарных электронных компонентов. Увеличение количества операций, выполняемых за один такт работы процессора, достигается путем эффективного использования кэш-памяти и совершенствования архитектурного построения процессора.
Одним из наиболее действенных способов повышения производительности процессоров является внедрение в вычислительный процесс механизма конвейерной обработки команд. Производительность конвейера может существенно снижаться в силу имеющих место в конвейере конфликтных ситуаций, таких как конфликты по ресурсам, по данным и по управлению. Для преодоления конфликтных ситуаций в процессоре используются различные аппаратные и программные схемы и механизмы. Наиболее эффективными способами борьбы с конфликтами по управлению в современных процессорах являются стратегии статического и динамического предсказания условных переходов. Прогрессивным архитектурным решением является суперконвейеризация, которая заключается в увеличении количества ступеней конвейера как за счет добавления новых ступеней, так и путем дробления имеющихся ступеней на несколько более простых подступеней.
Процессоры с расширенной системой команд, реализующих на аппаратурном уровне сложные операторы языков программирования высокого уровня, принято называть процессорами с полным набором команд или процессорами с CISC-архитектурой. Более простая по аппаратной реализации архитектура процессоров с сокращенным набором команд или RISC-архитектура базируется на использовании менее сложных команд и построении в результате этого максимально эффективного конвейера команд.
Еще одним эффективным архитектурным решением, вводящим в вычислительный процесс определенный уровень параллелизма, является применение векторных (потоковых) и матричных схем работы процессоров, которые используются для обработки многокомпонентных операндов типа векторов и массивов. Дополнительный параллелизм вычислений реализуется в суперскалярных процессорах, включающих в свой состав несколько самостоятельных функциональных исполнительных блоков, каждый из которых отвечает за определенный класс выполняемых операций.
В последнее время внедряется новая VLIW-архитектура процессора со сверхдлинными командами, образуемыми более простыми командами типа RISC. При этом благодаря отсутствию сложных аппаратных механизмов, характерных для суперскалярных процессоров, (таких, как предсказание переходов, внеочередное исполнение и т. п.), достигается значительный выигрыш в производительности.
Процессоры ВМ прошли сложный путь эволюции от первого относительно простого 4-разрядного микропроцессора i4004 до современных 32- и 64-разрядных высокопроизводительных процессоров Pentium 4, Xeon, Itanium корпорации Intel и Athlon XP, Athlon 64, Opteron корпорации AMD, а также других менее распространенных моделей. Для рынка недорогих массовых компьютеров корпорациями Intel и AMD предлагаются более дешевые варианты своих базовых процессоров: Celeron, Duron, Sempron. Ведущие производители процессоров (а это, главным образом, Intel и AMD) все более четко позиционируют свои изделия по классам компьютеров, для которых эти процессоры предназначаются. Процессоры для мобильных переносных ПК характеризуются малыми величинами энергопотребления и тепловыделения. Процессорам для высокопроизводительных вычислительных машин и систем присущи более сложные схемные решения. Специфическими особенностями таких процессоров являются повышенные частотные характеристики и увеличенные объемы кэш-памяти, а также переход на 64-разрядную архитектуру.
Контрольные вопросы и задания
1. Какие функции выполняет процессор в вычислительной машине?
2. Что такое процессорные регистры и каково их назначение?
3. От каких параметров зависит производительность процессора?
4. Поясните понятие проектных норм технологического процесса изготовления процессоров. Приведите их характерные значения.
5. Опишите механизм конвейерной обработки команд в процессоре.
6. Охарактеризуйте возможные конфликтные ситуации в конвейере процессора и представьте способы их разрешения.
7. На основе каких механизмов решаются проблемы условных переходов в конвейере команд процессора?
8. Чем отличается статический метод предсказания переходов в конвейере процессора от динамического метода?
9. Дайте понятие суперскалярной архитектуры процессора.
10. Назовите основные отличия архитектур процессоров CISK, RISK и VLIW.
11. Опишите векторные и матричные схемы работы процессоров.
12. Охарактеризуйте первые модели микропроцессоров корпорации Intel (от i8086 до i80386).
13. Поясните функции математического сопроцессора.
14. Чем отличались процессоры семейства i80486 от предыдущих разработок корпорации Intel и других производителей процессоров?
15. Дайте общую характеристику процессоров семейства Intel Pentium.
16. Назовите основные усовершенствования, впервые примененные в процессорах Pentium MMX и Pentium Pro.
17. Какими параметрами отличаются процессоры с торговым наименованием Intel Celeron от исходных («полных») процессоров Intel Pentium?
18. Охарактеризуйте основные нововведения в процессорах Intel Pentium 4 и AMD Athlon.
19. Назовите основные различия в архитектуре и параметрах современных процессоров корпораций Intel и AMD.
20. Каковы особенности разработки процессоров для мобильных ПК?
21. Какие преимущества дает переход к 64-разрядной архитектуре процессоров и какие сложности возникают при ее практическом внедрении?
22. Охарактеризуйте основные типы, параметры и особенности архитектуры процессоров для высокопроизводительных вычислительных машин и систем.
23. Какие типы процессоров наиболее часто используются в настоящее время при разработке новых многопроцессорных вычислительных комплексов.
3. Запоминающие устройства
вычислительных машин