Скачать .docx |
Книга: Книга: Микропроцессоры 2
Микропроцессоры
Наиболее важными компонентами любого компьютера, обусловливающими его основные характеристики, являются микропроцессоры, системные платы и интерфейсы.
Микропроцессор (МП), или CentralProcessingUnit (CPU) — функционально законченное программно управляемое устройство обработки информации, выполненное в виде одной или нескольких больших (БИС) или сверхбольших (СБИС) интегральных схем.
Микропроцессор выполняет следующие функции :
□ вычисление адресов команд и операндов;
□ выборку и дешифрацию команд из основной памяти (ОП);
□ выборку данных из ОП, регистров МПП и регистров адаптеров внешних устройств (ВУ);
□ прием и обработку запросов и команд от адаптеров на обслуживание ВУ;
□ обработку данных и их запись в ОП, регистры МПП и регистры адаптеров ВУ;
□ выработку управляющих сигналов для всех прочих узлов и блоков ПК;
□ переход к следующей команде.
Основными параметрами микропроцессоров являются :
□ разрядность;
□ рабочая тактовая частота;
□ размер кэш-памяти;
□ состав инструкций;
□ конструктив;
□ рабочее напряжение и т. д.
Разрядность шины данных микропроцессора определяет количество разрядов, над которыми одновременно могут выполняться операции; разрядность шины адреса МП определяет его адресное пространство.
Адресное пространство — это максимальное количество ячеек основной памяти, которое может быть непосредственно адресовано микропроцессором.
Рабочая тактовая частота МП во многом определяет его внутреннее быстродействие, поскольку каждая команда выполняется за определенное количество тактов. Быстродействие (производительность) ПК зависит также и от тактовой частоты шины системной платы, с которой работает (может работать) МП.
Кэш-память, устанавливаемая на плате МП, имеет два уровня:
□ L1 — память 1-го уровня, находящаяся внутри основной микросхемы (ядра) МП и работающая всегда на полной частоте МП (впервые кэш L1 был введен в МП i486 и в МП i386SLC);
□ L2 — память 2-го уровня, кристалл, размещаемый на плате МП и связанный с ядром внутренней микропроцессорной шиной (впервые введен в МП PentiumII). Память L2 может работать на полной или половинной частоте МП. Эффективность этой кэш-памяти зависит и от пропускной способности микропроцессорной шины.
Состав инструкций — перечень, вид и тип команд, автоматически исполняемых МП. От типа команд зависит классификационная группа МП (CISC, RISC, VLIW и т. д.). Перечень и вид команд определяют непосредственно те процедуры, которые могут выполняться над данными в МП, и те категории данных, над которыми могут применяться эти процедуры. Дополнительные инструкции в небольших количествах вводились во многих МП (286, 486, PentiumPro и т. д.). Но существенное изменение состава инструкций произошло в МП i386 (этот состав далее принят за базовый), PentiumMMX, PentiumIII, Pentium 4.
Конструктив подразумевает те физические разъемные соединения, в которые устанавливается МП и которые определяют пригодность материнской платы для установки МП. Разные разъемы имеют разную конструкцию (Slot — щелевой разъем, Socket — разъем-гнездо), разное количество контактов, на которые подаются различные сигналы и рабочие напряжения.
Рабочее напряжение также является фактором пригодности материнской платы для установки МП.
Первый микропроцессор был выпущен в 1971 году фирмой Intel (США) — МП 4004. В настоящее время разными фирмами выпускается много десятков различных микропроцессоров, но наиболее популярными и распространенными являются микропроцессоры фирмы Intel и Intel-подобные.
Все микропроцессоры можно разделить на группы:
□ CISC (Complex Instruction Set Command) с полным набором системы команд;
□ RISC (Reduced Instruction Set Command) сусеченнымнаборомсистемыкоманд;
□ VLIW (Very Length Instruction Word) со сверхбольшим командным словом;
□ MISC (MinimumInstructionSetCommand) с минимальным набором системы команд и весьма высоким быстродействием и т. д.
Микропроцессоры типа CISC
Большинство современных ПК типа IBMPC используют МП типа CISC, выпускаемые многими фирмами: Intel, AMD, Cyrix, IBM и т. д. «Законодателем мод» здесь выступает Intel, но ей «на пятки» наступает AMD, в последние годы создавшая ряд МП, по некоторым параметрам превосходящие «интеловские». Все же пока МП фирмы Intel имеют большее распространение. Характеристики некоторых из них приведены в табл. 8.1.
Таблица 8.1. |
Характеристики | некоторых CISC МП1 | |||||||
Модель МП Intel | Разрядность данных /адреса, бит |
Тактовая частота, МГц | Адресное пространство, байт | Состав команд | Число элементов; Технология | Кэш L1 и L2, Кбайт | Напряжение питания; конструктив | Год выпуска | |
4004 | 4 | 4 | 0,108 | 640 | - | 2300; 10 мкм |
- | - | 1971 |
8080 | 8 | 8 | 2,0 | 64 - 103 | - | 10 000; 6 мкм | - | 1974 | |
8086 | 16 | 16 | 4,77 и8 | 106 | - | 70 000; 3 мкм | - | 1979 | |
8088 | 8, 16 | 16 | 4,77 и8 | 106 | - | 70 000; 3 мкм | - | 1978 | |
80186 | 16 | 20 | 8и 10 | 106 | - | 140 000 | - | - | 1981 |
80286 | 16 | 24 | 8-20 | 16 - 106 | - | 180 000; 1,5 мкм | - | - | 1982 |
80386 | 32 | 32 | 16-50 | 4 - 109 | Базовый | 275 000; 1 мкм |
- | - | 1985 |
80486 | 32 | 32 | 25-100 | 4- 109 | Базовый | 1,2 • 106 ; 1 мкм | 8 | - | 1989 |
Pentium | 64 | 32 | 60-233 | 4-Ю9 | Базовый | 3,3 - 106 ; 0,5, 0,35 мкм | 8 + 8 | 5 В; Socket 5 | 1993 |
PPentium Pro | 64 | 32 | 150-200 | 4-Ю9 | Базовый | 5,5 • 106 ; 0,5, 0,35 мкм | 8 + 8 | 5 В; Socket 8 | 1995 |
Следует знать, что:
□ у микропроцессоров 80386 и 80486 есть модификации с буквами SX, DX, SLи т. д., отличающиеся от базовой модели разрядностью шины, тактовой часто той, надежностью, габаритами, потреблением энергии, амплитудой напряжения и другими параметрами;
□ микропроцессоры Pentium, PentiumII, PentiumIII имеют много различных модификаций, некоторые из них будут названы далее;
□ число элементов — это количество элементарных полупроводниковых переходов, размещенных в интегральной схеме МП. Технология обычно характеризуется размером элемента в микрометрах (микронная технология).
Следует также знать, что:
□ микропроцессоры 80486DX и выше имеют встроенный математический сопроцессор, могут работать с умножением внутренней частоты. С увеличенной частотой работают только внутренние схемы МП, все внешние по отношению к МП схемы, в том числе расположенные на системной плате, работают с обычной частотой;
□ у МП 80286 и выше конвейерное выполнение команд. В МП 286 предусмотрены регистры для очереди команд общим размером 6 байт, в МП 486 —16 байт и т. д. Конвейерное выполнение команд — это одновременное выполнение разных тактов последовательных команд в разных частях МП при непосредственной передаче результатов из одной части МП в другую. Конвейерное выполнение команд увеличивает эффективное быстродействие ПК в 2-5 раз;
□ у МП 80286 и выше есть возможность работы и вычислительной сети;
□ у МП 80286 и выше имеется возможность многозадачной работы (многопрограммность) и сопутствующая ей защита памяти.
Современные микропроцес соры имеют два режима работы
О реальный (однозадачный, RealAddressMode), в котором возможно выполнение только одной программы и непосредственно адресоваться могут только 1024 + 64 Кбайт основной памяти компьютера, а остальная память (расширенная) доступна лишь при подключении специальных драйверов, поддерживается операционной системой DOS;
О защищенный (многозадачный, ProtectedVirtualAddressMode), обеспечивающий выполнение сразу нескольких программ, непосредственную адресацию и прямой доступ (без дополнительных драйверов) к расширенной основной памяти. Предоставляется непосредственный доступ к памяти емкостью 16 Мбайт для МП 286; 4 Гбайт для процессоров 386, 486, Celeron; 100 Гбайт для МП PentiumXeon и 64 Гбайт для остальных процессоров Pentium, а при страничной организации памяти — к 16 Тбайт виртуальной памяти каждой задаче. В этом режиме осуществляется автоматическое распределение памяти между выполняемыми программами и соответствующая ее защита от обращений со стороны чужих программ. Защищенный режим поддерживается операционными системами Windows, OS/2, Unix и т. д;
□ в МП 80386 и выше встроена поддержка системы виртуальных машин. Система виртуальных машин является дальнейшим развитием режима многозадачной работы, при котором каждая задача может выполняться под управлением своей операционной системы, то есть практически в одном МП моделируется как бы несколько компьютеров, работающих параллельно и имеющих разные операционные системы;
□ у МП 80486 и выше имеется поддержка кэш-памяти двух уровней (L1 и L2);
□ у МП 80486 и выше имеются RISC-элементы, позволяющие выполнять короткие операции за один такт.
Микропроцессоры Pentium
Микропроцессоры 80586 (Р5) более известны по их товарной марке Pentium, которая запатентована фирмой Intel (МП 80586 других фирм имеют иные обозначения: К5 у фирмы AMD, Ml у фирмы Cyrix и т. д.). Эти микропроцессоры имеют пятиступенную конвейерную структуру, обеспечивающую многократное совмещение тактов выполнения последовательных команд (возможно независимое выполнение сразу двух простых команд), и кэш-буфер для команд условной передачи управления, позволяющий предсказывать направление ветвления программ; по эффективному быстродействию они приближаются к RISC МП, выполняющим каждую команду как бы за один такт. Процессоры Pentium имеют 32-разрядную адресную шину и 64-разрядную шину данных. Обмен данными с системой может выполняться со скоростью 1 Гбайт/с.
У всех МП Pentium имеется встроенная кэш-память, отдельно для команд, отдельно для данных по 8-16 Кбайт, и встроенный контроллер кэш-памяти 2-го уровня (что обеспечивает работу последней на внутренней частоте МП); имеются специализированные конвейерные аппаратные блоки сложения, умножения и деления, существенно ускоряющие выполнение операций с плавающей запятой. Удачные архитектурные решения МП Pentium обусловили то, что производительности микропроцессоров 486DX4-120 и Pentium-60 приблизительно одинаковы (то есть за счет архитектуры производительность увеличилась в два раза).
Микропроцессоры Pentium Pro
В сентябре 1995 года были выпущены МП шестого поколения 80686 (Р6), торговая марка PentiumPro. Микропроцессор состоит из двух кристаллов: собственно МП и кэш-памяти. Но он не полностью совместим с просто Pentium и, в частности, требует специальную системную плату. PentiumPro прекрасно работает с 32-битовыми приложениями, а в 16-битовых иногда даже несколько проигрывает просто Pentium. Новые схемотехнические решения обеспечивают для ПК более высокую производительность. Часть этих новшеств может быть объединена понятием «динамическое исполнение» (dynamicexecution), что, в первую очередь, означает наличие многоступенчатой суперконвейерной структуры (superpipelining), предсказания ветвлений программы при условных передачах управления (multiplebranchprediction) и исполнение команд по предполагаемому пути ветвления (speculativeexecution).
В программах решения многих задач, особенно экономических, содержится большое число условных передач управления. Если процессор может заранее предсказывать направление перехода (ветвления), то производительность его работы значительно повысится за счет оптимизации загрузки вычислительных конвейеров. Тем не менее следует сказать, что если путь ветвления предсказан неверно, процессор должен сбросить полученные результаты, очистить конвейеры и загрузить нужные команды заново, что требует довольно большого числа тактов. В процессоре PentiumPro вероятность правильного предсказания 90 % против 80 % у МП Pentium.
Кэш-память емкостью 256-512 Кбайт — обязательный атрибут высокопроизводительных систем на базе процессоров Pentium. Однако у них встроенная кэшпамять имеет небольшую емкость (16 Кбайт), а основная ее часть находится вне процессора на материнской плате. Поэтому обмен данными с ней происходит не на внутренней частоте МП, а на частоте тактового генератора, которая обычно в 2-5 раз ниже, что снижает общее быстродействие компьютера. В МП PentiumPro есть и кэш-память 1-го уровня (по 8 Кбайт для команд и данных), и кристалл кэш-памяти 2-го уровня емкостью 256 или 512 Кбайт, расположенный тоже на плате самого микропроцессора и работающий на внутренней частоте МП.
Микропроцессоры Pentium ММХ и Pentium II
В 1997 году появились модернизированные для работы в мультимедийной технологии микропроцессоры Pentium и PentiumPro, получившие торговые марки, соответственно, Pentium ММХ (ММХ — MultiMediaeXtention) и Pentium П. МП Pentium ММХ содержит дополнительные 57 команд, ориентированные на обработку аудио- и видеоинформации, увеличенную вдвое (до 32 Кбайт) кэшпамять, дополнительные восемь 64-битовых регистров, новый блок предсказания ветвлений, заимствованный у МП PentiumPro, и т. д. Вследствие этого у него на 1 миллион транзисторных элементов больше, чем у МП Pentium.
Для эффективного использования этих микропроцессоров во все старые программы (в том числе и в операционные системы Windows 95, WindowsNT) необходимо включить согласующие программные фрагменты; правда и без них МП Pentium ММХ несколько производительнее просто МП Pentium. При выполнении обычных приложений Pentium ММХ на 10-15 % быстрее Pentium, а при работе мультимедийных приложений с использованием новых 57 команд он уже эффективнее на 30 % (для сравнения: МП PentiumPro опережает МП Pentium при выполнении обычных приложений примерно на 20 %). Программы, написанные с учетом специфики Pentium ММХ, не будут работать на ПК с обычным МП Pentium. Для МП Pentium ММХ требуется системная плата с разъемом Socket 7, с новым BIOS, поддерживающим ММХ, и с двумя напряжениями питания (3,5 и 2,8 В).
МП PentiumII имеет иную конструкцию, нежели чем все остальные МП, в частности, он выполнен в виде небольшой платы-картриджа (корпус SECC), на которой размещены сам процессор (содержащий 7,5 млн транзисторов против 5,5 млн в МП PentiumPro) и четыре микросхемы кэш-памяти 2-го уровня, общим объемом 512 Кбайт. Кэш-память 1-го уровня, находящаяся в микросхеме самого процессора, имеет емкость 32 Кбайта, против 16 Кбайт, имевшихся в МП PentiumPro, но кэш-память 2-го уровня работает не на внутренней частоте МП, а на вдвое меньшей частоте.
Важным отличием PentiumII является архитектура двойной независимой шины (первые варианты введения такой шины были уже у МП PentiumPro). Процессор обменивается данными с кэшем L2 по специализированной высокоскоростной шине (иногда называемой backside — задней), отделенной от системной шины (frontside — передней). Системная шина работает на частоте материнской платы, и это существенно снижает эффективное быстродействие компьютера. Наличие же backside-шины ускоряет обмен с кэш-памятью.
МП PentiumII поддерживает двухпроцессорную конфигурацию ПК. В МП PentiumPro и PentiumII появилась качественно новая перспектива: начали внедряться так называемые SIMD-инструкции (SingleInstructionMultiplyData — сравните со структурами многопроцессорных систем), в которых одно и то же действие совершается над многими данными (эта технология получит развитие в следующих моделях МП). МП производится на основе технологии 0,35 мкм и использует напряжение питания 2,8 В. Для него, естественно, требуется иная системная плата, чем для всех других Pentium. Микропроцессоры PentiumII имеют много модификаций: Klamath, Deschutes, Katmai, Tanga; МП средней группы Celeron — Covington, Mendocino, Dixon.
Для более дешевых компьютеров был предложен облегченный вариант процессора, названный Celeron. Первые процессоры Celeron имели частоты 266 и 300 МГц. Вторичный кэш исключили, что заметно отразилось на производительности ПК (системные платы с разъемом Slot 1 вторичного кэша не имеют), и ПК на их основе оказались малоэффективными. Тогда были выпущены процессоры Celeron А, которые имеют небольшой (128 Кбайт) вторичный кэш, установленный на плате МП и работающий уже на полной частоте МП. Эти процессоры, известные также под названием Mendocino, стали очень популярными.
Кроме широко известных особенностей вторичного кэша (либо его нет, либо 128 Кбайт), процессор Celeron имеет следующие отличия от PentiumII:
□ разрядность шины адреса сокращена с 36 до 32 бит (адресуемая память —4 Гбайт);
□ несколько ослаблены процедуры контроля достоверности преобразования информации;
□ Celeron предназначен только для однопроцессорных конфигураций.
Процессоры Celeron А являются самыми популярными из недорогих компьютеров и в настоящее время. Большинство МП PentiumII, в том числе и CeleronA, поддерживают частоту шины системной платы 100, 133 МГц и более (предыдущие модели — только 66 МГц).
Микропроцессоры Pentium III
Появившиеся в 1999 году процессоры PentiumHI (Coppermine) являются дальнейшим развитием PentiumII. Их главным отличием является основанное на новом блоке 128-разрядных регистров расширение набора SIMD-инструкций, ориентированных на форматы данных с плавающей запятой — SSE (StreamingSIMDExtensions). По возможностям мультипроцессорных конфигураций эти процессоры аналогичны своим предшественникам PentiumII.
Кэш 2-го уровня у МП PentiumIII имеет размер 256 Кбайт, работает на полной частоте МП и обслуживается быстродействующей backside-шиной, что во много раз ускоряет как работу с кэшем, так и производительность ПК в целом. МП PentiumIII предназначены для работы с материнскими платами, имеющими чипсеты (набор микросхем, связывающих процессор с остальной системой) Intel: 440BX, 440ZX, 440GX, 810, 815, 820, 840 и более новые; поддерживают частоту шины материнской платы 100, 133, 150 МГц и выше. «Простые» PentiumIII устанавливаются в SlotI, PentiumIIIXeon — в Slot 2. Процессоры PentiumHIXeon (и последующие модели Tanner, Cascades) являются продолжением линии МП PentiumPro и отличаются увеличенным кэшем 2-го уровня (512, 1024 и 2048 Кбайт), работающим на полной частоте МП.
Микропроцессоры Pentium 4
Модификация МП Pentium — Pentium 4 — предназначена для высокопроизводительных компьютеров, в первую очередь серверов, рабочих станций класса high-end и мультимедийных игровых ПК. Рассмотрим основные особенности Pentium 4.
Добавлены 144 новые потоковые инструкции, расширяющие набор SIMD-инструкций, ориентированных на форматы данных с плавающей запятой — SSE (StreamingSIMDExtensions). Модуль вычислений с плавающей запятой и потоковый модуль оптимизированы для работы с аудио- и видеопотоками, в том числе ЗО-технологиями.
Имеется кэш 2-го уровня размером 256 Кбайт; он работает на полной частоте МП, использует встроенную программу коррекции ошибок и обслуживается быстродействующей с разрядностью 256 бит (32 байт) шиной, работающей на частоте МП. Это для Pentium 4 с частотой 1500 МГц, например, обеспечивает скорость обмена с кэшем 48 Гбайт/с.
Есть возможность работы с системной шиной с эквивалентной частотой 400 МГц (Quard-PumpedBusno 100 МГц), что обеспечивает скорость обмена 3,2 Гбайт/с.
Вновь улучшена система «динамического исполнения» (dynamicexecution), что, в первую очередь, связано с наличием 20-ступенной (у МП PentiumIII конвейер имел 10 ступеней) суперконвейерной структуры (superpipelining), лучшего предсказания ветвлений программы при условных передачах управления (branchprediction) и параллельного «по предположению» (опережающего, спекулятивного) исполнения команд по нескольким предполагаемым путям ветвления (speculativeexecution). Поясним это. Динамическое исполнение позволяет процессору предсказывать порядок выполнения инструкций при помощи технологии множественного предсказания ветвлений, которая прогнозирует прохождение программы по нескольким ветвям. Это оказывается возможным, поскольку в процессе исполнения инструкции процессор просматривает программу на несколько шагов вперед. Технология анализа потока данных позволяет проанализировать программу и составить ожидаемую последовательность исполнения инструкций, независимо от порядка их следования в тексте программы. И наконец, опережающее выполнение повышает скорость работы программы за счет выполнения нескольких инструкций одновременно, по мере их поступления в ожидаемой последовательности — то есть по предположению (интеллектуально). Поскольку выполнение инструкций происходит на основе предсказания ветвлений, результаты сохраняются как «интеллектуальные» с последующим удалением тех, которые вызваны промахами в предсказании. На конечном этапе порядок инструкций и результатов их выполнения восстанавливается до первоначального.
Используется новая микроархитектура, базирующаяся на двух параллельных 32-битовых конвейерах и поддерживающая технологию поточной обработки HyperPipelined. Это позволило сделать эффективным длинный конвейер. Суть в том, что при длинном конвейере в задачах с частыми условными переходами его эффективность снижается. Два параллельных конвейера снижение эффективности уменьшают. Теперь реальна ситуация, когда в каждый момент времени одна инструкция загружается, другая декодируется, для третьей (или нескольких) формируется пакет данных, четвертая инструкция (или несколько) исполняется, для пятой записывается результат. И если при строго последовательном исполнении инструкций даже самые короткие операции исполнялись за 5 тактов, то при такой поточной обработке многие инструкции могут быть выполнены за такт.
Новая технология ускоренных вычислений (RapidExecutionEngine) использует два быстрых, работающих на удвоенной частоте, процессора АЛУ, выполняющие короткие арифметические и логические операции за 0,5 такта, и третье, медленное АЛУ, исполняющее длинные операции (умножение, деление и т. д.).
Процессор имеет площадь кристалла 217 мм2 , потребляет 52 Вт при частоте 1500 МГц, содержит 42 млн транзисторов. На базе Pentium 4 можно создать высокоэффективную ММХ-систему, но для этого необходимо наличие:
□ программного обеспечения, ориентированного на использование дополнительных команд этого процессора;
□ системной платы с чипсетами, поддерживающими данные микропроцессоры.
В 2002-2004 годах корпорация Intelпредставила:
□ семейство МП PentiumIIITualatin на основе технологии 0,13 мкм с улучшенными по сравнению с Coppermine характеристиками (тактовые частоты до 1266 МГц, кэш-память L2 емкостью до 512 Кбайт, работающая на частоте микропроцессора, с поддержкой частоты системной шины (FSB) до 133 МГц).
□ Выпускаются МП трех видов: для портативных и настольных компьютеров и для серверов;
□ МП Celeron с тактовыми частотами 2,3 и 2,4 ГГц, изготовленными по технологии 0,13 мкм и поддерживающими тактовую частоту шины 400 МГц;
□ семейство нового поколения МП Pentium 4E — ядро Prescott под процессорный разъем LGA7751 : Pentium 4Е 5202 2,8 ГГц, Pentium 4E 530 3 ГГц, Pentium 4E 540 3,2 ГГц, Pentium 4E 550 3,4 ГГц, Pentium 4E 560 3,6 ГГц.
Все МП имеют кэш 2-го уровня 1024 Кбайт.
□ две модели Р4ЕЕ (ExtremeEdition) 3,2 и 3,4 ГГц, кэш 3-го уровня 2 Мбайт и кэш 2-го уровня 512 Кбайт;
□ системный чипсет для этих МП — i875;
□ микропроцессоры PentiumM для портативных компьютеров — новое поколение МП с системным чипсетом i855 и средствами беспроводного доступа к локальным сетям по протоколу IEEE 802.11.
Компания Intel выпускает:
□ в 2005 году — МП по технологии 0,065 мкм, довести тактовую частоту МП до 20 ГГц;
□ в 2005-2006 годах — две версии микропроцессора Smithfield с двумя ядрами по технологии 0,09 мкм на конструктиве LGA775.
Все новые процессоры Pentium 4 имеют микроархитектуру Intel Net Burst , поддерживающую ряд инновационных возможностей:
□ технологию НТ;
□ технологию гиперконвейерной обработки данных;
□ частоту системной шины 800, 533 или 400 МГц;
□ кэш-память первого уровня с отслеживанием выполнения команд;
□ расширенные функции выполнения команд;
□ расширенные функции выполнения операций с плавающей запятой и мультимедийных операций;
□ набор потоковых SIMD-расширений SSE2 или SSE3.
Технология НТ
Технология HyperTreading (tread — поток) реализует многопотоковое исполнение программ: на одном физическом процессоре можно одновременно исполнять два задания или два потока команд одной программы (операционные системы «видят» два логических процессора вместо одного). Иначе говоря, эта техноло гия на базе одного МП формирует два или более логических процессора, работающих параллельно и, в известной степени, независимо. HyperTreading обеспечивает повышение производительности (до 30 %) в многозадачных средах и при исполнении программ, которые допускают многопотоковое исполнение.
ПРИМЕЧАНИЕ
Следует, однако, иметь в виду, что все микропроцессоры, начиная с i386, позволяют программным путем также реализовать систему виртуальных машин, когда на одном физическом МП моделируются два виртуальных, каждый из которых может исполнять свою программу независимо и даже под управлением своей операционной системы.
Технология НТ была создана фирмой Intel изначально для серверных процессоров Хеоn с целью повышения производительности серверных систем: в них она дополняет традиционную многопроцессорность, обеспечивая дополнительный параллелизм в работе.
Архитектурно микропроцессоры, поддерживающие НТ, имеют дополнительно группу дублирующих регистров и логические схемы, назначающие ресурсы потокам и средства APIC (AdvancedProgrammableInterruptController), организующие прерывания для обработки потоков команд разными логическими процессорами. Кроме этого для поддержки HyperTreading необходимы материнские платы с соответствующим BIOS, и с чипсетами Intel 845 РЕ и GE, Intel 865, 875, 915, 925 и т. п., а также многозадачные операционные системы WindowsXP, Linux (Windows 9х и ME непригодны, Window 2000 может использоваться с дополнительной настройкой).
Технология гиперконвейерной обработки
Технология гиперконвейерной обработки повышает пропускную способность конвейера, обеспечивая увеличение производительности и тактовой частоты. Так, один из основных конвейеров МП — конвейер предсказания ветвлений/возвратов ветвления, имеет глубину конвейерной обработки в 31 шаг (против 20 шагов в микропроцессорах Pentium 4 с суперконвейерной обработкой).
Поддержка системной шины с частотой до 800 МГц
Поддерживается самая производительная на 2004 год шина с частотой 800 МГц, обеспечивающая обмен данными между процессором и другими компонентами со скоростью 6,4 Гбайт/с. Это обеспечивается путем организации схемы передачи данных, позволяющей передавать четырехкратно увеличенный пакет по 200-мегагерцевой шине.
Кэш-память уровня L 1 с отслеживанием выполнения команд
Поддерживается увеличенный до 16 Мбайт объем кэш-памяти данных и кэш-память с отслеживанием выполнения команд, которая хранит до 12 000 микроопераций в порядке их выполнения. Это повышает производительность МП, в частности, из-за быстрого доступа к командам ветвления и ускоренного возврата из ветвлений, которые были неверно спрогнозированы.
Расширенные функции выполнения команд
Имеется микроблок улучшенного динамического выполнения команд, имеющий в том числе и усовершенствованный алгоритм предсказания ветвлений.
Расширенные функции выполнения операций
Имеется микроблок с расширенными до 128 байт регистрами операций с плавающей запятой и дополнительный регистр для передачи данных, что увеличивает производительность МП при работе с плавающей запятой и выполнении мультимедийных приложений.
Потоковые SIMD -расширения SSE 3
В SIMD-расширения SSE2 были добавлены 144 инструкции, а в SIMD-расширения SSE3 добавлены еще 13 инструкций, улучшающих синхронизацию мультимедиа потоков и повышающих производительность при работе с видео- и аудио-информацией, в том числе с речью и графикой.
Технология RAID
Большинство новых микропроцессоров поддерживают технологию IntelRAID (RedundantArrayIntensiveDisk — массив недорогих дисков с избыточностью). Достоинством этой технологии является простота организации RAID-массивов, то есть поддержка функционирования нескольких параллельно работающих и дублирующих друг друга винчестеров: два диска содержат зеркальную копию информации друг друга, уменьшая таким образом вероятность потери данных и обеспечивая сохранность важной информации. Переключение между дисками выполняется очень быстро и незаметно для пользователя: все заботы по синхронизации и верификации данных система берет на себя.
Новая маркировка МП фирмы Intel
Начиная с 2004 года фирма Intel вводит новую маркировку своих микропроцессоров. Вводимый фирмой единый трехзначный номер процессора будет учитывать сразу несколько характеристик: базовую архитектуру, тактовую частоту процессора и частоту системной шины, объем кэш-памяти и др.
В частности, базовая архитектура МП отображается старшим разрядом (предлагается ввести три серии):
□ ЗХХ — процессоры Celeron, CeleronM, CeleronM со сверхнизким энергопотреблением;
□ 5ХХ — процессоры Pentium 4 для настольных и мобильных ПК (в том числе и с технологией HyperTreading);
□ 7ХХ — процессоры PentiumM с низким и сверхнизким энергопотреблением.
Микропроцессоры Over Drive
МП OverDrive, по существу, являются своеобразными сопроцессорами, обеспечивающими для МП 80486 режимы работы и эффективное быстродействие, характерные для МП Pentium, а для МП Pentium — увеличение их производительности (в частности, OverDrive 125, 150 и 166, соответственно, для Pentium 75, 90 и 100, увеличивающие их внутреннюю частоту до указанных для OverDrive величин).
ПРИМЕЧАНИЕ
В сфере выпуска микропроцессоров с фирмой Intel постоянно конкурирует фирма AMD. Микропроцессоры фирмы AMD выпуска 2003- 2004 годов (AthlonXP, Athlon 64) мало в чем уступают процессорам Pentium 4, а в некоторых режимах работы даже превосходят последние по быстродействию. Но, как и прежде, МП AMD сильнее греются (их штатная температура — 55-80 °С, в то время, как у МП Pentium 30-60 С С), поэтому для них необходим мощный вентилятор и надежная система защиты от катастрофического перегрева. Все МП Pentium такой системой снабжены: у них имеется датчик, который при превышении температуры 120-130 °С мгновенно выключает МП, спасая его от «сгорания». У МП Pentium 4 есть еще более совершенная систем; ThermalMonitor, принудительно замедляющая работу микропроцессора при превыше га допустимой температуры Микропроцессоры AMD подобной системы пока не имеют, в связи с этим их рекомендуется использовать на системных платах, оснащенных надежной системой температурного контроля.
Микропроцессоры типа RISC
Микропроцессоры типа RISC содержат только набор простых, чаще всего встречающихся в программах команд. При необходимости выполнения более сложных команд в микропроцессоре производится их автоматическая сборка из простых. В этих МП все простые команды имеют одинаковый размер и на выполнение каждой из них тратится один машинный такт (на выполнение даже самой короткой команды из системы CISC обычно тратится четыре такта). Один из первых МП типа RISC — ARM (на его основе был создан ПК IBMPCRT): 32-разрядный МП, имеющий 118 различных команд. Современные 64-разрядные RISC-микропроцессоры выпускаются многими фирмами: Apple (PowerPC), IBM (PPC), DEC (Alpha), HP (PA), Sun (UltraSPARC) ит.д. '
Микропроцессоры PowerPC (PerformanceOptimizedWithEnhancedPC) весьма перспективны и уже сейчас широко применяются в машинах-серверах и в ПК типа Macintosh. Микропроцессоры PowerPC имеют тактовую частоту до 800 МГц, а микропроцессоры Alpha — тактовую частоту 1800 МГц. Микропроцессоры типа RISC характеризуются очень высоким быстродействием , но они программно не совместимы с CISC-процессорами: при выполнении программ, разработанных для ПК типа IBMPC, они могут лишь эмулировать (моделировать, имитировать) МП типа CISC на программном уровне, что приводит к резкому уменьшению их эффективной производительности.
Микропроцессоры типа VLIW
Это сравнительно новый и весьма перспективный тип МП. Микропроцессоры типа VLIW в 2004 году выпускают фирмы:
□ Transmeta — это микропроцессор Crusoe моделей ТМ3120, ТМ5400, ТМ5600 (технология 0,18 мкм, тактовые частоты до 700 МГц);
□ Intel — модель Mersed (торговая марка Itanium, 800 МГц);
□ Hewlett-Packard (HP) — модель McKinley.
Следует заметить, что при более глубоком анализе технология EPIC (ExplicitlyParallelInstructionComputing — вычисления с явной параллельностью инструкций), которой придерживаются фирмы Intel и HP, незначительно отличается от технологии VLIW, принятой за основу фирмой Transmeta. Но эти отличия несущественны, поэтому микропроцессоры VLIW и EPIC можно отнести к одной группе.
МП Merced — первый процессор, использующий полный набор 64-битовых инструкций (IntelArchitecture-64, IA-64; именно эта технология называется EPIC). Микропроцессор с тактовой частотой 1200 МГц изготавливается по технологическим нормам 0,18 мкм. К VLIW-типу можно отнести и ожидавшийся в 2002 году МП Elbrus 2000 — Е2К, разработанный российской компанией «Эльбрус». И хотя Е2К пока существует в виде компьютерной модели, этот процессор оставил «российский след» в американских проектах — о схожести определенных черт Е2К и процессора Crusoe компании Transmeta, а также архитектуры IA-64 (Intel и HP) много писалось в прессе.
Программисты доступа к внутренним VLIW-командам не имеют: все программы (даже операционная система) работают поверх специального низкоуровневого программного обеспечения (CodeMorphing), которое ответственно за трансляцию команд CISC-микропроцессоров в команды VLIW. МП типа VLIW вместо сложной схемной логики, обеспечивающей в современных суперскалярных микропроцессорах параллельное исполнение команд, опираются на программное обеспечение. Упрощение аппаратуры позволило уменьшить габариты МП и потребление энергии (эти МП иногда называют «холодными»).
Архитектура CISC появилась в 1978 году. Тогда процессоры представляли собой скалярные устройства (то есть могли в каждый момент времени выполнять только одну команду), при этом конвейеров практически не было. Процессоры содержали десятки тысяч транзисторов. МП RISC были разработаны в 1986 году, когда технология суперскалярных конвейеров только начала развиваться. Процессоры содержали сотни тысяч транзисторов. В конце 90-х наиболее совершенные процессоры уже содержат миллионы, десятки миллионов транзисторов. Первые МП архитектуры IA-64 содержат десятки миллионов транзисторов. В дальнейших модификациях их число, вероятно, увеличится до сотен миллионов.
Архитектура IA-64 не является ни 64-разрядным расширением архитектуры CISC, ни переработкой архитектуры RISC. IA-64 представляет собой новую архитектуру, использующую длинные слова команд (LIW), предикаты команд (instructionpredication), исключение ветвлений (branchelimination), предварительную загрузку данных (speculativeloading) и другие ухищрения для того, чтобы обеспечить больший параллелизм выполнения программ. Но тем не менее, IA-64 — это компромисс между CISCи RISC, попытка сделать их совместимыми: существуют два режима декодирования команд — VLIW и старый CISC. Программы автоматически переключаются в необходимый режим исполнения. Для работы
с VLIW операционные системы должны содержать и 64-разрядную часть на IA-64, и старую 32-разрядную.
Все новые МП создаются на основе технологий, обеспечивающих формирование элементов с линейным размером порядка 0,015 мкм и ниже (традиционные МП 80486 и Pentium использовали элементы 0,8 мкм).
Уменьшение размеров элементов обеспечивает возможность:
□ увеличения тактовой частоты МП до сотен мегагерц и выше;
□ уменьшения перегрева МП, что позволяет использовать пониженное напряжение питания 1-2 В (вместо 5 В).