Скачать .docx |
Реферат: Процесори фірми Intel
Вступ
Перший 16-розрядний процесор 8086 фірма Intel випустила в 1978 році. Частота 5 МГц, продуктивність 0.33 MIPS, але інструкції вже з 16-бітними операндами (пізніше з'явилися процесори 8 і 10 МГц). Технологія 3 мкм, 29 тис. транзисторів. Пам'ять, що адресується - 1 Мб. Регістрова архітектура і система команд істотно відрізнялася від 8080, але, природно, простежуються загальні ідеї. Через рік з'явився 8088 - той же процесор, але з 8-бітною шиною даних. З нього почалася історія IBM PC, що наклала свій відбиток на подальший розвиток цієї лінії процесорів Intel. Масове поширення і відвертість архітектури PC привели до лавиноподібної появи програмного забезпечення, що розробляється великими, середніми і дрібними фірмами і ентузіастами-одинаками. Технічний прогрес вимагав (і зараз вимагає) розвитку процесорів, але маса програмного забезпечення PC, яке повинно працювати і на більш нових процесорах, в свою чергу вимагала забезпечення зворотної програмної сумісності. Таким чином, всі нововведення в архітектурі подальших процесорів повинні були прилаштовуватися до існуючого ядра. А тут ще і сама архітектура PC «підкинула», наприклад, складності з використанням векторів переривань. Фірма Intel зарезервувала перші 32 вектори «для службового користування», однак на них «наїхали» переривання BIOS PC. Один з результатів – додатковий спосіб обробки виключень співпроцесора, що застосовується в старших моделях PC.
Процесор 80286, що знаменує наступний етап архітектури, з'явився тільки в 1982 році. Він вже мав 134 тис. транзисторів (технологія 1,5 мкм) і адресував до 16 Мб фізичної пам'яті. Його принципові новини – захищений режим і віртуальна пам'ять розміром до 1 Гб - не знайшли масового застосування, процесор переважно використовувався як дуже швидкий 8088.
Клас 32-розрядних процесорів був відкритий в 1985 році моделлю 80386 (275 тис. транзисторів, 1,5 мкм). Розрядність шини даних (як і внутрішніх регістрів) досягла 32 біт, що адресує фізичну пам'ять 4 Гб. З'явилися нові регістри, нові 32-бітні операції, істотно допрацьований захищений режим, з'явився режим V86, сторінкове управління пам'яттю. Процесор знайшов широке застосування в PC. З цього часу стала помітна тенденція «позитивного зворотного зв'язку»: на появу нового процесора виробники ПО реагують випуском нових привабливих продуктів, подальшим версіям яких стає явно тісно в рамках цього процесора. З'являється більш продуктивний процесор, але після нетривалого захоплення і його ресурси «з'їдають» і т. д. Це «вічне зрушення», звичайно, природно, але є обгрунтована підозра, що великі ресурси розбещують (або, принаймні, розслабляють) розробника ПО, не примушуючи його напружуватися в пошуках більш ефективних способів рішення задачі. Історія процесора 386 нагадує історію 8086: першу модель з 32-бітною шиною даних (згодом названої 386DX) змінив 386SX з 16-бітною шиною. Він досить легко вписувався в архітектуру PC AT, що раніше базувалася на процесорі 286.
Процесор Intel486DX з'явився в 1989 році. Транзисторів 1,2 млн, технологія 1 мкм. Від 386-го істотно відрізняється розміщенням на кристалі первинного кэша і вбудованого математичного співпроцесора (попередні процесори мали можливість використання зовнішніх х87 співпроцесорів). Крім того, для підвищення продуктивності в цьому CISC-процесорі (як і в подальших) застосоване RISC-ядро. Далі з'явилися його різновиди, відмінні наявністю або відсутністю співпроцесора, застосуванням внутрішнього множення частоти, політикою запису кэша і іншими. Зайнялися енергозбереженням (з'явився режим SMM), що відбилося і в продовженні лінії 386 процесорів (з'явився процесор Intel386SL)).
У 1993 році з'явилися перші процесори Pentium з частотою 60 і 66 МГц- 32-розрядні процесори з 64-бітною шиною даних. Транзисторів 3,1 млн, технологія 0,8 мкм, живлення 5 В. Від 486-го принципово відрізняється суперскалярной архітектурою здатністю за один такт випускати з конвейєрів до двох інструкцій (що, звичайно, не означає можливості проходження інструкції через процесор за пів такта або один такт). Інтерес до процесора з боку виробників і покупців PC стримувався його дуже високою ціною. Крім того, виник скандал з виявленою помилкою співпроцесора. Хоч фірма Intel математично обгрунтувала невисоку імовірність її вияву (раз в декілька років), вона все-таки пішла на безкоштовну заміну вже проданих процесорів на виправлені.
Процесори Pentium з частотою 75, 90 і 100 МГц, що з'явилися в 1994 році, представили вже друге покоління процесорів Pentium. При майже тому ж числі транзисторів вони виконувалися по технології 0,6 мкм, що дозволило знизити споживану потужність. Від першого покоління вони відрізнялися внутрішнім множенням частоти, підтримкою мультипроцесорних конфігурацій і мали інший тип корпусу. З'явилися версії (75 МГц в мініатюрному корпусі) для мобільних застосувань (блокнотних ПК). Процесори Pentium другого покоління стали вельми популярними в PC. У 1995 році з'явилися процесори на 120 і 133 МГц, виконані вже по технології 0,35 мкм (перші процесори на 120 МГц робилися ще по технології 0,6 мкм). 1996- й називають роком Pentium - з'явилися процесори на 150, 166 і 200 МГц, і Pentium став рядовим процесором для PC широкого застосування.
Паралельно з Pentium розвивався і процесор Pentium Pro, який відрізнявся новинками «динамічного виконання інструкцій», спрямованими на збільшення числа інструкцій, що паралельно виконуються. Крім того, в його корпусі розмістили і повторний кэш, для початку об'ємом 256 Кб. Однак на 16-бітних додатках, а також в середовищі Windows 95 його застосування не дає переваг. Процесор містить 5,5 млн транзисторів ядра і 15,5 млн. транзисторів для повторного кэша об'ємом 256 Кб. Перший процесор з частотою 150 МГц з'явився на початку 1995 року (технологія 0,6 мкм), а вже в кінці року з'явилися процесори з частотою 166, 180 і 200 МГц (технологія 0,35 мкм), у яких кэш досягав і 512 Кб.
Після довгих обіцянок на початку 1997 року з'явилися процесори Pentium ММХ. Розширення ММХ передбачає паралельну обробку групи операндів однією інструкцією. Технологія ММХ покликана прискорювати виконання мультимедийных додатків, зокрема операції із зображеннями і обробку сигналів. Її ефективність викликає спори в середовищі розробників, оскільки виграш в самих операціях обробки компенсується програшем на додаткових операціях упакування-розпаковування. Крім того, обмежена розрядність ставить під сумнів застосування ММХ в декодерах MPEG-2, в яких потрібна обробка 80-бітних операндів. Крім розширення ММХ ці процесори, в порівнянні із звичайним Pentium, мають подвоєний об'єм первинного кэша і деякі елементи архітектури, запозичений у Pentium Pro, що підвищує продуктивність процесора Pentium ММХ і на звичайних додатках. Процесори Pentium ММХ мають 4,5 млн транзисторів і виконані по технології 0,35 мкм.
Технологія ММХ була сполучена з архітектурою Pentium Pro і в травні 1997 року з'явився процесор Pentium II. Він являє собою злегка урізаний варіант ядра Pentium Pro з більш високою внутрішньою тактовою частотою, в яке ввели підтримку ММХ. Труднощі розміщення повторного кэша в одному корпусі з процесором подолали нехитрим способом- кристал з ядром процесора і набір кристалів статичної пам'яті і додаткових схем, що реалізовують повторний кэш, розмістили на невеликій друкарській платі-картріджі. Всі кристали закриті загальною кришкою і охолоджуються спеціальним вентилятором. Тактові частоти ядра 233, 266 і 300 МГц.
Процесори, сумісні з сімейством х86, випускаються не тільки фірмою Intel. Традиційний конкурент AMD випускає сумісні процесори звичайно трохи пізніше, але помітно дешевше, іноді по ряду технічних властивостей вони навіть випереджають аналогічні процесори Intel. Фірма Cyrix славиться своїми швидкими співпроцесорами. Однак для процесорів, призначених для застосування в PC, всі вони в тій або іншій мірі прагнуть до сумісності з виробами фірми Intel - «законодавця мод».
Як вже згадувалося вище, за системою команд і архітектурі розрізнюють процесори RISC і CISC.
RISC - Reduced (Restricted) Instruction Set Computer - процесори (комп'ютери) з скороченою системою команд. Ці процесори звичайно мають набір однорідних регістрів універсального призначення, і їх система команд відрізняються відносною простотою. У результаті апаратна реалізація такої архітектури дозволяє з невеликими витратами виконувати ці інструкції за мінімальне (в межі 1) число тактів синхронізації.
CISC - Complete Instruction Set Computer - процесори (комп'ютери) з повним набором інструкцій, до яких і відноситься сімейство х86. Склад і призначення їх регістрів істотно неоднорідні, широкий набір ускладнює декодування інструкцій, на що витрачаються апаратні ресурси. Зростає і число тактів, необхідне для виконання інструкцій.
У процесорах сімейства, що розглядається, починаючи з 486-го, застосовується комбінована архітектура CISC-процесор має RISC-ядро.
Сімейство 80х86 фірми Intel почалося з 16-розрядного процесора 8086. Все старші моделі процесорів, в тому числі 32-розрядні (386-й, 486-й, Pentium, Pentium Pro) і з 64-розрядним розширенням ММХ, включають в себе підмножину системи команд і архітектуру нижчестоячий моделей, забезпечуючи сумісність з раніше написаним ПЗ.[4]
1.Загальна характеристика мікропроцесорів фірми Intel
Загальні принципи будови мікропроцесорів фірми Intel відображає процесор з архітектурою Pentium (див ГР). Уперше це покоління було представлене корпорацією Intel в жовтні 1992 р., але комерційне освоєння почалося з березня 1993. Процесори Pentium перших версій містили 32-розрядний регістровий файл РЗП і 32-розрядну шину адреси. Зовнішня шина даних 64-розрядна і утворюється внутрішнім мультиплексуванням шин даних процесора. Процесор підтримує звертання до 4 Гбайт фізичного адресного простору Він містить вбудований блок співпроцесора з плаваючою точкою (FPU), блок управління і стабілізації напруження живлення (SMM, system management mode). Блок FPU доопрацьований для виконання операцій з плаваючою точкою за один такт синхронізації і має в своєму розпорядженні множник, дільник і суматор. Блок SMM дозволяє CPU працювати на пониженому напруженні живлення 2, 9 і 2, 5В.
У кристал процесора вбудована кэш-пам'ять L1, побудована по розділеній гарвардской архітектурі. По 8 Кбайт відведено окремо для секції команд і даних. Така організація розділеної кэш-пам'яті дозволяє уникнути конфліктів, пов'язаних з доступом до команд і даних на різних стадіях конвейєрної обробки. Внутрішня спеціалізована шина кэш-пам'яті працює на 2/3 внутрішній швидкості процесора. Організація цієї пам'яті 2-х портова, множинно-асоціативна, із зворотним записом. Процесор містить логіку синхронізації кэш-пам'яті для роботи в багатопроцессорной конфігурації.
У процесор вмонтований контроллер переривань (APIC, advanced peripheral interrupt controller), що програмується, що дозволяє створювати багатопроцесорні системи з кількістю процесорів до 256.
Процесори четвертого покоління мають в своєму розпорядженні єдиний конвейєр і називаються скалярними Одночасно на рівень декодування цього процесора може поступити тільки одна команда.
У деяких процесорах п'ять рівнів конвейєра діляться на багатоступінчаті операції, що дозволяє знизити складність кожного рівня. При цьому, на кожному рівні конвейєра скорочується число логічних операцій, завдяки чому легше перейти з рівня на рівень і підвищувати внутрішньопроцесорну тактову частоту. Така організація обчислень називається суперконвейєрною, вона характерна для мікропроцесорів клона Р5, а саме, AMD K5, NexGen NX586.
У базовій моделі Pentium задіяна інша методика обробки команд Він містить два конвейєри, званих u-pipe і v-pipe В першому з них (первинному) виконуються цілочисельні операції і команди з плаваючою точкою, а у повторному прості цілочисельні операції і певний тип команд з плаваючою точкою. Процеси в цих двох конвейєрах протікають незалежно один від одного одночасно з двома інструкціями. Такі процесори, що містять декілька незалежно працюючих конвейєрів, називаються суперскалярними (superscalar).
Процесор Pentium є двопотоковим по числу конвейєрів, але існують і чотирипотокові, наприклад, AMD K5. На одночасне виконання двох команд накладені деякі обмеження, пов'язані з комбінаціями команд і взаємозалежністю результатів. Всі команди, що поступають в конвейєри на обробку, повинні покидати їх точно в такому ж порядку, в якому вони на них і поступили Такий метод обробки називається впорядкованим надходженням (in-order issue), обробкою і впорядкованим завершенням (in-order completion) Якщо команда не може бути завершена в одному конвейєрі, то зупиняється і інший, що дещо знижує ефективність роботи процесора з точки зору продуктивності.
Існує і інший підхід неврегульоване завершення (out-of-order completion), характерний для процесорів AMD K5, Cyrix Ml, NexGen Nx586, що дозволяє одному з конвейєрів завершувати операцію навіть при «заторі» в іншому. У цьому випадку процесор може змінювати черговість надходження на виконання команд, обробляючи їх не в тому порядку в якому вони слідують в програмі, т. е. обробляючи готові до виконання і відкладаючи на більш пізній термін ті з команд, які не можуть бути виконані негайно, що називається неврегульованою обробкою (out-of order issue). Для реалізації подібного процесу в процесорі організуються додаткові апаратні вузли: буфери, вікна команд, накопичувачі команд.
Для підвищення продуктивності процесора широко застосовуються методи обходу (data bypassing) і просування даних (data forwarding). При обходах результати виконання однієї команди відразу пересилаються наступною, так що виключаються затримки на модифікацію і повторне читання з регістра процесора або ОЗП. Просування даних дозволяє процесору виконувати деякі команди паралельно, негайно передаючи результати однієї з них в іншу, якою вони не будуть потрібні до більш пізнього рівня конвейєрної обробки.
Як відмічалося, всередині мікропрограм CISC-команд, що виконуються існує безліч переходів і розгалужень. Перехід - це зміна послідовності виконання команди, яка може бути пов'язана з додатковою інформацією (ознакою стану або умовою). Такий перехід називається умовним. Існують і безумовні переходи, явно обумовлені логікою мікропрограм. Як ті, так і інші переходи займають при виконанні команд певний час.
У процесорі Pentium застосовується спеціальний буфер прогнозування розгалужень (ВТВ, branch target buffer) на 256 позицій, що відстежує і що зберігає дані про результати 256 останніх розгалужень. Буфер – це місце для зберігання якої-небудь інформації, частіше за все буфери організовуються для вирівнювання швидкостей між двома, різними по швидкодії пристроями.
Спираючись на цю інформацію процесор намагається передбачити станеться або не станеться перехід. Зустрівши команду умовного переходу (по коду операції поля команди) процесор робить припущення про шлях розгалуження, яке може бути істинним (true) або помилковим (false). Процесор починає виконання команди не спочатку, а з передбаченої адреси мікрокоманди переходу у відповідності зі своїм припущенням Може забезпечуватися декілька рівнів прогнозування До остаточної ствердної відповіді на питання про перехід процесор не здійснює ніяких модифікацій своїх регістрів і ОЗП. У разі неправильного припущення всі установки команди відміняються, а буфер очищається, що помітно знижує продуктивність процесора.
Всі процесори виконані по дуже енергоекономічній технології BiCMOS (Bipolar CMOS), однак виділення тепла цим приладом дуже велике. Як правило, процесори Pentium розраховуються для роботи при робочій температурі до 85°З, при цьому нагрів корпусу без ефективного тепловідводу досягає температури понад 180°С.
При розробці і впровадженні продуктів, призначеній для роботи в середовищі з процесором Pentium подальший розвиток отримала система OverDrive. Pentium OverDrive містить додаткові блоки множення частоти, фільтр напруження, блок пониження напруження живлення з 5, 0В до 3, 3В, посилена система тепловідводу радіатором і вентилятором.
Всі виробники системних плат постачають свої вироби, враховуючи необхідність подальшої модернізації і установки більш швидкісних процесорів. Частіше за все на системній платі можна зустріти стандартні гніздові панелі (LIF, low-insertion-force) або настановні панелі з нульовим зусиллям (ZIF, zero-insertion-force). [10]
2.Архітектура сучасних мікропроцесорів фірми Intel
Сучасні мікропроцесори фірми Intel основані на архітектурі P6 і мають ряд особливостей та відмінностей від попереднього покоління.
Конвейєр процесорів сімейства Р6 істотно відрізняється від конвейєра процесорів сімейства Р5. У Р6 реалізований принципово новий підхід до виконання команд. Додано ряд нових прийомів для запобігання заторам конвейєра, наприклад позачергове виконання команд (out-of-order-execution), перейменування регістрів. Конвейєр Р6 складається з трьох частин:
1. In-Order Issue Front End. На цьому етапі відбувається вибірка команд з пам'яті і декодування в мікрооперації.
2. Out-of-Order Core. На цьому етапі процесор виконує мікрооперації. Виконання може відбуватися без черги.
3. In-Order Retirement unit. На цьому етапі відбувається вилучення команд з конвейєра.
Тепер розглянемо процес виконання команд більш детально. Р6 містить 3 паралельно працюючих декодера. Перший декодер здатний декодувати макрокоманди, що складаються з чотирьох і більше мікрооперацій. Складні макрокоманди (більш чотирьох мікрооперацій) вимагають більше ніж один такт для декодування. Другий і третій декодери можуть декодувати макрокоманди, що складаються тільки з однієї мікрооперації. Таким чином, при складанні коду потрібно дотримуватися послідовності 4-1-1 (перша макрокоманда складається з чотирьох мікрооперацій, а інші дві - з однієї мікрооперації). Таке упорядкування макрокоманд дозволить досягнути максимальної продуктивності декодерів .
У кожному такті декодери можуть проводити до шести мікрооперацій, які поступають в спеціальну чергу. З черги до трьох мікрооперацій поступає на стадію (RAT) Register Allocation Table. Тут відбувається переіменування регістрів і резервування місць (регістрів) в (ROB)- Re-order buffer. Перейменування регістрів дозволяє нейтралізувати помилкову взаємозалежність.
Далі мікрооперації записуються в (ROB). ROB організований у вигляді кільцевого буфера на 40 місць (40 програмно-прозорих регістрів, що служать для перейменування). Мікрооперації поступають в (ROB) в порядку черги і віддаляються в порядку черги, а виконуватися мікрооперації можуть без черги по мірі готовності початкових даних і доступності виконавчих пристроїв процесора. До трьох мікрооперацій можуть передаватися на виконання в кожному такті. У залежності від функції, що виконується, мікрооперація прямує в один з п'яти портів (конвейєрів). До кожного порту прикріплені свої виконавчі пристрої. Після виконання мікрооперація повертається зворотно в (ROB), де чекає вилучення. Після того як результат мікрооперації був записаний в (ROB), він (результат) стає доступним іншим мікроопераціям. Оскільки процесор виконує команди без черги, то важливим моментом є забезпечення достатнього числа мікрооперацій, готових до виконання. Це може бути досягнуто шляхом швидкого декодування і оптимізації прогнозу розгалуження.
У кожному такті можуть віддалятися до трьох мікрооперацій. При видаленні тимчасові результати, що зберігаються в (ROB), записуються у відповідні програмні регістри або пам'ять. Видалення відбувається в порядку черги, що забезпечує правильне ведення контексту.
Прогнозу розгалуження варто виділити особливу увагу, оскільки невірний прогноз в процесорах Р6 обходиться дуже дорого, набагато дорожче, ніж в Р5. Затримка при помилковому прогнозі складає мінімум 12 тактів, але може бути і більше.
Коли команда переходу після виконання повертається в ROB, процесор дізнається, чи правильно був зроблений прогноз. Якщо «так», то робота конвейєра продовжується як звичайно. Якщо «ні», то процесор забороняє надходження нових команд в (ROB), скидає команди, що знаходяться на стадіях від початку конвейєра до (RAT) включно, оскільки вони відповідають невірній гілці програми. Потім процесор продовжує виконувати команди, що залишилися в (ROB) до видалення команди переходу, що спричинила неправильний прогноз. Після чого процесор скидає команди, що встигли проникнути в (ROB) після команди переходу, і дозволяє надходження в (ROB) нових команд. Якщо такі ситуації будуть зустрічатися досить часто, то продуктивність процесора різко знизиться.
Для динамічного прогнозу розгалуження використовується пристрій, званий Branch Target Buffer - ВТВ. Він являє собою кеш-пам'ять, в якій зберігається інформація про зроблені раніше переходи. Коли команда вибирається з пам'яті, її адреса транслюється через ВТВ і ВТВ видає пристрою передвиборку адресу наступної команди.
ВТВ працює за наступним принципом:
-якщо адреса команди відсутня в ВТВ, то передвиборка продовжується далі з наступної адреси;
-якщо адреса команди знаходиться в ВТВ і перехід передбачається як зроблений, то це вимагає одного зайвого такту;
ВТВ зберігає 4-бітну історію переходів.
Переходи, які відсутні в ВТВ, передбачаються з використанням статичного алгоритму прогнозу розгалуження:
-безумовні переходи передбачаються як зроблені;
-умовні переходи назад передбачаються як зроблені;
-умовні переходи уперед передбачаються як не зроблені.
Затримка на статичний прогноз становить 6 тактів.
З допомогою ВТВ можна успішно передбачати один
перехід, якщо він має закономірність виконання, що регулярно повторюється. Наприклад, буде коректно передбачений умовний перехід, який виконується при кожній парній ітерації і не виконується при кожній непарній ітерації. Переходи по покажчику, значення якого не є постійним для переважної більшості випадків, а також умовні переходи, що не мають закономірності виконання є непередбачуваними або погано передбачуваними. Якщо такі переходи зустрічаються всередині циклів, що часто повторюються, то це може істотно позначитися на продуктивності.
Якщо процесор зчитує дані з 32-розрядного регістру (наприклад, ЕАХ) відразу після того, як був зроблений запис у фрагмент цього регістра (наприклад, AL, АН, АХ), мікрооперація зчитання не зможе проникнути в (ROB) до того як мікрооперація запису не виконається і не буде видалена з (ROB). Це займає мінімум 7 тактів.
Затримка пов'язана з тим, що після повернення в (ROB) результату мікрооперації, яка записує в регістр, (ROB) буде міститися лише фрагмент регістра, а мікроперації, яка прочитує з регістра, потрібен цілий регістр.
Процесор не може збирати один регістр по частинах з різних місць. Мікрооперація на стадії (RAT) буде чекати, поки з (ROB) не будуть видалені мікрооперації.[2]
Мікропроцесор Pentium ІІІ побудований на архітектурі P6 і має ряд нововведень. Він виготовляється по 0.25-мікронній технології, має 32 Кв кеша L1 та 512 Кв кеша L2. Він розрахований на роботу на частоті 100 MHz, кеш другого рівня працює на половині тактової частоти. Серед сосбливостей його архітектури - динамічне виконання команд і технологія потокової пам’яті, яка дозволяє покращити систему вводу/виводу з комбінованим записом (WC) та використовувати інструкції попередньої виборки і потокового запам’ятовування. В Pentium ІІІ з’явилось вісім нових регістрів з прямим доступом, які здатні зберігати чотири числа ординарної точності (всього 128 розрядів).[8]
Потокові розширення SIMD (Single Instruction Multiply Data, відомі раніше як KNI- Katmai New Instructions) добавили 50 інструкцій для операції (ординарної точності) над числами з плаваючою точкою, що дозволяє отримувати до чотирьох результатів за один цикл процесора. З’явились також 12 нових мультимедійних інструкцій (в додаток до тих, що залишились у спадщину від технології MMX) і 8 інструкцій кешування.[9]
3. Процесори фірми Intel в порівнянні з моделями інших фірм
Компанія Advanced Micro Devices (AMD) є , мабуть, основним конкурентом Intel в секторі процесорів IA архітектури. Потрібно зазначити, що процесори AMD, no крайній мірі починаючи з моделі К5, завжди відрізнялися більш розвиненою мікроархітектурою. Наприклад, вони містять найбільшу кількість транзисторів, в порівнянні з процесорами того ж класу фірми Intel.
Мікроархітектура сімейства К6, про яке піде мова, характеризується всіма особливостями, властивими шостому поколінню мікропроцесорів Це, передусім, - конвергенція технологій RISC і CISC, яка забезпечує суперконвейєрність, виконання інструкцій з порушенням черговості їх проходження (out of-order), спекулятивне виконання, розвинений механізм прогнозу розгалужень і перейменування регістрів. Всі моделі мають так звану гарвардську архітектуру - роздільну для інструкцій і даних кеш-пам'ять першого рівня (в цьому випадку по 32 KB).
На початку січня 1998 року компанія AMD випустила нову модель процесора К6, працюючу на частоті 266 MHz, - перший процесор AMD, виготовлений по 0,25-мікронній технології.
7 квітня AMD анонсувала процесор К6 300 MHz, одночасно оголосивши про зниження цін на всю лінійку шостого покоління. 28 травня на виставці Electronics Entertainment Expo в Атланті (штат Джорджія) компанія AMD повідомила про початок поставок нового чіпа AMD-K6-2. Це - перший процесор з суперскалярною обробкою ММХ-інструкцій і технологією 3DNow, що включає набір з 21 нової інструкції, які використовуються для прискорення побудови тривимірних об'єктів, а також для підтримки стереозвука і відео. Технологію ж 3DNow багато хто оцінюють як першу в історії суперництва перемогу AMD над Intel. Були випущені три модифікації процесора - з частотами 266, 300 і 333 MHz
У серпні AMD представила К6-2 з технологією 3DNow, що оперує на частоті 350 MHz, а 16 листопада компанія оголосила про випуск трьох версій процесора AMD-K6-2, працюючих на частотах 366, 380 і 400 MHz
Процесори містять 9,3 млн транзисторів і виконані по 0.25 мікронній технології з п’ятишаровою металізацією. AMD K6-2 став першим процесором для Socket 7/Super 7, підтримуючим частоту шини 100 MHz, що надало процесору деякі переваги над тогочасними процесорами фірми Intel.
Слід визнати талановитість команди розробників фірми Cyrix. На сьогоднішній день це - єдиний процесор, що досягає досить високого рейтингу при реально менших тактових частотах. Крім того, пригадаємо, що це був перший процесор, що подолав бар'єр 66 MHz для системної шини.
У кінці березня 1998 Cyrix/IBM випускає процесор IBM 6x86MX PR266, підтримуючий частоту системної шини 83 MHz Процесор працює на тактовій частоті 208 MHz (83 х 2,5), виготовлений по 0,35-мікронній технології, має 64 KB кэш пам'яті L1 (по 32 KB для інструкції і даних, відповідно) і підтримує набір інструкцій ММХ.
Бар'єр PR300 IBM і Cyrix вирішили подолати роздільно В травні 1998 р. IBM Microelectronics представила два нових процесори - 6x86MX-PR300 і PR333, а Cyrix - модель з маркуванням Cyrix Mil 300, але вона не перевищувала в продуктивності аналогічні моделі фірми Intel.
Процесор 6х86 PR300 є першим чіпом, виготовленим IBM по 0,25 мікронній технології. В порівнянні з версією 6х86 PR266, частота системної шини понижена і становить 75 MHz, тому виграш в продуктивності невеликий Однак незаперечною перевагою процесора над процесорами фірми Intel є менше розсіяння енергії, а значить, велика надійність Внутрішня частота процесорів рівна 225 MHz (75 х 3)
Заслуговує уваги і така інновація Суrix, як сімейство процесорів MediaGX. Вони призначаються для мультимедійных ПК початкового рівня.
18 березня 1998 року National Semiconductor анонсувала процесор MediaGX (Mxi), працюючий на частоті 233 MHz , що підтримував технологію MMX . Реалізовуючи ідеологію «система на чіпі», процесор представляє високоінтегровану систему, яка об'єднує на одному кристалі функції графіки і аудіо, управління пам'яттю і інтерфейс з шиною РСI. Таке об'єднання системних, мультимедіних і графічних функцій в процесорі дозволяє досягнути значної продуктивності на відповідних додатках, що максимально наблизило продуктивність цих мікропроцесорів до мікропроцесорів фірми Intel.
Компанія Integrated Device Technology скромно з'явилася на «полі битви» гігантів, запропонувавши в 1997 р. процесор початкового рівня WinChip C6 архітектури х86, розроблений дочірньою компанією Centaur Technology. Цей чіп відверто націлений на нижній ціновий рівень ринку і позиціонується розробниками як недорога, але гідна альтернатива процесору Pentium ММХ. Хоч WinChip C6 і підтримує набір команд ММХ, його мікроархітектура істотно відрізняється від мікроархітектури процесорів шостого покоління.
Вона гранично спрощена і близька до мікроархітектури RISC процесора з елементами 486-го. Розробники не робили секрету з того, що блоки обчислення з плаваючою точкою і ММХ не так швидкі, як у Pentium ММХ. Це - перший процесор з 1993 р. (після виходу Pentium) без суперскалярного конвейєра і механізму прогнозу розгалужень.Тут немає ні позачергового виконання команд, ні перейменування регістрів, однак все підлегле задачі швидкого виконання інструкції . Ядро процесора містить класичний п’ятиступінчатий конвейєр з додатковим рівнем трансляції інструкції х86 у внутрішній мікрокомандний код Відтрансльовані інструкції асинхронно поступають на конвейєр, де згодом виконуються в порядку проходження в програмі.
Продуктивність досягається за рахунок високої внутрішньої частоти (очікується модель з частотою 400 MHz), об'ємної і швидкої кеш пам'яті першого рівня (в сьогоднішніх версіях по 32 KB для інструкції і даних, відповідно) окремих блоків для операції з плаваючою точкою і для команд ММХ і ряду інших хитрощів. Проте переваг в продуктивності над продукцією фірми Intel ці процесори не мають.
Варто звернути увагу і на те, що процесор вимагає живлення тільки одного рівня 3,5 В при цьому він розсіює всього 10 Вт .Таке живлення дозволяє виконати апгрейд комп'ютерів зі старими материнськими платами, що може виявитися привабливим для певного сектора ринку. WinChip C6 містить 5,4 млн. транзисторів, виконаний по 0,35 мікронній технології . Оголошена в квітні 1998 модель з частотою 200 MHz підтримує частоту системної шини 66 MHz і сумісна з роз'єм Socket 7.
19 травня 1998 року IDT оголосила про початок випробовувань моделей процесорів WinChip 2 i WinChip 2 3D .[1]
Загальну картину порівняльних характеристик прцесорів різних фірм можна побачити в таблиці 3.1 .[5]
Таблиця 3.1. Продуктивність різних процесорів
Процесор |
Бали |
Pentium II 333 |
149.1 |
Pentium II 300 |
138.6 |
IBM 6x86 PR266 |
132.7 |
Penium II 266 |
129.6 |
IBM 6x86 PR233 |
119.4 |
Pentium II 233 |
117.1 |
AMD K6 266 |
115.6 |
AMD K6 233 |
107.8 |
Pentium MMX 233 |
99.9 |
IDT WinChip C6 200 |
96.0 |
Отже, судячи з даної таблиці, мікропроцесори фірми Intel мають найвищу продуктивність серед моделей свого класу. Основним конкурентом в продуктивності є фірма AMD; порівняльні характеристики сучасних моделей фірми Intel та AMD зображені у таблиці 3.2.[3]
Таблиця 3.2 Порівняльні характеристики процесорів фірм AMD та Intel.
Cpu |
K6-2-500 |
K6-3-500 |
K7-500 |
Katmai-500 |
Роз’єм |
super 7 |
super 7 |
slot A |
slot 1 |
L1-cache |
64 Kb |
64 Kb |
128 Kb |
64 Kb |
L2-cache |
512 Kb |
256 Kb |
512 Kb |
512 Kb |
l3-cache |
0 |
512 Kb |
0 |
0 |
Швидкість L2 |
100 |
500 |
250 |
250 |
Прпускна здатність ядра, мб/с |
800 |
4800 |
3600 |
2800 |
Отже, на сьогоднішній день мікропроцесори фірми Intel досягають найвищої продуктивності, але стрімкий науково-технічний прогрес, винахідливість фірм-конкурентів змушують фірму Intel шукати все новіші шляхи вдосконалення та прикладати всі зусиля для того, щоб втримати свої позиції на світовому ринку мікропроцесорів.
Висновки
На зміну більшості процесорів Intel в цьому році прийшов Katmai (робоча назва), який на початку січня отримав офіційну назву Pentium III. Тактові частоти цього процесора на даний час становлять 450 та 500 MГц. Те, що з цією технологією Intel в стані здійснити ще декілька кроків вперед було подемонстровано під час однієї з конференцій розробників. Тоді Katmai працював на частоті вище 800 МГц.
Проте Intel вже подумала про те, щоб не тільки висунути на переднній план швидкість процесора як таку, але й одночасно продемонструвати можливі засоби, які стануть можливими завдяки збільшеній продуктивності процесорів. Один з напрямків діяльності лабораторії Intel - виявлення нових областей використання комп’ютера наприклад, в домашній сітці, в яку, крім ПК, інтегровані й побутові пристрої , наприклад холодильник.
В слідуючому півріччі вслід за процесором Katmai повинен з’явитись новий процесор, який розробляється під робочоє назвою Coppermine і представляє собою слідуюче покоління Katmai.
З ним Intel почне перехід від 0.25-мікронної технології до 0.18-мікронної. З одного боку, це приведе до можливості створення ще більш швидких процесорів з тактовими частотами більше 500МГц, а з іншої - звільнить місце для інших компонентів, які також можна буде інтегрувати на загальній з процесором кремнієвій пластині. Intel має на меті використати цю можливість для розміщення тем кешу другого рівня (L2-cache) і там самим використати ту ж стратегію, що і в другому поколінні Celeron, що також має L2-cache на кремнії.
Цей рік пройде під знаком технології Katmai як в області робочих станцій, так і серверів. Після того, як тактова частота процесорів Xeon була підвищена до 450 МГц, а об’єм кеша був підвищений до 2Мб, в другому кварталі з’явиться процесор Pentium III Xeon (кодова назва Tanner) для робочих станцій та серверів. В другому півріччі очікується поява варіанту Coppermine для серверів та робочих станцій під назвою Cascades. Його особливостями є наявність KNI, інтегрований на на кремнії L2-cache, можливо L3-cache в корпусі процесора і частота 500МГц.[6]
Фірма Intel досягнула значних успіхів у розробці мікропроцесорних технологій . Вона є провідною фірмою в цій галузі і надає великі надії на вдосконалення комп’ютерної індустрії в світовому масштабі. На даний час цей напівпровідниковий гігант подолав бар’єр частоти роботи процесора в 1 ГГц [7] і на думку світової громадськості Intel - фірма, що підніме людство на вищий рівень розвитку.
Список використаної літератури.
1.Бараш Л. Большие гонки или Процессоры’98 // Комп’ютерное обозрение №49-50,1998г.
2.Бердышев Е. Технология MMX.Возможности процессоров P5 и P6.М:Диалог-Мифи,1998г.
3.В гонке наметился лидер // Компьютеры+программы №2,1999г.
4.Гук М. Процессоры Intel от 8086 до Pentium III.Санкт-Петербург:Питер,1997г.
5.Десять современных компьютеров в сравнении // Chip №6, 1998г.
6.Карпенко А. Третье поколение Pentium // Chip №2,1999г.
7.Кондратенко Ю. Новинки на Intel Developer Forum//Компьютерное обозрение №8,1999г.
8.Северинский Е. Тестироавние Pentium III, первый раунд // Комп’ютерное обозрение №9,1999г.
9.Сидоренко Ю. Intel представляет:Pentium III // Компьютерное обозрение №8,1999г.
10.Степаненко О.С. Компьютер внутри.К:Логос, 1998г.