Реферат: Паралельноє програмирование

4.2 Задача ............................... 44 C:\www\doc2html\work\bestreferat-232132-13965101163743\input\Бакалаврська Вайнагій Олександр.docx - _Toc263737444

4.4 Тестування програм. 47

ВИСНОВКИ.. 51

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ.. 52

ВСТУП

Довгий час виробники процесорів – для підвищення продуктивності процесорів підвищували їх тактову частоту. Проте|однак| при тактовій частоті більше 3,8 ГГц чіпи просто перегріваються, відповідно, про вигоду можна забути.

Було потрібно нові ідеї і технології, одній з яких і стала ідея створення|створіння| багатоядерних чіпів. У такому чіпі паралельно працюють два і більше процесорів, які при меншій тактовій частоті забезпечують велику продуктивність. Виконувана в даний момент програма ділить завдання|задачі| по обробці даних на обоє|обидва| ядра. Це дає максимальний ефект, коли і операційна система, і прикладні програми розраховані на паралельну роботу.|із||застосуваннями| «Багатоядерність» впливає і на одночасну роботу стандартних застосувань. Так, наприклад, одне ядро процесора може відповідати за програму, що працює у фоновому режимі, тоді як антивірусна програма займає|позичає| ресурси другого ядра.

Наявність декількох ядер дозволяє розподіляти фонові завдання|задачі| операційної системи по декількох ядрах процесорів, всі процеси, що вимагають інтенсивних обчислень|підрахунків|, протікають швидше:

Обробка відео: стискування|стиснення| і обробка відеофайлів відбуваються|походять| помітно швидше.

інтегрований кеш: оскільки|тому що| прочитування і запис даних в оперативній пам'яті триває набагато довше, ніж вимагається процесору для обчислень|підрахунків|, ці чіпи використовують особливо швидкий кеш, який, на відміну від старих рішень|вирішень|, разом з електронікою (так званим кеш-контроллером), що управляє, вбудований в той же чіп, що і ядра. Це дозволяє процесору дуже швидко звертатися|обертатися| до вбудованої кеш-пам'яті, що в черговий раз|у черговий раз| підвищує швидкодію. У багатоядерних процесорах від AMD| кожне ядро має свій власний кеш, завдяки чому досягається певна перевага: коди, що зберігаються в кеші, і дані одночасно виконуваних програм не заважають|мішають| один одному;

покращування|поліпшувати| схеми: з|із| кожним поколінням процесорів розробники оптимізують електронні схеми, зменшуючи кількість елементів. За рахунок цього нові чіпи виконують операції набагато швидше своїх попередників;

вузькі струмопровідні доріжки: ширина робочих елементів найсучасніших мікропроцесорів складає всього 65 нанометрів. Завдяки цьому на одній і тій же площі|майдані| уміщається більше схем, а відстані між ними стають коротшими, що дозволяє значно прискорити виконання операцій;

багатоступінчасті|багатоступінчаті| енергозбережні функції: новітні|найновіші| процесори набагато економніше витрачають електроенергію, що подовжує|продовжує| термін служби і безперервної роботи акумуляторів в ноутбуках. Залежно від міри|ступеня| завантаженості окремі ділянки чіпа можуть поетапно відключатися, витримуючи таким чином різні «фази сну». Наприклад, використовується динамічна кеш-пам'ять: якщо вся буферна пам'ять в даний момент не використовується, сучасні багатоядерні процесори можуть відключати її фрагменти.

1 БАГАТОЯДЕРНІ АМД ПРОЦЕСОРИ

1.1 АМД ПРОЦЕСОРИ

Ще один підхід до вирішення даної проблеми був реалізований в VLIW/EPIC-архітектурі IA-64|, де частина|частка| проблем перекладена з апаратури на компілятор; проте|однак| сьогодні розробники визнають, що для високої продуктивності мікроархітектура важливіша.

Таблиця 1. Продуктивність серверних процесорів на тестах SPECcpu2000| (пиковое/базовое значення)

Рис1.1 Продуктивність серверних процесорів на тестах SPECcpu2000| (пікове/базове значення)

1.2 AMD Opteron/Athlon64

«Opteron» (укр. Оптерон; кодова назва під час розробки Sledgehammer або K8) — перший мікропроцесор фірми AMD, заснований на 64-бітовій технології AMD64 (також званою x86-64). AMD створила цей процесор в основному для застосування на ринку серверів, тому існують варіанти Opteron для використання в системах з 1—16 процесорами.

Крім того, Opteron і Athlon64 використовуть для підтримки когерентності кеша досконаліший|довершений| протокол MOESI|, що дає переваги в масштабуванні при роботі з|із| пам'яттю. Пов'язаний з роботою протоколу MOESI| трафік в двоядерних процесорах Athlon64| не зачіпає комутатор, що не блокується, а використовує SRQ|, чергу системних запитів, що відповідає за управління ядрами і визначення їх пріоритету, і контроллер пам'яті. При цьому також зменшуються затримки, оскільки не додаються|добавляють| затримки на комутаторі.

1.3 AMD Phenom

AMD Phenom (скорочено від слова phenomenon (феномен, незвичне явище) - багатоядерний центральний процесор від компанії AMD. Створений для персональних комп'ютерів. Має: два, три або чотири ядра. Базується на архітектурі К10. Триядерні версії (кодова назва Toliman) Phenom відносяться до серії 8000 і чотирьохядерні (кодова назва Agena) до AMD Phenom X4 9000.

AMD вважають, що чотирьохядерні Phenom-и були першими «істинними» чотирьохядерними процесорами, тому що саме вони, по суті, являються монолітним багатоядерним чіпом (всі ядра розташовані на тій же підложці кремнію), на відміну від серії процесорівIntel Core 2 Quad, які за дизайном являються мультикристально-модульними процесорами. Процесори розроблені для платформи Socket AM2+.[2]

Ці процесори покоління AMD| K10|, на жаль, не здобули популярності серед користувачів із-за проблем, що мали місце при їх появі.Перед офіційним випуском Phenom, була виявлена помилка в буфер асоціативної трансляції (TLB), яка могла спричинити блокування системи в різних випадках. Процесори Phenom аж до степінгу «B2» і «BA» схильні до цієї помилки. Якщо в BIOS і в програмному забезпеченні відключч\ити TLB, то це, як правило, призводить до втрати швидкодії порядку 10%. Процесори Phenom степінгу «В3» (моделі з номерами «xx50») були представлені 27 березня 2008 року, і були позбавлені помилки TLB

Серед ключових|джерельних| особливостей виділимо наступні|такі| пункти.

Всі перераховані і деякі інші нововведення забезпечують, за словами представників AMD|, підвищення продуктивності кожного ядра Phenom| на 20 -25% в порівнянні з поколінням Athlon| 64 при рівних тактових частотах. Що ж, в цьому у нас ще буде можливість|спроможність| переконатися.

Рис. 1.2 і Рис. 1.3

Рис. 1.2AMD| Phenom| X4|

Рис. 1.3 AMD| Phenom| X3|

Рис. 1.4 Структура процессораAMD| Phenom| X3

1.4 AMD Turion

TurionX2 Ultra (кодове ім'я Griffin) є першим із сімейства процесорів AMD виключно для мобільної платформи, заснованої на Athlon 64 (K8 Редакція G) архітектури з деякими конкретними архітектурних удосконалень за аналогією з нинішньою Phenom процесорів, спрямованих на зниження споживання потужності і збільшення терміну служби батарей . Ultra процесор Turion була випущена як частина " Пума "мобільної платформи в червні 2008 року.

TurionX2 Ultra є двоядерний процесор для виготовлених на 65-нм технології з використанням 300 мм пластин КНІ. Вона підтримує DDR2-800 SO-DIMM і можливості DRAMPrefetcher для підвищення продуктивності і мобільних підвищеної північний міст (контролер пам'яті, контролер HyperTransport і координатний комутатор). Кожне ядро процесора входить 1 Мб кеша L2 на загальну суму 2 Мбайт кешу L2 на весь процесор. Кеш L2 знаходиться на поточному Turion 64 X2. Тактова частота коливається від 2,0 ГГц до 2,4 ГГц, а теплової енергії дизайн (TDP) в діапазоні від 32 Вт до 35 Вт.]

Нова функція X2 Ultra процесор Turion є те, що він реалізує три напруги площинах: одна для північного мосту і один для кожного ядра. Це, поряд з кількома фазами петлі (PLL), дозволяє змінювати основні напруги, і частоту незалежно від інших основних і незалежно від північного мосту. Дійсно, протягом декількох мікросекунд, процесор може переключитися на один з 8 рівнів частоти і один з 5 рівнів напруги. Змінюючи частоту і напругу під час роботи, процесор може адаптуватися до різних навантаження і знизити споживання енергії. Він може працювати як низький, як 250 МГц, для збереження контролю в енерговикористанні.

Він також реалізує теплові датчики на основі комплексного SMBUS (SB-TSI) інтерфейс (замінює і виключає теплової схеми чіп монітор через SMBUS в його попередники) з додатковим сигналом, посланим з вбудованих контролера до процессора і пам'яті для зниження температури.

TurionX2 Ultra процесор буде ділитися на той же сокет S1, як і його попередник ( Turion 64 X2 ), але не буде мати ту ж розкладку.

Зважаючи на вищевказані заходи по архітектурі ядра були мінімально змінені і засновані на K8, а не K10 мікроархітектури. Це робить більш імовірним, що TurionUltra будуть уникати труднощі масштабування тактової частоти, присутньої в продукції AMD K10.

TurionIIUltra (кодове ім'я Каспію) є мобільною версією архітектури K10.5, відомий також своїм настільним варіантом Regor. Це двоядерний процесор, з тактовою частотою 2,4 ГГц до 2,6 ГГц, 2 Мб кеша L2 (1 МБ на кожне ядро), HyperTransport на 3,6 GT / с і 128-бітний FPU. Він підтримує TDP 35W від від свого попередника TurionX2 Ultra (кодове ім'я Griffin).

TurionII збігається з TurionUltraII, за винятком того TurionII кошти лише 1 МБ кешу L2 (512 КБ на кожне ядро), і більш низькі тактові частоти від 2,2 ГГц до 2,3 ГГц.

Характеристики	AMD Turion 64 X2
Кодове названня	Taylor, Trinidad
Архітектура	AMD64
Сокет	S1, 638 контактов
Інтерфейс	HyperTransport (HT800)
Техпроцесс	90 нм SOI
Контролер памяті	Двохканальний DDR2-667
Число ядер	2
Кеш L1	64 кбайт даних, 64 кбайт інструкції на ядро
Кеш L2	512 кбайт на ядро
Тактова частота	1,6 - 2,0 ГГц
Площа ядра	183 мм²
Число транзисторів	154 млн.
Рабоча напруга	0,8 - 1,1 В
Тепловой пакет (TDP)	31, 33, 35 Вт
Функції енергозбереження	PowerNow!
Набір інструкцій	MMX, E3DNow!, SSE, SSE2, SSE3, NX-Bit, Pacifica VT

Таблиця 1. Характеристики AMD Turion

2 ЗАСОБ И МОВ С#, ADA ДЛЯ ПРОГРАМУВАННЯПОТОКІВ

2.1 Вирішення завдання синхронізації в мові С#

using| System|;

using System.Threading;

clas|s ThreadTes|t

{

static| void| Main|()

{

Thread| t = new| Thread|(WRITEY|);

t.Start();

while| (true|)

Console|.Write("x"); |

}

static| void| WRITEY|()

{

while| (true|)

Console|.Write("y|у|");

}

У головному потоці створюється новий потік t, виконуючий метод, який безперервно друкує символ ‘ y’. Одночасно головний потік безперервно друкує символ ‘ x’.

CLR призначає кожному потоку свій стек, так що локальні змінні зберігаються окремо. У наступному прикладі ми визначаємо метод із локальною змінною, а потім виконуємо його одночасно в головномуі cтвореному потоках:

static| void| Main|()

{

new| Thread|(Go|).Start();

Go|(); }

static| void| Go|()

{

// Визначаємо і використовуємо локальну змінну 'cycles|'

for| (int| cycles| = 0; cycles| < 5; cycles++|)

Console|.Write('?');

}

Управління багатопоточністю здійснює планувальник потоків, цю функцію CLR| зазвичай|звично| делегує операційній системі. Планувальник потоків гарантує, що активним потокам виділяється відповідний час на виконання, а потоки, чекаючі або блоковані, наприклад|приміром|, на чеканні|очікуванні| ексклюзивного блокування, або призначеного для користувача введення – не споживають часу CPU|.

На однопроцесорних комп'ютерах планувальник потоків використовує квантування часу – швидке перемикання між виконанням кожного з активних потоків. Це наводить до непередбачуваної поведінки, як в найпершому прикладі, де кожна послідовність символів ‘ X’ і ‘ Y’ відповідає кванту часу, виділеному потоку. У WindowsXP типове значення кванта часу – десятки мілісекунд – вибрано як набагато більше, ніж витрати CPU на перемикання контексту між потоками (декілька мікросекунд).

На багатопроцесорних комп'ютерах багатопоточність реалізована як суміш квантування часу і справжнього паралелізму, коли різні потоки виконують код на різних CPU|. Необхідність квантування часу все одно залишається, оскільки|тому що| операційна система повинна обслуговувати як свої власні потоки, так і потоки інших застосувань.

Говорять, що потік витісняється, коли його виконання припиняється із-за зовнішніх чинників типа квантування часу. В більшості випадків потік не може контролювати, коли і де він буде витиснений.

Всі потоки одного застосування логічно містяться|утримуються| в межах процесу – модуля операційної системи, в якому виконується додаток|застосування|.

У деяких аспектах потоки і процеси схожі – наприклад, час розділяється між процесами, що виконуються на одному комп'ютері, так само, як між потоками одного C#-додатком|. Ключова|джерельна| відмінність полягає в тому, що процеси повністю|цілком| ізольовані один від одного. Потоки розділяють пам'ять з|із| іншими потоками цього ж застосування. Завдяки цьому один потік може поставляти дані у фоновому режимі, а інший – показувати ці дані у міру їх вступу|надходження|.

Типове застосування з багатопоточністю виконує тривалі обчислення у фоновому режимі. Головний потік продовжує виконання, тоді як робочий потік виконує фонове завдання. У додатках WindowsForms, коли головний потік зайнятий тривалими обчисленнями, він не може обробляти повідомлення клавіатури і миші, і додаток перестає відгукуватися. З цієї причини слід запускати що віднімають багато часу завдання в робочому потоці, навіть якщо головний потік в цей час демонструє користувачеві модальний діалог з написом “Працюю... Будь ласка, чекайте” , оскільки програма не може перейти до наступної операції, поки не закінчена поточна. Таке рішення гарантує, що додаток не буде помічений операційною системою як що “Не відповідає”. В разі|у разі| додатків|застосувань| без UI|, наприклад, служб Windows|, багатопоточність має сенс, якщо виконуване завдання|задача| може зайняти|позичати| багато часу, оскільки|тому що| потрібне чекання|очікування| відповіді від іншого комп'ютера (сервера додатків|застосувань|, сервера баз даних або клієнта). Запуск такого завдання|задачі| в окремому робочому потоці означає, що головний|чільний| потік негайно звільняється|визволяє| для інших завдань|задач|.

Інше вживання багатопоточність знаходить в методах, що виконують інтенсивні обчислення. Такі методи можуть виконуватися швидше на багатопроцесорних комп'ютерах, якщо робоче навантаження рознесене по декількох потоках (кількість процесорів можна отримати через властивість Environment .ProcessorCount ).

C#-додаток можна зробити багатопотоковим двома способами: або явно створюючи додаткові потоки і управляючи ними, або використовуючи можливості неявного створення потоків .NET Framework – BackgroundWorker , пул потоків, потоковий таймер, Remoting-сервер, Web-службы або додаток ASP.NET. У двох останніх випадках альтернативи багатопоточності не існує. Однопоточний web-сервер не просто поганий, він просто неможливий. На щастя, в разі серверів додатків, що не зберігають стан (stateless), багатопоточність реалізується зазвичай досить просто, складнощі можливі хіба що в синхронізації доступу до даних в статичних змінних.

Багатопоточність разом з|поряд з| перевагами має і свої недоліки|нестачі|. Саме головний|чільний| з|із| них – значне збільшення складності програм. Складність збільшують не додаткові потоки самі по собі, а необхідність організації їх взаємодії. Від того, наскільки ця взаємодія є навмисною|умисною|, залежить тривалість циклу розробки, а також кількість помилок, що спорадично виявляються і важковловимих, в програмі. Таким чином, потрібно або підтримувати дизайн взаємодії потоків простим, або не використовувати багатопоточність взагалі, якщо лише|тільки| ви не маєте протиприродної схильності до переписування і відладки коди.

Крім того, надмірне використання багатопоточності віднімає ресурси і час CPU на створення потоків і перемикання між потоками. Зокрема, коли використовуються операції чтения/записи на диск, швидшим може виявитися послідовне виконання завдань в одному або двох потоках, чим одночасне їх виконання в декількох потоках.

Створення|створіння| і запуск потоків С#

Для створення потоків використовується конструктор класу Thread , що приймає як параметр делегат типа ThreadStart , вказуючий метод, який потрібно виконати. Делегат ThreadStart визначається так:

public delegate void ThreadStart();

Виклик методу Start починає виконання потоку. Потік триває до виходу з виконуваного методу. Ось приклад, що використовує повний синтаксис C# для створення делегата ThreadStart :

class| ThreadTest|

{

static| void| Main|()

{

Thread| t = new| Thread|(new| ThreadStart|(Go|));

t.Start(); // Виконати Go|() у новому потоці.

Go|(); // Одночасно запустити Go|() у головному|чільному| потоці.

}

static void Go() { Console.WriteLine("hello!"); }

В даному прикладі потік виконує метод Go () одночасно з головним потоком. Результат – два майже одночасних «hello»:

hello|! hello|!

2.2 Засоби|кошти| синхронізації в мові С#

У наступних|таких| таблицях приведена інформація про інструменти С# для координації (синхронізації) потоків:

Конструкція	Призначення
Sleep	Блокування на вказаний час
Join	Чекання закінчення іншого потоку

Табл. 2.1 Прості методи блокування

Конструкція	Призначення	Доступна з інших процесів?	Швидкість
Lock	Гарантує, що лише один потік може дістати доступ до ресурсу або секції коди.	немає	швидко
Mutex	Гарантує, що лише один потік може дістати доступ до ресурсу або секції коди. Може використовуватися для запобігання запуску декількох екземплярів додатка.	так	середня
Semaphore	Гарантує, що не більш заданого числа потоків може дістати доступ до ресурсу або секції коди.	так	середня

Табл. 2.2 Блокувальні конструкції

Конструкція	Призначення	Доступна з інших процесів	Швидкість
EventWaitHandle	Дозволяє потоку чекати сигналу від іншого потоку.	так	середньо
Wait and Pulse	Дозволяє потоку чекати, поки не виконається задана умова блокування.	немає	середньо

Табл. 2.3 Сигнальні конструкції

Конструкція	Призначення	Доступна з інших процесів	Швидкість
Interlocked	Виконання простих не блокуючих атомарних операцій.	Так – через пам'ять, що розділяється	дуже швидко
volatile	Для безпечного не блокуючого доступу до полів.	Так – через пам'ять, що розділяється	дуже швидко

Табл. 2.4 Не блокуючі конструкції синхронізації

Блокування

Коли потік зупинений в результаті використання конструкцій, перерахованих в наведених вище таблицях, говорять, що він блокований. Будучи блокованим, потік негайно перестає отримувати час CPU, встановлює властивість ThreadState в WaitSleepJoin і залишається в такому стані, поки не розблоковується. Розблокування може статися в наступних чотирьох випадках (кнопка виключення живлення не вважається!):

виконається умова розблокування;
витече|закінчуватиметься| таймаут операції (якщо він був заданий);
по перериванню через Thread .Interrupt;
по аварійному завершенню через Thread .Abort.

Потік не вважається блокованим, якщо його виконання припинене методом Suspend , що не рекомендується.

Виклик Thread .Sleep блокує поточний потік на вказаний час (або до переривання):

static| void| Main|()

{

Thread|.Sleep(0); |

Thread|.Sleep(1000);

Thread|.Sleep(TimeSpan|.FromHours(1));

Thread|.Sleep(Timeout|.Infinite);

}

Якщо бути точнішим, Thread .Sleep відпускає CPU і повідомляє, що потоку не повинен виділятися час у вказаний період. Thread .Sleep(0) відпускає CPU для виділення одного кванта часу наступному потоку в черзі на виконання.

Унікальність Thread .Sleep серед інших методів блокування в тому, що він припиняє прокачування повідомлень Windows в додатках WindowsForms або COM-окружении потоку в однопоточному апартаменті. Через це тривале блокування головного (UI) потоку додатка WindowsForms наводить до того що додаток перестає відгукуватися – і отже, використання Thread .Sleep потрібно уникати незалежно від того, чи дійсно прокачування черги повідомлень технічно припинене. У старому COM-среде ситуація складніша, там інколи може бути бажане блокування за допомогою Sleep з одночасним прокачуванням черги повідомлень.

Клас Thread також надає метод SpinWait , який не відмовляється від часу CPU, а навпаки, завантажує процесор в циклі на задану кількість ітерацій. 50 ітерацій еквівалентні паузі приблизно в мікросекунду, хоча це залежить від швидкості і завантаження CPU. Технічно SpinWait – не блокуючий метод: ThreadState такого потоку не встановлюється в WaitSleepJoin , і потік не може бути перерваний з іншого потоку. SpinWait рідко використовується – його головне вживання це чекання ресурсу, який повинен звільниться дуже скоро (у перебігу мікросекунд) без виклику Sleep і витрати процесорного часу на перемикання потоку. Проте ця методика вигідна лише на багатопроцесорних комп'ютерах, на однопроцесорному комп'ютері в ресурсу немає жодного шансу звільнитися, поки чекаючий на SpinWait потік не розтратить залишок кванта часу, а значить, необхідний результат недосяжний спочатку. А часті або тривалі виклики SpinWait даремно розтрачує час CPU.

Чекання|очікування| завершення потоку

Потік можна заблокувати до завершення іншого потоку викликом методу Join :

class| JoinDemo|

{

static| void| Main|()

{

Thread| t = new| Thread|(delegate|() { Console|.ReadLine(); });

t.Start();

t.Join(); // чекати, поки|доки| потік не завершиться

}

Метод Join може також приймати як аргумент timeout - в мілісекундах або як TimeSpan . Якщо вказаний час витік, а потік не завершився, Join повертає false. Join з timeout функціонує як Sleep – фактично наступні два рядки коди наводять до однакового результату:

Thread|.Sleep(1000);

Thread.CurrentThread.Join(1000);

Блокування і потокова безпека

class| ThreadUnsafe|

{

static| int| val1|, val2|;

static| void| Go|()

{

if| (val2| != 0)

Console|.WriteLine(val1| / val2|);

val2| = 0;

}

Він не є потокобезпечним: якби метод Go викликався двома потоками одночасно, можна було б отримати помилку ділення на 0, оскільки змінна val2 могла бути встановлена в 0 в одному потоці, у той час коли інший потік знаходився б між if і Console .WriteLine.

От як за допомогою блокування можна вирішити цю проблему:

class| ThreadSafe|

{

static| int| val1|, val2|;

static| void| Go|()

{

lock| (locker|)

{

if| (val2| != 0)

Console|.WriteLine(val1| / val2|);

val2| = 0;

}

Лише один потік може одноразово заблокувати об'єкт синхронізації (в даному випадку locker ), а всі інші конкуруючі потоки будуть припинені, поки блокування не буде знято. Якщо за блокування борються декілька потоків, вони ставляться в чергу чекання – "Readyqueue" – і обслуговуються, як тільки це стає можливим, за принципом “першим прийшов – першим обслужений”. Ексклюзивне блокування, як вже говорилося, забезпечує послідовний доступ до того, що вона захищає, так що виконувані потоки вже не можуть накластися один на одного. В даному випадку ми захистили логіку усередині методу Go , так само, як і поля val1 і val2 .

Потік, заблокований на час чекання звільнення блокування, має властивість ThreadState , встановлену в WaitSleepJoin . Пізніше ми обговоримо, як потік, заблокований в такому стані, може бути примусово звільнений з іншого потоку викликом методів Interrupt або Abort . Це досить потужна можливість, використовувана зазвичай для завершення робочого потоку.

Оператор lock мови C# фактично є синтаксичним скороченням для викликів методів Monitor .Enter і Monitor .Exit в рамках блоків try-finally . Ось в що фактично розвертається реалізація методу Go з попереднього прикладу:

Monitor|.Enter(locker|);

try|

{

if| (val2| != 0)

Console|.WriteLine(val1| / val2|);

val2| = 0;

}

finally { Monitor.Exit(locker); }

Виклик Monitor .Exit без попереднього виклику Monitor .Enter для того ж об'єкту синхронізації викличе виключення.

Monitor також надає метод TryEnter , що дозволяє задати час чекання в мілісекундах або у вигляді TimeSpan . Метод повертає true , якщо блокування було отримане, і false , якщо блокування не було отримане за заданий час. TryEnter може також бути викликаний без параметрів і в цьому випадку повертає управління негайно.

При неправильному використанні в блокування можуть бути і негативні наслідки – зменшення можливості паралельного виконання потоків, взаимоблокировки, гонки блокувань. Можливості для паралельного виконання зменшуються, коли надто багато коди поміщено в конструкцію lock , заставляючи інші потоки простоювати весь час, поки цей код виконується. Взаємоблокування настає, коли кожен з двох потоків чекає на блокуванні іншого потоку і, таким чином, ні той, ні інший не може рушити далі. Гонкою блокувань називається ситуація, коли будь-який з двох потоків може першим отримати блокування, проте програма ламається, якщо першим це зробить “неправильний” потік.

Заблокований потік може бути передчасно розблокований двома шляхами:

За допомогою Thread .Interrupt.
За допомогою Thread .Abort.

Це повинно бути зроблено з|із| іншого потоку; чекаючий потік безсилий що-небудь зробити в блокованому стані|статку|.

Interrupt|

Виклик Interrupt для блокованого потоку примусово звільняє його з генерацією виключення ThreadInterruptedException , як показано в наступному прикладі:

class| Program|

{

static| void| Main|()

{

Thread| t = new| Thread|(delegate|()

{

try|

{

Thread|.Sleep(Timeout|.Infinite);

}

catch|(ThreadInterruptedException|)

{

Console|.Write("Forcibly| ");

}

Console|.WriteLine("Woken|!");

});

t.Start();

t.Interrupt();

}

Wait| Handles|

Оператор lock – один з прикладів конструкцій синхронізації потоків. Lock є самим відповідним засобом для організації монопольного доступу до ресурсу або секції коди, але є завдання синхронізації (типа подачі сигналу початку роботи чекаючому потоку), для яких lock буде не найадекватнішим і зручнішим засобом.

У Win32 API є багатий набір конструкцій синхронізації, і вони доступні в .NET Framework у вигляді класів EventWaitHandle , Mutex і Semaphore . Деякі з них практичний за інших: Mutex , наприклад, здебільше дублює можливості lock , тоді як EventWaitHandle надає унікальні можливості сигналізації.

Всі три класи засновано на абстрактному класі WaitHandle , але вельми відрізняються по поведінці. Одна із загальних особливостей – це здатність іменування, що робить можливою роботу з потоками не лише одного, але і різних процесів.

EventWaitHandle має два похідних класу – AutoResetEvent і ManualResetEvent (що не мають жодного відношення до подій і делегатів C#). Обом класам доступні всі функціональні можливості базового класу, єдина відмінність полягає у виклику конструктора базового класу з різними параметрами.

У частині продуктивності, все WaitHandle зазвичай виконуються в районі декількох мікросекунд. Це рідко має значення з врахуванням контексту, в якому вони застосовуються.

AutoResetEvent дуже схожий на турнікет – один квиток дозволяє пройти одній людині. Приставка “auto” в назві відноситься до того факту, що відкритий турнікет автоматично закривається або “скидається” після того, як дозволяє кому-небудь пройти. Потік блокується в турнікета викликом WaitOne (чекати (wait ) в даного (one ) турнікета, поки він не відкриється), а квиток вставляється викликом методу Set . Якщо декілька потоків викликають WaitOne , за турнікетом утворюється черга. Квиток може “вставити” будь-який потік – іншими словами, будь-який (неблокований) потік, що має доступ до об'єкту AutoResetEvent , може викликати Set , аби пропустити один блокований потік.

Якщо Set викликається, коли немає чекаючих потоків, хэндл знаходитиметься у відкритому стані, поки який-небудь потік не викличе WaitOne . Ця особливість допомагає уникнути гонок між потоком, відповідним до турнікета, і потоком, що вставляє квиток (“опа, квиток вставлений на мікросекунду раніше, дуже шкода, але вам доведеться почекати ще скільки-небудь!”). Проте багатократний виклик Set для вільного турнікета не дозволяє пропустити за раз цілий натовп – зможе пройти лише один людина, всі останні квитки будуть витрачені даремно.

WaitOne приймає необов'язковий параметр timeout – метод повертає false , якщо чекання закінчується по таймауту, а не по здобуттю сигналу. WaitOne також можна виучити виходити з поточного контексту синхронізації для продовження чекання (якщо використовується режим з автоматичним блокуванням) щоб уникнути надмірного блокування.

Метод Reset забезпечує закриття відкритого турнікета, без всяких чекань і блокувань.

Мьютекс забезпечує ті ж самі функціональні можливості, що і оператор lock в C#, що робить його таким, що не дуже зажадався. Єдина перевага полягає в тому, що Mutex доступний з різних процесів, забезпечуючи блокування на рівні комп'ютера, у відмінності від оператора lock , який діє лише на рівні додатка. Mutex відносно швидкий, але lock швидше в сотні разів. Здобуття мьютекса займає декілька мікросекунд, виклик lock – десятки Наносекунди (якщо не відбувається власне блокування). Метод WaitOne для Mutex отримує виняткове блокування, блокуючи потік, якщо це необхідно. Виняткове блокування може бути зняте викликом методу ReleaseMutex . Точно також як оператор lock в C#, Mutex може бути звільнений лише з того ж потоку, що його захопив.

class| OneAtATimePlease|

{

static| void| Main|()

{

if| (!mutex.WaitOne(TimeSpan|.FromSeconds(5), false|))

{

Console|.WriteLine("У системі запущений інший екземпляр|примірник| програми!");

return|;

}

try|

{

Console|.WriteLine("Працюємо - натискуйте|натискайте| Enter| для виходу...");

Console|.ReadLine();

}

finally| { mutex|.ReleaseMutex(); }

}

Корисна властивість Mutex – якщо додаток завершується без виклику ReleaseMutex , CLR звільняє мьютекс автоматично.

Semaphore з ємкістю, рівній одиниці, подібний Mutex або lock , за винятком того, що він не має потоку-господаря. Будь-який потік може викликати Release для Semaphore , тоді як у випадку з Mutex або lock лише потік, що захопив ресурс, може його звільнити.

У наступному прикладі по черзі запускаються десять потоків, що виконують виклик Sleep . Semaphore гарантує, що не більше трьох потоків можуть викликати Sleep одночасно:

class| SemaphoreTest|

{

static| void| Main|()

{

for| (int| i = 0; i < 10; i++|)

new| Thread|(Go|).Start();

}

static| void| Go|()

{

while| (true|)

{

s.WaitOne();

// Лише|тільки| 3 потоки можуть знаходитися|перебувати| тут одночасно

Thread|.Sleep(100);

s.Release();

}

2.3 ВИРІШЕННЯ ЗАВДАННЯ СИНХРОНІЗАЦІЇ В МОВІ АДА

Завдання синхронізації двох процесів полягає в тому, що в одному процесі, наприклад Б, у визначеній точці (точці події) виконується подія (обчислення даних, уведення або виведення даних і т. ін.), а другий процес А у визначеній точці (точці очікування події) блокується доти, доки ця подія не відбудеться і він зможе продовжити своє виконання. Точка події і точка очікування - це точки синхронізації Якщо процес А вийшов на точку синхронізації, коли подія вже відбулася, то він не блокується і продовжує виконуватись.

Існує декілька схем синхронізації процесів :

• один процес очікує на подію в одному процесі (а);

• декілька процесів очікують на подію в одному процесі (b);

• один процес очікує на події в кількох процесах (с).

Для вирішення завдання синхронізації, яке іноді називають синхронізацією за подіями (eventsynchronization), можна використовувати різні механізми синхронізації процесів, таки як семафори, події, монітори.

Для вирішення завдання синхронізації в мові Ада95 можна застосувати механізм семафорів, а також захищені модулі.

Застосування семафорів. Розглянемо приклад, у якому задача А чекає на подію, яку мають містити задачі В, наприклад, введення даних (змінної х). Для синхронізації процесів з уведення використовуємо семафор СігналПроПодію з початковим значенням false, яке встановлюється автоматично під час створювання семафора. Очікування події в процесі А реалізовано за допомогою операції Suspend__Until_True (СігналПроПодію), а посилання сиггалу про подію в задачі В реалізовано за допомогою операції SetTrue(СігналПроПодію) .

procedureСинхронізація is

X: integer; -- глобальна змінна

СігналПроПодію: Suspension_Object; -- семафор

— задача, що чекає на подію

taskA;

task body A is

begin

точка очікування події

Suspend_Until_True(СігналПроПодію);

end A;

-- задача, де пройде подія

task В;

task body В is

begin

get(X); -- введення даних(подія, наяку чекає А)

Set_True(СігналПроПодію); -- сигнал задачі А

end В; begin

null ;

end Синхронізація;

Механізм семафорів запропонував математик Е.Дейкстра. У класичній інтерпретації механізм семафорів - це спеціальний захищений тип Semaphore та дві неподільні операції над змінною цього типу: P(S) і V(S).Неподільність операції означає, що її не можна переривати, поки не завершиться її виконання.

У мови Ада механізм семафорів подано у вигляді пакета Synchronous_Task_Control в додатку Annex D: Real-Time Systems. Пакет реалізує механізм семафорів таким чином. Семафорний тип забезпечується приватним типом Suspension_object, операції P(S) і V(S) реалізовані за допомогою процедур Suspend_Until_True () і SetJTrue (). Використовується бінарний логічний семафор, тобто семафорні змінні типу Suspension_Object набувають значень false і true. Крім указаних процедур, в пакеті реалізовані допоміжні процедури SetFalseOдля встановлення значення семафора в false і Currentstate () для зчитування поточного значення семафора. Специфікація пакета:

package Ada.Synchronous_Task_Control is

type Suspension_Object limited private ;

rocedure Set_True(S : in out 3uspension_Object);

procedure Set_False(S : in out Suspension_Object);

function Current_State(S : Suspension_Object) return Boolean ;

procedure Suspend_Until_True(3:in out Suspension_Object); private

end Ada. Synchronous_Task_Control;

Ідея монітора, яку запропонував Б. Хансен і розвинув С. Хо ґрунтується на об'єднанні змінних, що описують спільний ресуpc, і дій, які визначають засоби доступу до спільного ресурсу. Монітор - програмний модуль, що містить змінні та процедури роботи над ними, причому доступ до змінних можливий тільки

в процедурі.

Монітор - засіб розподілу ресурсів і взаємодії процесів Це назначення монітора реалізується за допомогою властивостей, якими наділені процедури монітора. Характерна особливість процедур монітора - взаємне виключення ними одне одного. У будь-який момент часу може виконуватися тільки одна процедура монітора. Якщо будь-який процес викликав і виконуй процедуру монітора. то жоден процес не може виконувати будь-які процедури цього монітора. За спроби виклику іншим процесом процедури, що виконується, або іншої процедури монітора цей процес блокується і розміщується в черзі блокованих процесів доти, доки активний процес не закінчить виконання процедури монітора. Тобто в моніторі не може "знаходитись" більше одного процесу. Така властивість процедур монітора забезпечує взаємне виключення процесів. які працюють з монітором.

Загальна структура монітора:

monitor ім'я Монітора;

-- Опис локальних даних

-- Опис процедур для доступу до даних begin

-- Ініціалізація локальних даних end ім'я Монітора;

У моніторі декларуються локальні змінні (спільні змінні), які захищені монітором, і процедури монітора. Значення локальних змінних можуть бути встановлені під час створення монітора. Далі значення цих змінних можуть бути прочитані або змінені процесами тільки за допомогою процедур, визначених у моніторі.

Концепцію моніторів у новому стандарті мови Ада95 реалізовано у вигляді спеціальних програмних модулів - захищених модулів (protected units). їх призначення - розширення можливості мови для програмування паралельних процесів. зокрема, для вирішення проблеми доступу до спільних ресурсів і синхронізації процесів. Крім того, захищені модулі забезпечують підтримку різних парадигм систем реального часу, для розроблення яких мову Ада використовують в першу чергу.

Спільні дані і операції над ними (захищені операції) об'єднуються в захищеному модулі, аналої ічно тому, як це робиться в інших модулях мови Ада- пакетах. Доступ до спільних ресурсів можливий тільки через захищені операції, які мають властивості, що дозволяють вирішити завдання взаємного виключення під час роботи зі спільними ресурсами.

Як і всі модулі в мові, захищені модулі складаються зі специфікації і тіла.

PROTECTED [TYPE] імя _Захшценого_Модуля

[Дискримінант] IS

Опис_Захищених_Операцій

[PRIVATE]

Опис_Захищених_Елемєнтів

END імя_Захищєного_Модуля;

Захищені операції - це:

• захищені функції.

• захищені процедури,

• захищені входи.

Захищені функції забезпечують доступ тільки до читання захищених і елементів. Але дозволяють робити це одночасно всім процесам автоматичним копіюванням елементів, які зчитуються.

Це порушує головну властивість процедур монітора, яка дозволяє знаходитися в моніторі тільки одному процесу, але це ''порушення" дозволяє скоротити час доступу до захищених елементів і не має будь-яких наслідків, оскільки зміна даних заборонена і не виконується.

Захищені процедури забезпечують ексклюзивний доступ до захищених елементів через читання і запис.

Захищені входи забезпечують ті самі функції, що й захищені процедури, додатково реалізуючі за допомогою бар 'єрів ексклюзивний (умовний) доступ до тіла захищеного входу. Це Дозволяє реалізувати за допомогою входів вирішення завдання синхронізації.

3 А ПАРАТНИЙ КОМПЛЕКС

3.1 Компютерна система

Табл 3.1 Структура комп’ютерної системи.

Процесор:	AMD PHENOM II X4 945(3.00GHz,AM3)	1213.00 Грн.
Материнська плата:	AMD 780V	559 грн.
Оперативна пам'ять:	DDR II 4GB PC6400 KINGSTONE(HYNIX)	1 115,80 грн.
Жорсткий диск:	500GB SATA II 16MB(WD,SEAGATE)	470.82 грн.
Відеокарта:	onboard VGA(DVI) up to 512MB
CD:	DVD-RW	184 грн.
Звук:	6-Channel HD Audio
Корпус	ATX 400W FSP(CHIEFTEC) 4U 701	624,1
4166,72

3.2 Процесор

AMD PHENOM II X4 945(3.00GHz,AM3)

Лінійка	Phenom II X4
Сокет	AM3
Тактова частота	3000 Мгц
Частота шини	HT
Коефіцієнт множення	15
Напруга на ядрі	0.875 B
Інструкції	MMX, SSE, SSE2, SSE3, SSE4, 3DNow!
Підтримка AMD64/EM64T	є
Підтримка NX Bit	є
Підтримка Virtualization Technology	є
Ядро	Deneb
Кількість ядер	4
Техпроцесс	45 нм
Об'єм кеша L1	128 Кб
Об'єм кеша L2	2048
Об'єм кеша L3	6144
Типове тепловиділення	125 Вт
Максимальна робоча температура	62 °C
Додаткова інформація	напруга на ядрі 0.875-1.5В

Табл 3.2 Характеристика процесора.

3.3 Системна плата ASUS| M3A78-CM| 6xSATA

Socket	AM2+
Кількість сокетів для процесора	1
Системна шина	HyperTransport
Підтримка багатоядерних процесорів	Є
Підтримувані процесори	AMD PhenomFX/Phenom/Athlon64 FX/Athlon64 X2/Athlon64/Sempron
Пам'ять	DDR2 DIMM, 533 - 1066 Мгц
Кількість слотів пам'яті	4
Максимальний об'єм пам'яті	8 Гб
Підтримка двоканального режиму	є
Слоти розширення	1xPCI-E 16x, 1xPCI-E 1x, 2xPCI
Підтримка PCI Express 2.0	є
Ethernet	1000 Мбіт/с
S-ATA	кількість слотів: 6, S-ATA II, RAID: 0, 1, 10
IDE	кількість слотів: 1, ULTRADMA 133
Звук	7.1CH, HDA
Вбудований відеоадаптер	Є
Роз'єм живлення процесора	4-pin
Наявність інтерфейсів	12xUSB 2.0, вихід S/PDIF, 1xCOM, LPT, D-Sub, DVI, Ethernet, PS/2 (клавіатура)
Роз'єми на задній панелі	6xUSB 2.0, D-Sub, DVI, Ethernet, PS/2 (клавіатура)
Основний роз'єм живлення	24-pin
Форм-фактор	mATX
Чіпсет	AMD 780V
Підтримка SLI/CrossFire	Hybrid CrossFireX
BIOS	AMI з можливістю аварійного відновлення

Табл 3.2 Характеристика системної плати.

3.4 Оперативна память

Hynix DDR2-800 4096MB PC6400 (HMP351U6AFR8C-S6)

Об'єм пам'яті	4 ГБ
Тип пам'яті	DDR2 SDRAM
Частота пам'яті	800 Мгц
Ефективна пропускна спроможність	6400 Mб/с
Схема таймінгів пам'яті	CL6

Табл 3.3 Характеристика оперативної памяті.

3.4 Жорсткий диск

Вінчестер SATA 500 GB WD WD5000AAKS 16MB 7200rpmА

Ємкість	500 Гб
Час включення	11 сек
Тип підшипників	Гідродинамічний (FDB).
Інтерфейс	SATA-II (Сумісно з SATA-I або SATA150 контроллерами)
Буфер	16 Мб
Швидкість обертання шпинделя	7200 оборотов/хв.
Середній час доступу	8.9 мс (читання), 10.9 мс (запис)
Час переходу з доріжки на доріжку	2 мс
Швидкість обміну між носієм і контроллером	до 972 Мбіт/сек
Рівень шуму	28 дБ (А) в режимі чекання, 33 дБ (А) - Seek Mode, 29 дБ (А) - Seek Mode 3
Максимальні перевантаження	65G тривалістю 2 мс при роботі; 300G тривалістю 2 мс у вимкненому стані
Пропускна спроможність інтерфейсу	300 Мб/сек
Живлення	Від SATA коннектора живлення.
Вжиток енергії	8.77 Вт (чтение/запись), 8.4 Вт (у режимі чекання)

Табл 3.4 Характеристика вінчестера.

3.5 Корпус

Корпус ATX 400W FSP(CHIEFTEC) 4U 701

5.25"	4 шт
3.5" зовнішні (для FDD,CardReader)	1шт
3.5" внутрішні (для HDD)	5шт
Додатково
USB 2.0 виходів -	2шт
Audio роз`єм(мікрофон, навушники)	2шт
Блок живлення	ATX 450 Вт кулер 120мм (SATA)
Розміри:
высотаглубинаширина (мм)	430480200

Табл 3.5 Характеристика корпусу

4 РОЗРОБКА ПРОГРАМ

4.1 Задача

Реалізація множення матриці на матрицю у чотирьох процесорній системі із спільною пам’яттю (рис. 4.1) з використання захищеного модуля мови Ада.

Вхідні дані:

комп’ютерна система зі спільною пам’яттю, яка включає чотири процесори і два пристрої введення-виведення (рис. 2.1);

математичне завдання: реалізації множення матриці на матрицю і вектора на матрицю ;

де MА, М B , М C – вектори розмірності N .

введення вектора M В виконується в процесорі Т2, введення матриці МС виконується в процесорі Т1, виведення результату – матриці МА – у процесі Т1.

Етап 1. Побудова паралельного алгоритму. Паралельний алгоритм можна подати у вигляді

(4.1)

де - Н елементів матриці MB , MA .

Співвідношення (4.1) визначає дії у кожному процесорі системи під час виконання обчислень.

Спільним ресурсом у рівнянні (4.1) є MC .

Етап2. Розроблення алгоритмів роботи кожного процесу.

Цей етап включає розроблення детального алгоритму роботи кожного процесу. Такий алгоритм має включати всі дії процесу, які, крім безпосередніх обчислень за формулою (2.1), будуть включати введення даних і виведення результату, а також дії, що пов’язані з організацією взаємодії процесів (розв’язування задач взаємного виключення та синхронізації).

Т1	Т2	Т3	Т4
1.Ввід MC .	1.Введення М B .	1. Чекати сигнал від Т1,Т2.	1.Чекати сигнал від Т1,Т2.
2.СигналT1,Т2,Т3,Т4 про закінчення введення MC.	2.СигналТ1,T2,T3,Т4 про закінчення введення М B .	2. Копія =.	2. Копія =.
3.Чекати сигнал від Т1,Т2.	3.Чекати сигнал від Т1,Т2.	3.Обчислення *	3.Обчислення *
4. Kопія=.	4. Копія =.	4. Сигнал про завершення обчислення Т1	4.Сигнал від Т1, про завершення обчислення
5.Обчислення *	5.Обчислення *
6.Чекатисигналвід T1,Т2,Т3,Т4 про завершення обчислення.	6.Сигнал про завершення обчислення Т1.
7.Виведення MА .

Табл.3.1. Структурна таблиця розроблення алгоритмів роботи кожного процесу.

Етап 3. Розробка структурної схеми взаємодії задач. Цей етап пов'язаний із розробкою структури захищеного модуля, за допомогою якого реалізується взаємодія задач. Захищений модуль Керування (рис 2.2) включає чотири захищені елементи: В, МС, F 1, F 2, а також набір захищених операцій:

· вхід Чекати 1 для синхронізації з введенням в задачах Т1, Т2;

· вхід Чекати 2 для синхронізації після завершення обчислень у задачі Т1;

· функцію Копія МС для копіювання спільного ресурсу МС;

· процедуру Ввід МС для запису значення МС у захищений модуль;

· процедуру Сигнал 1 для сигналу про завершення обчислень у задачі Т1, Т2, Т3,T4;

· процедуру Сигнал 2 для сигналу про завершення введення даних у задачах Т2 і Т4.

Захищені змінні F1 F2 використовуються в бар’єрах входів Чекати 1 і Чекати 2.

Схема захищеного модуля представлена в Додатку А

Етап 4. Лістинг програми

Лістинг програми представлено в Додатку Б

4.2 Задача

Реалізація множення матриці на матрицю у чотирьох процесорній системі із спільною пам’яттю (рис. 4.2) з використання захищеного модуля мови Ада.

Вхідні дані:

· комп’ютерна система зі спільною пам’яттю, яка включає чотири процесори ітри пристрої введення-виведення (рис. 2.1);

· математичне завдання: реалізації множення матриці на матрицю і на

· ще одну матрицю ;

де MА, М B , М C , МЕ – матриці розмірності N .

· введення матриціM В виконується в процесорі Т2, введення матриці МС виконується в процесорі Т1, введення матриці М E виконується в процесорі Т3, виведення результату – матриці МА – у процесі Т4.

Етап 1. Побудова паралельного алгоритму. Паралельний алгоритм можна подати у вигляді

(4.2)

де - Н елементів матриціМА ,MB,MC,MAA .

Співвідношення (4.2) визначає дії у кожному процесорі системи під час виконання обчислень.

Спільним ресурсом у рівнянні (4.2) є матрицяMC іпотім створена матриця M АА .

Етап2. Розроблення алгоритмів роботи кожного процесу.

Цей етап включає розроблення детального алгоритму роботи кожного процесу. Такий алгоритм має включати всі дії процесу, які, крім безпосередніх

обчислень за формулою (4.2), будуть включати введення даних і виведення результату, а також дії, що пов’язані з організацією взаємодії процесів (розв’язування задач взаємного виключення та синхронізації).

Т1	Т2	Т3	Т4
1. Введення MC .	1.Введення М B .	1. Введення М E .	1.Чекати сигнал від Т1,Т2,Т3.
2.Сигнал T1,Т2,Т3,Т4 про закінчення введення MC .	2.Сигнал Т1,Т3,Т4 про закінчення введення М B .	2.Сигнал Т1,Т2,Т4 про закінчення введення ME .	2.Копія
3.Чекати сигнал від T1,Т2,Т3.	3.Чекати сигнал від Т1,T2,Т3.	3.Чекати сигнал від Т1,Т2,T3.	3.Обчислення
4.Копія	4.Копія	4.Копія	4.Сигнал від Т1, Т2, Т3, Т4 про завершення обчислення.
5.Обчислення	5.Обчислення	5. Обчислення	5. Чекати сигнал від Т1,Т2,T3,Т
6. Сигнал від Т1, Т2, Т3, Т4 про завершення обчислення.	6. Сигнал від Т1, Т2, Т3, Т4 про завершення обчислення.	6. Сигнал від Т1, Т2, Т3, Т4 про завершення обчислення.	6.Копія
7. Чекати сигнал від Т1,Т2,T3,Т4.	7. Чекати сигнал від Т1,Т2,T3,Т4.	7. Чекати сигнал від Т1,Т2,T3,Т4.	7.Обчислення
8.Копія	8.Копія	8.Копія	8. Сигнал Т4 про завершення обчислення.
9. Сигнал Т4 про завершення обчислення	9. Сигнал Т4 про завершення обчислення	8. Сигнал Т4 про завершення обчислення	9. Вивід MA

Табл. 4.2 Структурна таблиця розроблення алгоритмів роботи кожного процесу.

Етап 3. Розробка структурної схеми взаємодії задач. Цей етап пов'язаний із розробкою структури захищеного модуля, за допомогою якого реалізується взаємодія задач. Захищений модуль Керування (рис 2.2) включає чотири захищені елементи: МE, F 1, F 2, F3 а також набір захищених операцій:

· вхід Чекати 1 для синхронізації з введенням в задачах Т1, Т2, Т3;

· вхід Чекати 2 для синхронізації після завершення обчислень у задачі Т1, Т2, Т3,Т4;

· вхід Чекати 3 для синхронізації після завершення обчислень у задачі Т4;

· функцію Копія MAA , Kopija ME для копіювання спільного ресурсу MAA,МС;

· процедуру Ввід М E для запису значення МE у захищений модуль;

· процедуру Сигнал 1 для сигналу про завершення обчислень у задачі Т1, Т2, Т3;

· процедуру Сигнал 2 для сигналу про завершення введення даних у задачах Т1, Т2, Т3,Т4;

· процедуру Сигнал 3 для сигналу про завершення введення даних у задачах Т1, Т2, Т3,Т4;

Захищені змінні F1, F2, F3 використовуються в бар’єрах входів Чекати 1 , Чекати 2, Чекати 3.

Схема захищеного модуля представлена в Додатку В

Етап 4. Лістинг програми

Лістинг програми представлено в Додатку Г

4.2 Задача

Реалізація cуми двох добутків матриці на матрицю у чотирьох процесорній системі із спільною пам’яттю (рис. 4.3) з використання захищеного модуля мови Ада.

Вхідні дані:

· комп’ютерна система зі спільною пам’яттю, яка включає чотири процесори і чотири пристрої введення-виведення (рис. 2.1);

· математичне завдання: реалізації множення матриці на матрицю і вектора на матрицю ;

де MА, М B , М C,MO,MK – матриці розмірності N .

· введення вектора M В виконується в процесорі Т2, введення матриці МС виконується в процесорі Т1, введення матриці М O виконується в процесорі Т3, введення матриці МK виконується в процесорі Т4, виведення результату – матриці МА – у процесі Т3.

Етап 1. Побудова паралельного алгоритму. Паралельний алгоритм можна подати у вигляді

(4.3)

де - Н елементів матриці M A .

Співвідношення (4.3) визначає дії у кожному процесорі системи під час виконання обчислень.

Спільним ресурсом у рівнянні (4.3) є MC і MK .

Етап2. Розроблення алгоритмів роботи кожного процесу.

Цей етап включає розроблення детального алгоритму роботи кожного процесу. Такий алгоритм має включати всі дії процесу, які, крім безпосередніх обчислень за формулою (4.3), будуть включати введення даних і виведення результату, а також дії, що пов’язані з організацією взаємодії процесів (розв’язування задач взаємного виключення та синхронізації).

Т1	Т2	Т3	Т4
1.Ввід MB .	1.Введення М B .	1. Введення М O .	1. Введення М K .
2.Сигнал T1-T4про закінчення введення.	2.Сигнал T1-T4про закінчення введення.	2.Сигнал T1-T4про закінчення введення.	2. Сигнал T1-T4про закінчення введення.
3.Чекати сигнал від Т1-T4.	3.Чекати сигнал від Т1-T4.	3.Чекати сигнал від Т1-T4.	3.Чекати сигнал від Т1-T4.
4. Копія =.	4. Копія =.	4. Копія =.	4. Копія =.
5.Обчислення	5.Обчислення	5.Обчислення	5.Обчислення
6.Чекати сигнал від Т1-T4 про завершення обчислення.	6. Чекати сигнал від Т1-T4 про завершення обчислення.	6. Чекати сигнал від Т1-T4 про завершення обчислення.	6. Чекати сигнал від Т1-T4 про завершення обчислення.
7.Виведення MА .

Табл. 4.3 Структурна таблиця розроблення алгоритмів роботи кожного процесу.

Етап 3. Розробка структурної схеми взаємодії задач. Цей етап пов'язаний із розробкою структури захищеного модуля, за допомогою якого реалізується взаємодія задач. Захищений модуль Керування (рис 2.2) включає чотири захищені елементи: МС, MK, F 1, F 2, а також набір захищених операцій:

· вхід Чекати 1 для синхронізації з введенням в задачах Т1-T4;

· вхід Чекати 2 для синхронізації після завершення обчислень у задачахТ1-T4;

· функцію Копія МС для копіювання спільного ресурсу МС;

· функцію Копія М K для копіювання спільного ресурсу МС;

· процедуру Ввід МС для запису значення МС у захищений модуль;

· процедуру Ввід М K для запису значення МK у захищений модуль;

· процедуру Сигнал 1 для сигналу про завершення обчислень у задачі Т1, Т2, Т3,T4;

· процедуру Сигнал 2 для сигналу про завершення введення даних у задачах Т1, Т2, Т3,T4;

Захищені змінні F1 F2 використовуються в бар’єрах входів Чекати 1 і Чекати 2.

Схема захищеного модуля представлена в Додатку Д

Етап 4. Лістинг програми

Лістинг програми представлено в Додатку Е

4.4 Тестування програм

Для визначення ефективності розроблених програм було проведено дослідження, де визначався час виконання програми паралельної обчислюваної системи. Для цього було визначено час виконання програми у паралельно обчислюваній системі із двома ядрами, а потім у паралельно обчислюваній системі, де одне ядро було відключено через диспетчер задач. Це було зроблено для кількох значень N- розміру матриць. N ,було рівне 100, 200, 400, 600, 800, 1000.

Результати часу в сек. , , представлені в таблицях 4.4, 4.5, 4.6

1 - ядро	2 - ядра	4 - ядра
100	3	2	1
200	10	6	3
400	43	25	13
600	97	55	30
800	177	100	58
1000	288	166	110

Табл. 4.4 Тестування

Графік відношення часу до кількості елементів

Рис. 4.4 Графік відношення часу

1 - ядро	2 - ядра	4 - ядра
100	7	4	1
200	23	12	6
400	160	98	56
600	227	129	89
800	396	207	156
1000	653	326	250

Табл. 4.5 Тестування

Графік відношення часу до кількості елементів

Рис. 4.5 Графік відношення часу

1 - ядро	2 - ядра	4 - ядра
100	5	4	2
200	20	11	8
400	76	43	30
600	189	95	67
800	341	173	117
1000	523	268	177

Табл. 4.5 Тестування

Графік відношення часу до кількості елементів

Рис. 4.5 Графік відношення часу

ВИСНОВКИ

Метою бакалаврської роботи було розробити Програмно-апаратний комплекс на основі Амд-процесорів. В перших двох розділах описано AMD-багатоядерні процесори і засоби мов С# і ADA для програмування паралельних потоків.

У третьомурозділу розглядаєся апартна частина комплексу, визначено його складові і їхній кошторис

Метою четвертого розділу було визначення ефективності програми. Для визначення ефективності розробленої програми було проведено дослідження, де визначалося час виконання паралельної програми обчислюваної системи.

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ

1. Жуков І.А., Корочкин О.В. Паралельні та розподілені обчислення. Навч. Посіб – К.: Корнійчук, 2005. – 226 с.

2. Корочкин А. В. Ада95: Введение в программирование- К.:
Свит, 1999.-260 с.

3. Корочкин А., Мустафа Акрам Параллеьные вычисления: Ада и Java. - Вісн. НТУУ "КГП", Інформап ка, управління та обчислювальна техніка, 1999, К.: - № 32, С 3-17.

4. Языки программирования: Ада, Паскаль, Си.Сравнение и оценка/ Под ред.Н. Джехани - М.: Радио и связь, 1989. - 386 с.

5.Русанова О.В. Программное обеспечение компьютерны систем. Особенности программирования и компиляции. - К.: Корійчук, 2003.-94 с

6. Троелсон Є. С# и платформа-NET. Библиотека программиста -СПб.: Питер, 2004. - 796 с.

7. Эндрюс Г. Основы многопоточного, параллельного и распреде -ленного програмирования.: Пер. с англ. - М.: Изд. Дом «Виль -ямс», 2003.-512 с.

8. Элементы параллельного программирования / В.А.Вальковский, В.Е.Котов, А.Г.Марчук/ Под ред. В. Е. Котова- М.: Радио и связь, 1983.-240 с.

9.Бар Р. Язык Ада в проектировании систем. - М.: Мир, 1988.-ЗІ 0 с

10. Богачев К.Ю. Основы параллельного программирования.- М.: БИНОМ. Лаб. знаний, 2003. - 342 с .

11. М. Кузьминский, «64-разрядные микропроцессоры AMD». Открытые системы, № 4, 2002.

12.Паралельне програмування для многопроцессорних обчислювальних систем автори: Немнюгин С., Стесик О.

ДОДАТКИ

Додаток А

Блок-схема роботи програми

Рис. A.1 Захищений модуль операції

Додаток Б

Лістинг програми

-- Zaxushenuj modylj----

----------------------------------

with Ada.Text_IO,

Ada.Integer_Text_IO,Ada.Calendar;

use Ada.Text_IO,

Ada.Integer_Text_IO,Ada.Calendar;

Procedure Bakalawr1 is

P:integer:=4;

N:integer:=5000;

H:integer:=N/P;

t:time;

s1,s3:day_Duration;

s2,s4,s5:integer;

-----Tupu-----

type Vector is array (1..N) of integer;

type Matrix is array (1..N) of Vector;

-----Zminni------

MA,MC,MB:Matrix;

----Zaxuchenuj m-----

Protected Box is

procedure VvidMC(MCK: in Matrix);

function Kopija1 return Matrix;

procedure Signal1;

procedure Signal2;

entry Zdat1;

entry Zdat2;

private

F1:integer:=0;

F2:integer:=0;

end Box;

----------------------

protected body Box is

Procedure VvidMC(MCK: in Matrix) is

begin

MC:=MCK;

end VvidMC;

function Kopija1 return Matrix is

begin

return MC;

end Kopija1;

procedure Signal1 is

begin

F1:=F1+1;

end Signal1;

procedure Signal2 is

begin

F2:=F2+1;

end Signal2;

entry Zdat1

when F1=2 is

begin

null;

end Zdat1;

entry Zdat2

when F2=4 is

begin

null;

end Zdat2;

end Box;

----------------------

procedure start is

task T1;

task body T1 is

MCC,MC1:Matrix;

begin

put("T1 started");

new_line;

--vvid matruci MC-----

for i in 1..N loop

for j in 1..N loop

MCC(i)(j):=1;

end loop;

Box.VvidMC(MCC);

--Signal pro zavershennja vvody--

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

--Kopija---

MC1:=Box.Kopija1;

--Obchuslennja--

for i in 1..H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MC1(k)(j);--MB(i)(k);--*MC1(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

--Chekaje zavershennja obchuslennja inshux procesiv--

Box.Zdat2;

--vuvid--

for i in 1..N loop

for j in 1..N loop

put(MA(i)(j));

put(" ");

end loop;

new_line;

end loop;

put(" T1 Finished ");

end T1;

--------------------------------

task T2;

task body T2 is

MBB,MC2:Matrix;

begin

put(" T2 started ");

--vvid---------

for i in 1..N loop

for j in 1..N loop

MB(i)(j):=1;

end loop;

--Signal pro zavershennja vvody---

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

--Kopija--

MC2:=Box.Kopija1;

---Obchuslennja--

for i in H+1..2*H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MC2(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

put(" T2 Finished ");

end T2;

-------------------------------------------

task T3;

task body T3 is

MC3:Matrix;

begin

put(" T3 started ");

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

---Kopija---

MC3:=Box.Kopija1;

---Obchuslennja--

for i in 2*H+1..3*H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MC3(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

put(" T3 Finished ");

end T3;

-------------------------------------------

task T4;

task body T4 is

MC4:Matrix;

begin

put(" T4 started ");

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

---Kopija---

MC4:=Box.Kopija1;

---Obchuslennja--

for i in 3*H+1..N loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MC4(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

put(" T4 Finished ");

end T4;

begin Null;

end start;

begin

put_line("Main");

put("N=");

get(N);

t:=clock;

s1:=Seconds(t);

s2:=integer(s1);

start;

t:=clock;

s3:=Seconds(t);

s4:=integer(s3);

S5:=S4-S2;

new_line;

put("Càs programu=");

put(s5);

end Bakalawr1;

Додаток В

Блок-схема роботи програми

Рис. В.1 Захищений модуль операції

Додаток Г

Лістинг програми

-- Zaxushenuj modylj----

----------------------------------

with Ada.Text_IO,

Ada.Integer_Text_IO,Ada.Calendar;

use Ada.Text_IO,

Ada.Integer_Text_IO,Ada.Calendar;

Procedure Bakalawr2 is

P:integer:=4;

N:integer:=5000;

H:integer:=N/P;

t:time;

s1,S3:day_Duration;

s2,S4,S5:integer;

-----Tupu-----

type Vector is array (1..N) of integer;

type Matrix is array (1..N) of Vector;

-----Zminni------

MA,MC,MB,ME,MAA:Matrix;

----Zaxuchenuj m-----

Protected Box is

procedure VvidME(MEK: in Matrix);

function Kopija1 return Matrix;

function Kopija2 return Matrix;

procedure Signal1;

procedure Signal2;

procedure Signal3;

entry Zdat1;

entry Zdat2;

entry Zdat3;

private

F1:integer:=0;

F2:integer:=0;

F3:integer:=0;

end Box;

----------------------

protected body Box is

Procedure VvidME(MEK: in Matrix) is

begin

ME:=MEK;

end VvidME;

function Kopija1 return Matrix is

begin

return ME;

end Kopija1;

function Kopija2 return Matrix is

begin

return MAA;

end Kopija2;

procedure Signal1 is

begin

F1:=F1+1;

end Signal1;

procedure Signal2 is

begin

F2:=F2+1;

end Signal2;

procedure Signal3 is

begin

F3:=F3+1;

end Signal3;

entry Zdat1

when F1=3 is

begin

null;

end Zdat1;

entry Zdat2

when F2=4 is

begin

null;

end Zdat2;

entry Zdat3

when F3=4 is

begin

null;

end Zdat3;

end Box;

----------------------

procedure start is

task T1;

task body T1 is

MCC,ME1,MA1:Matrix;

begin

put("T1 started");

new_line;

--vvid matruci MC-----

for i in 1..N loop

for j in 1..N loop

MC(i)(j):=1;

end loop;

--Signal pro zavershennja vvody--

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

--Kopija---

ME1:=Box.Kopija1;

--Obchuslennja MC*ME--

for i in 1..H loop

for j in 1..N loop

for k in 1..N loop

MAA(i)(j):=MAA(i)(j)+MC(i)(k)*ME1(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

--Chekaje zavershennja obchuslennja inshux procesiv--

Box.Zdat2;

--Kopija---

MA1:=Box.Kopija2;

--Obchuslennja MB*(MC*ME)--

for i in 1..H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MA1(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal3;

put(" T1 Finished ");

end T1;

--------------------------------

task T2;

task body T2 is

MBB,ME2,MA2:Matrix;

begin

put(" T2 started ");

--vvid---------

for i in 1..N loop

for j in 1..N loop

MB(i)(j):=1;

end loop;

--Signal pro zavershennja vvody---

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

--Kopija--

ME2:=Box.Kopija1;

--Obchuslennja MC*ME--

for i in H+1..2*H loop

for j in 1..N loop

for k in 1..N loop

MAA(i)(j):=MAA(i)(j)+MC(i)(k)*ME2(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

--Chekaje zavershennja obchuslennja inshux procesiv--

Box.Zdat2;

--Kopija---

MA2:=Box.Kopija2;

--Obchuslennja MB*(MC*ME)--

for i in H+1..2*H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MA2(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal3;

put(" T2 Finished ");

end T2;

-------------------------------------------

task T3;

task body T3 is

MEE,ME3,MA3:Matrix;

begin

put(" T3 started ");

--vvid---------

for i in 1..N loop

for j in 1..N loop

MEE(i)(j):=1;

end loop;

Box.VvidME(MEE);

--Signal pro zavershennja vvody---

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

---Kopija---

ME3:=Box.Kopija1;

--Obchuslennja MC*ME--

for i in 2*H+1..3*H loop

for j in 1..N loop

for k in 1..N loop

MAA(i)(j):=MAA(i)(j)+MC(i)(k)*ME3(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

--Chekaje zavershennja obchuslennja inshux procesiv--

Box.Zdat2;

--Kopija---

MA3:=Box.Kopija2;

--Obchuslennja MB*(MC*ME)--

for i in 2*H+1..3*H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MA3(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal3;

put(" T3 Finished ");

end T3;

-------------------------------------------

task T4;

task body T4 is

ME4,MA4:Matrix;

begin

put(" T4 started ");

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

---Kopija---

ME4:=Box.Kopija1;

--Obchuslennja MC*ME--

for i in 3*H+1..N loop

for j in 1..N loop

for k in 1..N loop

MAA(i)(j):=MAA(i)(j)+MC(i)(k)*ME4(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

--Chekaje zavershennja obchuslennja inshux procesiv--

Box.Zdat2;

--Kopija---

MA4:=Box.Kopija2;

--Obchuslennja MB*(MC*ME)--

for i in 3*H+1..N loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MA4(k)(j);

end loop;

--Signal pro zavershennja obchuslennja—

Box.Signal3;

--Chekaje zavershennja obchuslennja inshux procesiv--

Box.Zdat3;

--vuvid--

for i in 1..N loop

for j in 1..N loop

put(MA(i)(j));

put(" ");

end loop;

new_line;

end loop;

put(" T4 Finished ");

end T4;

begin Null;

end start;

begin

put("N=");

get(N);

put_line("Main");

t:=clock;

s1:=Seconds(t);

s2:=integer(s1);

start;

t:=clock;

s3:=Seconds(t);

s4:=integer(s3);

S5:=S4-S2;

put(s5);

end Bakalawr2;

Додаток Д

Блок-схема роботи програми

Рис. Д.1 Захищений модуль операції

Додаток Е

Лістинг програми

-- Zaxushenuj modylj----

----------------------------------

with Ada.Text_IO,

Ada.Integer_Text_IO,Ada.Calendar;

use Ada.Text_IO,

Ada.Integer_Text_IO,Ada.Calendar;

Procedure Bakalawr3 is

P:integer:=4;

N:integer:=4000;

H:integer:=N/P;

t:time;

s1,S3:day_Duration;

s2,S4,S5:integer;

-----Tupu-----

type Vector is array (1..N) of integer;

type Matrix is array (1..N) of Vector;

-----Zminni------

MA,MC,MB,MO,MK:Matrix;

----Zaxuchenuj m-----

Protected Box is

procedure VvidMC(MCK: in Matrix);

procedure VvidMK(MKK: in Matrix);

function Kopija1 return Matrix;

function Kopija2 return Matrix;

procedure Signal1;

procedure Signal2;

entry Zdat1;

entry Zdat2;

private

F1:integer:=0;

F2:integer:=0;

end Box;

----------------------

protected body Box is

Procedure VvidMC(MCK: in Matrix) is

begin

MC:=MCK;

end VvidMC;

Procedure VvidMK(MKK: in Matrix) is

begin

MK:=MKK;

end VvidMK;

function Kopija1 return Matrix is

begin

return MC;

end Kopija1;

function Kopija2 return Matrix is

begin

return MK;

end Kopija2;

procedure Signal1 is

begin

F1:=F1+1;

end Signal1;

procedure Signal2 is

begin

F2:=F2+1;

end Signal2;

entry Zdat1

when F1=4 is

begin

null;

end Zdat1;

entry Zdat2

when F2=4 is

begin

null;

end Zdat2;

end Box;

----------------------

Procedure start is

task T1;

task body T1 is

MCC,MC1,MK1:Matrix;

begin

put("T1 started");

new_line;

--vvid matruci MC-----

for i in 1..N loop

for j in 1..N loop

MCC(i)(j):=1;

end loop;

Box.VvidMC(MCC);

--Signal pro zavershennja vvody--

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

--Kopija---

MC1:=Box.Kopija1;

MK1:=Box.Kopija2;

--Obchuslennja--

for i in 1..H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MC1(k)(j)+MO(i)(k)*MK1(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

put(" T1 Finished ");

end T1;

--------------------------------

task T2;

task body T2 is

MBB,MC2,MK2:Matrix;

begin

put(" T2 started ");

--vvid---------

for i in 1..N loop

for j in 1..N loop

MB(i)(j):=1;

end loop;

--Signal pro zavershennja vvody---

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

--Kopija--

MC2:=Box.Kopija1;

MK2:=Box.Kopija2;

--Obchuslennja--

for i in H+1..2*H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MC2(k)(j)+MO(i)(k)*MK2(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

put(" T2 Finished ");

end T2;

-------------------------------------------

task T3;

task body T3 is

MOO,MC3,MK3:Matrix;

begin

put(" T3 started ");

--vvid---------

for i in 1..N loop

for j in 1..N loop

MO(i)(j):=1;

end loop;

--Signal pro zavershennja vvody---

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

---Kopija---

MC3:=Box.Kopija1;

MK3:=Box.Kopija2;

--Obchuslennja--

for i in 2*H+1..3*H loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MC3(k)(j)+MO(i)(k)*MK3(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

--Chekaje zavershennja obchuslennja inshux procesiv--

Box.Zdat2;

--vuvid--

for i in 1..N loop

for j in 1..N loop

put(MA(i)(j));

put(" ");

end loop;

new_line;

end loop;

put(" T3 Finished ");

end T3;

-------------------------------------------

task T4;

task body T4 is

MKK,MC4,MK4:Matrix;

begin

put(" T4 started ");

--vvid---------

for i in 1..N loop

for j in 1..N loop

MKK(i)(j):=1;

end loop;

Box.VvidMK(MKK);

--Signal pro zavershennja vvody---

Box.Signal1;

--Chekaje zavershennja vvody inshux danux--

Box.Zdat1;

---Kopija---

MC4:=Box.Kopija1;

MK4:=Box.Kopija2;

--Obchuslennja--

for i in 3*H+1..N loop

for j in 1..N loop

for k in 1..N loop

MA(i)(j):=MA(i)(j)+MB(i)(k)*MC4(k)(j)+MO(i)(k)*MK4(k)(j);

end loop;

--Signal pro zavershennja obchuslennja--

Box.Signal2;

put(" T4 Finished ");

end T4;

begin Null;

end start;

begin

put("N=");

get(N);

t:=clock;

s1:=Seconds(t);

s2:=integer(s1);

start;

t:=clock;

s3:=Seconds(t);

s4:=integer(s3);

S5:=S4-S2;

put_line("Main");

new_line;

put("Cas=");

put(s5);

end Bakalawr3;