universidade federal de santa catarina programa de póe-graduação ...
universidade federal de santa catarina programa de póe-graduação ... universidade federal de santa catarina programa de póe-graduação ...
arquiteturas paralelas, os quais podem ser agrupados segundo suas caracteristicas comuns. Michael J. Flynn [3] apresenta uma classificação conforme o número de instruções e dados que a estrutura processa simultaneamente. Nesta classificação tem-se 4 tipos básicos de arquitetura: ø 4 i) Arquitetura SISD ("Single Instruction Single Data"), processa um dado utilizando uma instrução e, portanto, destina-se a processamentos sequenciais. Um exemplo é a clássica arquitetura de Von Neumann. ii) Arquitetura SIND ("Single Instruction Multiple Data"), processa vários dados utilizando uma instrução, ou seja, o processamento total é realizado através da utilização de várias unidades processadoras conectadas entre si, cada qual executando um mesmo algoritmo. É nesta classe de arquiteturas, a qual é apropriada para processamento especializado de alto desempenho, que estão incluídos os chamados arranjos sistólicos. iii) Arquitetura MIMD ("Multiple Instruction Multiple Data"), processa vários dados utilizando múltiplas instruções. Largamente utilizada em sistemas de multiprocessamento, normalmente utiliza-se de Qários processadores interagindo entre si gerenciados por um controlador geral ou por um sistema de "handshaking". Esta arquitetura é especialmente apropriada para processamento de propósito geral. iv) Arquitetura MISD ("Multiple Instruction Single Data"), processa um dado utilizando múltiplas instruções. Esta arquitetura não apresenta aplicações práticas até_o momento. _ Esta classificação, apesar de bastante difundida, tem-se mostrado incapaz
de diferenciar algumas estruturas recentemente desenvolvidas e que apresentam desempenhos* bastante distintos. Assim, diferentes classificações têm sido propostas na literatura [3`], as quais baseiam-se em outros critérios de diferenciação. Neste trabalho será adotada uma classificação que divide as arquiteturas paralelas em dois grandes grupos, arquiteturas de propósito geral e arquiteturas de propósito especifico. As arquiteturas de propósito geral destinam-se a satisfazer um grupo _ numeroso de aplicações e devem alocar seus recursos de processamento conforme o algoritmo a ser realizado. Este tipo de arquitetura requer uma estrutura sofisticada de controle egerenciamento das unidades constituintes, de forma a obter-se um desempenho adequado para diversas aplicações. Conseqüentemente, devido à sua generalidade, tais arquiteturas permitem apenas se alcançar um desempenho sub-ótimo para aplicações especificas [4]. _As arquiteturas de 'propósito específico são estruturas dedicadas, de forma a otimizar determinado.. parametro de interesse como, »por exemplo, a velocidade, em uma dada aplicação. No desenvolvimento destas arquiteturas deve-se ter um pleno conhecimento do algoritmo de processamento paralelo a ser utilizado, assim .como, das caracteristicas especificas da implementação pretendida, de forma a obter-se o máximo desempenho em termos do(s) parametro(s) de interesse [11]. Um parametro consistente de medida da eficácia de arquiteturas paralelas é dado pela relação entre a velocidade de processamento e 0 número de processadores utilizados na arquitetura [2]. No caso de multiprocessamento, onde N processadores são conectados a um único barramento, à medida que N cresce, ocorre o "engarrafamento" do barramento, limitando assim a velocidade 5
- Page 1 and 2: UNIVERSIDADE FEDERAL DE SANTA CATAR
- Page 3 and 4: À minha namorada, Marlise i
- Page 5 and 6: v R E S U H O 'A operação produto
- Page 7 and 8: vii S U H Á R I O CAPITULO 1 - INT
- Page 9 and 10: 1 cAPI'ru1.o 1 1NTRonuçÃo O Proce
- Page 11: velocidade atingiveis em um circuit
- Page 15 and 16: 7 - Além disso, as estruturas sist
- Page 17 and 18: assíncronos do tipo "wave front ar
- Page 19 and 20: 11 C A P Í T U L O 2 ESTRUTURAS SI
- Page 21 and 22: "pipelining". Estas estruturas pode
- Page 23 and 24: célula processadora, independentem
- Page 25 and 26: * Para ›-[\/133 17 Para k = 4: _
- Page 27 and 28: H 19 Para implementar a operação
- Page 29 and 30: ~ II 21 M W- D1 . . . . . .. W3(A1)
- Page 31 and 32: direita a cada pulso de clock. As s
- Page 33 and 34: Am e Bm, a cada ciclo de clock, de
- Page 35 and 36: I 28 de células tipo II. ¢ . ¢
- Page 37 and 38: . LJ - _ w ' . 30 cglum L¿¡>2L=
- Page 39 and 40: 32 2.6 - Estruturas Operando com N
- Page 41 and 42: I -9 V 34 ..w2‹A2›w2‹Ai›-
- Page 43 and 44: C2 = -Bm»z“ se Am < o e cz = o s
- Page 45 and 46: -B E W (A ) wiwm) : Li S H *I B (B
- Page 47 and 48: 40 C A P Í T U L O 3 Avaliação d
- Page 49 and 50: P › 42 P1 P2 b3 b4 Pi C b 1 1 a4
- Page 51 and 52: ~ dado ' A 44 resultando no tempo d
- Page 53 and 54: 46 Acellll E { 14n/k + 1 ]¢AE (3.1
- Page 55 and 56: V . -1 48 z[ kz-["/,s-(n/|‹›2+
- Page 57 and 58: 50 1) A estrutura multiplicadora-ac
- Page 59 and 60: normalizada como referência. V ¡-
- Page 61 and 62: * fz 50.00 54 4o.oo 4 /'I / ' E/S ,
<strong>de</strong> diferenciar algumas estruturas recentemente <strong>de</strong>senvolvidas e que apresentam<br />
<strong>de</strong>sempenhos* bastante distintos. Assim, diferentes classificações têm sido<br />
propostas na literatura [3`], as quais baseiam-se em outros critérios <strong>de</strong><br />
diferenciação. Neste trabalho será adotada uma classificação que divi<strong>de</strong> as<br />
arquiteturas paralelas em dois gran<strong>de</strong>s grupos, arquiteturas <strong>de</strong> propósito geral<br />
e arquiteturas <strong>de</strong> propósito especifico.<br />
As arquiteturas <strong>de</strong> propósito geral <strong>de</strong>stinam-se a satisfazer um grupo<br />
_<br />
numeroso <strong>de</strong> aplicações e <strong>de</strong>vem alocar seus recursos <strong>de</strong> processamento conforme<br />
o algoritmo a ser realizado. Este tipo <strong>de</strong> arquitetura requer uma estrutura<br />
sofisticada <strong>de</strong> controle egerenciamento das unida<strong>de</strong>s constituintes, <strong>de</strong> forma a<br />
obter-se um <strong>de</strong>sempenho a<strong>de</strong>quado para diversas aplicações. Conseqüentemente,<br />
<strong>de</strong>vido à sua generalida<strong>de</strong>, tais arquiteturas permitem apenas se alcançar um<br />
<strong>de</strong>sempenho sub-ótimo para aplicações especificas [4].<br />
_As arquiteturas <strong>de</strong> 'propósito específico são estruturas <strong>de</strong>dicadas, <strong>de</strong><br />
forma a otimizar <strong>de</strong>terminado.. parametro <strong>de</strong> interesse como, »por exemplo, a<br />
velocida<strong>de</strong>, em uma dada aplicação. No <strong>de</strong>senvolvimento <strong>de</strong>stas arquiteturas<br />
<strong>de</strong>ve-se ter um pleno conhecimento do algoritmo <strong>de</strong> processamento paralelo a ser<br />
utilizado, assim .como, das caracteristicas especificas da implementação<br />
pretendida, <strong>de</strong> forma a obter-se o máximo <strong>de</strong>sempenho em termos do(s)<br />
parametro(s) <strong>de</strong> interesse [11].<br />
Um parametro consistente <strong>de</strong> medida da eficácia <strong>de</strong> arquiteturas paralelas<br />
é dado pela relação entre a velocida<strong>de</strong> <strong>de</strong> processamento e 0 número <strong>de</strong><br />
processadores utilizados na arquitetura [2]. No caso <strong>de</strong> multiprocessamento,<br />
on<strong>de</strong> N processadores são conectados a um único barramento, à medida que N<br />
cresce, ocorre o "engarrafamento" do barramento, limitando assim a velocida<strong>de</strong><br />
5