A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento.

Apresentações semelhantes


Apresentação em tema: "1 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento."— Transcrição da apresentação:

1 1 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento de Alto Desempenho paralela e

2 2 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Sumário Strassen; Análise sequencial; Análise paralela; Otimização da análise paralela; Experimentos; Análise de resultados; Considerações finais.

3 3 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Algoritmo de Strassen Phase 1Phase 2 Phase 3Phase 4

4 4 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Algoritmo de Strassem

5 5 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise Sequencial Complexidade sequencial: T(n)=7T(n/2)+ Θ(n²); =Θ(n lg 7 ); =Θ(n 2,81 ); Melhor que algoritmo clássico para matrizes grandes; Problema com utilização de memória (algoritmo recursivo);

6 6 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise Paralela Complexidade paralela Utilizando-se n 2,81 processadores P = n 2,81 Obtém-se o tempo de execução T = log(n); O custo desta paralelização é C = n 2,81 * log(n); Maior do que o custo sequencial.

7 7 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Otimização da análise paralela Complexidade paralela Diminuindo-se o número de processadores para P = n 2,81 / log(n) Cada processador irá executar a multiplicação de pacotes de tamanho log(n); Obtém-se o tempo T = log(n)+log(n 2,81 / log(n)) log(n) T = log(n) E o custo C = n 2,81 / log(n) * log(n) = n 2,81 Equivalente ao sequencial;

8 8 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Objetivos Detectar o melhor ponto de corte para interromper a recursão; Utilização do algoritmo clássico após o término da recursão.

9 9 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Experimentos Sequencial (GCC): 10 execuções Sequencial (ICC): 50 execuções OMP Parallel Sections (GCC): 10 execuções OMP Tasks (ICC): 50 execuções Tamanhos de matrizes: 64 – 8192 Considerados apenas resultados: 512 – 4096 Pontos de corte:

10 10 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Size 512

11 11 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Size 1024

12 12 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Matriz 512 Faixa 1 Tempo (ponto de corte) Faixa 2 Tempo (ponto de corte) GCC1,1814 (32)2,6794 (8) ICC0,3295 (64)1,6173 (8) Par0,3942 (64)1,6343 (8) Tasks0,1222 (64)1, 7651 (8)

13 13 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Matriz 1024 Faixa 1 Tempo (ponto de corte) Faixa 2 Tempo (ponto de corte) GCC8,3354 (32)9,6164 (128) ICC2,3573 (64)3,3039 (16) Par2,6612 (64)3,5550 (256) Tasks0,7758 (64)1,5752 (128)

14 14 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Matriz 2048 Faixa 1 Tempo (ponto de corte) Faixa 2 Tempo (ponto de corte) GCC58,5979 (32)59,6194 (64) ICC16,7202 (64)17,6476 (64) Par18,3236 (64)19, 2504 (128) Tasks5,4260 (64)6,6779 (128)

15 15 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Matriz 4096 Faixa 1 Tempo (ponto de corte) Faixa 2 Tempo (ponto de corte) GCC410,8730 (32)411,7118 (32) ICC117,7752 (64)118,5165 (64) Par132,1687 (64)133,7958 (64) Tasks37,4389 (128)39,3907 (128)

16 16 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Speed-up

17 17 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Speed-up

18 18 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Considerações Finais A existência de diferentes grupos de tempos impediram a conclusão de um ponto de corte ideal; Seria necessário um trabalho de investigação mais longo para descobrir as causas do comportamento anormal; O desempenho do código compilado usando o ICC é claramente superior;

19 19 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento de Alto Desempenho paralela e

20 20 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD GCC 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 82, ,637814,696792,325693, , , ,32662,78709,352310,868166, , , ,18142,89708,33549,888858,597959, , , ,18722,86168,38139,767159, , , ,26822,86098,95029,616463, , , ,40792,800010, ,607069, , , ,734213,664589,605990, , ,9620

21 21 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD GCC – Desv. Pad. 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,0733 0, , ,04020, ,00170,10970,00680,09850,3760 0,37720, ,00070,07370,00400,11480,01300,17850,01230, ,00030,05970,00090,14170,2624 0,06450, ,00020, ,24070,2798 0,01980, ,00090,08010,2952 0,24170,02580,20000, ,01050,24120,06520,16570,31530,0534

22 22 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD ICC 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,74061,61735,18386,891636,491037, , , ,42631,77303, ,421722, , , ,35001,81632,49803,751317,719118, , , ,32951,83342,35733,821316,720217, , , ,35941,82682,56663,709218,185719, , , ,38871,79082,77183,631719,631020, , , ,83954,584927,342528, , ,4997

23 23 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD ICC – Desv. Pad. 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,01490,20920,03670,07690,50820,30140,55190, ,00130,10400,0827 0,03780,11650,15770, ,00110,10820,00310,14190,03250,21940,11140, ,00030,10340,00230,11200,01410,21240,04270, ,00040,10330,00270,15520,01260,05330,17630, ,00040,10440,00150,22350,01370,17900,28630, ,00350,24500,28910,05370,18800,2302

24 24 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Parallel Sections 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,76231,63435,26056,844436,638937, , , ,49041,70343,28144,860722,595023, , , ,41061,83322,72643,599818,816419, , , ,39421,84252,66123,675518,323619, , , ,41041,73962,76983,602719, , , ,42241,78973, ,783421, , , ,75434,670326,423027, , ,5084

25 25 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Parallel Sections – Desv. Pad. 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,00400,24180,02460,11980,23890,25631,44510, ,00710,15760,02300,11090,26530,21590,43640, ,00270,09670,02550,21360,06300,15320,68740, ,00380,17800,01900,18890,08330,04000,42070, ,00420, ,24880,1688 0,15851, ,00170,14960,2593 0,03090,24140,16640, ,00570,21200,03390,10180,32400,2140

26 26 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD OMP Tasks 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,37661,76512,62763,510718,569419, , , ,18841,92921,22722,89378,64869,529568,801279, ,13531,85920,87111,65586,32887,921546,165751, ,11761,91580,77581,58635,42606,774538,700943, ,12071,98570,78811,57525,43636,677937,438939, ,13081,89440,83001,61415,67476,698538,458139, ,17842,92677,77338,432752,346153,8635

27 27 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD OMP Tasks – Desv. Pad. 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,00570,09120,00510,22320,19870,25970,26570, ,00880,08010,01460,08660,06260,34500,90831, ,00660,07700,00740,22730,15940,08750,75860, ,00650,01260,00800,24200,06310,20641,33481, ,00340,00700,00380,20710,06780,09050,26080, ,00870,00510,00560,18740,07140,19020,23430, ,01630, ,31840,22750,0172


Carregar ppt "1 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento."

Apresentações semelhantes


Anúncios Google