A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

1 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento.

Apresentações semelhantes


Apresentação em tema: "1 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento."— Transcrição da apresentação:

1 1 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento de Alto Desempenho paralela e

2 2 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Sumário Strassen; Análise sequencial; Análise paralela; Otimização da análise paralela; Experimentos; Análise de resultados; Considerações finais.

3 3 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Algoritmo de Strassen Phase 1Phase 2 Phase 3Phase 4

4 4 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Algoritmo de Strassem

5 5 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise Sequencial Complexidade sequencial: T(n)=7T(n/2)+ Θ(n²); =Θ(n lg 7 ); =Θ(n 2,81 ); Melhor que algoritmo clássico para matrizes grandes; Problema com utilização de memória (algoritmo recursivo);

6 6 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise Paralela Complexidade paralela Utilizando-se n 2,81 processadores P = n 2,81 Obtém-se o tempo de execução T = log(n); O custo desta paralelização é C = n 2,81 * log(n); Maior do que o custo sequencial.

7 7 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Otimização da análise paralela Complexidade paralela Diminuindo-se o número de processadores para P = n 2,81 / log(n) Cada processador irá executar a multiplicação de pacotes de tamanho log(n); Obtém-se o tempo T = log(n)+log(n 2,81 / log(n)) log(n) T = log(n) E o custo C = n 2,81 / log(n) * log(n) = n 2,81 Equivalente ao sequencial;

8 8 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Objetivos Detectar o melhor ponto de corte para interromper a recursão; Utilização do algoritmo clássico após o término da recursão.

9 9 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Experimentos Sequencial (GCC): 10 execuções Sequencial (ICC): 50 execuções OMP Parallel Sections (GCC): 10 execuções OMP Tasks (ICC): 50 execuções Tamanhos de matrizes: 64 – 8192 Considerados apenas resultados: 512 – 4096 Pontos de corte: 8 - 256

10 10 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Size 512

11 11 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Size 1024

12 12 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Matriz 512 Faixa 1 Tempo (ponto de corte) Faixa 2 Tempo (ponto de corte) GCC1,1814 (32)2,6794 (8) ICC0,3295 (64)1,6173 (8) Par0,3942 (64)1,6343 (8) Tasks0,1222 (64)1, 7651 (8)

13 13 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Matriz 1024 Faixa 1 Tempo (ponto de corte) Faixa 2 Tempo (ponto de corte) GCC8,3354 (32)9,6164 (128) ICC2,3573 (64)3,3039 (16) Par2,6612 (64)3,5550 (256) Tasks0,7758 (64)1,5752 (128)

14 14 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Matriz 2048 Faixa 1 Tempo (ponto de corte) Faixa 2 Tempo (ponto de corte) GCC58,5979 (32)59,6194 (64) ICC16,7202 (64)17,6476 (64) Par18,3236 (64)19, 2504 (128) Tasks5,4260 (64)6,6779 (128)

15 15 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Análise – Matriz 4096 Faixa 1 Tempo (ponto de corte) Faixa 2 Tempo (ponto de corte) GCC410,8730 (32)411,7118 (32) ICC117,7752 (64)118,5165 (64) Par132,1687 (64)133,7958 (64) Tasks37,4389 (128)39,3907 (128)

16 16 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Speed-up

17 17 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Speed-up

18 18 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Considerações Finais A existência de diferentes grupos de tempos impediram a conclusão de um ponto de corte ideal; Seria necessário um trabalho de investigação mais longo para descobrir as causas do comportamento anormal; O desempenho do código compilado usando o ICC é claramente superior;

19 19 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento de Alto Desempenho paralela e

20 20 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD GCC 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 82,6794 13,637814,696792,325693,7591644,8177657,1735 161,32662,78709,352310,868166,4968 461,3811463,2704 321,18142,89708,33549,888858,597959,7238410,8730411,7118 641,18722,86168,38139,767159,6194 413,3123414,8611 1281,26822,86098,95029,616463,5842 441,3098442,8465 2561,40792,800010,5851 70,607069,7439489,3600490,8288 512 12,734213,664589,605990,7453628,4761629,9620

21 21 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD GCC – Desv. Pad. 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,0733 0,1280 -0,4169 -2,04020,8798 160,00170,10970,00680,09850,3760 0,37720,3212 320,00070,07370,00400,11480,01300,17850,01230,5236 640,00030,05970,00090,14170,2624 0,06450,0826 1280,00020,1003 -0,24070,2798 0,01980,0745 2560,00090,08010,2952 0,24170,02580,20000,1468 512 0,01050,24120,06520,16570,31530,0534

22 22 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD ICC 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,74061,61735,18386,891636,491037,7936254,9412256,6505 160,42631,77303,3039 21,421722,7705150,5059151,6570 320,35001,81632,49803,751317,719118,6725124,6937125,5670 640,32951,83342,35733,821316,720217,6476117,7752118,5165 1280,35941,82682,56663,709218,185719,9105128,2253129,8809 2560,38871,79082,77183,631719,631020,6662138,3601139,8249 512 3,83954,584927,342528,9152190,3627191,4997

23 23 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD ICC – Desv. Pad. 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,01490,20920,03670,07690,50820,30140,55190,8285 160,00130,10400,0827 0,03780,11650,15770,3509 320,00110,10820,00310,14190,03250,21940,11140,1742 640,00030,10340,00230,11200,01410,21240,04270,2419 1280,00040,10330,00270,15520,01260,05330,17630,0525 2560,00040,10440,00150,22350,01370,17900,28630,1193 512 0,00350,24500,28910,05370,18800,2302

24 24 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Parallel Sections 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,76231,63435,26056,844436,638937,5812258,2750260,6770 160,49041,70343,28144,860722,595023,6894174,1059175,5924 320,41061,83322,72643,599818,816419,6934137,9803139,7659 640,39421,84252,66123,675518,323619,7329132,1687133,7958 1280,41041,73962,76983,602719,2504 132,7070134,1744 2560,42241,78973,5550 20,783421,6558144,4441145,9774 512 3,75434,670326,423027,7349184,3587185,5084

25 25 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD Parallel Sections – Desv. Pad. 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,00400,24180,02460,11980,23890,25631,44510,4640 160,00710,15760,02300,11090,26530,21590,43640,3773 320,00270,09670,02550,21360,06300,15320,68740,1197 640,00380,17800,01900,18890,08330,04000,42070,1486 1280,00420,0852 -0,24880,1688 0,15851,0177 2560,00170,14960,2593 0,03090,24140,16640,3527 512 0,00570,21200,03390,10180,32400,2140

26 26 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD OMP Tasks 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,37661,76512,62763,510718,569419,6303130,8212138,6886 160,18841,92921,22722,89378,64869,529568,801279,2175 320,13531,85920,87111,65586,32887,921546,165751,3656 640,11761,91580,77581,58635,42606,774538,700943,8425 1280,12071,98570,78811,57525,43636,677937,438939,3907 2560,13081,89440,83001,61415,67476,698538,458139,6640 512 1,17842,92677,77338,432752,346153,8635

27 27 Strassen Felipe L. SeverinoProj. Prog. Par. para PPD OMP Tasks – Desv. Pad. 512 (1)512 (2)1024 (1)1024 (2)2048 (1)2048 (2)4096 (1)4096 (2) 80,00570,09120,00510,22320,19870,25970,26570,8344 160,00880,08010,01460,08660,06260,34500,90831,0972 320,00660,07700,00740,22730,15940,08750,75860,5807 640,00650,01260,00800,24200,06310,20641,33481,6121 1280,00340,00700,00380,20710,06780,09050,26080,9007 2560,00870,00510,00560,18740,07140,19020,23430,2128 512 0,01630,0655 -0,31840,22750,0172


Carregar ppt "1 Felipe L. SeverinoProj. Prog. Par. para PPD Paralelização do algoritmo de Strassen Felipe L. Severino Projeto de Programas Paralelos para Processamento."

Apresentações semelhantes


Anúncios Google