|
Revision 57, 1.3 kB
(checked in by pernet, 10 months ago)
|
|
Add MatCopy? in fflas
Add rank profile routines and fullranksubmatrix routines.
Minor fixes
|
| Line | |
|---|
| 1 | Repenser la structure de fgemm: |
|---|
| 2 | * plus de template, moins de tests |
|---|
| 3 | * templater DoubleDomain/FLoatDomain? |
|---|
| 4 | * plus rapide avec des petites matrices |
|---|
| 5 | * Meilleure strategie de calcul des parametres |
|---|
| 6 | * Automatic tuning des thresholds Float/Double |
|---|
| 7 | |
|---|
| 8 | LUdivine |
|---|
| 9 | * Automatic tuning des thresholds gauss/LUdivine |
|---|
| 10 | * Plus de localite? |
|---|
| 11 | |
|---|
| 12 | TRSM/TRMM |
|---|
| 13 | * Traitement automatique float/double depuis int |
|---|
| 14 | * Securiser les bornes t_update: quand winograd intervient |
|---|
| 15 | * remplacer BLAS-trsm par le code de reference de ATLAS |
|---|
| 16 | |
|---|
| 17 | FTRTRI/FTRTRM |
|---|
| 18 | * generation automatique du code |
|---|
| 19 | * traitement des cas de base (seuil > 1) |
|---|
| 20 | |
|---|
| 21 | Idee: |
|---|
| 22 | 1/ Pourquoi templater FFLAS? |
|---|
| 23 | --> integration au sein de ATLAS (C et corps definitif) |
|---|
| 24 | 2/ ameliorer les cas terminaux de ftrsm ftrmm: copier les ATL_reftrsm sur double et float |
|---|
| 25 | --> introduire un nouveau seuil dans trsm: celui ou on fait des boucles et pas de la recursivite |
|---|
| 26 | 2/ Conversion des le debut vers modular double/float (evite les conv multiples) |
|---|
| 27 | 3/ Implantations non template de fgemm, trsm, .... sur double |
|---|
| 28 | 4/ Compilation des noyaux |
|---|
| 29 | |
|---|
| 30 | A discuter en fonction du besoin d'un FFLAS generique |
|---|
| 31 | |
|---|
| 32 | |
|---|
| 33 | Verifier la validite avec modular<int> (sage révele des det faux) |
|---|
| 34 | |
|---|
| 35 | Revoir la structure des bornes dans winograd: trop de reductions |
|---|
| 36 | modulaires quand il y a des etapes de wino dans le corps fini. |
|---|