Universität Karlsruhe
Analyse von Profilinformationen fĂĽr cachesensitives Befehlsanordnen

Diplomarbeit

[dagl:99]Götz Lindenmaier, Analyse von Profilinformationen für cachesensitives Befehlsanordnen, Feb 1999.

Zusammenfassung

Analyse von Profilinformationen fĂĽr cachesensitives Befehlsanordnen

Wegen der grossen Geschwindigkeitsunterschiede zwischen Speicherhierarchie und dem Prozessor ist dies eine aktuelle Arbeit. Optimierene Übersetzer implementieren verschiedene Algorithmen, die von Informationen über die Lokalität von Daten profitieren. Diese können von statischen Analysen berechnet werden, wenn das Programm gewisse Strukturen aufweist, z.B. Schleifen mit regelmäßen Feldzugriffen.

Mit dem Aufkommen von Hardwarezählern in Prozessoren zur Überwachung und Messung der Prozessorleistung ist es möglich, solche Informationen für alle Befehle zu messen, unabhägig von der Programmstruktur. Zusätzlich wird Laufzeitinformation eines Programmes dadurch billiger, und damit eine Optimierung anhand solcher Informationen möglich.

Die in dieser Arbeit entwickelte Lokalitätsanalyse basiert auf dem Werkzeug DCPI von Digital. Der Algorithmus analysiert die Meßergebnisse dieses Werkzeuges und generiert Lokalitätsinformationen auf Assemblerebene. Die Verwendbarkeit dieser Informationen wurde mit dem Balanced Scheduling Algorithmus gezeigt. Dieser verwendet Lokalitätsinformation um Ladebefehle die häufig Fehlzugriffe sind agressiver anzuordnen, d.h. mehr andere Befehle zwischen dem Ladebefehl und dem das geladene Datum verwendenden Befehl zu plazieren. Dies ist eine dem Vorladen (prefetching) vergleichbare Methode die Kosten eines Fehlzugriffes zu verringern für nicht blockierende Cac. Für Versuche wurden die SPEC95 Meßprogramme verwendet.

[Erzeuge bibTeX Eintrag]

 

[Herunterladen]

Autoren

Alumni
Dr. Götz Lindenmaier
Login
Links