Να στείλετε μήνυμα

Ειδήσεις

March 11, 2021

Εξαρτώμενη από το πεδίο μνήμη

Ο εξαρτώμενος από το πεδίο υπολογισμός μπορεί να είναι όλη η οργή, αλλά αποφεύγει το πραγματικό πρόβλημα.

Η μεγαλύτερη ανησυχία είναι οι μνήμες που στραγγαλίζουν την απόδοση επεξεργαστών, καταναλώνουν περισσότερη ενέργεια, και λαμβάνουν την περισσότερη περιοχή τσιπ. Οι μνήμες πρέπει να σπάσουν απαλλαγμένο από τις άκαμπτες δομές που προτιμώνται από το υπάρχον λογισμικό. Όταν οι αλγόριθμοι και η μνήμη σχεδιάζονται μαζί, οι βελτιώσεις στην απόδοση είναι σημαντικές και η επεξεργασία μπορεί να βελτιστοποιηθεί.

Η εξαρτώμενη από το πεδίο επεξεργασία διαδόθηκε από τη διάλεξη Turing του 2018, «μια νέα χρυσή εποχή για την αρχιτεκτονική υπολογιστών,» από το John Hennessy και το Δαβίδ Patterson. Αλλά οι επεξεργαστές έχουν περιοριστεί από τη μνήμη για δεκαετίες. Η μεταβαλλόμενη επεξεργασία χωρίς ξανασκέφτεται της μνήμης και οι ιεραρχίες μνήμης αγνοούν το νόμο Amdahl, ο οποίος παρέχει ότι μια μαθηματική σχέση μεταξύ επιταχύνει πιθανό για ένα σύστημα όταν βελτιώνονται ορισμένα κομμάτια εκείνου του συστήματος. Λέει βασικά ότι παίρνετε τις μικραίνοντας επιστροφές εάν επικεντρώνεστε μόνο στο ένα κομμάτι του συστήματος παρά την εξέταση το σύστημα συνολικά.

Έτσι γιατί να μην επικεντρωθεί στη δυσχέρεια; Η «εξαρτώμενη από το πεδίο μνήμη είναι ακριβώς ένας νέος όρος, αλλά οι αρχιτέκτονες έχουν κάνει αυτά τα είδη βελτιστοποιήσεων για πολύ καιρό,» λέει Prasad Saggurti, διευθυντής του μάρκετινγκ προϊόντος σε Synopsys. «Και εάν δεν έχουν, χάνουν ένα τέχνασμα επειδή οι περισσότεροι άνθρωποι το έχουν κάνει.»

Άλλοι συμφωνούν. «Θυμηθείτε τις τηλεοπτικές μνήμες — DRAM με τους ενσωματωμένους καταλόγους μετατόπισης;» ρωτά το Michael Frank, συνεργάτης και αρχιτέκτονας συστημάτων σε Arteris IP. «Ίσως GDDR [1-5], ειδικές μνήμες ετικεττών κρύπτης, ή συνειρμικές μνήμες πίσω στις ημέρες TTL; Πολλοί αυτοί δεν έχουν επιζήσει πραγματικά επειδή η λειτουργία τους ήταν πάρα πολύ συγκεκριμένη. Στόχευσαν σε μια μοναδική συσκευή. Χρειάζεστε μια αρκετά μεγάλη περιοχή, και παλεύετε ενάντια στο χαμηλότερο κόστος του σημερινού DRAM, το οποίο έχει το όφελος της μεγάλης ποσότητας και της μεγάλης κλίμακας κατασκευής.»

Μερικές φορές πηγαίνει βαθύτερο από αυτός. «Hardwire κάτι σε ένα ROM,» λέει Saggurti Synopsys. «Τι βλέπουμε είναι περισσότεροι άνθρωποι που καθορίζουν με ακρίβεια τη μνήμη σήμερα. Για παράδειγμα, με έναν μετασχηματισμό κατά Φουριέ, ή μια μετατροπή Ζ, οι άνθρωποι θα έγραφαν τον κώδικα κατά τέτοιο τρόπο ώστε να μπορείτε να αποθηκεύσετε τους συντελεστές σε μια ορισμένη διαταγή. Όταν κάνετε έναν πολλαπλασιασμό μητρών, μπορείτε να αποθηκεύσετε τους συντελεστές σε μια ορισμένη διαταγή έτσι ώστε ανάγνωση που έξω θα ήταν γρηγορότερο. Δεν μπορείτε να αποθηκεύσετε τα στοιχεία σε μια μνήμη, αντ' αυτού, υποβάλλοντας το τρεις ή τέσσερις διαφορετικές μνήμες έτσι ώστε να μπορείτε τα πράγματα μέσω των πολλαπλάσιων πορειών στοιχείων. Αυτά τα είδη πραγμάτων έχουν συμβεί πιό πρόσφατα.»

Η αλλαγή είναι σκληρή. «Η πρόκληση είναι ότι στο παρελθόν, οι άνθρωποι είχαν ένα συμπαθητικό, αφηρημένο πρότυπο για τη σκέψη για τον υπολογισμό των συστημάτων,» λέει ότι ο Steven επιζητά, συντροφικός και διακεκριμένος εφευρέτης σε Rambus. «Δεν έπρεπε ποτέ πραγματικά να σκεφτούν για τη μνήμη. Ήρθε εμπρός δωρεάν και το πρότυπο προγραμματισμού το έκανε έτσι ώστε όταν κάνατε τις αναφορές στη μνήμη, συνέβη ακριβώς. Δεν έπρεπε ποτέ να είστε ρητοί για αυτό που κάνατε.»

Η πρόοδος γίνεται γενικά την απόδοση μνήμης. Οι «σημερινοί ελεγκτές μνήμης και τα προηγμένα πρότυπα διεπαφών έχουν βελτιώσει εντυπωσιακά τι που μπορείτε να εξαγάγετε από την προηγμένη τεχνολογία πυριτίου,» λένε το Frank Arteris. «Αυτό έχει επιτρέψει στις βαθιές σειρές αναμονής και τους προηγμένους χρονοπρογραμματιστές. Προηγμένες τεχνολογίες μνήμης, όπως η υψηλή μνήμη εύρους ζώνης (HBM), και συσσωρευμένα εύρη ζώνης υποστήριξης κύβων ότι σκεφτήκαμε αδύνατοι να επιτύχουμε ακριβώς μια δεκαετία πριν. Ακόμα δεν έρχεται φτηνός. Υπο--10 οι τεχνολογίες NM επιτρέπουν επίσης τις μεγάλες κρύπτες, έτσι ίσως μπορούμε να καλέσουμε την εξαρτώμενη από το πεδίο μνήμη αυτού του φτωχού ανθρώπου.»

Αλλά αυτά είναι όλα τα παραδείγματα των μικρών επαυξητικών αλλαγών. «Τα υποσυστήματα μνήμης Architecting στα οποία υπολογίστε πρώτιστα ακολουθούν τα στοιχεία, παρά τον άλλο τρόπο γύρω, απαιτούν ότι ένας σημαντικός ξανασκέφτεται πολλών ενταλμάτων ότι οι αρχιτέκτονες είναι εξοικειωμένοι με,» λέει ματ Horsnell, ανώτερος κύριος ερευνητικός μηχανικός για ομάδα την ερευνητική και ανάπτυξης του βραχίονα. «Υπάρχει μια ευκαιρία να ενισχυθεί η αφαίρεση προγραμματισμού, από το σημερινό χαρακτηριστικό κατάλογο διαδικασιών στα στοιχεία, σε μια επεκταθείσα μορφή που τοποθετεί το συναγωνισμό σε κάψα και κάποια έννοια των σχετικών αποστάσεων μεταξύ υπολογίστε τις μονάδες και τα στοιχεία στοιχείων. Τέτοιες αφαιρέσεις θα μπορούσαν να επιτρέψουν στους απαραίτητους μετασχηματισμούς για να στοχεύσουν βέλτιστα στις εξαρτώμενες από το πεδίο μνήμες όταν εξελίσσονται γρήγορα οι αλγόριθμοι.»

Κέντρα δεδομένων στη θέση του οδηγού
Τα κέντρα δεδομένων είναι οι οδηγοί για πολλές τάσεις της τεχνολογίας σήμερα. «Μια από τις ταχύτατης ανάπτυξης εφαρμογές για υπολογίζει είναι στα κέντρα δεδομένων όπου οι εφαρμογές λογισμικού ποθούν περισσότερη ικανότητα μνήμης, το εύρος ζώνης στη χαμηλότερη λανθάνουσα κατάσταση,» λέει τη Ravi Thummarukudy, CEO για Mobiveil. «Με την εμφάνιση του πιό πρόσφατου βιομηχανικά τυποποιημένου, υπολογίστε τη σαφή σύνδεση (CXL), οι αρχιτέκτονες συστημάτων μπορούν σειρά η μνήμη που απαιτείται μεταξύ της κύριας μνήμης σε DDRn DIMMS, και CXL-βασισμένες νεώτερων επίμονες μνήμες DDRn ή. Η λανθάνουσα κατάσταση και τα οικονομικά χαρακτηριστικά αυτών των σειρών των μνημών είναι διαφορετικές, και αυτή δίνει τις επιλογές αρχιτεκτόνων να αναμίξουν και να ταιριάξουν με τις μνήμες για να ταιριάξουν τις απαιτήσεις τους.»

Αυτή είναι μια συνέχεια των αρχιτεκτονικών μνήμης κληρονομιών. «Πολλά σπίτια OEMs και συστημάτων σχεδιάζουν το SoCs τους για να προσαρμόσουν το πυρίτιο στους συγκεκριμένους φόρτους εργασίας τους,» λέει Tim Kogel, κύριος μηχανικός εφαρμογών σε Synopsys. «Η μεγαλύτερη ευκαιρία για τα κέρδη απόδοσης και δύναμης είναι η ειδίκευση της ιεραρχίας μνήμης μαζί με την υποστήριξη διασυνδέει την αρχιτεκτονική.

Εξετάστε τη δύναμη. «Στις τρέχουσες αρχιτεκτονικές, 90% της ενέργειας για τους φόρτους εργασίας AI καταναλώνεται από τη μετακίνηση στοιχείων, μεταφέροντας τα βάρη και τις ενεργοποιήσεις μεταξύ της εξωτερικής μνήμης, κρύπτες -τσιπ, και τελικά το ίδιο στο στοιχείο υπολογισμού (δείτε το σχήμα 1),» λέει Arun Iyengar, CEO Untether AI. «Μόνο με την εστίαση στις ανάγκες για την επιτάχυνση και τη μεγιστοποίηση συμπεράσματος της αποδοτικότητας δύναμης είμαστε ικανοί να παραδώσουμε τη πρωτοφανή υπολογιστική απόδοση.»

Η βελτιστοποίηση μνήμης είναι ένα σύστημα-ισόπεδο πρόβλημα που αγγίζει όλες τις πτυχές του σχεδίου — υλικό, λογισμικό, και εργαλεία. «Οι στρατηγικές για να βελτιστοποιήσουν τη μνήμη είναι διαφορετικές και εξαρτώνται από την περιοχή εφαρμογής,» προσθέτει Kogel. «Η καλύτερη στρατηγική είναι να αποφευχθεί η off-chip πρόσβαση μνήμης συνολικά. Για τις εξαρτώμενες από το πεδίο αρχιτεκτονικές, αυτό μπορεί χαρακτηριστικά να επιτευχθεί από την αυξανόμενη διαθέσιμη μνήμη -τσιπ, είτε υπό μορφή κρυπτών είτε διοικούμενης εφαρμογή μνήμης. Ειδικά στον τομέα των βαθιών επιταχυντών εκμάθησης, η διαθέσιμη μνήμη -τσιπ είναι μια αποφασιστική παράμετρος σχεδίου που προσκρούει επίσης σπώς η νευρική εφαρμογή δικτύων συντάσσεται επάνω στο υλικό στόχων — παραδείγματος χάριν, η επικεράμωση του χειριστή συνελίξεων.»

Πολλά σχέδια κοιτάζουν για να πάνε περαιτέρω από αυτό. Οι «εξαρτώμενες από το πεδίο έννοιες μνήμης εξερευνιούνται στο χωρικό υπολογίζουν την περιοχή,» λέει Horsnell του βραχίονα. «Για παράδειγμα, DSPs τείνει να παρέχει μια ομάδα των διανεμημένων μνημών, συχνά άμεσα διοικούμενη στο λογισμικό, το οποίο μπορεί να είναι μια καλύτερη τακτοποίηση για τις απαιτήσεις εύρους ζώνης και τα σχέδια πρόσβασης των εξειδικευμένων εφαρμογών από τα παραδοσιακά συστήματα μοιράζομαι-μνήμης. Προκειμένου να γεφυρωθεί το χάσμα αποδοτικότητας με την καθορίζω-λειτουργία ASICs, αυτοί οι επεξεργαστές προσφέρουν συχνά κάποια μορφή ειδίκευσης μνήμης με την παροχή της άμεσης υποστήριξης για τα συγκεκριμένα σχέδια πρόσβασης (όπως η ν-αποθήκευση, FIFOs, οι απομονωτές γραμμών, η συμπίεση, κ.λπ.). Μια κρίσιμη πτυχή του orchestration μέσα σε αυτά τα συστήματα, και μια πρόκληση στο σχεδιασμό τους, καθορίζουν τη σωστή κοκκοποίηση για τις προσβάσεις στοιχείων, οι οποίες μπορούν να ελαχιστοποιήσουν τα γενικά έξοδα επικοινωνίας και συγχρονισμού ταυτόχρονα μεγιστοποιώντας το συναγωνισμό συγχρόνως. Άλλες προκλήσεις εμμένουν, συμπεριλαμβανομένου του προγραμματισμού, της συνοχής, του συγχρονισμού, και της μετάφρασης, οι οποίες προσθέτουν την πολυπλοκότητα λογισμικού. Εντούτοις, μια πιθανή διαδρομή μπροστινή πρόκειται να στηριχθεί στις εξαρτώμενες από το πεδίο γλώσσες (DSLs), οι οποίες με να καταστήσει τη ροή στοιχείων των apps ρητότερη, μπορεί να επιτρέψει στους μεταγλωττιστές για να προσδιορίσει τα εξειδικευμένα σχέδια πρόσβασης μνήμης και να τους χαρτογραφήσει επάνω στο υλικό αποτελεσματικότερα.»

Πληρώνει επίσης για να πάρει μια προσεκτικότερη ματιά στις μνήμες οι ίδιοι. «Η υπερβολικός-προσαρμογή είναι η τάση που βλέπουμε όταν τις μνήμες,» λέμε Anand Thiruvengadam, διευθυντής μάρκετινγκ προϊόντος ανώτερου προσωπικό μέσα σε Synopsys. «Αυτό σημαίνει τις κατασκευασμένες επί τούτου μνήμες για τις διαφορετικές εφαρμογές τελών. Ακόμη και μέσα σε μια ιδιαίτερη εφαρμογή τελών όπως το AI υπάρχουν διαφορετικές ανάγκες για τις μνήμες, όπως για την κατάρτιση ή, στους κεντρικούς υπολογιστές, ή στη μακρινή άκρη. Κάθε μια από αυτές τις εφαρμογές έχει τις διαφορετικές απαιτήσεις, και αυτή σημαίνει ότι πρέπει να προσαρμόσετε τις μνήμες. Αυτή η προσαρμογή σημαίνει ότι δεν μπορείτε πλέον να δείτε τις μνήμες ως προϊόντα ή off-the-shelf προϊόντα. Πρέπει να το χτίσετε για μια ιδιαίτερη εφαρμογή. Αυτός είναι όπου τα μυστικά λακτίσματα σάλτσας μέσα.»

Σε πολλές περιπτώσεις η μνήμη και διασυνδέει συνδέεται στενά. «Τίποτα πηγαίνει όταν το συνδυασμό της μνήμης και διασυνδέει τις τεχνολογίες για να ικανοποιήσει τις απαιτήσεις πρόσβασης στοιχείων των φόρτων εργασίας εφαρμογής — παραδείγματος χάριν, τα πολλαπλάσια επίπεδα συγκέντρωσης της συνδυάζοντας επεξεργασίας με την τοπική μνήμη για να εκμεταλλευτούν την τοποθεσία στις εφαρμογές ροής πληροφοριών, ή τεράστιο πολυ-κατατεθειμένο/πολυ-το -τσιπ SRAMs για την αποθήκευση των χαρτών χαρακτηριστικών γνωρισμάτων των επιταχυντών CNN, και οι βαθιές ιεραρχίες κρύπτης με τα περίπλοκα πρωτόκολλα συνοχής για να μετριάσουν το χλιαρό σύνολο εργασίας φόρτων εργασίας κέντρων δεδομένων.»

Οι μικρές αλλαγές μπορούν να παραγάγουν τα μεγάλα αποτελέσματα. «Εξετάστε ακριβώς το μικρό θαύμα που η Apple έχει εκτελέσει με το M1,» λέει το Frank. «Υπολόγισαν πώς στον αρχιτέκτονα ένα υποσύστημα μνήμης που εξυπηρετεί τους πολλαπλάσιους ετερογενείς κυρίους καλά, χρησιμοποιώντας την ευφυή εναποθηκεύοντας στρατηγική και μια τεράστια, πολλαπλής στάθμης ιεραρχία κρύπτης.»

Όπως είναι συχνά η περίπτωση, το λογισμικό είναι η αδρανής άγκυρα. «Τι συμβαίνει συνήθως είναι είναι εκεί ένας αλγόριθμος σε ισχύ, και βλέπουμε έναν τρόπο να τον βελτιστοποιήσουμε, να βελτιστοποιήσει τη μνήμη, έτσι ώστε ο αλγόριθμος πολύ καλύτερα εφαρμόζεται,» λέμε Saggurti. «Στη αρνητική πλευρά, έχουμε αυτούς τους διαφορετικούς τύπους μνημών. Μπορείτε να αλλάξετε τον αλγόριθμό σας για να χρησιμοποιήσετε αυτά τα νέα είδη μνημών; Στο παρελθόν, που χρησιμοποιεί TCAMs ήταν συνήθως ένα κατασκεύασμα περιοχών δικτύωσης για να κοιτάξει επάνω στις διευθύνσεις IP. Πιό πρόσφατα, οι μηχανές κατάρτισης αρχίζουν να χρησιμοποιούν TCAMs, και αυτή είναι μια τέτοια διαφορετική προσέγγιση. Αυτό χρειάζεται το λογισμικό, ή το υλικολογισμικό στην αλλαγή βασισμένη στους τύπους μνημών διαθέσιμων. Αλλά το μεγαλύτερο μέρος του χρόνου, το λογισμικό μένει σταθερές και αλλαγές μνήμης για να καταστήσουν την επακόλουθη εφαρμογή καλύτερη.»

Συνειδητοποίηση ρυθμοαπόδοσης
Πολλή ώρα και χρήματα επενδύεται στην τεχνητή νοημοσύνη αυτές τις μέρες. Τα τσιπ συνήθειας περιορίζονται από τη ρυθμοαπόδοση, και αυτός βάζει το επίκεντρο στη μνήμη και διασυνδέει.

«Ιστορικά, η μνήμη και διασυνδέει τις αρχιτεκτονικές έχει σχεδιαστεί βασισμένος στους στατικούς υπολογισμούς με λογιστικό φύλλο (spreadsheet) ή τα απλά αναλυτικά πρότυπα όπως το πρότυπο απόδοσης roofline,» λένε Kogel. «Για τις εφαρμογές κατάστασης προόδου, αυτό γίνεται αρκετά σύνθετο. Παραδείγματος χάριν, η πρόβλεψη των απαιτήσεων μνήμης κάθε στρώματος σε ένα CNN απαιτεί την εκτίμηση της βελτιστοποίησης μεταγλωττιστών όπως την επικεράμωση και την τήξη στρώματος. Αυτές οι στατικές μέθοδοι γίνονται αδικαιολόγητα σύνθετες και ανακριβείς για την πρόβλεψη και τη βελτιστοποίηση των SOC-ισόπεδων φόρτων εργασίας με τα διαφορετικά υποσυστήματα IP και τα δυναμικά σενάρια εφαρμογής. Αφ' ετέρου, το τρέξιμο της εφαρμογής πάνω από την άμιλλα υλικού ή ένα σύστημα διαμόρφωσης πρωτοτύπου είναι πάρα πολύ αργά στη αναπτυξιακή διαδικασία για να κάνει οποιαδήποτε δραστικές αλλαγές ή σημαντική βελτιστοποίηση του σχεδίου μνήμης.»

Αυτός εστιάζει την προσοχή στους προοριζόμενους φόρτους εργασίας. «Το κλειδί για τα αποδοτικά υποσυστήματα μνήμης είναι η γνώση του φόρτου εργασίας σας,» λέει το Frank. «Καταλαβαίνοντας πώς συμπεριφέρεται, ίσως διαμορφώνοντας το ακόμη και που με τέτοιο τρόπο ώστε το καθιστά συμβατότερο με τον περιορισμό της ιεραρχίας μνήμης σας, αυτό είναι όπου η αρχιτεκτονική προκαλείται. Οι εξαρτώμενοι από το πεδίο επιταχυντές απαιτούν τα συντονισμένα συστήματα μνήμης — και η τέχνη της οικοδόμησης της μηχανής μετασχηματισμού ότι “η σύνθετη αντίσταση” ταιριάζει με τη μάζα παραχθείσα, της σελίδας που οργανώνονται, της bursty πρόσβασης DRAM και του σχεδίου πρόσβασης της μηχανής απαιτεί τη διορατικότητα στη συμπεριφορά του συστήματος, τα εργαλεία διαμόρφωσης και πολλούς φόρτους εργασίας για να παίξει με. Μερικές φορές παίρνει την αλλαγή του τρόπου οι διαδικασίες φόρτου εργασίας τα στοιχεία για να είναι σε θέση να βελτιώσει το γενικό σύστημα. Ένα καλό παράδειγμα ήταν η μετάβαση από τη “άμεση” απόδοση στην κεραμίδι-βασισμένη επεξεργασία σε GPUs.»

Όλα έρχεται κάτω στη διαμόρφωση και την προσομοίωση. «Προτείνουμε τη χρήση των εικονικών εργαλείων διαμόρφωσης πρωτοτύπου για να διαμορφώσουμε το φόρτο εργασίας εφαρμογής, μαζί με τα ακριβή συναλλαγή-ισόπεδα πρότυπα της διασύνδεσης και η αρχιτεκτονική μνήμης,» λέει Kogel. «Αυτή η ποσοτική “προσέγγιση αρχιτεκτονικής πρώτα” επιτρέπει την πρόωρη ανάλυση ανταλλαγής, με συνέπεια μια αξιόπιστη προδιαγραφή εφαρμογής. Εις βάρος της πρόσθετης προσπάθειας διαμόρφωσης και προσομοίωσης, το όφελος είναι μειωμένος κίνδυνος τους στόχους απόδοσης και δύναμης, ή μειωμένο κόστος το υλικό για να είναι ακριβώς στην ασφαλή πλευρά. Στην εποχή των μικραίνοντας επιστροφών από το νόμο Moore, η ευκαιρία είναι να βγεί με ένα βελτιστοποιημένο και διαφοροποιημένο προϊόν.»

Αυτός επιτρέπει στον αντίκτυπο των αλγοριθμικών αλλαγών για να δει, επίσης. «Υπάρχει μια ανάγκη να επιστρέψει και να ξανασχεδιαστούν οι αλγόριθμοι,» λέει Thiruvengadam. «Μπορούν για τις παραδοσιακές αρχιτεκτονικές μνήμης κληρονομιών, ή μπορούν να ξανασχεδιαστούν για τις νέες αρχιτεκτονικές, νέες μορφές μνημών, νέες γεύσεις μνήμης. Υπάρχει αυτή η σταθερή ώθηση για το ξελέπιασμα απόδοσης, το ξελέπιασμα δαπανών, και επίσης να είσαι σε θέση να ισορροπηθούν των ανταλλαγών για τις διαφορετικές εφαρμογές. Αυτό είναι ουσιαστικά ο λόγος για τον οποίο βλέπετε τη συνεχή ανάπτυξη MRAMs και FeRAMs. Προσπαθούν να βρούν ένα γλυκό σημείο για τουλάχιστον μερικές μεταβλητές, εάν όχι όλες τις μεταβλητές. Η ανάγκη για τους αλγορίθμους μαζί με τις αρχιτεκτονικές μνήμης γίνεται βεβαίως σημαντική.»

Η ισορροπία είναι απαραίτητη. «Πρέπει να σκεφτείτε για την έννοια της υπολογιστικής έντασης και ο τύπος διαδικασιών σχετικών,» λέει το Frank. «Ορισμένοι αλγόριθμοι έχουν τις ακόρεστες απαιτήσεις εύρους ζώνης, ενώ άλλες κινούν μόνο σχετικά τα στοιχεία μικρών ποσών αλλά εκτελούν χιλιάδες διαδικασίες σε το. Η λειτουργία -μνήμης μπορεί να λειτουργήσει καλά για την επεξεργασία SIMD-τύπων, όπου το εύρος ζώνης οδηγίας είναι μικρό σχετικά με το εύρος ζώνης στοιχείων και πολλά στοιχεία υποβάλλονται σε επεξεργασία χρησιμοποιώντας την ίδια συνταγή. Αλλά μόλις υπάρχουν διαδοχικές εξαρτήσεις στο ρεύμα στοιχείων ή την ανώμαλη ροή πληροφοριών, το όφελος της εξαρτώμενης από το πεδίο μνήμης συρρικνώνεται.»

Μνήμη συνήθειας
Ενώ οι αρχιτεκτονικές αλλαγές μπορούν να παραγάγουν τα μεγάλα αποτελέσματα, η βελτιστοποίηση των μνημών μπορεί επίσης να παρέχει τα κέρδη. «Ένα μεγάλο ποσοστό της δύναμης και της περιοχής των σημερινών επιταχυντών χρησιμοποιείται στη μνήμη,» λέει Horsnell. «Έτσι οποιεσδήποτε βελτιώσεις λανθάνουσας κατάστασης/πυκνότητας/ενέργειας που επιτεύχθηκαν από τις νέες τεχνολογίες μνήμης θα μπορούσαν να ασκήσουν δραματική επίδραση.»

Οι μνήμες συνήθειας γίνονται μεγάλη επιχείρηση. «Αρχίζετε να βλέπετε τα πράγματα όπως την -μνήμη υπολογίζετε, η κοντινός-μνήμη υπολογίζει, συγκεκριμένες μνήμες που να είναι γράφω-όλος-μηδενισμένη μνήμη — οι μνήμες που είναι βελτιστοποιημένοι για ορισμένα τύποι διαδικασιών,» λένε Saggurti. «Βλέπουμε πολλούς πελάτες μας ρωτάμε για MRAM, ακόμα περισσότερη προσαρμογή SRAMs, TCAMs, και ορισμένων τσιμπημάτων στο TCAMs.»

Οι δυσκολίες παραμένουν, εν τούτοις. «έχω διοργανώσει πολλές συζητήσεις σχετικά με τα σχέδια μνήμης συνήθειας, όπου η επεξεργασία στον κύβο μνήμης θα ήταν μια “ιδανική” αρχιτεκτονική,» λέω το Frank. «Θα είχε παράσχει το υψηλό εύρος ζώνης, τη χαμηλή λανθάνουσα κατάσταση, κ.λπ. Όλα ήταν σωστά, εκτός από το γεγονός, ότι η διαδικασία μνήμης περιόριζε ποια λογική μπόρεσε να ενσωματωθεί — τρία ή τέσσερα στρώματα μετάλλων, χαμηλής ισχύος, αλλά αργές κρυσταλλολυχνίες. Εκείνη η σημαμένη ανεπάρκεια για υπολογίζει τη μηχανή. Η θυσία της ταχύτητας ρολογιών και της πολυπλοκότητας κυκλωμάτων έκανε ξαφνικά την ολοκλήρωση να υπολογίσει τη μηχανή πια μια τέτοια καλή επιλογή.»

Αλλά μερικές από αυτές τις αλλαγές θα γίνουν απαραίτητες. «Οι άνθρωποι θέλουν να φέρουν τη λάμψη στο τσιπ και να την κάνουν μια ενσωματωμένη λάμψη,» λέει Saggurti. «Έπειτα η ερώτηση γίνεται, “είναι ακόμα και δυνατό; “Σε 28nm να είστε σε θέση να κάνετε την ενσωματωμένη λάμψη, αλλά οι άνθρωποι αρχίζουν να σκέφτονται για τα πράγματα όπως MRAM σε 22nm.»

Ακόμα, υπάρχουν άλλοι τρόποι να εξετάσουν το πρόβλημα. Η «μεταβλητότητα διαδικασίας πέρα από μια γκοφρέτα και πέρα από τον κύβο, και ακόμα και με τον καιρό, σχέδιο μνήμης ορίου,» προσθέτει Saggurti. «Όταν σχεδιάζετε μια μνήμη, ένα απλό SRAM, εσείς τείνει να σχεδιάσει για την περίπτωση όταν πηγαίνει το κύτταρο κομματιών ένας τρόπος — αργός — και η περιφέρεια πηγαίνει ο άλλος τρόπος — γρήγορα. Εάν σχεδιάζετε για αυτόν, και εάν η πλειοψηφία του πυριτίου σας είναι χαρακτηριστική, αφήνετε πολλές απόδοση και δύναμη στον πίνακα. Εάν καταλαβαίνετε όπου είστε στη σειρά διαδικασίας και επιτρέπετε στο σχεδιαστή τσιπ για να ενεργήσετε επάνω σε εκείνες τις πληροφορίες, κατόπιν μπορείτε να ρυθμίσετε το συγχρονισμό αναλόγως. Το σχέδιό σας θα μπορούσε να είναι βέλτιστο, και δεν ειναι απαραίτητο να σχεδιάσετε για τη χειρότερη περίπτωση.»

Συμπέρασμα
Ενώ η μνήμη είναι πάντα μια ανταλλαγή σχεδίου, δεν έχει λάβει ποτέ το ίδιο επίπεδο προσοχής με την επεξεργασία, ακόμα κι αν είναι ο περιοριστής απόδοσης από την άποψη του εύρους ζώνης, της δύναμης, και της περιοχής. Το AI αναγκάζει τους ανθρώπους για να ξανασκεφτεί τις αρχιτεκτονικές μνήμης από την ανάγκη, αλλά με εκείνη την πρόσθετη προσοχή, οι ομάδες σχεδίου μπορούν επίσης να ξανασκεφτούν μερικά από το λογισμικό και τους αλγορίθμους που βελτιστοποιήθηκαν για τα συστήματα μνήμης κληρονομιών. Σε έναν κόσμο όπου τα κέρδη απόδοσης δεν έρχονται δωρεάν κάθε 18 μήνες, περισσότερα ακραία μέτρα γίνονται ο μόνος τρόπος να σταματηθούν τα προϊόντα από να γίνουν προϊόντα. (Από το Brian Bailey)

Στοιχεία επικοινωνίας