Mikroarhitektuur (Inglise keeles microarchitecture), informaatikas ja arvutitehnikas kirjeldab mikroarhitektuur kuidas protsessoris on teostatud etteantud käsustik. Kui käsustik kirjeldab kuidas protsessor käske täidab siis mikroarhitektuur kirjeldab kuidas protsessori [1]osad on ühendatud loogilselt ja füüsiliselt. Mikroarhitektuur võib kirjeldada ühendusi suuremate osade vahel, nagu kuidas aritmeerika-loogikaplokk on registritega ühenuses või kuidas on ühendatud individuaalsed loogikaväravad.
Käsustik hoomab enda alla assemblerkeele, registrid, grammatika (Inglise keeles: syntax), käitumise (Inglise keeles: Execution model), aadressid ja andmetüübid. Näiteks sama käsustiku jagavad kõik x86 protsessorid, x86_64 protsessorid (tuntud ka kui AMD64) ja muud teised.
Protsessori mikroarhitektuur on tavaliselt esitatud kui protsessori osade omavaheliste ühenduste loogikadiagramm. Nendel joonistel on tavaliselt eraldatud juhtsignaalid ja andmesignaalid. Mikroarhitektuuri erinevaid komponente on võimalik kirjeldada sarnaste skeemidega kus on näidatud ühendused erinevate loogika komponentide vahel, nendest loogika komponentidest on omakorda tehtud elektriskeemid mis kirjeldavad tema tööd[2].
Mikroarhitektuuri skeem koosneb aritmeerika-loogikaplokkist, registritest, ühest või mitmestandmesiinist, puhvermälust, juhtliinidest. Diagramm näitab mis juhtsignaalide, sisendite ja väljunditega teatud masina osad tegelevad.
Erinevatel protsessoritel võivad olla erinevad lahendused, et saavutada sama lõpp tulemust kui teised sama käsustiku protsessorid. Mikroarhitektuuri muutused võivad esile tuua ka tehnoloogilised arengud kas pooljuhtides, tootmises või muus[3].
Sama mikroarhitektuuriga masinatel on võimalik kasutada erinevaid käsustike miniaalsete mikrokoodi muudatustega[4][5]. Mikrokood on protsessori sees olev püsimälu mis määrab kuidas protsessori masinkäske täidetakse. Uuematel protsessoritel on võimalik, et see püsimälu on ülekirjutatav (vaata välkmälu). Seda mikrokoodi uuendatakse tihti läbi BIOS ja UEFI püsivara uuenduste.
Programmide käivitamiseks peab protsessori tegema järgmist:
Toru ehk konveier on kogum jadamisi ühendatud andmete töötlemise elemente, kus ühe elemendi väljund on järgmise elemendi sisendiks. Torud on aruvutiteks kasutuses selleks, et protsessoril oleks võimalik teha mitu erinevat ülesannet ühe takti jooksul. Olenevalt ülesandest võib see drastiliseslt suurendada käskude täitmise kiirust. Kui aga on tegu üksteistele järgnevate käskudega mis kõik omaette olenevad endast varema käsu tulemusest siis ei pruugi muutus olla märgatav.
Käsu töötlemise saab jagada näiteks viieks etapiks:
Superkalaarseks arhitektuuriks nimetatakse arhitektuuri, mis on varustatud rohkem kui ühe konveieriga. Sellisel korral peavad igal konveieril olema oma komponentide komplekt. Superskalaarse arhitektuuriga seadmetel on kahte tüüpi rakendustega konveiereid:
Vahemälu (Inglise keeles cache) on suure kiirusega mälu, mis asub protsessorile võimalikult lähedal, kõige kiirem L1 vahemälu asub protsessori põhi räni peal. Vahemälu eesmärk on hoida andmeid mida võib korduvalt vaja minna ning vältida ajakulukat põhimälust andmete leidmist.
Vahemälu tasemed:
Igal füüsilisel tuumal võib olla mitu käsumootorit (Inglise keeles: execution unit) ja oma vahemälu. L2 ja L3 vahemälude korral on tihti tegu tuumade vahel jagatud vahemäluga. Kui vahemälu kasutaja (CPU, veebibrauser, operatsioonisüsteem) soovib andmeid, uuritakse kõigepealt vahemälu.
Kui vahemälust leitakse kirje ID-ga, mis sobib otsitud andmeühiku ID-ga, siis kasutatakse andmeelementide vahemälu. Vastasel korral prab pöörduma põhimälu poole.
Käsustiku valik võib drastiliselt mõjutada protsessori mikroarhitektuuri kompleksust. CISC protsessori mikroarhitektuur on palju keerulisem, kui RISC protsessoritel, sest neil on aja jooksul kujunenud keerulisemad käsud spetsialiseeritud ülessanete jaoks. RISC protsessorite põhi disaini strateegia oli lihtsustada individuaalseid juhiseid ja nende täitmiseks vajaliku loogikat.
Siirete ennustamine on tehtud protsessori poolt, et määrata kuhu käskude täitmine läheb peale tingimuslikku hüppet, selleks, et lugeda mälust järgmisi käske. Spekulatiivne käivitamine on 1 samma rohkem ja tegelikult määrab mis järgneva koodi tulemus oleks.
Spekulatiivse käivitamise puhul käivitatakse kood enne kui selle koodi tulemusi vaja läheb teadmata kas selle koodi tulemust läheb vaja. See tähendab, et tingimusliku hargnemise puhul käiakse läbi mõlemad harud ja kui selgub kummale poole kood tegelikult peale minema peab siis heidetakse vale haru ära. Seda on võimalik teha kui protsessoril on vabu ressursse. Kaasaegsetel protsessoritel võimaldab see meetod paremini ära kasutada konveiereid ja konveieri registrites olevaid ressursse.
Siirete ennustamine on programmis olevate hüppete ennustamine enne kui on teada kas hüppet sooritatakse. Kuna instruktsioonide konveier on mitmesammuline ja käsu täitmiseks kulub mitu takti, siis hüppele järgnevaid käske ei saa alati kohe mällu laadida, vaid tuleb oodata, kuni eelnevad käsud on konveieri läbinud ja nende tulemuse järgi on teada, kas hüpe toimub. Siirete ennustamise võimaluse puudumisel peab protsessor ootama ära hüppe sooritamiseks vajaliku tingimuse tulemust.
Ennustamise implementeerimise viisid:
Dünaamiline ajastamise[6] (Inglise keeles dynamic execution või out-of-order execution) puhul käivitatakse koodi võimalusel erinevas järjekorras, et optimeerida konveieri kasutust ja minimseerida seisakuid. Näiteks kui protsessor peab ootama, et mingit informatsiooni põhimäust leitakse, siis on ootamise ajal võimalik täita teise käske mis ei vaja andmeid mälust.
Multitöötlus (Inglise keeles multiprocessing) on mitme protsessori kasutus ühe arvuti süsteemi sees. Multitöötlus süsteemis võivad kõik protsessorid olla võrdsed, tuntud kui sümmetriline multitöötlus, või võib tegu olla süsteemiga kus on üks põhiprotsessor mis jagab ülesandeid teistele protsessoritele, asünkroonne multitöötlus. Multitöötluse all mõeldakse pigem, et ühe füüsilise protsessori kiibi sees on mitu n.ö loogilist protsessorit.
Mitmeprotsessorilisus.[7] (Inglise keels multiprocessor system) on kui ühe süsteemi sees on mitu füüsilist protsessorit.
Mitmeprotsessoriga süsteemide tüübid:
Mitmelõimelisus (Inglise keeles multithreading) on protsessori või protsessori tuuma võime jagada programm mitmele lõimele laiali.
See on erinev multitöötlusest, sest mitmelõimelises programmis lõimed jagavad ühe või mitme tuuma ressursse, sealhulgas vahemälu, puhvreid jm. Kui multitöötlus süsteemid sisaldavad mitmeid töötlusplokke ühes või mitmes tuumas, siis mitmelõimelisuse eesmärk on optimiseerida ühe tuuma kasutust.