ARM (lyhenne aluksi sanoista Acorn RISC Machine, myöhemmin sanoista Advanced RISC Machine[1]) on mikroprosessoriarkkitehtuuri, jonka brittiläinen tietokonevalmistaja Acorn Computers kehitti 1980-luvun puolivälissä.[2] Arkkitehtuuriin kuuluu 32- ja 64-bittisiä suorittimia. ARM on pitkäikäisimpiä RISC-arkkitehtuureja ja nykyisin suosittu etenkin kämmentietokoneiden, matkapuhelimien ja sulautettujen järjestelmien suorittimissa. Se on maailman eniten valmistettu 32-bittinen suoritinarkkitehtuuri: alkuvuodesta 2007 ARM-suorittimia oli valmistettu viisi miljardia kappaletta, ja mm. 90 % matkapuhelimista käyttää niitä.[3][4] Vuonna 2014 luku oli kymmenkertaistunut yli viiteenkymmeneen miljardiin.[5]
ARM | |
---|---|
Perustietoja | |
Kehittäjä | Acorn Computers, Arm |
Valmistaja | Samsung, Texas Instruments |
Arkkitehtuuri ja luokitus | |
Arkkitehtuurityyppi | RISC |
Osoiteavaruus | 32-bit / 64-bit |
Tavujärjestys | Bi-endian |
Lisenssi | suljettu, kaupallinen |
Historia
ARM-suoritin kehitettiin korvaamaan MOS 6502, jota Acorn Computers käytti Acorn Atomissa ja BBC Microssa.[6] Prosessorin suunnittelivat Sophie Wilson ja Steve Furber.[7][8] Acorn Computersin Hauser ja Curry olivat vakuuttuneita, että mikropiirisuunnitteluun kannatti panostaa vaikka niitä ei valmistaisi itse vaan jotta yrityksellä olisi paremmin tietoa liiketoiminnan kannalta oleellisesta asiasta.[8] Yritykseen hankittiin mikropiirien suunnitteluun kolme henkilöä sekä työkalut ja työasemat.[8] Lisäksi Hauser esitti Wilsonille ja Furberille IBM:n esittämiä ideoita.[8] Wilson ja Furber vierailivat Western Design Centressä, jossa Bill Mensch työskenteli piirisuunnitelman parissa: projektin pieni mittakaava rohkaisi Wilsonia ja Furberia kehittämään prosessorin itse.[8][9] Wilson suunnitteli käskykannan ja Furber muodosti siitä tehtaalle valmistukseen lähetettävän tiedon (tape-out).[9] 18 kuukautta myöhemmin heillä oli toimiva ARM.[9][10] Virran käyttö ei aluksi ollut tärkeää, mutta halpa hinta oli ja käytettyjen materiaalien johdosta virrankäyttö piti olla alle yhden watin.[10] Pienen transistorimäärän myötä piiri ei käyttänyt paljoa virtaa ja toimi viileämpänä kuin monet muut, joista tuli myöhemmin hyödyllisiä ominaisuuksia mobiililaitteiden kannalta.[6]
Prosessori alkoi tutkimusprojektina, jonka ensimmäiset näytekappaleet saatiin 26. huhtikuuta 1985.[10][1] Ensimmäiset mallit valmistettiin 3 mikrometrin VLSI-tekniikalla ja se tarvitsi alle 25 000 transistoria.[1] ARM1:n korvasi nopeasti ARM2, joka oli ensimmäinen tuotantoversio ja vain 30 000 transistoria.[1] ARM2:n käskykanta oli parempi suorituskyvyn maksimoimiseen ja siinä oli 32-bittinen dataväylä, 26-bittinen osoiteväylä ja 16 rekisteriä.[1] ARM2:ssa ei ollut piirillä välimuistia.[1]
Ensimmäinen ARM-prosessoria käyttävä tuote oli ARM Development System (BBC Micron laajennus[10]), jota seurasi Acorn Archimedes vuonna 1987.[1][11] Vuonna 1990 kehitys siirtyi Acornilta uuteen yhtiöön.[12]
ARMista tuli järjestelmäpiirille sopiva: koska varsinainen prosessori ei tarvitse paljoa tilaa voidaan samalle piirille jäävä tila käyttää muihin tarkoituksiin.[11] Apple käytti ARMia Apple Newtonin prototyyppeihin ja päätyi ostamaan osuuden yhtiöstä.[11]
ARM-suorittimet ovat olleet 32-bittisiä (32-bittinen leveys ja osoiteavaruus) ARMv3:sta lähtien: tätä edeltävät mallit käyttivät 26-bittistä osoiteavaruutta.[13] Nokian tarpeita varten ARM:iin suunniteltiin 16-bittinen Thumb-käskykanta, jolloin 32-bittistä suoritinta voitiin käyttää vähemmän muistia vaativilla käskyillä: tämä julkaistiin ARM7-versiossa, josta tuli menestystuote.[14]
64-bittinen ARM-suoritinsarja on julkaistu lokakuussa 2011.[15] Armv8 toi uuden käskykannan lisäksi muutoksia rekistereihin sekä 64-bittisen virtuaalisen osoiteavaruuden.[16]
Armv9-arkkitehtuuriversio on julkaistu maaliskuussa 2021.[17] Armv9 jatkaa Armv8:n tuoman 64-bittisen käskykannan kanssa ja lisää laajennuksia.[16] Uutena Armv9:ssä on koneoppimisen käyttöön suunnattu eri tarkkuuksien liukuluvut (kuten bfloat16) matriisien laskentaan sekä digitaalisen signaalinkäsittelyn parannukset.[17] Armv9:ssä on SIMD-tyyppisen vektoriyksikön Scalable Vector Extensions toinen versio (SVE2).[16][18]
Valmistajat
ARM-suorittimia suunnitteleva Arm ei valmista ARM-suorittimia, vaan on keskittynyt vain niiden suunnittelemiseen ja lisensoi niiden arkkitehtuurin ja valmistusoikeudet useille muille yrityksille kuten Samsungille (katso Exynos), Texas Instrumentsille (katso OMAP), Motorolalle (katso DragonBall MX), Qualcommille (katso Qualcomm Snapdragon) ja Applelle (katso Apple M1).
Ampere Computing suunnittelee pilvipalveluita tarjoaville yrityksille suunnattuja Altra-suorittimia, jotka perustuvat ARM-suorittimille.[19]
Suuret pilvipalveluja tuottavat yritykset Amazon ja Google ovat kertoneet omista ARM-suorittimistaan. Yritykset ovat kertoneet paremmasta suorituskyvystä ja pienemmästä virrankulutuksesta omissa testeissään. Amazonin ja Googlen ARM-suorittimet perustuvat Armin Neoverse-suunnitteluun.[20][21][22][23]
ARM-käskykannan ominaisuuksia
ARM soveltuu pienikokoisiin laitteisiin hyvin, koska sen voi toteuttaa suhteellisen vähäisellä logiikkamäärällä tehokkuuteensa nähden. Esimerkiksi ARM2:ssa oli vain noin 30 000 transistoria, mutta se oli silti nopeampi kuin samalla kellotaajuudella ajettu Motorola 68000, jossa transistoreja oli noin 68 000. Pienestä koostaan huolimatta ARM-prosessorit ovat varteenotettavia prosessoreita, koska ne voivat sisältää esimerkiksi muistinhallintayksikön (MMU), joka mahdollistaa kehittyneiden käyttöjärjestelmien ajamisen.
ARM-käskykanta on RISC-tyyppinen load-store-arkkitehtuuri, jossa on suuri määrä rekistereitä ja pieni määrä komentoja.[13] Operaatiot tehdään rekisterien välillä. Muistia käsittelevät vain muistinlataus- ja tallennuskäskyt. ARM sisältää kuitenkin myös joukon RISC-kantaa ilmaisuvoimaisempia käskyjä, kuten käskyt pinon käyttämiseen. Lisäksi normaaleihin aritmeettisiin käskyihin voidaan liittää toisen parametrin bittien siirto (shiftaus). Miltei jokainen käsky voi olla ehdollinen, eli käsky voidaan joko suorittaa tai olla suorittamatta riippuen jonkun ehtorekisterin arvosta. Sen avulla voidaan välttää osa ohjelmakoodin ehdollisista haarautumisista, jolla saadaan pidettyä suorittimen liukuhihnat täynnä ja parannettua välimuistin osumatarkkuutta, joka parantaa suorituskykyä.
Muistin osoitusmoodien ollessa rajattu kaikki käskyt voidaan koodata täsmälleen 32-bitillä.[13] Käskyt voidaan tasata muistiosoitteisiin ja käskyn purkaminen voidaan toteuttaa hyvin yksinkertaisesti.[13] Vertailun vuoksi x86-suorittimissa käskykoko vaihtelee ja ne ratkaisevat haittapuolia purkamalla käskyt yksinkertaisempiin RISC-tyyppisiin mikro-operaatioihin.[13]
Normaalit ARM-käskyt ovat 32 bittiä pitkiä.[24][25] ARMv4T ja myöhemmät sisältävät 16-bittisen käskykannan nimeltä Thumb.[24] Thumb-käskykannassa on suurin osa 32-bittisestä toiminnallisuudesta, mutta jotkin operaatiot vaativat useampia käskyjä.[24] Thumb mahdollistaa tiiviimmän ohjelmakoodin suorituskyvyn kustannuksella.[24] ARMv6T sisältää 32-bittisen Thumb-käskykannan (Thumb-2).[24] ARMv7T määrittelee ThumbEE-käskykannan laitteella luotua koodia varten.[24] ARM-tilassa käskyt tallennetaan sanapituuteen tasattuihin osoitteisiin, mutta Thumb- ja ThumbEE-tiloissa käskyt voivat olla puolisanaan tasattuja.[25] Thumb-tilassa ohjelmamuistia sekä ohjelmamuistin ja prosessorin välistä muistiväylää tarvitaan vähemmän ja prosessorin toiminta on rajoittunutta: esimerkiksi vapaasti käytettävien rekisterien määrä on rajoitettu kahdeksaan, eikä muiden kuin hyppykäskyjen suoritus voi olla ehdollista.
ARMissa on 30 kappaletta 32-bittisiä yleiskäyttöisiä rekistereitä, joista 15 on jatkuvasti saatavilla riippuen suorittimen tilasta.[26] Ohjelmalaskuria (PC, R15) ei lasketa mukaan yleiskäyttöisiin rekistereihin.[26] Pino-osoitin (SP, R13) ja linkkirekisteri (LR, R14) ovat erityiskäyttöön tarkoitettuja.[26] Osa rekistereistä on käytettävissä vain eritysoikeustilassa.[27] Useimmat 16-bittiset Thumb-käskyt voivat käyttää vain kahdeksaa ensimmäistä rekisteriä (R0–R7), joita kutsutaan alemmiksi rekistereiksi (Lo).[28] Ylemmät rekisterit (Hi) ovat R8–R12, SP, LR ja PC.[28] 32-bittisessä Thumb-tilassa kaikki käskyt voivat käyttää rekistereitä R0–R12 sekä LR-rekisteriä.[28] Useimmat Thumb-käskyt eivät voi käyttää ohjelmalaskuria (PC).[28] ARM-tilassa kaikki käskyt voivat käyttää rekistereitä R0–R12, SP ja LR sekä useimmat voivat käyttää ohjelmalaskuria PC.[28]
Tavujärjestys on bi-endian ARM6-malleista eteenpäin, joka tarkoittaa että suoritin tukee molempia mahdollisuuksia (little, big).[29][30] Vanhat mallit olivat vain pieni-endiaanisia (ARM2, ARM3, ARM2aS).[30]
Monien muiden suorittimien tavoin ARM tukee eri toimintamoodeja: käyttäjätila tavallisille ohjelmille ja järjestelmätila (system mode) käyttöjärjestelmän koodille.[13] ARMv7:stä lähtien mukana on laitteistotuki hypervisor-virtualisoinnille, joka ARMv8:ssa on osa arkkitehtuuria suoritustasonimellä EL2.[13][31] EL1-suoritustaso on käyttöjärjestelmän ytimelle ja EL0-taso ilman eritysoikeuksia suoritettavalle koodille.[31] Lisäksi on toimintojen avuksi on kehitetty uusia keskeytyskäsittelijöitä (GIC) sekä IOMMU-tuki (SMMU ARM-arkkitehtuurissa).[31]
VFP apusuoritin sisältää tuen liukulukuaritmetiikalle.[32] VFP ja NEON-laajennus jakavat rekistereitä.[32][33][34]
ARM-suorittimien big.LITTLE-arkkitehtuuri yhdistää kahden tyyppistä erikoistunutta prosessoria, jossa "LITTLE" tähtää energiatehokkuuteen (pieneen virrankäyttöön) ja "big" laskentatehoon. Arkkitehtuuri on suunnattu tilanteisiin, joissa käyttö vaihtelee kuten mobiililaitteissa, joissa on pitkiä vähäisen virrankäytön jaksoja ja hetkittäisiä suuremman suorituskyvyn tarpeita.[35]
ARM-suoritinytimiä
- ARM1 (1985), prototyyppi
- ARM2 (1986), jota käytettiin Acorn Archimedes -mikrotietokoneissa
- ARM3
- ARM6 (1991), jota käytettiin Apple Newton -PDA-laitteessa
- ARM7, jota käytettiin muun muassa GameBoy Advancessa
- StrongARM, jota valmisti aluksi DEC, ja jonka valmistusoikeudet myytiin sittemmin Intelille
- Intel XScale
- ARM9, joka on mm. hyvin monessa PDA:ssa käytetyn OMAP1xxx-piirin sisällä
- ARM11, löytyy mm. OMAP2xxx-piirin sisältä.
- Cortex A8, sisältää haarautumisenennustuksen, käytössä mm. iPhone 3GS:ssä ja Nokia N900:ssa.
- Cortex A9, ensimmäinen käskyjä uudelleenjärjestelevä ARM-suoritin. Löytyy mm. Nvidian Tegra 2 -piirin sisältä.
- Scorpion, Qualcommin suunnittelema ARM-ydin. Suorittaa kahta käskyä rinnakkain ja uudelleenjärjestelee käskyjä rajoitetusti. Käytössä mm. useimmissa Windows Phone 7-puhelimissa olevissa SnapDragon-piireissä.
- Cortex A5, uudempi pienempi, vähävirtaisempi ja suorituskyvyltään heikompi malli.
- Cortex A7, korvasi Cortex A8n, vähävirtaisempi mutta nopeampi.
- Cortex A15, selvästi järeämpi ydin, pystyy suorittamaan kolmea käskyä rinnakkain ja pystyy uudelleenjärjestelemään käskyjä.
- Krait, Qualcommin uudempi ARM-ydin. Suorittaa kolmea käskyä rinnakkain ja uudelleenjärjestelee käskyjä. Käytössä mm. useimmissa Windows Phone 8-puhelimissa olevissa SnapDragon-piireissä.
- Swift, Applen suunnittelema ARM-ydin. Käytössä mm. iPhone 5:ssa. Suorittaa kolmea käskyä rinnakkain. [36]
- Cortex A12, korvasi Cortex A9n, rakenteeltaan samantyylinen mutta suorituskyvyltään parempi.
- Cortex A17, paranneltu Cortex A12.
- Cyclone, Applen suunnittelema ja käyttämä ARM-ydin. Käytössä mm. iPhone 5S:ssä, pystyy suorittamaan jopa kuutta käskyä rinnakkain.[36]
- Cortex-R-sarja on tarkoitettu deterministiseen käyttöön reaaliaikajärjestelmissä[37]
- Cortex-M-sarja on tarkoitettu alhaisen hinnan ja virrankäytön kohteisiin mikrokontrollereissa[38]
ARM 64-bit
64-bittinen ARM-suoritinsarja on julkaistu lokakuussa 2011.[15]
Sarjan ensimmäinen malli on ARMv8-A, johon on kaksi päivitysversiota: ARMv8.1-A ja ARMv8.2-A.
64-bittinen ARM-arkkitehtuuri tunnetaan nimellä AArch64 ja se käyttää A64-käskykantaa.[39]
Lokakuussa 2020 kerrottiin että Cortex-A-sarjan suorittimet ovat vuodesta 2022 alkaen vain 64-bittisiä ja tuki 32-bittiselle ARM32-käskykannalle jää niistä pois.[40] Cortex-R- ja Cortex-M-sarjojen suorittimet ovat vielä 32-bittisiä.[40] ARM32-käskykannassa on käskyjä, jotka ovat vaikeita spekulatiiviselle suoritukselle ja vaikeasti optimoitavissa liukuhihnalle.[40]
NEON
NEON (tai engl. Media Processing Engine, MPE) on ARM-suorittimien vastine SIMD-käskylaajennuksille.[41]
Mali
- Pääartikkeli: Mali (grafiikkasuoritin)
Mali on ARM Holdingsin grafiikkasuoritinsarja (GPU).
Lähteet
Aiheesta muualla
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.