Kirjoittaja Aihe: ARM-prosessori ja cache-muisti  (Luettu 7864 kertaa)

Mistofelees

  • Käyttäjä
  • Viestejä: 663
    • Profiili
ARM-prosessori ja cache-muisti
« : 11.02.15 - klo:09.17 »
Minusta ARM-koneiden tehot eivät ole nousseet samaa tahtia, kuin ytimien lukumäärä prosessorissa.
Koitin kaivella, miten ARM käyttää cache-muistia. Minusta näyttää siltä, että prosessorissa on vain yksi unified cache, jota kaikki prosessorit käyttävät 'vuorotellen'.
Aiheuttaako tämä pullonkaulan prosessorin tehoon ?
Olisiko tehokkaampaa, jos kullakin ytimellä olisi oma, vaikka pienempikin, cachensa ?

Tehon arviointi on tietenkin vaikeaa, koska on lähes mahdotonta arvioida, miten hyvin erilaiset ohjelmat ja käyttöjärjestelmät osaavat jakaa prosesseja ytimille.

_Pete_

  • Käyttäjä
  • Viestejä: 1845
  • Fufufuuffuuu
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #1 : 11.02.15 - klo:09.42 »
Minusta ARM-koneiden tehot eivät ole nousseet samaa tahtia, kuin ytimien lukumäärä prosessorissa.

Mistä niin päättelet? Jossain hienoja käppyröitä asiasta?

Koitin kaivella, miten ARM käyttää cache-muistia. Minusta näyttää siltä, että prosessorissa on vain yksi unified cache, jota kaikki prosessorit käyttävät 'vuorotellen'. Aiheuttaako tämä pullonkaulan prosessorin tehoon ?
Olisiko tehokkaampaa, jos kullakin ytimellä olisi oma, vaikka pienempikin, cachensa ?

Jokaisella ytimellä ei voi olla erillistä cachea koska silloin niissä voisi olla toisistaan ristiriitaista tietoa. Tai jos olisikin pitäisi olla joku tapa jolla erillisten cachejen sisältö syncronoidaan.

Tehon arviointi on tietenkin vaikeaa, koska on lähes mahdotonta arvioida, miten hyvin erilaiset ohjelmat ja käyttöjärjestelmät osaavat jakaa prosesseja ytimille.

Tehon arviointi on helppoa ajamalla sopiva benchmark ohjelma :)


Mistofelees

  • Käyttäjä
  • Viestejä: 663
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #2 : 11.02.15 - klo:14.01 »
En ole koonnut käppyröitä. Näkemys perustuu mutuun noiden tablettien ja puhelimien pohjalta, joita olen kokeillut ja käyttänyt.
Werkossa on näkynyt tietoja nopeuksista, jotka on kasattu joillain benchmark-ohjelmilla.
Vanhastaan benchmarkkeja on pidetty hyvänä vitsinä. Ne testaavat konetta joissain erikoistapauksissa, eivätkä todellisessa käytössä.

En käsitä, miksei kullakin ytimellä ja siinä pyörivällä prosessilla voisi olla omaa cacheaan. Jos se on oikein laadittu, on vaikea käsittää, miten se saisi aikaan kuvaamaasi ristiriitaa. Tietenkin, jos moni prosessi käsittelee samaa dataa, pitää datan kirjoitus lukita. Tämä on kuitenkin ollut tietojenkäsittelyn arkipäivää jo kymmeniä vuosia.

Lepotila zZ

  • Käyttäjä
  • Viestejä: 347
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #3 : 11.02.15 - klo:14.26 »
Katsoin juuri Snapdragon 805 speksejä ja kyllä sen ytimillä on omat pienet välimuistinsa ja niiden lisäksi sitten yksi suurempi ytimille yhteinen välimuisti. Samalla tavalla pöytäkoneeni FX-8320E prosessorissa on välimuisteja useammassa tasossa, tosin kolmessa eikä kahdessa tasossa. Eiköhän ne suorittimien suunnittelijat osaa optimoida välimuistien määrään ja laadun paremmin kuin me maallikot...  :)

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #4 : 11.02.15 - klo:14.29 »
En ole koonnut käppyröitä. Näkemys perustuu mutuun noiden tablettien ja puhelimien pohjalta, joita olen kokeillut ja käyttänyt.

Eihän sovellusten nopeus käytännössä kasvakaan lineaarisesti ytimien lukumäärän suhteen. Yleensä raskaskin laskenta tehdään vain yhdessä säikeessä, eikä sovelluksia ole rinnakkaistettu niin, että ajossa olisi samanaikaisesti useita säikeitä. Nettiselainkin käyttää todennäköisesti vain yhtä säiettä per sivu.

Lepotila zZ

  • Käyttäjä
  • Viestejä: 347
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #5 : 11.02.15 - klo:14.50 »
Eihän sovellusten nopeus käytännössä kasvakaan lineaarisesti ytimien lukumäärän suhteen. Yleensä raskaskin laskenta tehdään vain yhdessä säikeessä, eikä sovelluksia ole rinnakkaistettu niin, että ajossa olisi samanaikaisesti useita säikeitä. Nettiselainkin käyttää todennäköisesti vain yhtä säiettä per sivu.

Olen seurannut prosessorin ytimien toimintaa nyt kun on tuo uusi kahdeksan ytiminen prosessori käytössä. Minusta näyttää siltä, että ainakin käyttämäni Opera-selain osaa jakaa työtä yllättävän hyvin monelle säikeelle ja siten usean ytimen työstettäväksi. Käyttämäni 'suoritinkäyttö' -appletti (xfce4-cpugraph-plugin) näyttää tapahtumat vain neljännessekunnin tarkkuudella, mutta siinä uuden sivun avaaminen hyppäyttää aivan kaikkien ytimien kuvaajia. Opera, joka pohjautuu Chromiumiin, luo jokaista sivua varten useita säikeitä, joita käyttis voi sitten sijoitella  suoritettavaksi eri prosessoreille.
« Viimeksi muokattu: 11.02.15 - klo:14.53 kirjoittanut Lepotila zZ »

JaniAlander

  • Käyttäjä / moderaattori+
  • Viestejä: 3369
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #6 : 12.02.15 - klo:05.53 »
Kun nyt moniydinprossuista yms. puhutaan, mietinkin tuossa, että miten nyt vaikkapa jonkun Hasswell tai Broadwell sukupolven Intelien (vaikka nyt sitten i5 ja i7) yksiydinsuorituskyky vertautuu loppupään Pentium 4:sten kanssa? Niiden siis jotka vetivät sillä liki 4 gigahertsin taajuudella. Ollaanko samalla tasolla, vai onko ydinkohtainen suorituskyky itseasiassa heikompi?


Core i5-9400F 2.9ghz 32GB Ram, Nvidia RTX2060 Kubuntu 24.04-64bit, Windows 10 Pro 64-bit Samsung Series 5, AMD A-6 2.1 GHz 4 Gt Ram, Ubuntu 18.04 64-bit.
Lenovo T60 Core2Duo 2GB Ram Ati Mobility Radeon 128 MB Ubuntu Mate 16.04-64bit
Commodore Amiga 500 1MB Ram.

kamara

  • Käyttäjä
  • Viestejä: 3032
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #7 : 12.02.15 - klo:07.21 »
Kun nyt moniydinprossuista yms. puhutaan, mietinkin tuossa, että miten nyt vaikkapa jonkun Hasswell tai Broadwell sukupolven Intelien (vaikka nyt sitten i5 ja i7) yksiydinsuorituskyky vertautuu loppupään Pentium 4:sten kanssa? Niiden siis jotka vetivät sillä liki 4 gigahertsin taajuudella. Ollaanko samalla tasolla, vai onko ydinkohtainen suorituskyky itseasiassa heikompi?

Omat kokemukset oli, kun vaihdoin P4:sta I7:ään, niin videonpakkaus muuttui 13 tunnista 0,5 tuntiin, joten siitä voisi vetää jotakin johtopäätöstä.

I7 näkyy 8 ytimisenä, mutta kuitenkin vaikka P4:n ajan kertoisi 8:lla, niin se on hitaampi. P4:nen oli muistaakseni 2,4 GHz, ja I7 2,6 GHz, joten suorittimien ero johtuu vain P4:n huonommasta nopeudesta.

En tosin tiedä hyödyntääkö videonpakkaus myös grafiikkasuoritinta.

Tämä tietenkin on vain henkilökohtainen huomio, eikä siitä voi vetää liian suoria johtopäätöksiä. Lisäksi muistikin saattaa tehdä kepposen, kun siitä P4 ajasta on jo muutama vuosi.

Lepotila zZ

  • Käyttäjä
  • Viestejä: 347
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #8 : 12.02.15 - klo:09.30 »
Kun nyt moniydinprossuista yms. puhutaan, mietinkin tuossa, että miten nyt vaikkapa jonkun Hasswell tai Broadwell sukupolven Intelien (vaikka nyt sitten i5 ja i7) yksiydinsuorituskyky vertautuu loppupään Pentium 4:sten kanssa? Niiden siis jotka vetivät sillä liki 4 gigahertsin taajuudella. Ollaanko samalla tasolla, vai onko ydinkohtainen suorituskyky itseasiassa heikompi?

Omat kokemukset oli, kun vaihdoin P4:sta I7:ään, niin videonpakkaus muuttui 13 tunnista 0,5 tuntiin, joten siitä voisi vetää jotakin johtopäätöstä.

I7 näkyy 8 ytimisenä, mutta kuitenkin vaikka P4:n ajan kertoisi 8:lla, niin se on hitaampi. P4:nen oli muistaakseni 2,4 GHz, ja I7 2,6 GHz, joten suorittimien ero johtuu vain P4:n huonommasta nopeudesta.

En tosin tiedä hyödyntääkö videonpakkaus myös grafiikkasuoritinta.

Tämä tietenkin on vain henkilökohtainen huomio, eikä siitä voi vetää liian suoria johtopäätöksiä. Lisäksi muistikin saattaa tehdä kepposen, kun siitä P4 ajasta on jo muutama vuosi.

Onko tuossa i7:ssa siis 4 fyysistä ydintä? (2 säiettä/ydin.) Käsittääkseni ydinten suorituskyky on noussut melkoisesti riippumatta suorittimien kellotaajuuksista. Jos videonpakkaus sujuu 26-kertaa nopeammin, se tarkoittaa sitä, että jokainen i7-ydin tekee työtä 6,5 kertaa tehokkaammin kuin yksi P4 ydin. Vaikka laskisikin nuo 'virtuaaliytimet' suorittimiksi, olisi i7-ydin 3,25 kertaa nopeampi. Se ei selvästikään selity pelkästään kellotaajuudella, joka on vain n. 8% suurempi.

http://fi.wikipedia.org/wiki/Hypersäikeistys

Yhden benchmark -sivuston single thread -listan paras P4-suoritin (Intel Pentium 4 3.80GHz) saa 846 pistettä. Listan ykkönen (Intel Core i7-4790K) saa 2533 pistettä. Joten on se ydinkohtainenkin suorituskyky noussut reilusti.

http://cpubenchmark.net/singleThread.html

(Jos olet kasaamassa budjettikonetta ja ydinkohtainen suorituskyky on tärkeää : Intel Pentium G3258.)

kamara

  • Käyttäjä
  • Viestejä: 3032
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #9 : 12.02.15 - klo:09.44 »
Onko tuossa i7:ssa siis 4 fyysistä ydintä? (2 säiettä/ydin.) Käsittääkseni ydinten suorituskyky on noussut melkoisesti riippumatta suorittimien kellotaajuuksista. Jos videonpakkaus sujuu 26-kertaa nopeammin, se tarkoittaa sitä, että jokainen i7-ydin tekee työtä 6,5 kertaa tehokkaammin kuin yksi P4 ydin. Vaikka laskisikin nuo 'virtuaaliytimet' suorittimiksi, olisi i7-ydin 3,25 kertaa nopeampi. Se ei selvästikään selity pelkästään kellotaajuudella, joka on vain n. 8% suurempi.

Jep 4 fyysistä ydintä, mutta kyseiset arvot ovat muistini mukaan. Nykyisin käytän eri algoritmia videon pakkaukseen, joten molemmat arvot ovat muistini mukaan.
Muistini, joka on tunnetustikin huono.  8)

Pitäisi kaivella todella vanhoja säikeitä esiin, jotta voisin varmistaa sen P4:n videonpakkausajan.

Edit - Muistin oikein P4:lla 5 framea/sekunti. Samalla käskyllä muisteleisin olevan ainakin 50 framea/sekunti I7:llä.

Edit 2 - Tuota I7:llä kuluvaa aikaa kyseisellä algoritmilla ei enää voi testata, kun nykyiselle mencoderille ei käy sellaisenaan samat parametrit, kuin silloiseen aikaan.
« Viimeksi muokattu: 12.02.15 - klo:09.55 kirjoittanut kamara »

_Pete_

  • Käyttäjä
  • Viestejä: 1845
  • Fufufuuffuuu
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #10 : 12.02.15 - klo:10.43 »
http://www.cpubenchmark.net/cpu_list.php

Tuossa kattava lista CPU:ta benchmarkissa. Siitä saa hyvin suhteen cpu vs cpu ...

JaniAlander

  • Käyttäjä / moderaattori+
  • Viestejä: 3369
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #11 : 12.02.15 - klo:10.59 »
Toisaalta olen ymmärtänyt, että nykyisten suoritinten suorituskyvyn parannus on monesti ollut isommasta välimuistista kiinni. Kun saa nopeasti kamaa prosessoitavaksi ei sillä ole väliä vaikka käskyn suoritus veisi saman aikaa tai jopa hiukan enemmän.  Periaatteessa kai pitäisi verrata jollain sellaisella mikä mahtuu kerta heitolla vertailtavien suoritintin välimuistiin...
Core i5-9400F 2.9ghz 32GB Ram, Nvidia RTX2060 Kubuntu 24.04-64bit, Windows 10 Pro 64-bit Samsung Series 5, AMD A-6 2.1 GHz 4 Gt Ram, Ubuntu 18.04 64-bit.
Lenovo T60 Core2Duo 2GB Ram Ati Mobility Radeon 128 MB Ubuntu Mate 16.04-64bit
Commodore Amiga 500 1MB Ram.

Tomin

  • Palvelimen ylläpitäjä
  • Käyttäjä / moderaattori+
  • Viestejä: 11481
    • Profiili
    • Tomin kotisivut
Vs: ARM-prosessori ja cache-muisti
« Vastaus #12 : 12.02.15 - klo:16.50 »
Kyllähän nykyisten suorittimien IPC (instructions per cycle, komentoa per sykli) on noussut, joten kyllä ne Intelin uudet ytimet ovat paljon nopeampia kuin vanhemmat vaikka kellotaajuus ei olisi samaa luokkaa. (Muutenkin Pentium 4 oli aika huono arkkitehtuuri.  ;D)

Vähän luettavaa: http://en.wikipedia.org/wiki/Instructions_per_cycle

Muokkaus. Tuossa vielä taulukko suorittimien suorituskyvystä mitattuna sekunnissa suoritettujen käskyjen mukaan:
http://en.wikipedia.org/wiki/Instructions_per_second
Tuolta voi nähdä, että eräälle Pentium 4 suorittimelle käskyä kellojaksolla lukema on 3.0 ja eräälle Intelin Core 2 suorittimelle se on 9.2 (koko suoritin) tai 4.6 (per ydin). Vastaavasti eräälle erittäin nopealle Intel Core i7 suorittimelle vastaavat lukemat ovat 99.3 ja 12.4. Eli suorituskyky olisi karkeasti nelinkertaistunut. Harmillisesti eräs AMD:n uusi suoritin saa tulokseksi vain 23.1 ja  2.9 eli se olisi tuota P4:ääkin hitaampi yhdellä ytimellä samalla kellotaajuudella. Toisaalta monet muut asiat (muistit, väylät, jne.) tietokoneissa ovat parantuneet, joten asia ei ole ihan niin yksiselitteinen. (ja huomautan vielä, että en tarkastanut noita lukuja mistään muualta, toinen Bulldozer suoritin sai paremman luvun pienemmästä mallinumerostaan huolimatta)
« Viimeksi muokattu: 12.02.15 - klo:16.59 kirjoittanut Tomin »
Automaattinen allekirjoitus:
Lisäisitkö [RATKAISTU] ketjun ensimmäisen viestin aiheeseen ongelman ratkettua, kiitos.

Lepotila zZ

  • Käyttäjä
  • Viestejä: 347
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #13 : 12.02.15 - klo:17.34 »
Voi  olla, että Alanderin epäilyt osuvat kohdalleen AMD:n suhteen, vaikkakaan ei Intelin. Pentium 4 oli sykliä kohden suoritettujen käskyjen suhteen heikompi kuin AMD:n Athlonit. Intelin siirtyessa Core arkkitehtuuriin ja AMD:n siirtyessä Bulldozeriin asetelma kääntyi päinvastaiseksi. AMD siis otti takapakkia siirtyessään K10 arkkitehtuurista Bulldozeriin, ajatellen korvaavansa sen muulla tavoin. Tämän hetkinen markkinatilanne kertonee, että AMD valitsi väärän strategian ja Intel oikean.



joonas60

  • Käyttäjä
  • Viestejä: 255
  • Tietotekniikan kanssa puuhastelua yli 30 vuotta
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #14 : 16.02.15 - klo:12.54 »
Mitä tulee alkuperäiseen kysymykseen eli onko moniytimisillä ARM-prossuilla omaa cachea, niin vastaus on kyllä. L1:n tason cachet löytyvät sekä käskyille ja datalle (esim Cortex-A15 molemmat cachet 32 kB), lisäksi on tason L2 cachea (Cortex-A15 512 kB:sta 4 MB:vuun). Pitkät porinat cache-jutuista Cortex-A-sarjalaisille löytyy dokumentista Cortex A Series Programmer's Guide. Uusin versio (4.00) saa ARM:in sivuilta, mutta vaatii rekisteröitymisen, vanhemman version saa ilman sitä.

Pitää muistaa, että ARM ei itse tee prossun prossua, vaan lisensoi niitä IP-lohkoina SoC-firmoille kuten Samsung ja NVidia.
terv. joonas60
Asus X4909F, Windows 10, WSL2-Ubuntu

qwertyy

  • Käyttäjä
  • Viestejä: 5778
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #15 : 16.02.15 - klo:14.33 »
Omat kokemukset oli, kun vaihdoin P4:sta I7:ään, niin videonpakkaus muuttui 13 tunnista 0,5 tuntiin, joten siitä voisi vetää jotakin johtopäätöstä.

I7 näkyy 8 ytimisenä, mutta kuitenkin vaikka P4:n ajan kertoisi 8:lla, niin se on hitaampi. P4:nen oli muistaakseni 2,4 GHz, ja I7 2,6 GHz, joten suorittimien ero johtuu vain P4:n huonommasta nopeudesta.

En tosin tiedä hyödyntääkö videonpakkaus myös grafiikkasuoritinta.
Tämä. Pitää muistaa että suorittimille on tullut valtavasti optimointeja, jotka ei liity varsinaisesti välimuisteihin, kellotaajuuksiin jne. oikeastaan mitenkään. Tuoreet Intelit tosiaan nimittäin osaa hyödyntää tuota piirin gpu-osuuttakin. Näkeehän tuon esim. uusissa Atom/Celeron prossuissa. "Potkua" prossuissa ei ole moniin asioihin käytännössä minkään vertaa, mutta esim. todella rankat videodekoodaus prosessit hoituu silti täysin ongelmitta ja toiston aikana katsottaessa prosessori ei ole näennäisesti juurikaan edes kuormitettuna.

Lainaus
Tehon arviointi on helppoa ajamalla sopiva benchmark ohjelma :)
Nimenomaan sopiva. Aiheeseen liittyviä ongelmia on tullut vastaan medioissa lähiaikoina paljonkin. Monet laitevalmistajat on alkaneet ympätä firmwareen sopivia kikkoja, että yleisimmissä testisovelluksissa saadaan ylioptimistisia tuloksia. Muistaakseni ensimmäisen kerran laitevalmistajat jäivät kiinni, kun joku hoksasi selvittää, että "laite x" ei voi edes teoriassa päästä saatuihin hienoihin benchmark-tuloksiin.

nm

  • Käyttäjä
  • Viestejä: 16430
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #16 : 16.02.15 - klo:21.19 »
Omat kokemukset oli, kun vaihdoin P4:sta I7:ään, niin videonpakkaus muuttui 13 tunnista 0,5 tuntiin, joten siitä voisi vetää jotakin johtopäätöstä.

I7 näkyy 8 ytimisenä, mutta kuitenkin vaikka P4:n ajan kertoisi 8:lla, niin se on hitaampi. P4:nen oli muistaakseni 2,4 GHz, ja I7 2,6 GHz, joten suorittimien ero johtuu vain P4:n huonommasta nopeudesta.

En tosin tiedä hyödyntääkö videonpakkaus myös grafiikkasuoritinta.
Tämä. Pitää muistaa että suorittimille on tullut valtavasti optimointeja, jotka ei liity varsinaisesti välimuisteihin, kellotaajuuksiin jne. oikeastaan mitenkään. Tuoreet Intelit tosiaan nimittäin osaa hyödyntää tuota piirin gpu-osuuttakin. Näkeehän tuon esim. uusissa Atom/Celeron prossuissa. "Potkua" prossuissa ei ole moniin asioihin käytännössä minkään vertaa, mutta esim. todella rankat videodekoodaus prosessit hoituu silti täysin ongelmitta ja toiston aikana katsottaessa prosessori ei ole näennäisesti juurikaan edes kuormitettuna.

Kamara mainitsi viestissään käyttäneensä Mencoderia, joka ei hyödynnä videon uudelleenpakkauksessa lainkaan näytönohjainta tai muita oheispiirejä, vaan ero tulee puhtaasti prosessorin kehittymisestä. x264:ää ja joitakin muita videoenkoodereita käytetään laajasti benchmarkkina, koska ne mittaavat prosessorin todellista suorituskykyä varsin hyvin, ja vieläpä niin, etteivät näytönohjain tai kokoonpanon muut komponentit vaikuta tulokseen. x264 myös hyödyntää useita ytimiä paremmin kuin useimmat muut todellisen maailman softat, eli esimerkiksi siirryttäessä kahdesta ytimestä neljään yhtä nopeaan, pakkausaika käytännössä puolittuu.

qwertyy

  • Käyttäjä
  • Viestejä: 5778
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #17 : 16.02.15 - klo:23.09 »
Enpäs tosiaan tuota huomannut lukea. No ei silti muuta kyllä asiaa, että nämä Intel Quick Sync Videot yms. on lisänneet käytännön suorituskykyä todella radikaalisti, erityisesti tuolta P4 ajoilta. Luonnollisestikaan kyseessä ei ole pelkästään videotoisto-optimoinnit vaan lukuisat muut vuosien saatossa tulleet tekniikat. UEFI:t yms. jotka sheivaa boottiajasta parhaimmillaan 10sekuntia pois jne. Samoin tietysti sitten nämä hetkittäiset pikkikuormat, joihin esim. Intel vastaa hetkellisesti rajustikin ylikellottamalla automaattisesti prosessoria yms.

Tuossa kun Sandy Bridge julkaistiin, niin silloin melkein kaikissa paikoissa oli artikkeleita, että megahertsikisat on nyt viimeistään loppuneet. Muut tekniikat ajaa lujaa hertsien edelle.

Itse tuosta ARM-prossujen cachesta, niin eikös koko tekniikka poikkea niin paljon tästä perinteisestä "x86":sta, että välimuisteja ei niin tarvitse tuijotella samaan tyyliin? Toisekseen tuo prossujen välimuisti on varmaan se yksi kaikista kalleimmista komponenteista ja vie vielä suhteellisen paljon tilaa siruilta. Sitten kun kyseessä on mobiiliprossu, niin ei taida valmistajia houkuttaa lähteä kilpailemaan tuolla saralla?

joonas60

  • Käyttäjä
  • Viestejä: 255
  • Tietotekniikan kanssa puuhastelua yli 30 vuotta
    • Profiili
Vs: ARM-prosessori ja cache-muisti
« Vastaus #18 : 17.02.15 - klo:09.16 »
Toisekseen tuo prossujen välimuisti on varmaan se yksi kaikista kalleimmista komponenteista ja vie vielä suhteellisen paljon tilaa siruilta. Sitten kun kyseessä on mobiiliprossu, niin ei taida valmistajia houkuttaa lähteä kilpailemaan tuolla saralla?
Osuit asian ytimeen. Cachet ovat SRAM-muisteja, jotka ovat DRAM-muisteja kookkaampia ja huomattavasti kalliimpia, mutta nopeampia. Toisaalta iso cache kasvattaa latensia, jolloin nopeusetu pienenee.

Itse olen saanut sellaisen kuvan, että Intel ja ARM kisaavat keskenään mobiilirintamalla, ainakin jossain määrin: Intel on tehokkaampi, mutta syöpömpi sähkön suhteen. ARM häviää tehoissa, mutta on parempi virrankulutuksen suhteen. Jossain näin sellaista, että mobiilipuolella (lähinnä kai älypuhelimet?) ARM:illa olisi 95% markkinaosuus. Tälläisiin lukuihin suhtaudun kuitenkin varauksella 8)
« Viimeksi muokattu: 17.02.15 - klo:09.27 kirjoittanut joonas60 »
terv. joonas60
Asus X4909F, Windows 10, WSL2-Ubuntu