Kui suur on pilv?

Suur pilv

Eelmisel kuul näitas 2007es.com teile internetiporno tegelik ulatus . Ühel ajal kasutab täiskasvanute videote voogesitus tõenäoliselt umbes 30% Interneti kogu ribalaiusest, mis võrdub umbes 6 terabaidi pornotarbimisega iga sekund . Aga kuidas on ülejäänud 70% -ga? Netflix, YouTube ja muud täiskasvanutele mõeldud videosaidid on tohutu ribalaiusega sigadused, mis võivad moodustada isegi 40% Interneti-liiklusest. Digitaalsed failikapid, nagu Rapidshare ja Megaupload, moodustavad kogu maailmas umbes 10% liiklusest. Veebisurf ja e-post (ja rämpspost!) On veel 15%. Ja siis on pilvandmetöötlus.



Tänapäeval on valdav enamus veebiteenuseid ja saite hostitud pilves. Selle all mõtlen ma seda, et ettevõtete asemel (näiteks Ziff Davis / 2007es.com), kes haldavad oma riistvara, kasutatakse kolmanda osapoole pilvemälu ja arvutusteenuseid. Amazoni veebiteenused (AWS), Microsoft Azure ja Google on kolm silmapaistvat näidet tohututest pilveklastritest, kuid on sadu väiksemaid toiminguid, mille suurus ulatub tervest andmekeskusest kuni mõne rackini.

Pilve jõud on selles, et seda saab sundida ja kingadega sarvitada nii erinevateks ülesanneteks kui pilvepõhine superarvuti , veebimeili, aadressile lihtne dokumentide salvestamine . Ühes pilveklastris saab Google hostida ja teenindada petabaiti YouTube'i videoid ning salvestada kõik teie meilid ja dokumendid. Kõigist pilve tahkudest keskendume siiski täna pilvesalvestusele.



Microsofti andmekeskus

Microsofti andmekeskus

Kuigi salvestusruum ei pruugi olla nii seksikas kui terabaiti RAM-i ja tuhandeid protsessori südamikke, on see kõige usaldusväärsem viis mõõta suurus pilve, eriti kui arvestame ribalaiuse kasutamist. Kogumahust saame välja töötada ka maksumus pilvemälust - ja sealt edasi saame lõpuks trenni miks nagu Google, Microsoft ja Dropbox langevad pilvemäluteenuste pakkumiseks ise üle.



Nagu pornolugu, alustame kõigepealt mõnest teoreetilisest numbrist ja seejärel asume pilvevarunduse pakkuja Backblaze tegelike tegelaste (ja riistvara) peale.

Petabaiti

Enamasti on suurettevõtete, nagu Google, Facebook, Amazon ja Microsoft tegelikke numbreid vähe. Kui aga veebi sirvida, ilmnevad mõned umbkaudsed palliväljakud:

  • IPO-avalduses ütles Facebook, et see salvestab üle 100 petabaiti (PB) meediumit (fotosid ja videoid). Pole ebareaalne öelda, et Facebookil on tõenäoliselt mahutavuse kogumaht ka sellest kaugemal, kui arvestate varukoopiaid ja muid andmeid (olekuvärskendused, meeldimised jne), võib-olla vahemikus 300PB.
  • Microsoft tunnistas hiljuti, et Hotmail salvestab üle 100 petabaiti ja SkyDrive koos 17 miljoni kliendiga salvestab 10PB andmeid. Nagu Facebook, on ka Microsofti kogu võimsus, kui arvestame ülejäänud Azure'i ja selle veebiomadustega, üle 300 petabaiti.
  • Megaüleslaadimine on sellega võrreldes suhteliselt väike, salvestades ilmselt vaid 25 petabaiti.
  • Selle asemel, et anda meile kena ja lihtne petabaitide arv, teatab Amazon selle asemel, kui palju on S3 pilvemäluteenuse salvestatud objekte. 2012. aasta aprilli seisuga salvestas Amazon S3 905 miljardit objekti. Kui eeldame, et keskmine suurus on 100 KB, on see umbes 90 petabaiti; kui keskmine suurus on 1 MB, on see 900 petabaiti - peaaegu eksabait!
  • Aasta tagasi talletatud Dropbox salvestas „10+ petabaiti” andmeid. Sel ajal oli sellel 25 miljonit kasutajat ja täna 100 miljonit kasutajat, nii et kõik asjad on ettevõttes võrdsed - umbes 40PB andmeid.

Nende arvude perspektiivi vaatamiseks on keskmisel arvutil tõenäoliselt 500 GB või 1 TB kõvaketas ja petabaidi maht on 1024 TB. Siis mängivad Microsofti ja Facebooki andmekeskused vähemalt vähemalt 100 000 kõvaketast. Ilma kohandatud riistvara ehitamata saate pigistada 48 draivi 4U korpusesse. Pärast võrgutarvete arvestamist tähendab see, et tõenäoliselt vaatate 40U raami kohta umbes 400 kõvaketast - või 250 riiulit, millest igaüks võtab umbes ühe ruutmeetri põrandapinda. See võib kõlada palju, kuid kui mõelda, et Google, Amazon, Facebook ja Microsoft levitavad regulaarselt andmekeskusi, mille põhiplaanid on üle 30 000 ruutmeetri (300 000+ ruutjalga), pole see tegelikult nii palju. Suures plaanis on serveritele (st protsessoritele) ja võrguseadmetele pühendatud palju rohkem ruumi.

Ribalaius



Andmekeskuse lülitiRibalaiuse mõttes on meil suurte poiste andmeid veelgi vähem. Me teame, et eelmise aasta seisuga salvestati iga viie minuti tagant miljon faili - seega täna neli korda rohkem kasutajaid, see on 800 000 faili minutis. Dropboxist oluliselt suurem Amazon S3 tegeleb 650 000 taotlusega sekundis.

Kui eeldame, et Dropboxi keskmiselt on salvestatud fail 500KB (fotode, videote ja dokumentide segu), salvestab Dropbox kokku 400 000 megabaiti (0,4TB) minutis - ehk 6,7GB sekundis (54Gbps). Meil pole andmeid selle kohta, kui palju andmeid Dropbox on saadab minutis (s.t inimesed laadivad oma Dropboxist faile alla), kuid tõenäoliselt on see vahemikus 10 kuni 20 Gbps.

Amazon S3, mida kasutatakse peamiselt veebisaitide staatiliste failide (piltide, stiililehtede, videote) salvestamiseks, on tõenäoliselt väiksema keskmise failisuurusega kui Dropbox. Kui eeldame, et faili keskmine suurus on 100 KB, siis 650 000 päringut sekundis on kokku 61 gigabaiti sekundis edastatud andmeid ehk 488 Gbps. See on väga lähedal 800Gbps näitajale, mille hindasime suurele pornosaidile, mis võrdub umbes 2% -ga kogu Interneti-liiklusest - Amazon on päris suur!



Facebook ja Microsoft, kumbki vahemikus 100–300 TB, jäävad ribalaiuse kasutamise osas tõenäoliselt Dropboxi ja Amazoni vahele - võib-olla 200 Gbps tükk.

Kuid piisavalt teooriat! Arutleme mõne reaalse numbri ja reaalse riistvara üle!

Copyright © Kõik Õigused Kaitstud | 2007es.com