+36 1 999 6900

14 - 19 perc olvasási időArista: Túllépve a hálózati korlátokon – adatközpontoktól a felhőig és tovább

Olvasómód

48-port 25G Ethernet, vagy 32-port 100G Ethernet. Vagy más sebességek és portszámok. Nem napelemes, így mindegyik áramot fogyaszt.  Ethernet switch ez is, az is. Miben más?

  • Arista?
  • Nem hallottam még róla… Ez megint egy újabb hálózatos gyártó?
A blog tartalma:
A kezdetek…

Az alapítók előéletének jelentősége van a történet szempontjából és jóval korábbra nyúlik vissza, mint magának az Aristának a megalapítása. 2004. Az akkor erősen növekedő és feltörekvő Google kiadott egy tender-kiírást, amely rendkívül rövid volt:

Olyan switching megoldást keresünk, amely képes összekötni 100 000 szervert, mindegyik szervert 1G-vel bekötve, maximum 100 USD költséggel szerverenként.” – a kiírásra akkor gyakorlatilag senki nem adott be ajánlatot.

Alapvetően nem a szándék hiányzott, hanem maga a termék: nem volt akkoriban olyan switching architektúra, amely képes lett volna megbirkózni egy ekkora méretű adatközponti hálózati igénnyel.

A kiírás viszont elültetett egy magot a Szilícium-völgy networking-technológiai zsenijének fejében. Andy Becholsteim nem csak a Sun Microsystems megalapítója, fő technológiai designere és vezetője volt, hanem később a Granite Systems nevű startupé is, amely cég az 1990-es évek közepén az elsők között fejlesztett és gyártott GigabitEthernet multi-layer switcheket, és amely switching startupot röviddel a megalapítása után felvásárolt egy nagy hálózati eszközöket gyártó cég.

Miután a “nagy hálózati eszközgyártónál” eltöltött 8 évet és új kihívásokat keresett, pont kapóra jött a nevezetes Google tender is: Andy Becholsteim fantáziáját erősen megmozgatta a kiírás, hogy – ismét – elsőként fejlesszen ki és vigyen piacra csúcstechnológiát képviselő hálózati technológiát. Egy másik szilícium-völgybeli vizionárius zsenivel David Cheritonnal szövetkezve megalapították saját startup cégüket. A pároshoz rövidesen csatlakozott Ken Duda – aki többek között pl. a Catalyst 4000 switch-család fő technológiai designere volt előző munkahelyén. A trió saját maga finanszírozta a vállalkozást és a fejlesztéseket. Az első négy évben 2004-2008–ig, mindenféle külső nyomástól mentesen és külső anyagi segítség nélkül fejlesztették dédelgetett technológiai álmukat:

a lehető legstabilabb, robosztusabb és skálázhatóbb hálózati operációs rendszert.

Tehát a kezdeti kérdésfelvetésre, hogy ők miben különböznek más hálózatos gyártótól egyszerű a válasz:

Abban más, hogy ők – több más gyártóval ellentétben – valóban rászánták az időt és vették a fáradságot, hogy a nulláról újragondoljanak és a semmiből írjanak egy olyan hálózati operációs rendszert, amelynél végig egy fő tervezési és design szempont volt, a stabilitás tetőfokának elérése.

Figyelembe véve azokat a tapasztalatokat, amiket Duda, Becholsteim és Chariton korábban switch-architektúra tervezések és megvalósítások kapcsán már megszereztek, látták, hogy mely megközelítések működnek jól a switch szoftver- és hardver-architektúrák terén és melyek kevésbé.

Egyik korábbi blogcikkben kifejtettük, hogy az Arista eszközök fő megkülönböztető sajátossága az operációs rendszer, a szoftver, az EOS (Extensible Operating System), illetve annak moduláris és hierarchikus felépítése, mely más hálózati-operációs-rendszerekhez képest jóval nagyobb hibatűrést és stabilitást biztosít.

Rövid emlékeztető, hogy mi a különbség a karácsonyfaizzós jellegű szoftver-felépítés és a moduláris, hierarchikus, stateless-processeket használó EOS között:

 

Néhány pontban összeszedve azok a jellemzők, amik az Arista, és az Arista termékek lényeges megkülönböztetői:

  • Az EOS felépítése és kialakítása a versenytársakéhoz képest nagyobb megbízhatóságot és hibatűrést eredményez
  • Bár az EOS “look-and-feel” gyakorlatilag az industry-standard CLI, van azonban számos olyan plusz, amelyek révén jóval többet nyújt, mint más OS-ek:
    • Commit-and-rollback jellegű konfiguráció lehetősége: van “conf t” is, ha a klasszikus módon szeretnénk konfigurálni az eszközt, de van a commit-rollbackes “config session” is: ha nagyot vagy kockázatosat változtatunk, vagy távoli eszközt menedzselünk, vagy nem akarjuk, hogy a változtatások CLI soronként hajtódjanak végre, hanem egyszerre a végén. Mi dönthetjük el, melyiket használjuk, a választási lehetőség adott.
    • Ez is az Arista szoftver-fejlesztési filozófia jellemzője: minél többfajta megoldási lehetőséget kínálni az ügyfélnek, hogy a saját környezetében a neki leginkább megfelelőt tudja választani és használni.
  • Az EOS szoftver-fejlesztés módszere és kultúrája és a kódtesztelés alapossága miatt a kód, ill. az oprendszer sokkal kevesebb “bugot” tartalmaz, mint vetélytársai.
  • Ha mégis minden kötél szakad, és a TAC-ot kell hívni, akkor a gyártó oldalon expert, ill. Level-3 support tudású Arista alkalmazott (mérnök) veszi fel a telefont. Nincs kiszervezve a support, csak frontline support van, ahol a mérnökök mindegyike Level-3 expert szintű szakértője a hibával érintett területnek.
  • Minden switch platformra ugyanaz az OS. Ugyanaz a bináris a 12-portos fanless PoE switchre és legnagyobb, multi-terabites, moduláris switchre is. Ügyféloldalon az üzemeltetést könnyíti, gyártóoldalon a szoftverfejlesztést és a release/train karbantartást egyszerűsíti és teszi hatékonyabbá.
  • Nincs stacking. Egyik switch család/típus esetén sem, még a Campus portfolio PoE-s switcheinél sincs stacking, mert a stacking technológiát nem tartja az Arista megfelelően megbízhatónak ahhoz, hogy komolyabb rendszereket bízzon rá az ügyfelük. Nekem és kollégáimnak is voltak kellemetlen élményeink stack-ekkel kapcsolatban (ez minden stackinget használó gyártóra érvényes). A stacking hiánya egyáltalán nem probléma, nagyobb portszám igények esetére van pl. 2RU-s 96-portos switch, melyeket össze lehet kötni MLAG-párba, illetve vannak moduláris Campus switchek is a még nagyobb portszám igények kielégítésére.
  • Az első OS verziótól van ún. Streaming telemetria, amely lehetővé teszi, hogy folyamatosan részletes valós idejű képünk legyen a hálózati eszközökről és a hálózat egészéről.
  • A CVP (CloudVisionPortal) az a “real-time visibility and automation” platform, amely képes egy folyamatos valós idejű képet rajzolni a hálózatról és a hálózati forgalmi viszonyokról. A switchek a CPV-be öntik be (streamelik) folyamatosan az állapotjelző infókat magukról. A CVP-vel lehetőségünk van ZeroTouch-Provisioning-re is: új switch hálózatba illesztésére vagy meglévő switch cseréjére automatizált módon. Számos további – itt most nem részletezésre kerülő – értékes képessége/szolgáltatása/funkciója miatt úgy vélem, hogy a CVP egy vagy több külön cikket érdemel.
Arista az adatközpontban

A pénzügyi szektorban megalapozott stabil pénzügyi háttér: 2008-ban az első Arista termék egy ún. Ultra-low-latency switch volt (DCS-7150, 24-port 10G), melynek célközönsége elsősorban a tőzsdék és hasonló pénzügyi intézmények voltak, emellett már a kezdetektől – lásd a 2004-es Google hálózatos tender – az Arista a világ legnagyobb adatközpontjai számára tervezett és gyártott megoldásokat. (Kevéssé ismert tény pl., hogy a leaf-spine (v. spine-leaf) architektúra és elnevezés is az Arista mérnökeitől származik, amit az iparág átvett és azóta is használ.) Az Arista egyik legnagyobb kiemelt ügyfele a Microsoft, aki számára már az Azure Cloud első kialakításához is szállított nagy teljesítményű DC switching megoldásokat. Google, Facebook, Netflix stb. lehetne folytatni a sort ahol jelentős mennyiségű vagy kizárólagosan csak Arista switch üzemel.

A felhőszolgáltatóknál – a méretek miatt – minden kis hiba sokszorosan felnagyítódik, így hosszabb távon csak olyan hálózati architektúrák, hálózati operációs rendszerek és switching megoldások tudnak “megmaradni”, amelyek valóban kiállták és folyamatosan kiállják a legszigorúbb próbákat és folyamatosan jól teljesítenek. Az “Uptime” mind teljes hálózat, mind pedig egyes switchek szintjén abszolút kritikus.

Ezek a szolgáltatók azért választották és választják az Arista megoldásait, mert megbíznak benne, elvégre sok éve ugyanazt a magas szintet hozza és képviseli.

Egy másik fontos tényező, hogy az EOS, ill. Arista-switchek könnyen integrálhatóak, mert nincsenek “proprietary” gyártóspecifikus protokollok vagy megoldások, melyek vendor lock-in-t hoznának.

Gyakorlatilag minden adatközpont-méretre skálázhatók az Arista DataCenter Networking megoldások, a legkisebb 1-2 switches méretektől a több ezer switchet összefogó VXLAN-EVPN DC-fabric megoldásokig:

Mivel az Arista már VXLAN RFC kidolgozásában is jelentős részt vállalt, így az Arista DataCenter megoldások esetén alapvető és magától értetődő a rendkívül kiforrott és stabil VXLAN implementáció. A tapasztalataink szerint egyszerűbb bekonfigurálni és könnyebb hibakeresni, mint más gyártók VXLAN implementációit.

Arista a vállalati hálózatokban

Számos olyan nagyvállalat, amely Arista switcheket és megoldásokat kezdett alkalmazni az adatközpontjaiban, igen pozitív tapasztalatokat szerzett, az eszközök és megoldások nagyon jól beváltak az adatközponti részen, érdeklődni kezdett az Aristanál, hogy “van-e PoE-s switchetek?”, illetve, hogy szeretnék a CloudVision által nyújtott vizibilitást és automatizációt a normál felhasználókat kiszolgáló kliensoldali hálózati részen… van erre valami megoldásotok?”

A sztori lényege, hogy volt az a “business case”, volt akkora az igény (lots of dollars $$$), amire már nem lehetett nemet mondani. Ennek eredményeképp elindultak a fejlesztések, és rövidesen kijöttek az első Campus switchek: a 720XP fix és a 750 moduláris switchek. Mint általában, ebben az esetben is –úttörőként – a piacon akkoriban elérhető legmagasabb 100G port sűrűséggel rendelkező switch volt a 750 moduláris platform, a 720XP-k pedig multi-GigabitEthernet portokkal rendelkező és 25G vagy 100G uplink-kel rendelkező switchek voltak, VXLAN-ra (is) optimalizált hardverrel és szoftverrel, hogy az ügyfelek azokat az adatközpontokban rendkívül sikeres technológiákat és megoldásokat, mint pl. az EVPN-VXLAN alapú network fabric a vállalati hálózatokba is könnyedén átültethessék.

Az a trend, hogy “lefelé skáláznak” igen jellemző az Aristára: azt értem ez alatt, hogy azok a technológiák és megoldások, melyeket a legnagyobb “cloud titanok” számára fejlesztettek ki, optimalizáltak, a mai legnagyobb méretű hálózatokban is megállják a helyüket, így könnyen átültetik kisebb méretű és komplexitású (pl. Enterprise Campus hálózati) környezetbe is. Ezt a megközelítést, ill. az óriási felhőkönyezetekben való hálózatos igény szettet és azt megvalósító design elveket hívja az Arista “Cloud Principles”–nak, ami a hálózattervezés (design&architecture) legfontosabb alapelveit és a felhőspecifikus pluszokat összesíti, pl. modularitás, skálázhatóság, hibatűrés, sokügyfeles környezet, stb., illetve az ezeket megvalósító technológiákat: EVPN-VXLAN fabric, automatizáció, Infrastructure-as-Code, CI/CD pipeline, stb.

WiFi

Az Arista Campus switchek sikere nyomán erős igény jelentkezett arra, hogy a már Arista campus hálózatot használó ügyfelek számára ne csak a vezetékes, hanem a vezeték nélküli hálózatot is tudja biztosítani az Arista. Természetesen továbbra is a CloudVision által nyújtott átfogó valós idejű vizibilitást és automatizációs lehetőségeket megtartva.

A Mojo Networks 2018-as akvizíciója révén az Arista egy kiváló wireless megoldást emelt be a portfóliójába, melyet jól integráltak a közös menedzsment és vizibilitási platform (a CloudVisionPortal) alá. A Mojo kiemelkedő a Wireless-IPS (Intrusion Prevention System) képességek szempontjából. A Mojo wifi lényeges jellemzője, hogy a menedzsmentréteg központosított és felhő alapú, tehát mindig a Mojo, ill. Arista felhőben fut, nincs on-site dedikált controller.

A controller funkció az access-point-okban elosztott, és vele a data-plane (a tényleges adattovábbítás) is “lent maradó”, nem megy fel a felhőbe. Választható módon az access-point vagy tovább tunnel-ezi egy megadott céleszköz (pl. tűzfal) felé, vagy közvetlenül át-bridge-eli a forgalmat a vezetékes hálózatra a csatlakozó switchport-on. Lényeges, hogy a tunnel protokoll választható, de elsősorban alapértelmezetten a VXLAN technológia kerül alkalmazásra, az alábbi ábra szerinti módon:

A Mojo wifi kiválóan képes a BYOD eszközökre vonatkozó házirendet kikényszeríteni, így az ún. Zero Trust Networking jól megvalósítható az alkalmazásával.

Az ún. Cognitive Management Plane számos előnyt nyújt:

  • Machine-learning segítségével felismeri, beazonosítja és felhívja a figyelmet a forgalmi anomáliákra
  • Automatikusan detektálja és osztályozza a kliens-kapcsolódási hibákat és felhívja a figyelmet a probléma alapvető okára
  • Beazonosítja a gyenge hálózati performanciát “élvező” klienseket, root-cause analízist végez és megoldási javaslatot ad

Network Detection and Response (NDR) vs. AGNI

Mivel az elmúlt néhány évben drámai módon átalakult a hálózat, ahálózati forgalmi viszonyok, a perimeter és network-access biztonság kérdésköre, egyre erősebb igény jelentkezett olyan hálózatbiztonsági megoldások iránt, amelyek képesek menet közben valós időben a hálózati forgalomban észlelni a problémás, illetve kártékony forgalmakat, és a megjelenő fenyegetésre azonnal reagálni. Ilyen ún. NDR (Network Detection and Response) startup volt az Awake Security, melyet 2019-ben vásárolt meg az Arista. Az Awake megoldása a teljes hálózati forgalom L1-L7 forgalmát figyeli, a teljes packet-payload analízisre kerül és az aktuális forgalmak adatleíró ún. metaadatokkal kerülnek leírásra egy központi adatbázisban. Amikor match (érdekes forgalom) van, a rendszer képes a teljes forgalom kinyerésére vonatkozó automatizmust beindítani, hogy a részletes analízist lehetővé tegye. Az NDR funkción túlmenően a koncepció és az integrációs scope jelentősen továbbfejlődött.

Jelenleg az Arista next-gen NetworkAdmissionControl megoldása az ún. AGNI (Arista Guardian for Network Identity), amely egy cloud-native microservice-es kiszolgáló oldali architektúrával és Machine-Learning / Artificial-Intelligence alkalmazásával megtámogatott hatékony keretrendszert alkot, mellyel – a rendszerek ügyféloldali J – komplexitása, és az (ügyféloldali) üzemeltetési és adminisztrációs feladatok egyaránt csökkennek.

A felhasználók számára egyszerű önkiszolgáló portálon keresztüli onboarding-ot tesz lehetővé, hogy egyedi Wifi kulcsokat és tanúsítványokat kaphassanak, és onnantól, hogy a kliens fedélzeten van (sikeresen hálózati hozzáférést kapott) egészen a kilépésig, ill. lecsatlakozásig teljes “életciklus-menedzsment” jelleggel kezeli a felhasználót a rendszer: profilozás, hozzáférések megfelelő hozzárendelése és hozzáférés korlátozások, log-olás és rendszerszintű vizibilitás. Az AGNI minden jelentős cloud és on-prem Identity Provider alkalmazással és szoftverrel képes integrálódni:


Arista a szolgáltatói hálózatokban

Mivel az elmúlt években erős konvergencia ment végbe a szolgáltatói transzport technológiák terén, és látszik hogy az IP-to-optical trendek mellett az MPLS és azon belül is az SR-MPLS (Segment Routing with MultiProtocol Label Switching) vált meghatározóvá a data-plane-t tekintve, illetve az EVPN (Ethernet VPN), mint control-plane protokoll egyre inkább egyedülivé vált mind az adatközpontokat, mind pedig a szolgáltatói hálózatokat tekintve, így az Arista ezekre fókuszálja a routing-platformjait (R végű switchek: 7280R, 7500R, 7800R stb) tekintve. Minden ami EVPN (funkció/feature) az megvan, minden ami VXLAN (funkció/feature) az megvan, és közel minden ami MPLS és SR-MPLS funkció és feature az elérhető az EOS-ben.

Ezek az említett deep-buffer-es platformok a Broadcom Jericho ASIC-jeit használják, és ezáltal hardveresen is fel vannak készítve a komplex csomag és forgalomkezelési műveletekre (pl. MPLS-címkeműveletek). Ezek a switchek gyakorlatilag switch árban ServiceProvider routerek, melyek mind core, mind edge funkciókra kiválóan alkalmasak.

A fent említett Arista platformok alkalmazásával költséghatékony módon lehetséges Service Provider hálózatok részeit vagy egészét kialakítani. Példa az alábbi, ahol a hálózat meghatározó P és PE routerei mind MPLS és SR-MPLS képes Arista eszközök:

Másik best practice példa SP hálózatra az alábbi:

Az Arista eszközök alkalmazásának előnyei a szolgáltatók számára, hogy:

  • Fajlagosan jóval olcsóbban tudnak 10/25/40/50/100G, ill. 400G és/vagy 800G port-okat használni a rendszereik kialakítására, mint azt más SP kategóriájú routerekkel tehetnék. Az Arista R-széria eszközei igen nagy portsűrűségű edge és core router-ekként használhatók. Minden lényeges MPLS alapú szolgáltatás kialakítható: L2VPN, L3VPN, EoMPLS, E-Line, E-LAN, VPLS, Traffic-Engineering LDP+RSVP–vel vagy Segment-Routing és SR-TE alkalmazásával, és sok más is J
  • A rendkívül robosztus és stabil hálózati OS kritikus fontosságú a szolgáltatói környezetben: az EOS pontosan ilyen célokra lett létrehozva.

Arista UCN

Az Universal Cloud Network az Arista best practice megközelítése nagy, és komplex követelményeket kielégítő hibrid-felhős vállalati környezetek kialakítására. A koncepció sémája az alábbi:

A hálózati transzportot a telephelyek és a “felhők” között a jól bevált leaf-spine jellegű gerinchálózat biztosítja. A telephelyeken, illetve a felhőkön belüli hálózatok is önmagukban követik a kiválóan skálázódó és jó hibatűrő képességű leaf-spine architektúrát.

Összegzés

Ha röviden akarom összegezni az eddigieket, akkor talán azzal zárnám a cikket, hogy az Arista a 2008-as alapítás óta kis cégből nagy céggé, majd óriáscéggé válva is képes volt megőrizni termékeinek, megoldásainak, és szolgáltatásainak kivételesen magas minőségét, míg méretben, és a portfolió szélességét és összetételét tekintve is jelentősen bővült:

  • Adatközpontbeli előnyök a platform stabilitása és a szoftver által nyújtott kiváló integrálhatóság (igen jól dokumentált az API), a telemetrián keresztüli kiváló vizibilitás, valamint a széleskörű automatizációs lehetőségek.
  • Vállalati hálózatokban a fentieken kívüli további előny a next-gen NAC, az AGNI, amely egyenszilárdságú felhasználói élményt és biztonsági szintet tud biztosítani nagy és heterogén felépítésű rendszerek esetén is.
  • Szolgáltatói hálózatok esetén: gyakorlatilag ugyanazokat a funkciókat, amiket egy nagyobb (és igen költséges) szolgáltatói routerrel tudna kialakítani a szolgáltató, meg tudja valósítani az R-szériás Arista eszközökkel, melyek nemcsak, hogy fajlagosan jóval olcsóbb per-port költséggel rendelkeznek, hanem kisebb helyet foglalnak és kevesebbet fogyasztanak is.

Egy szubjektív plusz ami nekem szimpatikus az az, hogy a switchek funkcióira vonatkozó licencek nem subscription jellegűek, hanem fixek, tehát más gyártókkal ellentétben – a switchek kapcsán legalábbis – nem kényszeríti az ügyfeleket az előfizetéses egyirányú utcába az Arista. Az EOS-ben minden funkció elérhető és használható a licencek nélkül is, a licenc nem kulcsos, nem kell lekérni és vagy feltölteni semmit. A licenc becsületkasszás, ettől függetlenül a használt funkciókhoz megfelelőt – a support miatt is – szükséges megvenni.

A CloudVisionPortal subscription jelleggel licencelődik, de az előfizetés lejártakor nem “áll meg”. Erről talán egy másik cikkben..