I dessa tider
Med tanke på den situation världen befinner sig i när jag skriver detta är det enkelt att förstå att mycket av det vi tar för givet inte längre fungerar som tänkt. Detta gäller även molnet.
Bara de senaste veckorna har flera rapporter om brist på kapacitet i Azure dykt upp [1] [2], en brist som av förklarliga skäl kan leda till problem för de organisationer som förlitar sig på molnet för att driva sin verksamhet. Vår nuvarande situation till trots kan det emellertid finnas en uppsida med att ha sin last i molnet just nu.
I den här artikeln skriver jag om vad som definierar ett moln och hur vår nuvarande situation påverkar konsumtion av molnresurser, samt ger min syn på vad ni behöver göra för att bättre hantera situationer som denna.
Vad är ett moln?
Initialt var det endast NIST som definierade de egenskaper en plattform måste uppvisa för att få kallas ett moln [3], men sedan ett tag tillbaka har även ISO en definition för detta (17788:2014, samt 17789:2014) [4]. Jag tycker personligen att NISTs definition är enklare att läsa men ISO-standarden har fler egenskaper som definierar vad ett moln är varför jag kommer referera till den.
ISO 17788 anger följande nyckelegenskaper för ett moln (min översättning från engelska):
Bred nätverksaccess
Mätbar konsumtion
Fleranvändardesign
Självbetjäning på begäran
Snabb skalbarhet
Gemensamma resurser
Jag kommer inte gå igenom dessa i detalj, enda anledningen till att jag nämner dem är så att vi skall ha en gemensam grundsyn på vad som definierar ett moln. Såväl NISTs definition och ISOs standard kan läsas av någon som har en grundläggande teknisk förståelse för hur ett moln fungerar och jag uppmuntrar er att kika igenom åtminstone ett av dem.
Den enda egenskap jag vill fokusera på i den här artikeln är "Snabb skalbarhet," eller "Rapid elasticity and scalability" som texten lyder i dokumentet.
Obegränsad kapacitet?
ISO 17788 beskriver "Rapid elasticity and scalability" som:
A feature where physical or virtual resources can be rapidly and elastically adjusted, in some cases automatically, to quickly increase or decrease resources. For the cloud service customer, the physical or virtual resources available for provisioning often appear to be unlimited and can be purchased in any quantity at any time automatically, subject to constraints of service agreements. Therefore, the focus of this key characteristic is that cloud computing means that the customers no longer need to worry about limited resources and might not need to worry about capacity planning;
Kort sammanfattat innebär detta att ni som kund skall förvänta er att molnet skalar i takt med era behov, till synes i all evighet, så länge ert avtal med molnleverantören inte säger annat. Uppenbarligen fungerar inte detta i de fall där Microsofts kunder beskriver att de inte längre kan skapa nya resurser i Azure
Av ren nyfikenhet ville jag ta reda på hur Microsofts avtal är formulerade. De har olika avtal för var och en av sina tjänster, och jag tänker inte kika igenom dem alla för att se vad de säger, men när jag läste avtalet för virtuella maskiner [5] tog det mindre än en minut att hitta följande text i stycket som beskriver de undantag som gäller:
Due to factors outside our reasonable control (for example, natural disaster, war, acts of terrorism, riots, government action, or a network or device failure external to our data centers, including at your site or between your site and our data center);
Om någon skulle ge sig på att dra Microsoft inför domstol på grund av begränsad kapacitet är det högst sannolikt att paragrafen ovan ger Microsoft rätt då en pandemi i allra högsta grad är utanför deras kontroll.
Oavsett vad avtalet säger, och hur er dialog med Microsoft kommer vara, måste ni i första hand hantera situationen.
För att behärska molnet måste ni förstå det
Det är tyvärr vanligt att organisationer som använder molnet inte förstår vad det faktiskt är och vilka följder sådan kunskapsbrist kan få, framförallt när oförutsedda situationer uppstår.
Jag har aldrig tyckt om uttrycket "There is no cloud, only someone else's computer." helt enkelt eftersom det är felaktigt. Självklart behövs det en server att köra molntjänsterna på men molnet är så oerhört mycket mer än en server i ett datacenter. Det enda positiva med det här uttrycket är att det avdramatiserar molnet som något magiskt.
Ett moln består av extremt många delar som alla måste fungera i harmoni, utan att tumma på säkerhet eller prestanda. De tjänster ni konsumerar körs på hårdvara som ofta är specialbyggd, och hanteras av tusentals personer enligt strikt definierade processer.
Under normala omständigheter fungerar detta imponerande väl men just nu befinner vi oss i allt annat än normala omständigheter.
Om ni förstår att molnet är extremt komplext, och något påtagligt som påverkas av det som händer i världen, blir det mycket enklare att behärska det när det inte uppför sig som tänkt. Utan att gå in på de exakta orsakerna till varför Microsoft har slut på resurser i delar av Azure är det enkelt att inse att vår nuvarande kris resulterar i problem.
Ni skall kunna förlita er på att molnet erbjuder den kapacitet ni behöver, det är trots allt en av nyckelegenskaperna hos ett moln, men som med så mycket annat gäller det att planera för det värsta och hoppas på det bästa. Framförallt om det gäller er organisations överlevnad.
Vad kan ni göra?
Om ni som organisation är beroende av molnet för att er verksamhet skall fungera måste ni ha en strategi för att hantera en situation där molnet inte fungerar. Övertron till molnets ofelbarhet resulterar tyvärr ganska ofta i att denna risk inte får den uppmärksamhet den behöver.
Det spelar ingen roll att Microsoft garanterar en viss tillgänglighet, eller att jag med flera andra sida upp och sida ner förklarar hur säkert och pålitligt molnet är, det är er skyldighet att ha en plan för hur ni skall agera när ni inte längre kan konsumera molntjänster, oavsett varför.
Hur komplex er katastrofplanering för bortfall av molntjänster blir beror på en mångfald av faktorer; hur komplexa integrationer ni har, om ni kör ett hybridmoln och hur det är designat, hur er organisation är utspridd geografiskt och hur ni konstruerat ert nätverk - bara för att nämna några.
Denna komplexitet är ibland ännu en orsak till att arbetet skjuts på men som vanligt är det ofta det tråkiga och jobbiga arbetet som är det viktiga. Jag jobbar inte själv med katastrofplanering men kan assistera som teknisk expert gällande molnet (framförallt Azure), och har dessutom flera kontakter i branschen som är duktiga på detta om ni inte själva har någon att vända er till.
Fördelen med att använda molnet just nu
Min filosofi är att försöka se det positiva i alla lägen, det är mycket enklare att ta sig igenom dagen på det viset, varför jag vill avsluta med att nämna en uppsida med att ha er last i molnet just nu.
En av molnets egenskaper jag nämnde tidigare är snabb skalbarhet, en egenskap som inte bara innebär att ni snabbt kan skala upp eller ut, utan också ner eller in. I den bästa av världar har ni redan designat era applikationer så att de skalar dynamiskt men då vi befinner oss i en minst sagt ovanlig situation finns det anledning att se över ert konsumtionsmönster av molnapplikationer.
Hårdvara som står i ert eget datacenter kostar (i de allra flesta fall) lika mycket oavsett hur mycket eller lite ni använder den men om ni för tillfället inte längre behöver de tjänster ni kör i molnet så kan, och skall, ni skala ner eller kanske till och med stänga av dem.
Har ni dessutom korrekt implementerad kostnadskontroll kan ni i ett tidigt skede räkna ut vilken besparing en justering av de tjänster ni kör i molnet ger.
Avslutningsvis
Molnet erbjuder möjligheter som det är svårt att realisera i sitt eget datacenter, men det kräver fortfarande att ni som organisation vet hur ni skall hantera katastrofscenarion gällande era molntjänster.
Det duger inte att förlita sig på att molnleverantören, eller eventuellt er IT-partner, ansvarar för att er verksamhet kan fortsätta obehindrat - det är till syvende och sist ni som måste ta fram planen och se till att den efterlevs.
Tveka inte att kontakta mig, antingen via e-mail, telefon eller formuläret här på hemsidan, om ni är intresserade av att diskutera ämnet vidare med mig.
Tack för er tid!
Källor
https://www.theregister.co.uk/2020/03/24/azure_seems_to_be_full/
https://nvlpubs.nist.gov/nistpubs/Legacy/SP/nistspecialpublication800-145.pdf
https://standards.iso.org/ittf/PubliclyAvailableStandards/c060544_ISO_IEC_17788_2014.zip
https://azure.microsoft.com/en-us/support/legal/sla/virtual-machines/v1_9/
Comments