Una Novi veliki prekid rada Cloudflare mreže Oluja je ponovo zaustavila internet ovog petka ujutro, uzrokujući probleme s pristupom svim vrstama web stranica i aplikacija u brojnim zemljama. U Španiji i ostatku kontinentalne Evrope, prvi znaci su se počeli pojavljivati sredinom jutra, kada su mnogi korisnici naišli na stranice koje se nisu učitale ili su vraćale poruke o grešci.
Američka kompanija, koja djeluje kao ključna komponenta u sigurnosti i distribuciji sadržaja za milione web stranica, je potvrdio da incident prvenstveno utiče na njegovu kontrolnu ploču (komandna tabla) i API-je, iako se pravi doseg osjetio daleko izvan njegovih internih alata: dizajnerskih platformi, video poziva, video igara onlineDigitalno bankarstvo i široko korištene korporativne usluge bile su djelomično ili potpuno nedostupne veći dio jutra.
Greška u kontrolnoj ploči i API-jima uzrokuje ogromne greške

Prema rečima Službena stranica o statusu Cloudflare-aProblem je nastao u komandna tabla i u interfejsima za programiranje aplikacija (API-jima) koje klijenti koriste za upravljanje konfiguracijama, sigurnosnim pravilima i naprednim uslugama. Kada ove komponente zakažu, ne pate samo administrativni zadaci; mogu postojati i kaskadni efekti na same web stranice koje zavise od platforme.
Počevši od 08:56 UTC (09:56 u kontinentalnoj Španiji), Cloudflare je počeo upozoravati da je istraživanje problema u kontrolnoj ploči i povezanim API-jimaNekoliko minuta kasnije, u 09:09 UTC, kompanija je još uvijek istraživala i ubrzo nakon toga objavila da Ispravka je već bila primijenjena, ulaskom u fazu pažljivog praćenja kako bi se provjerilo da li je pravni lijek bio efikasan.
U međuvremenu, u praksi, hiljade web stranica su počele prikazivati greške kao što su "500 Interna greška servera" ili "Loš pristupnik"kao i prazne stranice i beskonačno vrijeme učitavanja. Da biste provjerili latenciju tokom prekida, korisno je konsultovati vodič na Kako izmjeriti ping u Windowsu 11Za mnoge korisnike, osjećaj je bio isti: od banaka online Čak su i njihovi uobičajeni radni alati, značajan dio njihovog digitalnog života, zamrznuti na nekoliko sati.
Sam Cloudflare priznaje da kupci koji intenzivno koriste komandna tabla i API-ji mogu vidjeti neuspjeli zahtjevi, nedostajući podaci ili nepotpuni odgovoriIako kompanija insistira da njena mreža za isporuku sadržaja (CDN) i sigurnosni sloj koji štiti web stranice na rubu mreže i dalje rade, istina je da je iskustvo za krajnje korisnike bilo vrlo drugačije, s raširenim prekidima u uslugama koje zavise od njene infrastrukture.
Uticaj u Španiji i Evropi: od digitalnog bankarstva do video igara online

Posljedice pada su se snažno osjetile u Španija i ostatak Evropegdje se veliki dio jutarnjeg rada i slobodnih aktivnosti oslanja na usluge distribuirane putem Cloudflarea. Alati su sveprisutni u svakodnevnom životu kao što su Canva ili Zoom Imali su ozbiljnih problema s pristupom, što je otežalo rad na daljinu i virtualne sastanke u kompanijama i obrazovnim centrima.
U oblasti zabave, korisnici video igre online kao što su Fortnite, Valorant, League of Legends A Epic Games Store je prijavio greške u povezivanju, beskrajne ekrane za učitavanje ili jednostavno nemogućnost prijave. U nekim slučajevima, problem je rezultirao izbacivanjem igrača iz mečeva ili nemogućnošću nastavka tekućih sesija, što je posebno frustrirajuće za one koji imaju zakazane turnire ili rangirane mečeve.
Ni finansijski sektor nije pošteđen. Nekoliko subjekata koji posluju u Španiji, kao što su CaixaBank ili BankinterVidjeli su da njihovi digitalni kanali doživljavaju kvarove, pri čemu korisnici nisu mogli pristupiti svojim računima, vršiti transfere ili provjeravati transakcije. Iako su u nekim slučajevima prekidi bili povremeni i relativno kratki, osjećaj ranjivosti u bankarstvu online To je ponovo pokrenuto.
Portali poput DowndetectorKompanije specijalizirane za praćenje incidenata koje prijavljuju korisnici u stvarnom vremenu pokazale su porast prijava od ranog jutra. Izvještaji pokrivaju sve, od društvenih medija i platformi za sadržaj do usluga plaćanja i korporativnih alata, što potvrđuje da Prekid rada Cloudflare-a imao je globalni doseg i u više ekonomskih sektora.
Ponekad postoje čak i stranice posvećene posebno praćenju prekida usluga. Imali su problema s učitavanjemOvo pojačava ideju da problem potiče iz zajedničke cloud infrastrukture, a ne iz izolovanog kvara jedne ili druge specifične usluge. Kada je pogođen međusloj koji podržava veliki dio mrežnog prometa, efekti se šire vrlo brzo.
Podudarnost sa zadacima održavanja u podatkovnim centrima u Sjedinjenim Američkim Državama

Incident se vremenski poklopio sa Planirani radovi na održavanju od strane Cloudflarea u nekoliko svojih podatkovnih centara u Sjedinjenim Američkim Državama, posebno u Detroitu i Chicagu. Ove tehničke operacije, koje su se, prema navodima kompanije, odvijale između 07:00 i 13:00 UTC, mogle su rezultirati preusmjeravanjem prometa i povećanom latencijom za korisnike u pogođenim regijama.
Cloudflare je prethodno upozorio da će tokom ovih perioda održavanja, Neki mrežni interfejsi mogu biti privremeno van upotrebeOvo je prisililo korisnike s direktnim međusobnim vezama da se oslanjaju na automatske sisteme preključivanja ili alternativne rute. Međutim, kompanija još nije potvrdila da li su ovi radovi direktno povezani s današnjim globalnim prekidom ili je riječ samo o nesretnoj vremenskoj koincidenciji.
Ono što se čini jasnim jeste da kombinacija zadataka održavanja i incident u centralnim službama kao što je komandna tabla i API-ji Ovo je stvorilo posebno delikatan scenario. Male greške u konfiguraciji ili problemi u širenju promjena mogu imati mnogo veći učinak kada se poklope s preusmjeravanjem prometa i promjenama u topologiji mreže.
Na svom statusnom portalu, Cloudflare održava aktivne informativne kanale za kupce i korisnike, sa periodična upozorenja o razvoju kvaraKompanija insistira da je "popravka već implementirana" i da je sistem "pod nadzorom", tako da bi se, teoretski, situacija trebala postepeno vraćati u normalu tokom dana.
Međutim, na vrhuncu utjecaja, mnogi korisnici su se i dalje suočavali Stranice koje se ne bi učitale do kraja ili povremene poruke o grešciOvo nepravilno ponašanje je obično tipično kada se primjenjuje rješenje koje još nije završilo širenje po cijeloj mreži ili kada se različiti dijelovi svijeta ažuriraju različitim brzinama.
Ponovljeni padovi: sjena nedavnih neuspjeha
Ova epizoda se ne pojavljuje niotkuda. Manje od mjesec dana ranije, 18 za novembarCloudflare je već pretrpio još jedan globalni prekid rada koji je ugasio široko korištene servise kao što su X (ranije Twitter), ChatGPT, Canva i razne korporativne i e-trgovačke web stranice. Taj prekid je trajao oko četiri sata i izazvao je široku debatu o pouzdanosti glavnih pružatelja usluga u oblaku.
Tom prilikom, sama kompanija je objasnila da je problem nastao nakon promjena dozvola interne baze podatakaTo naizgled malo prilagođavanje uzrokovalo je da sistem automatski kreira hiljade dodatnih unosa u datoteci koju koristi modul za upravljanje. robota, odgovoran za razlikovanje legitimnog korisničkog prometa od automatiziranih posjeta.
Kako je ta datoteka rasla, bila je udvostručavajući svoju veličinu sve dok ne pređe granicu koju softver može podnijeti odgovoran za kanaliziranje prometa. Rezultat je bio interni kolaps koji je rezultirao sa 500 grešaka, ekstremnom sporošću i porukama "izazova" koje traže otključavanje sigurnosnih izazova u challenges.cloudflare.comDrugim riječima, riječ je o čisto softverskom i konfiguracijskom kvaru, bez tragova vanjskih cyber napada.
Zvaničnici kompanije, uključujući izvršnog direktora Matthewa Princea, opisali su problem u to vrijeme kao "interna softverska greška" i tvrdili su da nema dokaza o zlonamjernoj aktivnosti. Međutim, činjenica da se to dogodilo za samo nekoliko sedmica Još jedan značajan neuspjeh koji milione korisnika ponovo ostavlja bez usluge. To počinje izazivati zabrinutost među poslovnim klijentima i javnom upravom.
Industrijski analitičari sugeriraju da, kada se dva ozbiljna incidenta dogode u tako kratkom vremenskom perioduRazumljivo je postaviti pitanje da li su procesi osiguranja kvaliteta, testiranja i implementacije promjena dovoljno rigorozni. Pored specifičnog tehničkog uzroka svakog prekida, zabrinutost se fokusira na to da li Cloudflare adekvatno upravlja svojim rastućim opterećenjem globalne internet infrastrukture.
Ovisnost o oblaku i jedinstvena tačka otkaza
Tokom godina, Cloudflare je postao jedna od okosnica modernog webaPrema procjenama industrije, njihove usluge CDN-a, sigurnosti, ublažavanja DDoS napada i optimizacije performansi prisutne su na otprilike 20% web stranica širom svijeta. To znači da kada kompanija naiđe na problem, učinak se gotovo trenutno pojačava.
Ovo nije izolovan slučaj. Posljednjih mjeseci zabilježeni su značajni incidenti i na drugim velikim cloud platformama kao što su AWS (Amazon Web Services) ili Microsoft AzureOvi prekidi su u nekoliko zemalja onesposobili poslovne aplikacije, digitalne usluge i kritične alate. Svaki od ovih kvarova dodatno naglašava ogromnu zavisnost od male grupe dobavljača.
U praksi, za prosječnog korisnika, kada jedan od ovih giganata ima loš dan, Izgleda da je polovina interneta prestala da radiOd društvenih mreža do trgovina onlineOd generativnih AI usluga i platnih platformi do internih poslovnih sistema, sve se oslanja na infrastrukturu koja često prolazi nezapaženo sve dok ne zakaže.
Stručnjaci za infrastrukturu ističu da ova centralizacija podrazumijeva jedna tačka kvara Za mnoge kritične usluge, jedna pogrešna konfiguracija, neispravno ažuriranje ili loše upravljani problem s mrežom mogu izazvati domino efekat. Ovaj rizik postaje posebno kritičan u sektorima poput bankarstva, digitalnih komunalnih usluga i online obrazovanja.
U Španiji su glasovi iz tehnološkog i finansijskog sektora već upozoravali da koncentracija toliko mnogo usluga u nekoliko oblaka Ovo zahtijeva ponovno razmatranje strategija otpornosti, sigurnosnih kopija i planova za nepredviđene situacije. Dugotrajni prekid rada ne bi uticao samo na svakodnevni život korisnika, već i na interno poslovanje preduzeća i vladinih agencija.
Šta se zna o odgovoru Cloudflarea i šta korisnici mogu učiniti?
Za sada, Cloudflare kaže da implementirao je ispravku i održava intenzivan nadzor sa svoje mreže kako bi potvrdili da je incident u potpunosti riješen. Njihov statusni portal se ažurira porukama koje detaljno opisuju napredak istrage i status komandna tabla, API-je i ostale uključene usluge.
Kompanija insistira na tome Još uvijek nema službeno potvrđen uzrok Što se tiče današnjeg prekida rada, njihov tehnički tim nastavlja analizirati logove, nedavne promjene i moguće interakcije s tekućim zadacima održavanja. Dok se ta analiza ne završi, neće se znati da li se radi o problemu sličnom onome od 18. novembra ili o kvaru drugačije prirode.
Sa stanovišta korisnika, malo toga se može učiniti osim sačekajte da se usluge obnoveNeki stručnjaci preporučuju, u ovim slučajevima, da se ne opsesivno radi na stalnom osvježavanju stranica ili forsiranju operacija na kritičnim aplikacijama, jer usred ozbiljnog incidenta odgovori sistema mogu biti nepredvidivi ili generirati dodatne greške.
Kao što je istakao DevOps menadžer konsultovan prije nekoliko sedmica nakon prethodnog prekida, kada provajder ovog tipa prestane sa radom, Naši uređaji postaju gotovo kao "utiskivač papira" za mnoge svakodnevne zadatke: administrativne procedure, kupovinu, učenje, rad na daljinu, igranje igrica online...sve, na ovaj ili onaj način, prolazi kroz podatkovne centre i mreže za distribuciju sadržaja.
U poslovnom svijetu, IT timovi često koriste planovi za vanredne situacije Ove mjere uključuju aktiviranje alternativne infrastrukture, promjene DNS-a, preusmjeravanje prometa ili čak degradirane načine rada kako bi se održale barem osnovne funkcije. Međutim, nemaju sve kompanije resurse ili multicloud arhitekture koje im omogućavaju brzu reakciju na prekide ovog obima.
S obzirom na to da se usluge počinju oporavljati i da se aktivnosti polako vraćaju u normalu, ono što se danas dogodilo s Cloudflareom služi kao podsjetnik na... U kojoj mjeri globalna mreža zavisi od nekolicine aktera i kako kvar u naizgled nevidljivom sloju može uticati na svakodnevni život miliona ljudi u roku od nekoliko minuta.
