02:47
09.02.12

שרתי הענן של אמזון נפלו בעקבות מכת ברק

ג'ף בזוס, מנכ"ל ומייסד אמזון | צלם: בלומברג

חלק מהשרתים המתארחים בשירותי ה-Elastic Cloud של החברה נעלמו בימים האחרונים בעקבות פגיעה בספק הכוח המרכזי של ה-Datacenter. בעקבות זאת איבדו החברות באופן זמני גישה לכל השירותים אותם סיפקו ללקוחותיהן

14.06.09 | 09:55  יניב פלדמן, Newsgeek
Storage

לפני כארבעה ימים, בשעה 18:30 (שעון החוף המזרחי) נעלמו חלק מהשרתים המתארחים בשרותי ה-Elastic Cloud של אמזון. החברה הודיעה בתגובה, כשעה מאוחר יותר, כי אחד מה-Datacenters שלה נפגע כתוצאה ממכת ברק. הברק, לטענת החברה, פגע ישירות בספק הכוח המרכזי של ה-Datacenter, מה שגרם לנפילה מיידית של חלק מהשירותים שאורחו על-ידי אותו Datacenter. שירותי ה-EC2 של אמזון, מספקים שירותי אירוח בענן ממרכזים הפרושים בארצות הברית ובאירופה, כאשר כל אחד מהאזור מחולק למספר מרכזים שונים שנועדו לספק שרידות מקסימלית למערכת.

שלוש שעות לאחר מכן, הודיעה החברה כי החשמל שוחזר לכל המערכות שנפגעו ועד 1:20 לפנות בוקר כל הבעיות שנוצרו כתוצאה מהנפילה נפתרו לחלוטין. החברה הודיעה ללקוחותיה בזמן שעבדה על טיפול בבעיה כי הם יכולים ליצור שרתים וירטואליים חדשים שיחליפו את השרתים שנפלו באופן זמני או לחכות שהשרתים המקוריים שנפלו יתוקנו ויועלו לאוויר כאשר תיפתר בעיית החשמל.

אין זו הפעם הראשונה ששירותי ה-Cloud של אמזון סובלים מנפילת מתח. באוקטובר 2007 ובפברואר 2008 סבלו שירותי הענן של החברה מנפילות משמעותיות וגדולות הרבה יותר. אבל אלו דוגמאות לנפילות, מה שלא משתווה למקרה שזכור משנה שעבר, שבו אחד המהנדסים של החברה מחק "בטעות" את כל שירותי התשתית של Flexiscale שהתארחו בענן של החברה.

אחד הדברים שלוקחת חברה בחשבון כאשר היא בוחנת את האפשרות לארח את השירותים שלה בענן של אמזון, או של כל חברה אחת לצורך העניין, הוא נושא השרידות ויכולת ההתמודדות של ספק השירותים עם אסונות מהסוגים הללו. בהתחשב בעובדה שאמזון מגינה על שירותיה עם שרידות מבוססת מיקום ברחבי ארצות הברית ואירופה, היה לי קשה להאמין עד היום שלקוח של החברה יסבול מכשל נקודתי כלשהו. להפתעתי, חלק מהשירותים של לקוחות החברה היו מרוכזים באותו ה-Datacenter שנפל וכתוצאה מכך, אותם ספקי שירות איבדו גישה באופן זמני לכל השירותים אותם הם סיפקו ללקוחותיהם.

רוהיט שארמה כתב אתמול ב-GigaOM על הסוד להתמודדות עם בעיות תשתית. שארמה מחלק את ההתמודדות לשלושה שלבים אותם יש לתכנן מראש על-מנת להגיע למצב שבו התוכנה רצה כמו שצריך. שלושת השלבים הם: פיתוח (Develop), פרישה (Deploy) וגדילה (Scale).

הנקודה ששווה התייחסות מהמקרה של אמזון היא התכנון של שלבי הפרישה והגדילה של האפליקציה שלכם על-מנת שלא תושפעו ממקרים כמו המקרה האחרון שאירע בשירותי ה-Cloud של החברה. האם באמת ניתן להימנע מכך לחלוטין? האם שרידות מלאה היא אפשרית? כנראה שלא, אבל אנחנו צריכים ללמוד מטעויות העבר כדי להגביר את סיכויי ההתמודדות שלנו כמה שיותר ב"אסונות" שיגיעו בעתיד.

עוד בנושא

הרגליים על הקרקע, הראש בעננים
Denial of Service בטלפתיה


 עקבו אחרינו בטוויטר
 רוצים להיות חברים שלנו בפייסבוק

חזרה לדף הבית

עשרת הגדולים

שימושים:  דף הבית  |   RSS  |   אודות האתר  |   פרסום באתר  |   תקנון האתר
TheMarker:  העמוד הראשון  |   הייטק  |   שוק ההון  |   וול סטריט  |   בעולם  |   קריירה  |   פרסום ומדיה  |   צרכנות  |   נדל"ן  |   משפט  |   רכב  |   המדריך למשקיע  
Cafe:  ראשי  |   העמוד שלי  |   אנשים  |   קהילות  |   בלוגים  |   תמונות  |   וידאו  |   קהילת תמיכה  
עכבר העיר:  עכבר העיר  |   סרטים  |   קולנוע  |   מסעדות  |   מתכונים  |   הופעות  |   פעילויות ילדים  |   הצגות  |   לילה  |   מסיבות  |   עכבר העיר: סרטים, לילה, מסעדות  
לוח העיר:  דרושים  |   דרושים הייטק  |   נדל"ן  |   פרוייקטים חדשים  |   רכב  |   בעלי מקצוע  |   קח תן  
האתר פותח ע"יCoral.co.il