Vill du vara del av diskussionerna i forumet, ställa frågor eller hjälpa andra? Registrera dig här!

Binär bugg kraschar SSD-enheter från HP Enterprise efter 32 768 timmar

Binär bugg kraschar SSD-enheter från HP Enterprise efter 32 768 timmar

En bugg i firmware för HP Enterprises SSD-enheter gör att lagringsenheterna dör efter ett väldigt exakt antal timmar.

Läs hela artikeln här

Helt bedrövligt, oavsett. Men extra illa är det ju att det är enheter avsedda för företag som man tycker skall ha gått igenom extra test och QA. Skämmes, ta mig fan!

Det är säkert för att man ska behöva köpa nya produkter oftare.
Kapitalism-bugg.

Av flera andra skäl har jag redan svårt att ta HP på allvar men det här är ju nästan komiskt.

Har just uppgraderat diskfirmware på några servrar på jobbet med dessa diskar. Tur att de bara varit i drift ett drygt år ännu

Det här är en rolig bugg, men resultatet är ju verkligen förödande. Ajajaj.

Skickades från m.sweclockers.com

Vem ska stå för denna kostnad att flasha?
Liksom många system får ej stängas av. Proceduren vid avstängning om det ändå måste göras är stor och innebär stora risker. Så i bästa fall om produkten flashas innan krasch så blir det ändå en stor kostnad.

Ofta är det så att en kund har av en aktör köpt en lösning, denna aktör kan åtgärda detta fel. Det kommer då ta tid från aktören och den vill fakturera kund, men vill kund betala för detta?

HP borde skicka tekniker att flasha, men den tekniker har självklart ingen koll på vad systemet kör och den har inte en möjlighet att på egen hand ens se om det har startas rätt.

Är det vanligt att man använder samma typ av hårddiskar? Känns som att det inte behövs en alldeles för djup riskanalys för att man ska inse att det kan introducera stora konsekvenser...

Bästa pris på Bean: Den Totala Katastroffilmen

HP = halva produkter

Herrejösses... Blåskärmar, krascher och allmänna operativa problem "går väl an", men att diskarna totaldör och datan förloras vid den exakta tidpunkten är ju helt åt pipsvängen!

Det för minnena tillbaka till tiden då OCZ hade firmware-problem med tidiga OCZ-diskar, men i det fallet var det åtminstone fullt möjligt att uppgradera firmware vid den aktuella tidpunkten och fortsätta som vanligt. Kommer ihåg att jag upptäckte det på en Linux-server med berörd disk flera år senare genom att det via något S.M.A.R.T-program i CLI uttryckligen stod att den fallerar vid runt 20-30K timmar, vilket stämde väl överens med aktuella drifttimmar på disken.

Skrivet av Saddl3r:

Är det vanligt att man använder samma typ av hårddiskar? Känns som att det inte behövs en alldeles för djup riskanalys för att man ska inse att det kan introducera stora konsekvenser...

Ja det är ganska vanligt. Om man köper en server från HP så sitter det HP-diskar i den.

Skrivet av Saddl3r:

Är det vanligt att man använder samma typ av hårddiskar? Känns som att det inte behövs en alldeles för djup riskanalys för att man ska inse att det kan introducera stora konsekvenser...

Beror på vilka system man jobbar med. Det finns lösnngar som kräver två helt olika system.
Men annars man köper en SAN och man köper in ett gäng ssd/hdd som rekommenderas till denna. Att blanda en massa olika ssd/hd i san kan innebära problem det med. Så lösningen är väl att köpa 2 olika SAN. Priset på ett SAN varierar, jag vill minnas att för några år sedan gick ett standard san med sas hdd på runt ca 200 000kr.

Jag förstår inte varför det tog så lång tid för dem att upptäcka felet. Liksom mängder med ssd reklamerades, bland det första de skulle kolla är drifttid. Då skulle de direkt se att alla har samma drifttid och de genast skulle inse att problemet har något med detta att göra.

Skrivet av Saddl3r:

Är det vanligt att man använder samma typ av hårddiskar? Känns som att det inte behövs en alldeles för djup riskanalys för att man ska inse att det kan introducera stora konsekvenser...

Man kan ju försäkra sig genom att köra redundanta RAID-arrayer, om inte alla diskarna fallerar samtidigt (facepalm)

Skrivet av firstofmay:

Av flera andra skäl har jag redan svårt att ta HP på allvar men det här är ju nästan komiskt.

Dom har iaf gott om drivrutiner för skrivare på linux! Kan inte uttala mig om enterprise avdelningen så jag inte har npgon kontakt alls med den.

Hmm, Låt mig gissa..
Det är dagen efter deras garanti slutar gälla.. xP

Skickades från m.sweclockers.com

Låter som någon tryckte lite för hårt på teknikerna ang planned obsolescence.

Skickades från m.sweclockers.com

"Enterprise-nivå."

Skrivet av pacc:

redundanta RAID-arrayer

Avsiktligt eller ej så gillar jag dubbelredundans-skämtet

Skrivet av wowsers:

Dom har iaf gott om drivrutiner för skrivare på linux! Kan inte uttala mig om enterprise avdelningen så jag inte har npgon kontakt alls med den.

Deras skrivare är väl förhållandevis klanderfria men skrivare dras ju med problem som man inte trodde fanns, känns som att det hypotetiskt borde vara lättare att göra bra skrivare än annan teknik.

Skrivet av Nyhet:

En bugg i firmware för HP Enterprises SSD-enheter tros ligga bakom de problem som drabbat sjukvården i Västra Götaland.

Läs hela artikeln här

Jag tror inte en sekund på att det var en bugg. Detta var den planerade livslängden! Att det skulle bli en sådan här katastrof berodde på att de installerades samtidigt!

Skickades från m.sweclockers.com

Skrivet av lillaankan_i_dammen:

Jag förstår inte varför det tog så lång tid för dem att upptäcka felet. Liksom mängder med ssd reklamerades, bland det första de skulle kolla är drifttid. Då skulle de direkt se att alla har samma drifttid och de genast skulle inse att problemet har något med detta att göra.

Det kanske de gjorde - men eftersom felet ifråga inte uppträder förrän diskarna varit igång i nästan 4 år, så tar det ju nästan 4 år innan första disken kraschar.
Det tyder för övrigt på att det här inte är källan till problemen de hade i sjukvården i Västra Götaland. De datorerna var bara 2-3 år gamla, och stängdes oftast av över natten, så diskarna i de maskinerna har inte varit i gång tillräckligt länge för att trigga detta problem.

Man kan ju undra varför sjukvården köper in dyr SSD-lagring när de har problem med ekonomin och allt ändå går i snigelfart?

32 768 = 2^15, verkar som att någon snålat på bitarna.

Lätt at förstå varför de inte har öppen källkod till drivrutiner. Undrar vad som händer nästa gång! Trump borde reagera och ställa krav även på Korea mm om drivrutinerna kommer därifrån.

Skickades från m.sweclockers.com

Trist, haha men ändå ganska komiskt.

Samtidigt var det väl i lågstadiet man lärde sig att aldrig bygga en array med exakt lika dana diskar (samma tillverkare, modell och batch). Har själv haft det svettigt på jobbet då man gjort just detta. Inte jättekul när de pajar ungefär samtidigt och man börjar få slut på "spare-diskar" innan arrayen är återuppbyggd.

Skickades från m.sweclockers.com

Skrivet av Gender Bender:

Man kan ju undra varför sjukvården köper in dyr SSD-lagring när de har problem med ekonomin och allt ändå går i snigelfart?

Inget problem, bara att sparka personal om det blir för dyrt!

Skrivet av snickaren4life:

Det är säkert för att man ska behöva köpa nya produkter oftare.
Kapitalism-bugg.

Detta är enterprise-produkter, de är gjorda för att hålla i ungefär tre år. Men de kan gå i ytterligare många, många år (tyvärr, de lever kvar som rena zombies ute i vissa verksamheter).

Skrivet av Gender Bender:

Man kan ju undra varför sjukvården köper in dyr SSD-lagring när de har problem med ekonomin och allt ändå går i snigelfart?

Tänkte samma sak, och varför (antar jag) ett kritiskt system använder senaste tekniken som inte är beprövad och kan ha barnsjukdomar?

Om jag hade haft ett företag som var beroende av datorsystem, så hade jag ju tex inte varit först ut med att gå över till Windows 95, utan suttit kvar på 3,11 tills att de värsta buggarna är borta i windows95 för att sedan börja beta av system i taget.

Eller om HP släpper en ny SSD så går jag ju inte och köper in den, istället för en lite äldre SSD som är känd att hålla i minst 2 år utan problem etc.

Kan någon förklara varför tiden räknades i drivrutinen. Att man räknar bytes kan jag förstå. Men varför tiden?

Skickades från m.sweclockers.com