Blåskärm på servern .. Vad strular?

Permalänk
Medlem

Blåskärm på servern .. Vad strular?

För nån vecka sen när jag startade upp min server för att titta på några filer fick jag först inte liv i den, bytte batteriet på MK som hade ganska lite spänning kvar.. Fick den att starta systemet till slut.. Dock stannade systemet upp, fick blå skärm 2-3 gånger medan jag höll på att jobba i den..

Efter kollat i setupen om jag hade glömt ställa in nått, som BOOT-ordningen (eftersom den inte ville starta systemet först utan jag fick välja manuellt i bootmenyn. )

På bilden är ett batteri jag fann inne i burken, hade inte rekognoscerat det förut.. Är det detta batteri som är orsaken? Spänningen på den var inte mycket, samt verkar cellerna ha svällt något..

Eftersom jag inte har nån större lust att köpa dyra originaldelar från HP så har jag sågat upp plasten på batteriet (lossade det lilla kretskortet först), fått ur cellerna och lödit fast en sladd på den för att kunna ansluta en ny bunt NiMh celler på 4.8Volt en bit bredvid där plats fanns.

Hur ska man tolka den där gula lappen egentligen, betyder det om batteriet är dött.. Dra ur kontakten eller vad menar dom.. (Min engelska är väl inte så där jättebra )

Servern är för övrigt en HP/Compaq ML350 som det rullar den enklare formen av Windows server 2003 på, lyckades inte få fatt på något serienummer till de andra Windows-server 2008 skivorna jag fick med.. Då jag installerade den för en 7-8 år sen.

Någon som har några erfarenheter och känner igen detta?

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem

Det är ju en batteribackup till din raidkontroller, som ska förhindra dataförlust vid plötsligt spänningsbortfall.
Det går att köra utan, men man riskerar korrupt data om strömmen skulle gå och servern är igång.

Det borde finnas loggar på vad som kan vara fel i IPMI ( iLO ).

men WS2003 och 2008... du borde tänka på att byta till något annat.

Visa signatur

"Det här systemet fungerar urkasst." - operatör.
"Hur ska det fungera då?" - jag
"Gör så att det fungerar som jag vill." - operatör.
/facepalm

Permalänk
Medlem
Skrivet av Otur:

Det är ju en batteribackup till din raidkontroller, som ska förhindra dataförlust vid plötsligt spänningsbortfall.
Det går att köra utan, men man riskerar korrupt data om strömmen skulle gå och servern är igång.

Det borde finnas loggar på vad som kan vara fel i IPMI ( iLO ).

men WS2003 och 2008... du borde tänka på att byta till något annat.

Att byta till nått annat är inte aktuellt.. Fullständigt hatar det nya gränssnittet som kom efter dessa system.. I datorn jag jobbar med dagligen ligger Linux med mate i gränssnitt..

Vet inte ens hur man hittar de där loggarna ni nämner.

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem

Man skall förmodligen dra ur kontakten vid dåliga batteriet för att RAID-kontrollern inte skall ha fellarm hela tiden att batterierna är dåliga och lindra laddkretsarnas belastning om ev. batterier har gått i kortslutning

Default så slås writecache av i din RAID-kontroller när backuppbatteriet är dålig eller inte existerar, det kan påverka prestandan mycket till närmas katastrofal nivå då om du har SAS 10 och 15 krpm-diskar av enterprisetyp så har de inga writecache alls till en början - bara readcache. - att hantera writecache är RAID-kontrollerns roll i det hela (kontrollern P400, P410,420?).

Jag har gjort som du - köpt batterihållar och sladd för 4 st ikeas R03-batterier på kjell och sedan lött in det på batterikontrollen och allt fungerar efter det.

Det går att ställa RAID-kontrollern att använda skrivcache även utan batteri men då är risken för en förlorad RAID-set stor vid olämplig kommande strömavbrott eller flera strömavbrott kort efter varandra - det sistnämnda är det som brukar slakta flertalet av köpeNAS olika RAID-strukturer för att man har diskarnas skriv-cache aktiv - vilket numera är default och att stänga av dessa är numera djupt gömt eller borttaget.

Permalänk
Medlem

Angående det där med logg så fann jag detta.. Vet inte om jag kollade i rätt logg dock:

Type Date Time Source Category Event User Computer
Warning 2023-11-30 17:35:49 USER32 None 1076 administrator HULDA
Error 2023-11-30 17:32:15 Windows Update Agent Software Sync 16 N/A HULDA
Warning 2023-11-30 17:30:06 Netlogon None 5781 N/A HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7036 N/A HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7035 SYSTEM HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7036 N/A HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7035 SYSTEM HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7036 N/A HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7036 N/A HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7035 SYSTEM HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7036 N/A HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7035 SYSTEM HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7036 N/A HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7035 SYSTEM HULDA
Information 2023-11-30 17:27:51 Service Control Manager None 7035 SYSTEM HULDA
Information 2023-11-30 17:27:06 Browser None 8015 N/A HULDA
Warning 2023-11-30 17:27:02 LsaSrv SPNEGO (Negotiator) 40960 N/A HULDA
Warning 2023-11-30 17:26:47 LsaSrv SPNEGO (Negotiator) 40960 N/A HULDA
Error 2023-11-30 17:26:44 W32Time None 29 N/A HULDA
Warning 2023-11-30 17:26:44 W32Time None 14 N/A HULDA
Information 2023-11-30 17:26:35 WINS None 4097 N/A HULDA
Information 2023-11-30 17:26:32 IPSec None 4294 N/A HULDA
Information 2023-11-30 17:26:32 SBCore None 1000 N/A HULDA
Information 2023-11-30 17:26:31 DfsSvc None 14531 N/A HULDA
Information 2023-11-30 17:26:31 DfsSvc None 14533 N/A HULDA
Information 2023-11-30 17:26:31 Cissesrv None 24578 N/A HULDA
Information 2023-11-30 17:26:31 AeLookupSvc None 3 N/A HULDA
Warning 2023-11-30 17:26:31 Netlogon None 3096 N/A HULDA
Information 2023-11-30 17:26:01 e1express None 33 N/A HULDA
Information 2023-11-30 17:25:58 IPSec None 4295 N/A HULDA
Information 2023-11-30 17:26:06 DCOM None 10026 N/A HULDA
Information 2023-11-30 17:26:04 eventlog None 6005 N/A HULDA
Information 2023-11-30 17:26:04 eventlog None 6009 N/A HULDA
Error 2023-11-30 17:26:04 eventlog None 6008 N/A HULDA

Ett av dessa error var för att nått system ville ha kontakt med något uppdateringsställe.. Finns inget internet inkopplat till detta lilla nätverk, vilket jag gjort med avsikt för att slippa från i oönskad programkod.. För övrigt jämförd jag det här datumets logg mot en tidigare felfri start, men kunde inte så något annorlunda.

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem
Skrivet av xxargs:

(kontrollern P400, P410,420?).

Tack för ditt svar, kanske är det så att det dåliga batteriet med närmare noll volt stört funktionen, gjort systemet instabilt.. Batteriet i setupen hade visst lagt av redan i augusti.. Så några starter med default datum 2013 fanns där.

På din fråga vilken kontroller jag har är denna bild, vet inte modellbeteckningen.

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk

Du har inte möjligtvis fotat blåskärmen eller skrivit upp vad blåskärmen sa? Oftast tycker jag blåskärmar i sig är väldigt luddiga, men de brukar kunna ge en liten fingervisning om vad som möjligtvis felar.

Permalänk
Medlem

Kan vara egentligen vad som helst men troligtvis är det hårdvarurelaterat och med tanke på att det verkar vara något i stil med en HP ML350 G5 så är det knappast värt att lägga några pengar på den. Gissningsvis så sitter HDDs kopplade mot HBA/RAID-kortet så det kan vara lite meckligt om det ens är möjligt att importera arrayen till något annat system. Ladda över allt av intresse och gör två kopior av data på olika enheter och gå vidare.

Permalänk
Medlem
Skrivet av SupaBeast:

Du har inte möjligtvis fotat blåskärmen eller skrivit upp vad blåskärmen sa? Oftast tycker jag blåskärmar i sig är väldigt luddiga, men de brukar kunna ge en liten fingervisning om vad som möjligtvis felar.

Glömde tyvärr det..

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem

Det är en ML350 G6

Tror också på hårdvarurelaterat fel..

Sista starten nu så funkade det som det ska, borde jag om den fortsätter att lira att köra något form av diskdiagnosprogram? Finns det ett inbyggt i detta os som med W2K och windows XP? Duger detta?

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem
Skrivet av vilzen:

Det är en ML350 G6

Tror också på hårdvarurelaterat fel..

Sista starten nu så funkade det som det ska, borde jag om den fortsätter att lira att köra något form av diskdiagnosprogram? Finns det ett inbyggt i detta os som med W2K och windows XP? Duger detta?

Med tanke på åldern på servern så finns det många potentiella hårdvarumässiga felkällor. Men om jag vore du så skulle jag kontrollera S.M.A.R.T. status för hårddiskarna och/eller eventuell status för Raid-volym om din lagring baserar sig på detta. För status på Raid-volym ser du enklast genom att gå in i HP P410(i) Smart Array genom att trycka F8 i boot när detta alternativ visas.

Som sagt, med åldern på servern så skulle det till och med kunna vara så att en eller flera kondensatorer börjar bli dålig, det kan även vara så att power supply börjar fela med resultatet att strömmatningen blir instabil och således även mjukvaran som körs därunder. Har du redundanta PSU:er i servern?

Annars är det ju inte svårt att hitta en ny ML350 G6 om du ändå tänker dig att köra vidare på legacy operativsystem. Jag skämtar inte, men vi hade säkert 20st ML350 G6:or som stod och samlade damm på mitt gamla jobb, om inte f.d. chefen har fått tummen ur... och skickat iväg dessa på skroten vid det här laget, det var två år sedan jag slutade där.

Visa signatur

Also found as @piteball@mastodon.rockhost.se

Permalänk
Medlem

Här, sida 72 har du ILO porten.

https://support.hpe.com/hpesc/public/docDisplay?docLocale=en_...

Koppla upp den på ditt nätverk och logga in.
Leta upp IML (Integrated Management Log) och se vad som är fel.

ILO2 är ju riktigt gammalt, äldsta jag personligen sett är ILO3

Permalänk
Medlem
Skrivet av Pitr-:

Med tanke på åldern på servern så finns det många potentiella hårdvarumässiga felkällor. Men om jag vore du så skulle jag kontrollera S.M.A.R.T. status för hårddiskarna och/eller eventuell status för Raid-volym om din lagring baserar sig på detta. För status på Raid-volym ser du enklast genom att gå in i HP P410(i) Smart Array genom att trycka F8 i boot när detta alternativ visas.

Som sagt, med åldern på servern så skulle det till och med kunna vara så att en eller flera kondensatorer börjar bli dålig, det kan även vara så att power supply börjar fela med resultatet att strömmatningen blir instabil och således även mjukvaran som körs därunder. Har du redundanta PSU:er i servern?

Annars är det ju inte svårt att hitta en ny ML350 G6 om du ändå tänker dig att köra vidare på legacy operativsystem. Jag skämtar inte, men vi hade säkert 20st ML350 G6:or som stod och samlade damm på mitt gamla jobb, om inte f.d. chefen har fått tummen ur... och skickat iväg dessa på skroten vid det här laget, det var två år sedan jag slutade där.

Ska testa det... Synd vissa är så snabba att köra grejer på skroten, bättre o ha en "likbod" i källaren för sånt där.. Där kan det få stå en tid.. Själv har jag tyvärr ingen tillgång till att få begagnade saker så lätt, efter jag inte längre jobbar i branchen.

Ska testa det där du skrev nästa gång jag startar upp.. Det får nog vänta till om ett par dagar då det ska bli mildare.. Brukar öppna dörren in till det rummet på fm, låta värmen läcka ut dit eftersom jag inte tror det är så bra att starta upp datorer i +8grader.. ( Snålar lite på uppvärmningen i vissa rum då elen inte direkt är billig nu förtiden.

Nu är jag inte riktigt med vad en redundant PSU är, vet det sitter 1st powersupply i burken.. Vissa maskiner kan ha flera, men tror inte denna har det..

Jo, kondensatorer kan ju bli dåliga med tiden, men burken är väl bara 10 år, låter lite tidigt för sånt fel.

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem
Skrivet av kinkyboo:

Här, sida 72 har du ILO porten.

https://support.hpe.com/hpesc/public/docDisplay?docLocale=en_...

Koppla upp den på ditt nätverk och logga in.
Leta upp IML (Integrated Management Log) och se vad som är fel.

ILO2 är ju riktigt gammalt, äldsta jag personligen sett är ILO3

Ska kolla det där, har laddat ner dokumentet.. Fast min burk är en G6, dokumentet är G5..

Når man inte ILO genom att sätta sig vid servern och logga in??

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem

Har ytterligare en fundering kring detta, fick rådet att ta kopior på allt... Vissa delar på servern är min kopia från datorn där jag jobbar med bilder i PS, samt en massa dokument.. Dock finns ett katologträd på en av enheterna med programvaror och drivers för äldre hårdvara som jag nog inte vill bli av med. Så dessa behöver kopieras ( litade ju på detta RAID-set )

Förut på den gamla Proliant 1600 servern hade jag en AIT-bandstation att kunna köra upp vissa saker på tape, går tyvärr inte att flytta då denna ML 350 G6 burk saknar SCSI interface.. Har ett par DLT band liggandes, men saknar tyvärr bandstation till dem.

Jag har på gång att kanske få lite data-grejjor från en kompis vars brorsa driver ett åkeri.. Vet dock inte när eller vad som finns att ta över.. Om det finns en dator, installera Linux Mint 21.2 på den och lägga över det där.. Vad jag funderar på går det att låta en dator med Linux Mint installerat att uppföra sig som ett USB minne på en annan dator?

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem

Hur stor mängd data har du på servern? Det kan vara klokt att ta backup på allt som du inte vill bli av med så så fort som möjligt. Jag hade inte förlitat mig på såpass gammal hårdvara utan att använda backup.

Permalänk
Medlem
Skrivet av vilzen:

Ska kolla det där, har laddat ner dokumentet.. Fast min burk är en G6, dokumentet är G5..

Når man inte ILO genom att sätta sig vid servern och logga in??

G6: https://www.hpe.com/psnow/doc/c04200238
Fortfarande ILO2

Du kan ansluta till ILO via din server om du använder den som en vanlig dator men det är fortfarande ett web interface och ILO porten behöver vara uppkopplade på nätet.

Kan inte direkt rekommendera den här approachen, blir lite märkligt att administrera men om allt du ska göra att läsa loggarna så är det fine.

Permalänk
Medlem

Så man kikar på ILO via webbläsaren eller nått.. Ska kolla in dokumentet hos HP jag fick länk på.. Hoppas jag fattar hur man gör!

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem
Skrivet av joakim99:

Hur stor mängd data har du på servern? Det kan vara klokt att ta backup på allt som du inte vill bli av med så så fort som möjligt. Jag hade inte förlitat mig på såpass gammal hårdvara utan att använda backup.

Disk storlek är väl 750Gb , men det är nog bara fyllt till en fjärdedel.. Kommer inte riktigt ihåg... Har just nu inget bra att göra en tredje kopia på.

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem
Skrivet av vilzen:

Disk storlek är väl 750Gb , men det är nog bara fyllt till en fjärdedel.. Kommer inte riktigt ihåg... Har just nu inget bra att göra en tredje kopia på.

En vanlig USB-disk hade väl fungerat bra till det.

Permalänk
Medlem

Som svar till alla kan jag berätta att jag läst vad ni skrivit, tagit mig tid att svarat några av er.. Focus har varit på att jobba med att säkerhetskopiera med vad som jag hade till hands hemma.. Kopplade in en Compaq AIT Bandstation externt, körde in så mycket som fick plats av bilder och data på de fyra 35Gb banden jag hade ( Önskade att jag hade fått tag på fler band, var dock nära en gång men pratade för mycket att jag redan hade en bandstation så jag fick bara 2 band istället för 5 ) Sen ytterligare data backat till ett gäng DAT-band, sitter en sån bandstation i denna burk.. Använde ett helt gäng band av olika storlekar för att få ihop det.. Så där blev mitt förråd av drivrutiner, några imagefiler och sparade program säkrat.. Tyvärr hade jag inte band nog för mina camera-RAW filer, så de körde jag ner en extra kopia av på RAID-packen på min gammel-server där jag egentligen bara har OS med de logiska rättigheterna, AD mm kvar.. ( Fick hjälp av en kompis en gång att skapa denna struktur ) Har inte riktigt kunskapen att migrera över allt till en ensam server, så detta fick ligga kvar när jag fick denna HP Compaq ML350 G6 burk som diskuterats i denna tråd.. Vilken har ett gäng SAS diskar som ligger i lämpligt RAID-kluster för att säkert förvara data på. Som sagt, snurr diskar är väl den lagringsformen jag har mest förtroende för.

Tilläggas kan att efter jag gjort den habrovink med att öppna den gamla batteripacken till array-kortet.. Löda på ledningar och koppla dessa till en batterihållare jag hade hemma för 4stycken AA-batterier.. Har haft igång servern 5 gånger nu, sista av gångerna när jag körde backup i 11 timmar.. Allt lirade utan blåskärm, misstänker att när spänningen i batterierna blir i princip noll och de inte längre tar laddning så stör det array-kortets funktion. Har inte lyckats förstå hur man kopplar in sig på ILO, såg i serverns menyer ett val som verkade vara rätt och testade båda serverns portar mot switchen utan att få kontakt.. ILO, är något som jag aldrig tidigare varit i kontakt med.. ( Bortsett ifrån gamla moppar med ILO-motor vi köpte billigt, jag och bröderna roade oss med att trimma som tonåringar ) Däremot så fanns ett program i windows miljön för Arrayen, länkar med en bild på det felmeddelande som ännu syns.. Vilket säger väl i princip att write-cachen är disaebled på P410i embedded slot till batteriet är fulladdat.. error code 772 + 324

För övrigt så:
Om nån har ett tips på en begagnad bandare för DLT 160Gb band vore det intressant, sånt är väl bortsorterat på de flesta företag i dag, typ har väl egentligen inget större värde men duger gott för hemmabruk.. Har 2 helt nya band från HP som jag för närvarande inte kan använda.. Skulle även vilja ha fler band till mina 2 AIT-bandare, varav den ena sitter kvar i gammelservern och användes flitigt när den var ensam i drift. Ångar än idag att jag inte tog vara på en massa band, när jag med en kollega städade ur hos en kund till konsultfirman någonstans centralt i Stockholm.. Det var innan jag fick gammelservern, med sin AIT-bandare.. Vi fyllde en kartong på en lastpall med disketter och band av olika slag.. Fanns garanterat rätt bandtyper där, som jag den dagen inte visste att jag skulle behöva 6 månader senare.

Tack för all den grundliga feedback jag fått, den har väl gjort mig i någon mån lite klokare iaf. Hoppas jag!

Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p

Permalänk
Medlem
Visa signatur

Har jobbat som Serviceingenjör Digital Systems Services som blev uppköpt av Compaq, skruvar nu mest för egna behov.. Ägnar mig fotografi istället..
..Använder ibland när jag skriver lite ovanliga beskrivningar, jag är ordblind så då blire som det blir i texten ibland! :p