Linux server bara startar om och om igen

Permalänk
Medlem

Linux server bara startar om och om igen

Hej,
har ett problem som uppkommit nyligen. Min server har nämligen slutat funka. Jag kan starta den och hänga i BIOS hur länge som helst utan problem men så fort jag börjar ladda in Ubuntu så visar den en del text och sedan dör den för att starta om och dö om och om igen utan att visa någon bild. Stänger jag av den med knapp och sedan börjar om så kommer jag in i BIOS igen osv. Jag har även lyckats logga in en gång men sen hände detta igen.

Jag kan ej utesluta att detta inte hände efter ett strömavbrott.

Edit: Kommer in i recovery mode utan problem men sen när jag börjar reparera broken packages hamnar jag i samma skit igen.

Visa signatur

CPU: Ryzen 5600xGPU: 1080 TI ROG Strix RAM:2x16GB G.skill Trident @ 3600MHz MoBo: Asus B550FPSU: Corsair SF750
En resa till Nordkorea
2 dagar i Tjernobyl

Permalänk
Medlem
Skrivet av Pelegrino:

Hej,
har ett problem som uppkommit nyligen. Min server har nämligen slutat funka. Jag kan starta den och hänga i BIOS hur länge som helst utan problem men så fort jag börjar ladda in Ubuntu så visar den en del text och sedan dör den för att starta om och dö om och om igen utan att visa någon bild. Stänger jag av den med knapp och sedan börjar om så kommer jag in i BIOS igen osv. Jag har även lyckats logga in en gång men sen hände detta igen.

Jag kan ej utesluta att detta inte hände efter ett strömavbrott.

Edit: Kommer in i recovery mode utan problem men sen när jag börjar reparera broken packages hamnar jag i samma skit igen.

Hej, är ingen expert men vilken hårdvara kör du detta på? (Stationär/laptop/dedikerad server-hw?)
Spec på ingående prylar och/eller komponentförteckning?
Har du möjlighet att testa ett annat nätagg?
Testa att ta ur GPU och/eller andra tillbehör?

Testa att köra någon live-dist eller att installera någon dist på t.ex. usb-anslutet media?

Tänk på att ta backup.

Ett onödigt ord. Ett fel ord (disk->dist)
Permalänk
Medlem
Skrivet av Leoj:

Hej, är ingen expert men vilken hårdvara kör du detta på? (Stationär/laptop/dedikerad server-hw?)
Spec på ingående prylar och/eller komponentförteckning?
Har du möjlighet att testa ett annat nätagg?
Testa att ta ur GPU och/eller andra tillbehör?

Testa att köra någon live-dist eller att installera någon disk på t.ex. usb-anslutet media?

Tänk på att ta backup.

Hårdvaran är inte superrelevant i sammanhanget men kör på en gammal pentium g3258, z87-g45 mobo, 8Gb DDR3, godtyckliga hårddiskar. Nej jag har ej möjlighet att testa med ett annat nätagg och det är ingen GPU eller andra tillbehör i burken.

Jag är på väg att testa live-dist/formattera om.

Visa signatur

CPU: Ryzen 5600xGPU: 1080 TI ROG Strix RAM:2x16GB G.skill Trident @ 3600MHz MoBo: Asus B550FPSU: Corsair SF750
En resa till Nordkorea
2 dagar i Tjernobyl

Permalänk
Medlem

Det kanske går att reparera m.h.a. live-dist. Typ: https://help.ubuntu.com/community/Boot-Repair

Visa signatur

Ryzen 7 5800X3D | MSI 4090 Suprim Liquid X | Gigabyte Aorus X570 XTREME | 64GB Vengeance RGB Pro 3600MHz | Corsair MP600 M.2 - 500GB | Corsair MP600 M.2 - 2TB | Samsung 970 EVO 1TB M.2 | EVGA Supernova G2 1300W | Phanteks Eclipse P500A DRGB | Alienware 34" QD-OLED – AW3423DW

Permalänk
Medlem
Skrivet av Pelegrino:

Hej,
har ett problem som uppkommit nyligen. Min server har nämligen slutat funka. Jag kan starta den och hänga i BIOS hur länge som helst utan problem men så fort jag börjar ladda in Ubuntu så visar den en del text och sedan dör den för att starta om och dö om och om igen utan att visa någon bild. Stänger jag av den med knapp och sedan börjar om så kommer jag in i BIOS igen osv. Jag har även lyckats logga in en gång men sen hände detta igen.

Jag kan ej utesluta att detta inte hände efter ett strömavbrott.

Edit: Kommer in i recovery mode utan problem men sen när jag börjar reparera broken packages hamnar jag i samma skit igen.

Vad står det i texten då? brukar stå varför nåt crashar/startar om.

Visa signatur

i5-12600KF | Noctua NH-D15S Chromax Black | MSI MAG B660M | 64 GB G.Skill Trident Z | 3 * WD Black SN750 | Asus TUF OC RTX 3080 | Fractal Design Torrent | Corsair RM750W | Samsung Odyssey G9 49" |

Permalänk
Medlem
Skrivet av Sebban84:

Det kanske går att reparera m.h.a. live-dist. Typ: https://help.ubuntu.com/community/Boot-Repair

Ska ta en titt.

Skrivet av PierreB:

Vad står det i texten då? brukar stå varför nåt crashar/startar om.

Strår absolut ingenting som sticker ut.

Visa signatur

CPU: Ryzen 5600xGPU: 1080 TI ROG Strix RAM:2x16GB G.skill Trident @ 3600MHz MoBo: Asus B550FPSU: Corsair SF750
En resa till Nordkorea
2 dagar i Tjernobyl

Permalänk
Medlem

Om texten rulla fort - filma med mobilen och sedan titta i filmen vad som skrevs sist precis innan skärmen blev svart.

Sista saken eller saken efter som startades har med stor sannolikhet något att göra med att skärmen därefter blev svart.

det andra är att kika i loggfilerna då det brukar vara en loggfil som skrivs för just OS-start under /var/log/boot.log mfl. loggfiler och sedan jämföra med det du filmade och se om loggfilen startade ytterligare program efter den sista posten du ser i filmen.

Om du inte kan utesluta strömavbrott så är det förmodligen det som skedde - och kommer ett par kort efter varandra (hantverkarströmavbrott - typiskt i hus där renoveringsarbete pågår...) så kan det blir riktigt sörjigt i filsystemen då det oftast har hunnit påbörjas filsystemreparation och synkning mellan diskarna om det är RAID-struktur och därmed att lagringarnas skriv-cache är fulla med data som sedan glöms bort i nästa strömavbrott och det blir total oreda i filsystemen.

Dagens diskar har rätt stora write-cache och de flesta traditionella filsystem och RAID-system är inte byggda att kunna hantera när man får så stora databortfall i olika mönster vilande i write-cache och ännu inte hunnit ut på diskytan som det blir med dagens diskar vid strömavbrott - det är bara transaktionsbaserade filsystem med COW som BTRFS och ZFS som har större överlevnadsmöjligheter i dessa situationer - de flesta mjukvaru-RAID-system som mdadm-RAID och LVM kan går riktigt åt pipan i dom lägena och då hjälper inte ens med BTRFS som filsystem om den ligger ovanpå en sådan RAID och inte själv får hantera diskarna då RAID-systemen har ingen koll på strukturen på den ovanliggande systemet och vid synkning efter tex. en strömavbrott kan skriva om data (pga. fel tolkning av data inom stripen) att data modifieras som tex. BTRFS förutsätter inte har ändrats - man får en data-race situation där en process (RAID-synkningen) pillar i data som den andra processen (BTRFS) samtidigt förutsätter att datat inte ändras för att kunna göra korrekt rollback efter strömavbrottet.

För dig är det att försöka renovera upp eländet och i värsta fallet installera om med vad detta innebär - och nästa pryl i önskelistan att köpas skyndsamt är att köpa en UPS - billigast möjliga duger, bara den kan prata med värddatorn över USB på känt protokoll som APC-UPS så att OS får reda på att strömmen gått och när batterierna sinar för mycket att den gör en kontrollerad avstängning.

och till dess att köra all lagring med write-cache avstängd tills du får UPS:n på plats, - och ja, prestandan kommer vara mer eller mindre lidande när du har write-cache på diskarna avstängda, men lider mindre av det ju mer RAM-du har i servern då OS-diskcachen ändå gör ett hyffsad jobb vid diskskrivningar.

Permalänk
Medlem

Dog även under memtest och att live-köra ubuntu. Verkar vara något som inte är helt hundra. Väntar på att dockan kommer för SATA så jag kan ta ut ena hårddisken som har massa bileder (finns p åandra ställen också) men alla filmer är nog lost, verkar som 3TB disken är lite broken för den vill inte mountas i live-versionen.

Visa signatur

CPU: Ryzen 5600xGPU: 1080 TI ROG Strix RAM:2x16GB G.skill Trident @ 3600MHz MoBo: Asus B550FPSU: Corsair SF750
En resa till Nordkorea
2 dagar i Tjernobyl

Permalänk
Medlem

Monteras på samma eller annan dator med 3TB-disken? - då det verkar som att du har problem med ditt MB eller Ram-minnena på MB, köper du ett nytt moderkort för serverbruk - välj modellerna som också hanterar ECC-minnen då du nu kan ha bitrot på en eller flera filer i din server för att problemen har funnits ett tag innan det nu upptäcktes som haveri.

En disk som går sönder och det är SATA-bussen som låser sig kan också ge märkliga problem - men det brukar synas tydligt om man kör 'sudo dmesg' i en terminalfönster då det brukar vara illrött på dessa rader där det också står SATA...

Är det en Seagate barracuda 3TB anno 2010 - 2015?? - dom är erkänt benägna att haverera mer ofta än andra diskar i samma storleksklass. det är Segates stora - 'misslyckade' serie precis som Deathstar (Deskstar) var för IBM/Hitachi ett antal år tidigare och med lärdom av detta blev mycket respekterade och pålitliga diskar i HGST:s tillverkning.

"ddrescue" är väldigt bra på att mjölka ut en diskimage ur halvkrassliga diskar, se till att använda 3 filargument, inte 2 - den sista filargumentet är loggfilen som håller reda på vilken del av disken som redan är inläst och gör att man stänga av och starta ddrescue igen och det fortsätter där det slutade sist, och utan den så börjar det på ruta 1 om man måste starta om av någon orsak (tex att disken hänger sig och måste göra power OFF/ON innan det vaknar till igen - händer ganska ofta på SSD/NVMe när man försöker rädda ur en diskimage ur dessa).

- så jag skulle inte ge upp dina mediafiler ännu - dock är det bra med en rejält stor extern USB-disk för sådan meck - diskräddning tar alltid mycket plats och man behöver armbågsrum med kanske flera kopior av samma diskimage rullande samtidigt under arbetet.

minst en 8TB extern USB-disk, 12 TB och större om du har kassa för det.

Permalänk
Medlem
Skrivet av xxargs:

Monteras på samma eller annan dator med 3TB-disken? - då det verkar som att du har problem med ditt MB eller Ram-minnena på MB, köper du ett nytt moderkort för serverbruk - välj modellerna som också hanterar ECC-minnen då du nu kan ha bitrot på en eller flera filer i din server för att problemen har funnits ett tag innan det nu upptäcktes som haveri.

En disk som går sönder och det är SATA-bussen som låser sig kan också ge märkliga problem - men det brukar synas tydligt om man kör 'sudo dmesg' i en terminalfönster då det brukar vara illrött på dessa rader där det också står SATA...

Är det en Seagate barracuda 3TB anno 2010 - 2015?? - dom är erkänt benägna att haverera mer ofta än andra diskar i samma storleksklass. det är Segates stora - 'misslyckade' serie precis som Deathstar (Deskstar) var för IBM/Hitachi ett antal år tidigare och med lärdom av detta blev mycket respekterade och pålitliga diskar i HGST:s tillverkning.

"ddrescue" är väldigt bra på att mjölka ut en diskimage ur halvkrassliga diskar, se till att använda 3 filargument, inte 2 - den sista filargumentet är loggfilen som håller reda på vilken del av disken som redan är inläst och gör att man stänga av och starta ddrescue igen och det fortsätter där det slutade sist, och utan den så börjar det på ruta 1 om man måste starta om av någon orsak (tex att disken hänger sig och måste göra power OFF/ON innan det vaknar till igen - händer ganska ofta på SSD/NVMe när man försöker rädda ur en diskimage ur dessa).

- så jag skulle inte ge upp dina mediafiler ännu - dock är det bra med en rejält stor extern USB-disk för sådan meck - diskräddning tar alltid mycket plats och man behöver armbågsrum med kanske flera kopior av samma diskimage rullande samtidigt under arbetet.

minst en 8TB extern USB-disk, 12 TB och större om du har kassa för det.

Nej det är en vanlig WD Red. Det vore mer rimligt att den andra disken, en gammal sketen hitachi tagen från en 10-år gammal extern HDD, hade dött. Otur I guess. Vi får se när dockan kommer. Ej testat i annan dator utan väntar på det.

Det är enbart filmer, dvs inget viktigt som har försvunnit, mest bara irriterande.

Visa signatur

CPU: Ryzen 5600xGPU: 1080 TI ROG Strix RAM:2x16GB G.skill Trident @ 3600MHz MoBo: Asus B550FPSU: Corsair SF750
En resa till Nordkorea
2 dagar i Tjernobyl

Permalänk
Medlem

Det är mer körtimmar än faktiskt ålder som bestämmer när en snurrdisk börjar vara i slutet av sin livstid - hårddiskar är nog idag en av de säkrare långtidslagringsalternativen i paritet med optisk media när man pratar om +10 års lagringstid som urkopplad enhet - dock inte i bara en enda exemplar. Glöm SSD om det skall lagras oanslutet på lång sikt, eller åtminstone ha en kopia av innehållet på en snurrdisk också...

Och HGST/Hitachi är nog bland de bästa märkena i det avseende, både i möjlig körtid online och hur länge de håller data som cold storage.

Permalänk
Medlem

Okej så min externa HDD-vagga kom idag och kopplade in min 3TB HDD i den. Disken dyker upp i enhetshanteraren men inte bland mina diskar i utforskaren.

Vad gör jag? Vill minnas disken varit NTFS men kan inte svära på det, använts på Linux men skrivits hela tiden från windows via Samba.

Edit: Löste sig genom att öppna i Linux. Inga problem. Den andra disken däremot var någon konstig LVM2. Verkar ha löst det också så ska bara köra över bilderna så är jag snart tillbaka. Har tyvärr ej möjlighet att lista ut vilken del av hårdvaran som är fel så den får åka i garderoben så länge...

Visa signatur

CPU: Ryzen 5600xGPU: 1080 TI ROG Strix RAM:2x16GB G.skill Trident @ 3600MHz MoBo: Asus B550FPSU: Corsair SF750
En resa till Nordkorea
2 dagar i Tjernobyl

Permalänk
Medlem

Alltid, or rather, bästa när något sånt här händer är ju att ta bort så mycket felkällor man kan för att försöka lokalisera felet.

Ta ut moderkort, lägg det på en skärbräda eller icke ledande underlag, med cpu och en minnessticka, å psu. Har du inte inbyggd GPU i CPUn så grafikkort med. Se om datorn startar. Om den gör det, kör memtest eller whatever i ett gäng timmar.
Startar den inte? Testa sätta minnesstickan i annan plats, pröva samtliga platser. Fungerar inte det pröva annan minnessticka. Men också dubbelkolla i manualen så moderkortet inte har något idiotiskt krav på att ha två minnesstickor. Förhoppningsvis lyckas du få igång datorn, i annat fall är det testa med annan gpu, annan psu. Å fungerar inte det så får man hoppas man har annat moderkort med samma cpu sockel hemma, eller iaf en annan uppsättning moderkort+cpu med samma minnestyp så man kan testa så de fungerar osv.

Tillslut, förutsatt att man har antingen tur och det är t.ex. en av ens två minnesstickor som failar, så lyckas man lokalisera felet. Har man mindre tur så kan det vara en komponent man inte kan säkerställa är felet, t.ex. man har ingen extra CPU i samma sockel så kan inte verifiera om det är moderkort eller CPU som failar, utan att det är någon (eller båda) av de komponenterna.