"Döende" hårddisk, hur göra?

Permalänk
Medlem

"Döende" hårddisk, hur göra?

Hejsan.

Har en Toshiba DT01ACA300 3TB som tydligen hindrade min dator från att boota idag, pga ett SMART-värde som "failade" (det löste sig genom att ladda bootloadern direkt från BIOS/UEFI-inställningarna). Väl inne i Windows kollar jag då upp det:

Vilket inte låter så bra. Det betyder ju inte att disken kommer att dö idag eller imorgon, men skulle gärna byta ut den.

Det jag då undrar lite är, vilken hårddisk skulle ni köpt som ersättare?
Jag funderar på en likvärdig, Toshiba P300 HDWD130UZSVA 64MB 3TB

Funderar även på att köpa en dockningsstation när jag ändå håller på, som jag kan använda för att klona disken.
Vad vet/tycker ni om Deltaco MAP-GD35U3?

Tacksam för svar

Andreas

Permalänk
Medlem

En dålig sektor inebär ofta att en fil är korrupt så länge disken i övrigt är funktionell.
2000 sektorer, ja lite värre det.
Men ja den bör bytas ut och säkerhetskopieras snarast (inom 24h av drift).

Eftersom du inte har några pending sectors, dessa om defekta kan hindra disken från att fungera bra nog för att säkerhetskopiera så bör datan gå att rädda.
Råkar man ut för pending sektors under säkerhetskopieringen, vilket mycket väl kan hända så får man använda program eller tvinga disken att skriva till den dåliga sektorn genom att tvinga en läsning av den sektorn, finns guider för det, dock bara gjort det under linux själv men det har räckt för att rädda allt förutom någon enstaka fil.
Man kan få upprepa proceduren, man kan köra ett SMART självtest, den kommer halta vage gång den stöter på en dålig sektor och rapportera LBA för sektorn.

Har en gammal dockningsstation, 2Tb max, kolla vad gränsen går, ofta 4Tb för många billigare i dag.

Permalänk
Medlem

@pa1983: Hårddisken är urplockad sen några timmar nu.

Hur blir det om jag skulle klona disken till en större disk? Måste jag utöka partitionen eller något efteråt?

MVH

Permalänk
Medlem

Behöver du klona den då?

Hade satsat på att få över personlig data. Allt som kan tankas ner och installeras om är rätt irrelevant.

Permalänk
Medlem

Lita inte på disken någonsin mera.
Köp en ersättare, kopiera över allt du kan.
Disken kan sedan användas att spela varpa med.

Visa signatur

Workstation: i9-13900K @ 6.1 GHz - Asus Z790 ProArt - G.Skill 6400MHz 2x32 GB - Asus TUF 4080 16 GB
Samsung 990 Pro MVMe 1 TB - Kingston Renegade MVMe 4 TB - Asus 990 Pro NVMe 4TB
ASUS ROG Strix Aura 1000W - EK-Nucleus AIO CR360 - LianLi O11 Dynamic EVO
LG 38GL950G - Sound Blaster Katana V2X Soundbar - Corsair RGB Strafe - G-Wolves Sköll
Server: i7-6700K @ 4.2GHz - Asus Maximus VIII - Corsair DDR4 4x16 GB - Samsung 950 MVMe 256GB - Samsung EVO 1 TB

Permalänk
Medlem

@pa1983: Har inte mycket viktigt på den, så egentligen är det sak samma med det. Men det ligger väldigt mycket på den, och det skulle vara trevligt att slippa leta upp och ladda ned allt en gång till (sitter bara på ADSL).

Tycker du jag ska skita i att klona, och bara kopiera över det viktigaste?
Disken får iallfall ligga några dagar nu innan jag får hem ersättaren och möjligtvis dockan.

@JD: Jo det lutar åt det. Får ett par extra neodym-magneter iallafall

Permalänk
Medlem
Skrivet av m4gnify:

Hejsan.

Har en Toshiba DT01ACA300 3TB som tydligen hindrade min dator från att boota idag, pga ett SMART-värde som "failade" (det löste sig genom att ladda bootloadern direkt från BIOS/UEFI-inställningarna). Väl inne i Windows kollar jag då upp det:

http://i.imgur.com/AAZlpbS.png

Vilket inte låter så bra. Det betyder ju inte att disken kommer att dö idag eller imorgon, men skulle gärna byta ut den.

Jo, när SMART "fail" sker, så betyder det att disken kommer troligen dö idag eller imorgon. En SMART varning är en helt annan sak, det fick du troligen för länge sedan, men hade inte mjukvara att övervaka det med. Jag hade undvikt att använda den alls tills du kopierat vad du vill rädda.

I detta fall gissar jag på att den har 2048 st reservsektorer... och du har typ 40 kvar, innan disken inte ens kan hantera felen. Mao... kritiskt.

Skrivet av m4gnify:

Det jag då undrar lite är, vilken hårddisk skulle ni köpt som ersättare?
Jag funderar på en likvärdig, Toshiba P300 HDWD130UZSVA 64MB 3TB

HDD idag är same shit... det är väldigt mycket mer odds att du får en defekt disk (ett ex) än en defekt modell. Visst har där funnits bråkiga modeller hos vissa tillverkare, men annars är det lite skit samma.

Skrivet av m4gnify:

Funderar även på att köpa en dockningsstation när jag ändå håller på, som jag kan använda för att klona disken.
Vad vet/tycker ni om Deltaco MAP-GD35U3?

Tacksam för svar

Andreas

Har sett folk använda den dockstationen. Problemet är att du inte kan koppla bort den så enkelt utan att röra disken. Så den är lite känslig för utmatning. Jag använder en annan deltaco lösning med USB3 till SATA, som är bara en adapter man kopplar på. Man kan då koppla in 2,5 utan ström, eller 3,5" med 12V adapter (troligen som denna), men du kan också stänga av disken utan att röra den.

Detta är viktigt för all rörelse på en HDD när den är i drift, riskerar skada den. Avståndet mellan skiva och läsarm är extremt liten (tänk CPU transistorstorlek), och minsta rörelse kan orsaka problem.

Permalänk
Medlem

Hejsan m4gnify,

Skrivet av m4gnify:

Hejsan.

Har en Toshiba DT01ACA300 3TB som tydligen hindrade min dator från att boota idag, pga ett SMART-värde som "failade" (det löste sig genom att ladda bootloadern direkt från BIOS/UEFI-inställningarna). Väl inne i Windows kollar jag då upp det:

http://i.imgur.com/AAZlpbS.png

Vilket inte låter så bra. Det betyder ju inte att disken kommer att dö idag eller imorgon, men skulle gärna byta ut den.

Det jag då undrar lite är, vilken hårddisk skulle ni köpt som ersättare?
Jag funderar på en likvärdig, Toshiba P300 HDWD130UZSVA 64MB 3TB

Funderar även på att köpa en dockningsstation när jag ändå håller på, som jag kan använda för att klona disken.
Vad vet/tycker ni om Deltaco MAP-GD35U3?

Tacksam för svar

Andreas

Disken har använt upp alla reservsektorer.
Detta behöver i sig inte vara ett problem, men du skall enbart lagra redundant information på den.
Plocka ur disken, köp en ny, kopiera över oersättlig data; problemet löst!

Permalänk
Medlem

Blev en WD Red 4TB, som jag klonade till med hjälp av Deltacon. Fungerar prima. Blev såklart tvungen att uttöka partitionen i Diskhantering för att komma åt resterande 1TB.

Den fallerande hårddisken blev otroligt varm när kloningen kördes så var tvungen att ha en bordsfläkt på den konstant.
Kloningen tog även över 24 timmar

Permalänk
Medlem
Skrivet av m4gnify:

Blev en WD Red 4TB, som jag klonade till med hjälp av Deltacon. Fungerar prima. Blev såklart tvungen att uttöka partitionen i Diskhantering för att komma åt resterande 1TB.

Den fallerande hårddisken blev otroligt varm när kloningen kördes så var tvungen att ha en bordsfläkt på den konstant.
Kloningen tog även över 24 timmar

Låter som att den kämpat för att läsa då, och du gjorde det i precis rättan tid.

Nästa gång kanske du inte har sådan tur dock, så... titta på en till disk för backup när ekonomin tillåter. Det kommer en dag där den räddar dig.

Permalänk
Medlem

Jag hade köpt en SSD och kört den mekaniska sidan om.

Permalänk
Medlem

@Danne: Kör redan SSD som OS-disk. Bara lagring på de mekaniska

Permalänk
Medlem
Skrivet av m4gnify:

@Danne: Kör redan SSD som OS-disk. Bara lagring på de mekaniska

Ok jag tolkade "hindrade min dator från att boota idag" som att ditt OS låg på den disken.

Permalänk
Medlem

@Danne: Den var som sagt bara lagringsdisk, men mitt Asus-moderkorts POST klagade på att disken var nära att dö och hindrade boot.

Permalänk
Medlem
Skrivet av m4gnify:

@Danne: Den var som sagt bara lagringsdisk, men mitt Asus-moderkorts POST klagade på att disken var nära att dö och hindrade boot.

Det är dock bara att trycka förbi. Den varningen har funnits sen P2ans tid ungefär

Permalänk
Medlem

@Danne: Det som hände när jag tröck på F1 eller vad det stod var att datorn startade om och samma text visades igen, så jag vet inte.

Permalänk
Medlem

Låter som om det ligger filer på den som OSet använder sig av då. Annars ska det inta vara något märkligt att boota med en kass disk eftersom den inte läser om inte OSet behöver något där.

Permalänk
Medlem
Skrivet av m4gnify:

@Danne: Det som hände när jag tröck på F1 eller vad det stod var att datorn startade om och samma text visades igen, så jag vet inte.

Det är helt normalt.
Moderkortet läser alltid smart data från alla lagringsenheter och säger en enhet att den kommer gå sönder så säger moderkortet till dig också.
Det är en SISTA varning att ett haveri är oundvikligt, byt disken inom 24h från första varning så i min mening är det slarv från användaren om man får denna varning då haveriet ofta kunde utläsas från smart data minst en Veckan innan ofta mycket tidigare.
Det finns egentligen ingen orsak att få dessa varningar då man kan läsa av SMART data i realtid från OS, manuellt eller sätta upp en demon som läser av och skickar en ett mail om tex en sektor blir dålig eller grova läs/skrifel uppstår.

https://en.wikipedia.org/wiki/S.M.A.R.T.
Wikipedia har en lista på smart värdena och dom oranga med utropstecken är dom som är värda att vara noggranna med.

Här är en ny Seagate disk, värt att notera med Seagate är att Raw_Read_Error_Rate alltid stiger från första stund du startar disken.
Igen annan tillverkare har det så. Orsaken är att Seagate registrerar alla fel vid läs och skrivning, andra tillverkare gör det inte utan registerarer bara dom som disken inte kunde korigera.

Därmed är inte Seagate sämre i det avseendet även om vissa tror det.

Dom felsta tillverkare implementerar SMART data lite hur som helst så det är igen standard som efterföljs, därför måste mjukvaran som används vid avläsning också ha en profil så den faktiskt vet vad det är den analyserar för att ge användaren värdefull information.

Här är min nya Seagate, RAW värdet lägst till höger indikerar hur många gånger något hänt så väldigt smidigt för att tex se när första sektorn går eller liknande.
Sedan har man VALUE, man bör kolla detta när disken är ny, TEX är Reallocated_Sector_Ct 100 när den är ny så kommer det ju att skjunka med tiden om sektorer dör och passerar man tröskelvärdet (THRESH) så kommer det utlösa en SMART varning vid POST av datorn som i dit fall, det betyder då ofta tusentals registreringar på RAW_VALUE.

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 079 065 006 Pre-fail Always - 73455952 3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 2 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 061 060 045 Pre-fail Always - 1196652 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 358 (171 122 0) 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 2 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 064 058 040 Old_age Always - 36 (Min/Max 25/42) 191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 0 193 Load_Cycle_Count 0x0032 097 097 000 Old_age Always - 7147 194 Temperature_Celsius 0x0022 036 042 000 Old_age Always - 36 (0 25 0 0 0) 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 92 (89 255 0) 241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 651139856 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 154740344 254 Free_Fall_Sensor 0x0032 100 100 000 Old_age Always - 0

Man kan inte bara använda nåt uselt Windows program som säger PASS eller FAIL eller liknande, vill man använda SMART data för att förutspå sin disks livslängd och hälsa så får man börja lära sig hur SMART data fungerar och använda det för att komma fram till en slutsats själv när det är tid att byta en disk.

SMART data är tex användbart för att se om diskar med G- sensor vibrerar för mycket pga resonans från andra diskar eller hårdvara som kan orsaka läsfel och tidiga haverier.
Samsung har ofta G-sensor men vissa av deras diskar har också varit väldigt vibrations känssliga.

Permalänk
Medlem
Skrivet av pa1983:

Här är en ny Seagate disk, värt att notera med Seagate är att Raw_Read_Error_Rate alltid stiger från första stund du startar disken.
Igen annan tillverkare har det så. Orsaken är att Seagate registrerar alla fel vid läs och skrivning, andra tillverkare gör det inte utan registerarer bara dom som disken inte kunde korigera.

Därmed är inte Seagate sämre i det avseendet även om vissa tror det.

Seagate gör inte fel - bara att den gör annorlunda än andra tillverkare då hur RAW-värden anges är inte jättestandardiserade.

På position 1, 7 och 195 så har Seagate valt att på de lägsta 32 bitarna lägga en summaräknare på antalet lästa/skrivna sektorer under disken livstid (och wrappar till noll igen när man går över 4294967295) medans de högsta 16 bitarna är antalet noterade fel. Detta innebär ar att dessa register hela tiden räknar upp i snabb takt vid användning utan att det indikerar något fel.

Det betyder att så länge värdet är lika eller under 4294967295 (0xFFFFFFF) så är det noll fel. medans är värdet över så finns fel och då stegar med i värde med +4294967296 steg i värde per upptäckt fel.

En intressant position är 187 som dessvärre inte finns på alla diskar - där anges antalet sektorer som inte har kunna korrigerats efter läsning ens efter ECC-åtgärder och är riktiga läsfel (dvs. gett 'media error' eller I/O-error i någon program som försökt använda någon av dess sektorer - är den 0 så har disken aldrig läst av en sektor som är så dålig att den inte har levererats )

En snurrdisk idag har så mycket ECC och checksummor att den ger inte 'silent error' om en sektor skulle få stora fel under lagring (små fel tar ECC-rättningen) - sådana saker upptäcks alltid med I/O-error eller mediafel [1] som resultat så att brukaren blir uppmärksam på förhållandet, optomedia är också väldigt säkrade för att inte ge några 'silent - error' i och med att dessa är en direkt fortsättning på hur snurrdiskarna hanterar felsituationer och vill inte vara sämre än dem. SSD har också liknande felhantering men där är det mer osäkert om de är utförda lika bra som som snurrdiskar då det är andra felmekanismer inblandat och inte fullt lika utprövat för 'osannolika fel' som snurrdiskar där felmekanismen är väldigt empiriskt konstaterad under alla åren som magnetmedia har använts och är förutsägbar i beteende och i stort sett alla snurr-HD-tillverkare använder samma lösningar.

Däremot gäller detta inte SD-minnen och som jag nu fick reda på - även en del USB-stickor, av en kamrat som råkat ut för skarpa fel med 'silent error' med just sistnämnda media. Även om minneschippen som sådant har register i sig som indikerar läsfel när det inträffar, så verkar firmwaren i SD-minne och USB-stickor helt ignorerar detta och levererar den felaktiga datan lika glatt som den korrekta data utan fel - dvs. ger 'silent error'

[1] Detta felbeteende att inte leverera någon data vid media-fel (som har blivit standard på snurrdiskar och även optomedia) kommer från WD1003-tiden (diskkontrollerkort från Western Digital) som var standard i IBM:s AT-maskiner på mitten av och slutet av 1980-talet där diskkontrollern helt enkelt vägrade att ge några data mot värden om det var läsfel, kort sagt så levererades det korrekt data (så mycket felrättningen kunde kontrollera med sin räknerymd) eller så levererades det ingen data alls utan det i stället flaggade för mediafel - skulle man läsa ut datat som var korrumperat så behövde man göra specialprocedurer för att läsa ut den felaktiga bitmönstret - bokstavligen hacka sig igenom WD-kontrollern med användande av test-moder som bara är tänkt för utveckling-fasen när man designade diskkontrollerna en gång i tiden.

Permalänk
Medlem
Skrivet av pa1983:

"Wall of Text..."

Skrivet av xxargs:

"Wall of Text..."

Har ni funderat på att kanske göra en genomgående, men även enkel förklaring SMART tolkning av olika diskar? Det är något som efterfrågas rätt ofta när folk inte vet om deras disk har problem. Något som man skulle kunna ha som sticky ev.

Kanske tips om 2-3 olika mjukvaror att läsa av SMART med, och vilka undantag som vissa tillverkare gör.
Vilka kriterier som är ofarliga och vilka som är kritiska. Tex Uncorrectable Error som är kritiskt fel, medan nån enstaka sektor som har lässvårigheter kanske inte är döden för disken, tex. Lite så folk själv har en chans att se vad som sker och att man inte ska tolka ett SMART värde för sig själv, utan man måste se helheten i hela disken för att kunna bedöma dens skick.

Jag har en del kunskap om detta genom åren också och hjälper gärna till.

PS @xxargs du får nog "dumma ner" dina förklaringar då lite dock, för det är troligen få personer som förstår vad du exakt säger. Att du har en hel del kunskap om binär hantering och även HDD (speciellt Seagate diskar) förstår jag men jag tror inte alla förstår dina förklaringar.

Permalänk
Medlem
Skrivet av xxargs:

Seagate gör inte fel - bara att den gör annorlunda än andra tillverkare då hur RAW-värden anges är inte jättestandardiserade.

På position 1, 7 och 195 så har Seagate valt att på de lägsta 32 bitarna lägga en summaräknare på antalet lästa/skrivna sektorer under disken livstid (och wrappar till noll igen när man går över 4294967295) medans de högsta 16 bitarna är antalet noterade fel. Detta innebär ar att dessa register hela tiden räknar upp i snabb takt vid användning utan att det indikerar något fel.

Det betyder att så länge värdet är lika eller under 4294967295 (0xFFFFFFF) så är det noll fel. medans är värdet över så finns fel och då stegar med i värde med +4294967296 steg i värde per upptäckt fel.

En intressant position är 187 som dessvärre inte finns på alla diskar - där anges antalet sektorer som inte har kunna korrigerats efter läsning ens efter ECC-åtgärder och är riktiga läsfel (dvs. gett 'media error' eller I/O-error i någon program som försökt använda någon av dess sektorer - är den 0 så har disken aldrig läst av en sektor som är så dålig att den inte har levererats )

En snurrdisk idag har så mycket ECC och checksummor att den ger inte 'silent error' om en sektor skulle få stora fel under lagring (små fel tar ECC-rättningen) - sådana saker upptäcks alltid med I/O-error eller mediafel [1] som resultat så att brukaren blir uppmärksam på förhållandet, optomedia är också väldigt säkrade för att inte ge några 'silent - error' i och med att dessa är en direkt fortsättning på hur snurrdiskarna hanterar felsituationer och vill inte vara sämre än dem. SSD har också liknande felhantering men där är det mer osäkert om de är utförda lika bra som som snurrdiskar då det är andra felmekanismer inblandat och inte fullt lika utprövat för 'osannolika fel' som snurrdiskar där felmekanismen är väldigt empiriskt konstaterad under alla åren som magnetmedia har använts och är förutsägbar i beteende och i stort sett alla snurr-HD-tillverkare använder samma lösningar.

Däremot gäller detta inte SD-minnen och som jag nu fick reda på - även en del USB-stickor, av en kamrat som råkat ut för skarpa fel med 'silent error' med just sistnämnda media. Även om minneschippen som sådant har register i sig som indikerar läsfel när det inträffar, så verkar firmwaren i SD-minne och USB-stickor helt ignorerar detta och levererar den felaktiga datan lika glatt som den korrekta data utan fel - dvs. ger 'silent error'

[1] Detta felbeteende att inte leverera någon data vid media-fel (som har blivit standard på snurrdiskar och även optomedia) kommer från WD1003-tiden (diskkontrollerkort från Western Digital) som var standard i IBM:s AT-maskiner på mitten av och slutet av 1980-talet där diskkontrollern helt enkelt vägrade att ge några data mot värden om det var läsfel, kort sagt så levererades det korrekt data (så mycket felrättningen kunde kontrollera med sin räknerymd) eller så levererades det ingen data alls utan det i stället flaggade för mediafel - skulle man läsa ut datat som var korrumperat så behövde man göra specialprocedurer för att läsa ut den felaktiga bitmönstret - bokstavligen hacka sig igenom WD-kontrollern med användande av test-moder som bara är tänkt för utveckling-fasen när man designade diskkontrollerna en gång i tiden.

Var ju precis just det jag sa eller?
Ända skillnaden är att dom registrerar ALLA fel, övriga tillverkare registrerar inte Raw read errors sålänge ECC kan korigera dom.

På flera av Seagate diskarna jag har eller haft så matchar korrigerade fel exakt antalet Raw read errors, när dom inte gör det så dyker även felen upp i andra fälten.

Seagate ger en där med mer information, användbar eller ej kan ju diskuteras, dom loggar anorlunda som sagt inget annat och anlednigen jag sa det är för att många vet inte att Seagate gör så och att det därmed är helt normalt.