Statustråd - info om servrar som är nere

Permalänk
Medlem

Statustråd - info om servrar som är nere

Jag tänkte att vi kan ju ha en standardtråd för att meddela problem med olika servrar, kan vara bra info för de som inte hänger på Foldingforum dygnet runt. Nån får gärna klistra den här, kan vara bra att ha på toppen.

Försök håll tråden ren från irrelevant info, och om ni upplever problem med någon server - klipp in från er loggfil som jag gjort nedan så ser vi enkelt vad det handlar om.

Jag klipper in exempel från min loggfil så ni vet hur det ser ut ifall ni inte sett det förut.

Aktuell status försöker jag visa här:

----------------------------------------------------------------------------
Status 2008-10-27 17:00 --> FAIL!
----------------------------------------------------------------------------

Jag editerar tråden när något inträffar!

Resultatservers:
- allt verkar fungera som det skall!

[20:27:16] + Attempting to send results [October 24 20:27:16 UTC]
[20:27:18] - Couldn't send HTTP request to server
[20:27:18] + Could not connect to Work Server (results)
[20:27:18] (171.64.65.20:8080)
[20:27:18] + Retrying using alternative port
[20:27:19] - Couldn't send HTTP request to server
[20:27:19] + Could not connect to Work Server (results)
[20:27:19] (171.64.65.20:80)
[20:27:19] - Error: Could not transmit unit 01 (completed October 24) to work server.

WU-servrar:

171.64.65.20
171.64.65.106 - stendöda...
171.64.65.103 - svårt överbelastad

171.64.122.74 - fungerar, men man blir inte skickad dit.. :/
171.67.108.11 - fungerar, men har nästan slut på WUs att dela ut!

[20:49:54] + Attempting to get work packet
[20:49:54] - Connecting to assignment server
[20:49:54] - Successful: assigned to (171.67.108.11).
[20:49:54] + News From Folding@Home: GPU folding beta
[20:49:55] Loaded queue successfully.
[20:49:55] + Could not connect to Work Server
[20:49:55] - Attempt #9 to get work failed, and no other work to do.
Waiting before retry.

Jag ser även problem med "assignment servers" ibland, dvs de maskiner som man connectar till först som sedan ska skicka en vidare till en lämplig WU-server. I många fall nu gör de inte det utan failar direkt. Det ser ut såhär i loggen:

[21:11:23] + Attempting to get work packet
[21:11:23] - Connecting to assignment server
[21:11:24] + No appropriate work server was available; will try again in a bit.
[21:11:24] + Couldn't get work instructions.

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk
Medlem

Jag har samma problem som dig. GPU klienten vägrar skicka iväg sitt arbete. Min CPUklient fungerar dock som den ska, tror jag iaf. Den gjorde då det igårkväll när jag kollade.

Permalänk
Medlem

Uppdaterat.. Stora problem att få nya WUs för GPU-klienten. Alla servrar verkar mer eller mindre gå på knäna, vi hoppas att det löser sig inom kort!

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk

171.64.65.64 verkar inte må så bra den heller... =/

Permalänk
Medlem

Ack..

Nu börjar 171.64.65.106 att släppa lite WUs, det är positivt.. Jag har fått ett par nu.

Det är vanskligt det här. I princip är alla serverproblem ett kaskadproblem som börjar med att 171.64.65.20 går ner, och då skyfflas trafiken över till de andra servrarna, som i sin tur blir överbelastade, vilket leder till att folk startar om klienterna i ett försök att få nya WUs, vilket i sin tur leder till en extrem "net load" på de maskiner som fortfarande är uppe, vilket till slut brukar leda till att fler servrar kraschar.. Rena cirkusen. Lustigt att det i stort sett alltid är 65.20 som dyker först.. Vi har påpekat detta flera ggr till Pande, så de vet helt klart om problemen.

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk
Medlem

Är det nån mer som har problem nu? Jag får inga WUs till mina klienter.

Visa signatur

AMD Athlon XP 2000+(Palomino) | 512MiB DDR333 | Gigabyte GA-7VRXP | Point of View GeForce 4 Ti4200 XP | 2x IBM Deskstar 80GB i Raid 0 | Chieftec Dragon | Win2k |

AMD Ryzen R7 5700X | 16GiB DDR4 3200 CL14 | MSI B450 Tomahawk II | Sapphire RX5700 Pulse | Intel 660p 1TiB | Nanoxia Deep Silence | AOC CQ32G1 144Hz 1440p | Win 10 |

Permalänk
Medlem

Jo jag har märkt hur vår PPD har minskat en hel del. Hoppas det fixar sig. Pandelab borde kanske fixa fler servrar som klarar trycket.

Men det verkar funka ok för mig med ATI-kort. Och CPU-kärnorna har arbete. Fick dock 2 st EUE på projekt 2492 (Gromacs FahCore_78).

Visa signatur

AMD Ryzen 5 3600 | 4x8GiB 18-20-16-36-52-2T DDR4-3400 | MSI B450-A Pro Max AGESA 1.2.0.7 | Sapphire RX 480 Nitro+ OC 8GiB | Crucial MX500 500GB | PNY CS900 2TB | Samsung 850 EVO 500GB | Samsung PM961 512GB | Scythe Kamariki 4 450W