Vad är bäst att lära sig för skapa en informationsinsamlare?

Permalänk
Medlem

Vad är bäst att lära sig för skapa en informationsinsamlare?

Jag vet, jättedålig rubrik.

Jag lägger ut säljesannonser på prylar.
När jag skriver dessa annonserna så besöker jag först en webbsida och får fram alla deras säljesannonser med samma föremål/id.
Så ser jag vilka priser andra säljer för.
Och gör en bedömning var mitt pris ska ligga.
Jag noterar även detaljer som andra har skrivit in om objektet, såsom årtal.

Det här tar ju ~15 minuter att hålla på med per objekt.
Och jag tror det skulle bli stor tidsbesparing i längden om jag kunde skapa något automatiskt som gick in på webbsidan och plockade ut önskad data åt mig och presentera det på önskvärt sätt.

Jag har bara pysslat med webbdesign och sql-databaser förut, började kolla på phyton.
Vad skulle ni säga är det jag behöver lära mig för bäst kunna göra en datainsamlings-lösning?

(Behöver inte lagra, bara samla in och visa tillfälligt)

Permalänk
Medlem

Python låter förträffligt för jobbet. Finns ett lib som heter BeautifulSoup för att parsa html. Fråga bara ChatGPT hur man ska göra. Sedan använder du OpenAI's API för att ta fram det du ska utifrån texten du fått från BeautifulSoup, ChatGPT kan hjälpa dig med att använda sitt eget API också så att säga.

Permalänk
Medlem

Låter ut som det är "web scraping" du vill göra, alltså att parsa data från en webbsida.
Om det är Python du vill använda så verkar Beautiful Soup vara ett alternativ:
https://www.twilio.com/blog/web-scraping-and-parsing-html-in-...

Detta förutsätter ju då att sidan du parsar alltid har den HTML-kod du förväntar dig för att du ska kunna parsa ut rätt info.

Ett annat alternativ är att parsa sidan med regex istället men det blir lite krångligare.

Visa signatur

Acer Predator Helios 18 Core i9 32GB 1024GB SSD RTX 4080 250Hz 18"