Open AI tränade GPT-4 med Youtube – i över en miljon timmar

Permalänk
Melding Plague

Open AI tränade GPT-4 med Youtube – i över en miljon timmar

AI-företaget har vänt sig till Youtube för träningsdata i ren desperation enligt New York Times.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Tror att vi kommer få se stora skadestånd/förlikningar mellan aktörer i takt med att AI-boomen accelererar. Större risk för små aktörer, Open AI (errr Microsoft) har råd att punga ut i förlikningar.

Permalänk

Det kommer gå bra, vi i väst kommer bråka som bara tusan med oss själva angående Ai. Alltifrån att Ai ej får använda data från olika källor, till att Ai inte får ge ett svar som kränker någon inklusive de på ytterkanterna.
Övriga världen skiter i detta och bara kör på. Undra vem som vinner Ai racet?

Permalänk
Medlem

Det är alltså inte vilken data som helst som duger, utan specifikt bekräftad data med metadata och sammanhang som man vet är så korrekt det går

Permalänk
Medlem
Skrivet av lillaankan_i_dammen:

Det kommer gå bra, vi i väst kommer bråka som bara tusan med oss själva angående Ai. Alltifrån att Ai ej får använda data från olika källor, till att Ai inte får ge ett svar som kränker någon inklusive de på ytterkanterna.
Övriga världen skiter i detta och bara kör på. Undra vem som vinner Ai racet?

Personligen ser jag hellre att något så transformerande som detta görs under kontrollerade former än att vi vinner någon form av race, men you do you.

Visa signatur

CPU: AMD Ryzen 7 7800X3D CO + 2133 MHz FCLK GPU: Sapphire RX 7900 XT Pulse OC
RAM: Corsair 2x16GB 6000 MT/s CL30 (Hynix) BZ subtimings
MB: ASUS ROG Strix B650E-F Gaming WIFI SSD: Kingston KC3000 2TB PSU: Corsair RM850x

Permalänk
Medlem

De behöver träna modellerna med bra data. Nu verkar det mer att de tränar på all data. Beroende på vad tanken med modellerna är. Men för att ge mer exakta svar borde modellerna tränas på riktiga forsknings papper, istället för Wikipedia och YouTube. Dock är det enklare att kopiera data direkt från internet, istället för att scanna, och rensa upp datan från forsknings papper eller böcker.

Permalänk
Skrivet av Thunde:

De behöver träna modellerna med bra data. Nu verkar det mer att de tränar på all data. Beroende på vad tanken med modellerna är. Men för att ge mer exakta svar borde modellerna tränas på riktiga forsknings papper, istället för Wikipedia och YouTube. Dock är det enklare att kopiera data direkt från internet, istället för att scanna, och rensa upp datan från forsknings papper eller böcker.

Jag ser det som om man tränar ett barn endast på riktiga forsknings papper, istället för Wikipedia och YouTube. Så kan det bli ett väldigt konstigt barn som får det svårt med det sociala.

Med det sagt, Ai behöver tränas på i princip allt. Hur man ska få Ain att skilja på olika källor etc är en bra fråga utöver min författningsförmåga. Det jag påstår är mer att Ain på något sätt behöver tränas på mer vardaglig information.

Ai kan sedan användas till så otroligt mycket och kostnadseffektivisera. Rent generellt tycker jag folk överdriver teknikutvecklingen. Bara kolla på mobiltelefonerna som ändå har utvecklas bland det snabbaste. Det är inte en gigantisk skillnad på en iPhone 15 och en iPhone 6. Bara lite förfinat.
Så jag tror att Ain kommer utvecklas snabbt, men det kommer ej förändra saker så supersnabbt. Mer då än vissa jobb som telefonväxeloperatör och liknande.

Permalänk
Medlem

Riktigt smutsigt beteende.

Permalänk
Medlem

Så.... Vem är vi här på denna planet?
En del väljer att posta saker för att bli sedda..

Skall (vi) dem begränsa AI's att bara se the "bra" "vetenskapliga" saker folk postar?

Vi trodde världen skulle bli bättre när vi alla fick full tillgång till "information" med Internet...

Allt som hände var att vi fick det vi redan trodde vi visste.. fick höra vad vi redan trodde.. (eko kammare)

Att tro att AI som vi programerat skulle tro tycka uttrycka något annat...?

VAKNA!

Visa signatur

42? Seven and a half million years and all you can come up with is 42?!
► FD Define R2 | Win10Pro | i7-3770K | Hyper212+ SP120PWM | P8P67 PRO | CML8GX3M2A1600C9 | 1080 Ti | AX750 | Asus VG27WQ | Eizo S2100 | HP Z24n |► OnePlus 6 |

Permalänk
Medlem

Ur det här så gör jag ett antagande att AI:n kommer att ge skötselråd hur barn ska sminka sig och att katter är gulliga samtidigt satans egna lilla hantlangare.

Visa signatur

AMD Ryzen 3900X, Gigabyte X570 AORUS ELITE,
G.Skill Flare X 32GB 3200MHz, FOCUS GX 850W, SSD 125 och 500GB, HDD 2tb, Gainward GeForce RTX 4090 Phantom
Laptops:MSI GT73VR 6RE Titan

Permalänk
Medlem
Skrivet av xfade:

Allt som hände var att vi fick det vi redan trodde vi visste.. fick höra vad vi redan trodde.. (eko kammare)

Har ju bara blivit ännu värre med alla algoritmer som ska "forma" internet runt användaren, vidrigt är vad det är. Ser samma skit med AI, Musk släpper sin variant som är politiskt rätt enligt hans världsuppfattning osv...

Visa signatur

7800X3D//4090
MINT XFCE // W11 🤮

Permalänk
Hedersmedlem

Well, det kunde varit värre. 1 Miljon timmar från LiveLeak med diverse halshuggningar, skolskjutningar och diverse våldsdåd. Hej och välkommen Skynet

Visa signatur

|| SWECLOCKERS.COM ||
|| Självutnämnd Silverstone FT02-riddare ||
|| Silverstone FT02B-WRI "Limited Edition" No. 0743 & 0640 ||
|| Sweclockers officiella FT02-tråd ||

Permalänk
Medlem
Skrivet av firstofmay:

Har ju bara blivit ännu värre med alla algoritmer som ska "forma" internet runt användaren, vidrigt är vad det är. Ser samma skit med AI, Musk släpper sin variant som är politiskt rätt enligt hans världsuppfattning osv...

Tänker, musk å de andra vill att vi skall används deras platform. de kommer låta oss höra å se vad vi vill höra.
Så vi kommer tillbaka.

Så skulle jag matat min AI... (om jag hade ett vinst intresse i pengar eller användre i min plattform, vilket kommer att leda till slut till en vinst)

Visa signatur

42? Seven and a half million years and all you can come up with is 42?!
► FD Define R2 | Win10Pro | i7-3770K | Hyper212+ SP120PWM | P8P67 PRO | CML8GX3M2A1600C9 | 1080 Ti | AX750 | Asus VG27WQ | Eizo S2100 | HP Z24n |► OnePlus 6 |

Permalänk
Medlem

Det roliga är att google inte törs stämma nu för de vet att de tränat sin egen AI på samma sätt

Visa signatur

Processor: Motorola 68000 | Klockfrekvens: 7,09 Mhz (PAL) | Minne: 256 kB ROM / 512 kB RAM | Bussbredd: 24 bit | Joystick: Tac2 | Operativsystem: Amiga OS 1.3

Permalänk
Medlem

Jag hoppas de fick nytta av mina YouTube Poops.

Visa signatur

På Internet sedan 1997.

Permalänk
Medlem

Är det därför dessa AI svarar så ofta fel? Källan är youtube..

Visa signatur

JJ2 Multiplayer
JJ2 ZStats

[1] Ryzen 5800X | 5500XT | Kingston A2000 | Lenovo G24-10 144Hz [2] Ryzen 5700G | RX 560 | WD Blue SN550 [3] Ryzen 5600G | Kingston A2000 [4] Ryzen 3600 | GT 740 | 850 EVO [5] Ryzen 3600 | Geforce 405 | 850 EVO (alla är i bruk)

Permalänk
Medlem
Skrivet av maweric:

Är det därför dessa AI svarar så ofta fel? Källan är youtube..

Mycket är för att den är så begränsad i efterhand med snäva regler att förhålla sig efter. Den ofiltrerade gpt4 är väldigt imponerande.

Visa signatur

Laptop Workstation PC Specialist || Intel 10875H - 250mv & Liquid Metal || Nvidia RTX 2070 883mv @ 1935MHz & Liquid Metal ||64GB Ram || Samsung 970 EVO 2TB + 512GB OEM || 1TB & 512GB External SSD + 2.5TB NAS
Lyssna gärna på mitt band The Mulak Mind
Citera gärna om du vill ha svar!

Permalänk
Medlem

Antingen är väst med och slås om bästa AI, eller så låter vi stormakter(Ryssland+Kina) som inte respekterar copy right vinna det förstärkta intelligenskriget.

Permalänk
Medlem

Öppna upp allt bara, free for all for the greater good. Har hellre en AI assistent som sett alla filmer, läst alla böcker, all forskning osv, än en AI som måste googla allt.

Permalänk
Sötast

Haha storbolagen får sno från gemene man, men de får såklart inte sno av varandra! De borde köpt av varandra istället för att vara sådana drägg.... vi har ju redan alla data till dem redan!

Permalänk
Medlem
Skrivet av talonmas:

Det roliga är att google inte törs stämma nu för de vet att de tränat sin egen AI på samma sätt

Nu ingår ju Youtube i samma ägarstruktur som Google så jag tror inte att det finns en sådan rädsla.

Permalänk
Medlem

Sitter själv och funderar på om man kan lära AI att realtidsmappa en bil.

Visa signatur

Gammal men bra.

Permalänk
Medlem

- Spela upp 5 sekunder av någon annans musik: "Vi har rätt till alla intäkter från din video"
- Träna sin produkt på allt innehåll som någonsin laddats upp på sidan: "Fair use".

Visa signatur

Define XL R2 || CM Silent Pro M1000 || Asus Z490-F || Intel i9 10900k || Noctua NH-D15 || RTX 2080 || 64GB DDR4 || 1TB 970 Evo Plus M.2 + 1.5TB SSD + 2TB HDD || Win10 Pro

Permalänk
Medlem

Eeh jag trodde program som gpt4 behövde väldigt specifik data att träna på. Typ bilder och video där en människa tydligt taggat att detta är en hand, detta är en bil...osv. Men man kan kan bara sätta det att glo på youtube och den lär sig något?
Sjukt imponerande Isof, då har ju gpt möjlighet att bli något mer än T9 på steroider!

Visa signatur

"Jag är så gammal att jag brukade styra med piltangenterna"
StoppaCopySwede
Fraktrfitt:Inet

Permalänk
Skrivet av Orisons:

Eeh jag trodde program som gpt4 behövde väldigt specifik data att träna på. Typ bilder och video där en människa tydligt taggat att detta är en hand, detta är en bil...osv. Men man kan kan bara sätta det att glo på youtube och den lär sig något?
Sjukt imponerande Isof, då har ju gpt möjlighet att bli något mer än T9 på steroider!

Se det som att träna ett barn. En bildbok med detta är en hand, katt, bil etc kan vara bra i början. Vill man utveckla mer så får man bredda området. En Ai kan då lära sig en hel del från youtube, precis som en människa kan.

Jag skulle även tro att många frågor som folk frågar Ai inte är av typen vad är svaret på den yttersta frågan om livet, universum och allting? Utan mer frågor om någon känd youtuber etc.

Permalänk
Medlem

" ett mål för språkmodellerna är att de ska kunna generera sin egna data."
Ehhh???
Träna modeller på data som den egna modellen skapat?? Känns som saker och ting kan gå "sideways" riktigt fort...

Visa signatur

Asus Sabertooth X58 - Xeon X5680 - 12GB DDR3 - ASUS GTX1080 8GB

Permalänk
Medlem

Hur långt är det kvar innan AI gör alla IT-jobb som inte kräver praktiska färdigheter till lågavlönade arbeten eftersom vem som helst kommer kunna utföra dem med hjälp av AI?

Permalänk

Dax att skicka ut AI till Deep web om det nu finns för lite info för den på vanliga internet

Visa signatur

AMD Ryzen 9 5900X /Radeon RX 6950XT / Gigabyte X570 AORUS ULTRA / 32gb Corsair Vengeance RGB PRO DDR4 3600MHz /, EVGA Supernova G2 850W PSU/ Lian-li O11 Dynamic /M.2 Samsung 950pro,WD BLACK SN750 /EKWB Watercooling 240+120mm radiator /Corsair Hydro X Series XC7 RGB / Corsair K70 RGB / Phillips 27" G-sync + 2st 27" AOC .

Permalänk
Medlem
Skrivet av Dem8n:

Hur långt är det kvar innan AI gör alla IT-jobb som inte kräver praktiska färdigheter till lågavlönade arbeten eftersom vem som helst kommer kunna utföra dem med hjälp av AI?

Fast då är det väl inte AI som tar över om det behövs en lågavlönad för att faktiskt utföra jobbet?

Är inte så stor skillnad från dagens lågavlönade "IT-jobb" där folk går efter ett manus, kanske blir den supporten/kundtjänsten bättre.

Permalänk
Medlem

Så de har använt AI-genererad text (behäftad med ganska frekventa fel) till att träna en annan AI på att generera text?
Kan inte vara bra...