ChatGPT blev trænet af danske hestetøser - Hyggesnak

Hyggesnak

ChatGPT blev trænet af danske hestetøser

Forfatter:	Henrik (HN)
Dato:	25-09-2023 17:08

Indsat fra nyheden ChatGPT blev trænet af danske hestetøser:

Det kendte amerikanske finansmedie Bloomberg har opsnappet en ellers overset dansk forskningsartikel fra 2021, hvor det fremgår at brugernes debatter på Heste-Nettet udgør en væsentlig del af de danske tekster, der er blevet benyttet til at udvikle den danske sprogmodel, der bl.a. ligger til grund for den dansksprogede del af kunstig intelligens løsninger, som f.eks. ChatGPT.

Af en tabel på side 4 i forskningsartiklen fremgår det at Heste-Nettets brugerskare med 22% (forfulgt af Statens Retsinformation med 18%) er den største enkelte bidragsyder til det såkaldte Danish Gigaword Corpus (DAGW), beskrevet som "a billion-word corpus of language across various dimensions, including modality, time, setting, and place".

Artiklen på Bloomberg forklarer hvorfor indhold fra Heste-Nettet var et godt supplement til de øvrige offentligt tilgængelige tekst-kilder, som ChatGPT projektet kunne få adgang til.

Som aktiv bidragyder til debatterne på Heste-Nettet behøver man ikke være nervøs over brugen af indholdet til udvikling af danske AI (kunstig intelligens) sprogmodeller. Træningen af disse foregår lidt forsimplet ved at modellen for hvert ord, der forekommer i det såkaldte "tekst-korpus", lærer hvad de mest sandsynlige efterfølgende ord kan være. Der gemmes således som udgangspunkt ikke hele sætninger eller tekster på samme måde, som f.eks. søgemaskiner gør det for at generere deres søgeindeks og kunne vise "cachede" kopier af indholdet.

Men hvis du synes at ChatGPT formulerer sig som en mellemting mellem en embedsmand og en hestetøs, er det altså ikke så underligt ...

Foto: Photo by Sanket Mishra from Pexels

Svar på denne tråd

Tak for det :)

Forfatter:	Leon Derczynski (Skriv besked)
Dato:	26-09-2023 08:52

Faktatjek - jeg er ikke dansk - men kan godt lide heste!

Svar på denne tråd

Tjae..

Forfatter:	Doctor Who (Skriv besked)
Dato:	26-09-2023 19:55

Jeg sidder i min baghave, ser solen gå ned, himlen skifte farver...

Noget stort prutter derude på mine folde.
Tjek, jeg har heste.

Gramser mig selv på Thorax. Tjek, doktoren er stadig en dame..!

Jeg er tredje generation på denne ejendom. Selv dansk folkeparti må være enige i, at jeg er dansk...

Danske hestetøser.. Hæhæ.. Skal jeg føle mig ramt.

Selvfølgelig bruger de hestenettet...
Hestenettet ved alt...!

Svar på denne tråd

Så vildt

Forfatter:	HundeGitteMor (Skriv besked)
Dato:	28-09-2023 10:17

at gode gamle HN kan bruges til det :-)

Svar på denne tråd

Artikel og uddybende podcast på DR

Forfatter:	Henrik (HN) (Skriv besked)
Dato:	28-09-2023 21:34

DR har i dag været grundigt rundt om emnet med både

1) en artikel,

2) en mere uddybende teknologi podcast (lyt til intro + fra ca 42 minutter inde i podcasten)

3) et interview med tidligere nyhedsredaktør Julie Taylor om dette emne.

mvh.
Henrik (HN)
Heste-Nettet Teknik

Svar på denne tråd

Jamen, jeg

Forfatter:	Tine A (3) (Skriv besked)
Dato:	08-10-2023 23:04

Har det ikke supergodt med, at alt det vrøvl, jeg har lukket ud i tidens løb, lever evigt på nettet.

Men jeg behæmrkede at Chatbotten/AI, især ledte på unge menneskers sprog (Kulturnyt på P1, hvor Julie Taylor var med, og hun havde vist glemt alle de der "krige" om støvsugerridning og den slags, hun SELV var med i.)

Men det lyder jo til, at det er JuniorHN, der er høstet i. Hvordan har de unge mennesker det så, med det?!

Til lykke Henrik, dit store arbejde med HN kom omsider til offentlighedens kendskab. ;-)

Vi andre har åbenbart ikke ophavsret til vores indlæg?

Mvh

Tine

Svar på denne tråd

Tilføj til Mine debatter

Forrige tråd | Næste tråd

Rider du i din lokale skov?
Log ind for at deltage i afstemningen

Vælg bruger type