Overvågning: Staten arkiverer alle offentligt tilgængelige data på danske hjemmesider (opdateret)

Update: Politikens netudgave har så vidt jeg kan se givet oplysningerne i metroXpress’ artikel en ekstra tand, som det fremgår af nedenstående. Det, som arkiveres er alle offentligt tilgængelige oplysninger, og bibliotekerne får om nødvendigt deres egen profil, hvis det er nødvendigt for at kunne se disse. Pinligt, pinligt  :-). Læs kommentarerne for nærmere info.

Update, II, kl. 12.09: Jeg har kontaktet MetroXpress’ journalist Niels Thimmer, der svarer:

Selv om jeg skriftligt i går fik artiklen godkendt af Eva Fønss-Jørgensen,
så er det ikke korrekt, at private oplysninger høstes.

Vi har rettet artiklen på nettet:

http://www.metroxpress.dk/dk/article/2008/10/17/07/1949-83/index.xml

MetroXpress’ artikel har nu fået tilføjet følgende, som ikke stod der i første omgang: Alt, der er offentligt tilgængeligt, bliver gemt. Private mails forbliver private.

Har du en profil på arto.dk eller dating.dk eller lignende, hvor du gemmer personlige oplysninger eller udveksler beskeder af personlig karakter?

Så bør du vide, at staten får udleveret alle brugernavn og passwords til alle profiler og jævnligt arkiverer alle profilers personlige oplysninger. Hvadbehager?

Denne gang er det ikke PET, men Statsbiblioteket og Det Kongelige Bibliotek, der indhøster de mange oplysninger.

Politiken skriver:

Statsbiblioteket og Det Kongelige Bibliotek har adgang til alle
brugernavne og kodeord på danske internetsider og
arkiverer flittigt alt
fra børns indlæg på Arto.dk til kærlighedserklæringer og profilbilleder
fra Dating.dk.

Teknologien hedder internethøstning, og for tiden høster Netarkivet fire
gange om året samtlige danske hjemmesider.

En række nyheds-, dating- og andre sociale netværkssider bliver dog høstet
dagligt, fortæller Eva Fønns-Jørgensen, der er områdeleder for Netarkivet
på Statsbiblioteket i Århus.

»De danske sites har lovmæssig pligt til at give os adgangskoder. Vi har
siden 2005 høstet tekst, billeder og lyd,« siger hun.

Det er dog endnu kun forskere, der har adgang til den omfattende mængde
personlige materiale fra internethøstningen. Men 70 år efter at en
indehaver af eksempelvis en datingprofil er død, vil alle oplysninger være
offentligt tilgængelige.

Jeg ved ikke, hvor overrasket man bør være, men jeg må indrømme, at jeg er lettere målløs. Det er da ikke 1. april i dag? Og hvad mon man ville sige, om det for 50 år siden var blevet bekendtgjort, at postvæsnet fotokopierede alle folks private breve og udleverede dem til Statsbiblioteket og Det Kongelige Bibliotek “af hensyn til fremtidens forskning”?

Hvor er Datatilsynet henne? Og er det her ikke en potentiel krænkelse af folks privatliv? Vel:

»Vi var kritiske i forhold til lovforslaget og afgav en kritisk udtalelse ud fra et hensyn til de personer, hvis personlige oplysninger bliver gemt. Men nu er det lov, og sådan er det,« siger Datatilsynets direktør, Janni Christoffersen.

Statsbibliotekets netarkiv ser dog ingen grund til at kritisere registreringen.

»Det er jo folk selv, der har valgt at lægge materialet på nettet. Adgangen til vores arkiv er dog meget restriktiv, og det er først, når personen har været død i mange år, at materialet bliver frigivet,« siger Eva Fønns-Jørgensen.

Igen, jeg er virkelig målløs. Når man kan indføre sådan noget uden overhovedet at spørge folk ved man bare, at man lever i et samfund, hvor folks private kommunikation i forvejen overvåges massivt.

Spørgsmålet er, hvad vi kan gøre for at standse det.

Jeg er selvsagt nu lidt mindre målløs – til gengæld understreges betydningen af, at man forsøger at bekræfte især sensationelle historier fra flere, uafhængige kilder. Hvad overvågningen angår, vil jeg dog minde om, at al din email- og telefon-kommunikation samt al din web-læsning stadig bliver logget, med mindre du opholder dig i udlandet eller gør noget aktivt for at forhindre det.

11 thoughts on “Overvågning: Staten arkiverer alle offentligt tilgængelige data på danske hjemmesider (opdateret)”

  1. Jeg ville personligt gerne vide mere om den historie, for jeg synes, den lyder lidt oppustet. Især i omfanget og effektiviteten af registreringen (det rent principielle i, at der registreres er en anden diskussion).

    “for tiden høster Netarkivet fire gange om året samtlige danske hjemmesider.”

    Det er vist så som så -- de ville sikkert gerne, men helt ærligt: så meget styr på den danske del af internettet har Statsbiblioteket ikke. Og har de overhovedet kapaciteten til det?
    Egentlig var jeg kun af den overbevisning, at de fik adgang til de databaser, der kræver password, såsom Infomedia. Jeg tror ikke, de kan høste noget, som jeg i et socialt netværk eksplicit har markeret som delt med de mennesker, jeg selv har givet adgang. Det, som jeg har givet hele netværket adgang til, er en anden sag (også principielt, synes jeg).
    Men jeg kan tage fejl. 🙂

  2. Janus: Jamen, jeg regner da med at følge op på historien. Men der står jo eksplicit, at “børnebørn vil om 70 år kunne læse, hvordan mormor mødte morfar på Dating.dk”.

    Og hvis de har en liste af alle brugernavne og passwords på disse sociale netværkssider, er det heller ikke specielt vanskeligt at arkivere alle de tilhørende data med en “netscraper” eller hvad det nu hedder.

    Om de har kapacitet til det er en anden sag. Men det er, hvad de selv siger, om ikke andet.

    Men som sagt, jeg regner med at følge op på det, hvis/når der kommer nyt …

  3. Jeg ville tale mod bedrevidende, hvis jeg diskuterede datasikkerhed på webapplikationer, men alligevel: Mange webapplikationer gemmer slet ikke brugernes passwords, men en hash-udgave af det.

    Det er muligt, at udviklerne af hjemmesider sørger for at gemme brugernes passwords, når de bliver ændret, men det kræver en direkte programmeringsindsats i softwaren, der ikke altid er udviklet af de samme som de, der benytter softwaren. Der er også ofte beskyttelser indbygget, der får softwaren til at bede om nyt password, hvis man logger ind fra en ny IP-adresse, hvilket burde have givet nogle af de mere årvågne brugere mistanke om overvågning.

    Jeg hælder mere til Janus’ forklaring om, at der kan være kapacitetsproblemer, og at Statsbibliotekets interesse nok især ligger i tidsskrifter, artikler, osv.

  4. wolf: Jaja, men igen er det ikke det, der står i artiklen, og som personerne fra Datatilsynet og Statsbiblioteket forholder sig til.

    Rent teknisk er det her med gemning af passwords som hash rigtigt, men mht tidsskrifter er det jo ligegyldigt -- her kan bibliotekerne jo bare få deres egen bruger. Måske det vitterlig *er* den 1. april i dag, og vi ved det bare ikke? 🙂

  5. Det er faktisk den der med listen over brugernavne og passwords, som jeg lurer lidt på. Umiddelbart ville jeg bare tro, at de har adgang til disse sites på lige fod med andre brugere -- altså: jeg kan selv oprette mig på Arto og kopiere de oplysninger, som folk gør tilgængelige for alle deltagere på sitet, men jeg kan ikke se det, som de markerer som privat. Det er sådan, jeg har opfattet Statsbibliotekets arkivering.
    Hvis de virkelig kan logge på Dating.dk og registrere de mails, folk sender til hinanden, er den da helt gal (kender ikke Dating.dk, men jeg regner med, at der er et internt mail/message-system).

  6. Har en fornemmelse af, at metroexpress lige har givet historien en ekstra tand. Eller rettere: jeg håber, de har gjort det 🙂

  7. Hrrmpff, det kan godt være, jeg har været lidt for hurtig på aftrækkeren:

    http://netarchive.dk/faq/index-da.php#faq_pwd

    “Vi skaffer som udgangpunkt brugernavn og passwords på den måde, alle andre danskere gør: ved at udfylde en formular på de websites, vi gerne vil arkivere. Vi ønsker kun det materiale, som enhver dansker kan se på Internettet.
    Vi ønsker ikke at få nogen brugeres passwords til hverken webmail, bank eller noget i den retning.
    Det vi ønsker er at få oprettet en bruger så vi kan læse f.eks. de nyhedssites som kræver at man logger ind. På gratis nyhedssites, kan vi selvfølgelig bare oprette en bruger, men fx. betalingsaviser bliver vi nødt til at rette henvendelse for at få et brugernavn og password. Det er derfor der er et punkt i loven om brugernavne og passwords; for at vi kan få disse brugernavne/passwords uden betaling.
    Materiale, der kun er beregnet for en lukket skare (som alle derfor IKKE i princippet kan få adgang til -- fx. familie-websites, firmaers intranet…m.m.) anses ikke for offentliggjort og falder derfor ikke ind under bestemmelsen.”

    Det vil også forklare, hvorfor bibliotekarerne på Statsbiblioteket ikke ser nogen problemer i fremgangsmåden. Hmmm, lettere pinligt hvis jeg har været for hurtigt på aftrækkeren -- men jeg følger i alle tilfælde op på det og opdaterer historien, hvis det bliver nødvendigt …

  8. Synes ikke, du er for hurtig -- det er jo det, der står i artiklen.

    Jeg studsede selv over den på tekst-tv i morges, men var heldigvis for træt til at blive forarget 🙂

  9. Morfar: Flere terabyte pr. dag er det nu nok ikke. Men det er meget, det kan vi blive enige om.

    Men den holder som sagt heller ikke. Se Update.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.