Data over levende personen op Wikidata en Wikipedia

ARCHIEF

Achtergrond

Een paar weken terug was er in de Kroeg een discussie over -kort samengevat- de wenselijkheid en wettelijkheid van het delen van (zeer) persoonlijke gegevens over levende personen op Wikidata en Wikipedia. Wikimedia Nederland heeft toen aangeboden om een bredere discussie over dit onderwerp te faciliteren.

Voor ons zou het doel van de discussie moeten zijn om scherper te definiëren welke zaken als problematisch worden ervaren, hierover advies van deskundigen in te winnen, en de gemeenschap in staat stellen een onderbouwde beslissing te nemen over de vraag of er eventueel aanpassingen nodig zijn in de manier waarop met data over levende personen wordt omgegaan.

We stellen het volgende proces voor:

Stap 1: Het formuleren van een beperkt aantal vragen die de problematiek adequaat verwoorden. De Kroeg-discussie levert daarvoor volgens ons al voldoende basismateriaal; we stellen voor dat wij op basis van die discussie met een eerste voorstel komen voor een aantal vragen. Die kan de gemeenschap aanvullen, verbeteren, wijzigen...

Stap 2: Benaderen van een aantal deskundigen (te selecteren in overleg met de gemeenschap) op gebied van privacywetgeving/AVG, Wikimedia missie & Wikimedia Terms of Use, bredere ethische en veiligheidsaspecten rondom persoonsdata. Wij vragen ieder van hen om een beknopte notitie waarin ze hun mening geven over één of meer van de geformuleerde vragen.

Stap 3: De notities worden gepubliceerd zodat de gemeenschap commentaar kan leveren en vragen kan stellen. Vervolgens is er een Webinar/online workshop waarin de deskundigen hun mening toelichten, commentaar geven op elkaars visie en vragen vanuit de gemeenschap beantwoorden.

Stap 4: Op basis van de input van de deskundigen en de discussies antwoorden formuleren op de vragen uit stap 1. Dat vormt dan de basis voor een discussie in de gemeenschap over eventuele noodzakelijke of gewenste vervolgstappen.

Stap 1: de vragen

Vraag 1:

Op Wikidata en op Wikipedia, en in mindere mate ook op Wikimedia Commons, worden data over levende personen verzameld, gestructureerd en wereldwijd beschikbaar gemaakt - ook voor hergebruik. Hieronder is ook informatie die doorgaans als ‘gevoelig’ of ‘zeer persoonlijk’ wordt beschouwd. Al deze informatie is al eerder in verschillende, door de Wikimediagemeenschap betrouwbaar geachte, bronnen gepubliceerd.

De persoonlijke informatie kan:

  • verwerkt zijn in de tekst van encyclopedische artikelen
  • als categorie (trefwoord) aan een artikel zijn toegevoegd
  • zijn opgenomen in een data-item of infobox,
  • gebruikt zijn voor het creëren van een lijst van personen met dezelfde persoonlijke eigenschap.

Is dit binnen nationale en internationale wet- en regelgeving toegestaan?


Vraag 2:

Als het is toegestaan, is er dan - op basis van b.v. jurisprudentie of lopende politieke en maatschappelijke discussies - reden om te verwachten dat het op deze manier verzamelen en beschikbaar maken van persoonlijke data in de nabije toekomst aan aanvullende regels zal worden gebonden?


Vraag 3:

Is het op deze manier systematisch verzamelen, structureren en beschikbaar maken van (persoonlijke) informatie over levende personen op Wikipedia en Wikidata in overeenstemming met de Terms of Use voor de Wikimedia-sites en ander relevant richtinggevend beleid van de Wikimedia Foundation?


Vraag 4:

Is op basis van bestaande inzichten en ervaring in te schatten of het systematisch verzamelen, structureren en permanent beschikbaar maken van persoonlijke data (die op zich al wel openbaar waren) kan leiden tot nadelige gevolgen voor betrokken personen? Is aan te geven welke data in die zin het meest risicovol zijn?


Vraag 5:

Ziet u in zijn algemeenheid een noodzaak om het beleid inzake omgaan met persoonlijke data op Wikipedia, Wikidata of Wikimedia Commons aan te passen?


Vraag 6:

Wilt u de Wikimedia-gemeenschap vanuit uw expertise en ervaring een advies meegeven over het omgaan met persoonlijke data op Wikipedia, Wikidata of Wikimedia Commons?


Stap 2: de deskundigen

Benaderd

  • Bits of Freedom - non-profit organisatie die opkomt voor internetvrijheid in Nederland, in het bijzonder communicatievrijheid en privacy. (overlegt intern)
  • Wikimedia Foundation - deskundig op het gebied van Wikimedia Terms of Use en wettelijke verplichtingen van de Foundation als platformbeheerder (toegezegd)
  • Arnoud Engelfriet (toegezegd)

Mogelijk voor second opinion/webinar:

  • Marian Korpershoek
  • Loef Advies - adviseur op het gebied van AVG en archieven. Adviseerde o.a. Stichting Academisch Erfgoed over AVG-aspecten van het project Wiki-Wetenschappers.
  • Prof. mr. G.J. Zwenne, hoogleraar recht en de informatiemaatschappij Universiteit Leiden, advocaat te Den Haag bij Pels Rijcken & Droogleever Fortuijn, auteur en redacteur van de uitgave Tekst & Commentaar Privacy- en telecommunicatierecht, 6e druk, 2018, ISBN 978 90 13 143089

Informatie voor deskundigen (briefing note)

Hieronder een concept-tekst voor de deskundigen om de problematiek te schetsen. Hierin zijn ook een aantal van de opmerkingen die gemaakt zijn met betrekking tot de formulering van de vragen meegenomen Sandra Rientjes - Wikimedia Nederland (overleg) 5 jun 2020 13:23 (CEST)[reageren]


in English (pdf)

Achtergrond

De Wikimediabeweging is een wereldwijde vrijwilligersbeweging die zoveel mogelijk kennis vrijelijk toegankelijk wil maken voor iedereen.

Dit gebeurt via een aantal projecten (‘websites’), waarvan de internet-encyclopedie Wikipedia het bekendste is. Wikidata is een relatief nieuw Wikimediaproject: een snel in omvang en relevantie groeiende vrij toegankelijke en bewerkbare database.

Kenmerkend voor de Wikimedia-projecten is dat alle informatie die zij bevatten vrij te hergebruiken is, en dat alle inhoud door iedereen kan worden bewerkt of aangevuld.

Eigenaar van de domeinnamen en de servers is de Wikimedia Foundation, een Amerikaanse non-profit. Hoewel het inhoudelijk beheer van de projecten volledig in handen is van vrijwilligers, is de Wikimedia Foundation juridisch eindverantwoordelijk. Bijvoorbeeld: als op een van de projecten materiaal is geplaatst dat auteursrechtelijk is beschermd, zal in laatste instantie de Wikimedia Foundation door een (Amerikaanse) rechter worden gesommeerd om het te verwijderen. Bij een gerechtvaardigde claim zullen echter in de meeste gevallen de vrijwillige bewerkers het materiaal al hebben verwijderd voordat het zover komt.

In verschillende landen bestaan Wikimedia-verenigingen (chapters) die in hun regio de vrijwilligers en de projecten ondersteunen. Deze chapters hebben geen formele bevoegdheden of verantwoordelijkheden inzake de inhoud van de Wikimediaprojecten.

Het bestuur van de Wikimedia Foundation heeft kaders bepaald voor het opnemen van informatie of media over levende personen voor alle Wikimedia-projecten.

“The Wikimedia Foundation Board of Trustees urges the global Wikimedia community to uphold and strengthen our commitment to high-quality, accurate information, by:

  • Ensuring that all projects in all languages that describe or show living people have policies in place calling for special attention to the principles of neutrality and verifiability in those articles;
  • Taking human dignity and respect for personal privacy into account when adding or removing information and/or media, especially in articles or images of ephemeral or marginal interest;
  • Investigating new technical mechanisms to assess contributions , particularly when they affect living people, and to better enable readers to report problems;
  • Treating any person who has a complaint about how they are portrayed in our projects with patience, kindness, and respect, and encouraging others to do the same.”

https://foundation.wikimedia.org/wiki/Resolution:Media_about_living_people


Binnen de Nederlandse Wikimedia-gemeenschap leven vragen over de ethische en juridische grenzen van het verzamelen en publiceren van gegevens over levende personen op verschillende Wikimedia projecten. Het gaat hierbij met name om Wikipedia en Wikidata, en in mindere mate om Wikimedia Commons.


Gegevens over levende personen op Wikipedia

Voorbeeld: Wikipedia-artikel over levende persoon.

De internet encyclopedie Wikipedia maakt kennis toegankelijk door middel van encyclopedische lemma’s die door vrijwilligers worden geschreven. Wikipedia is niet thematisch begrensd en bevat ook biografische artikelen over levende personen.

Elk Wikipedia-artikel moet aan een aantal eisen voldoen: zo moet het onderwerp encyclopedisch relevant zijn en moet de informatie berusten op verifieerbare en betrouwbare bronnen. Ook dient een artikel neutraal te zijn in toon en inhoud.

Voor artikelen over levende personen gelden daarnaast specifieke strengere richtlijnen. https://nl.wikipedia.org/wiki/Wikipedia:Biografie%C3%ABn_van_levende_personen. Daarin staat onder andere:

“Gebruikers dienen bijzondere zorgvuldigheid te betrachten bij het opnemen en bewerken van informatie over levende personen. Het op waarde schatten en neutraal weergeven van dergelijke informatie vereist een grote mate van tact en inlevingsvermogen. De van toepassing zijnde wetgeving moet strikt worden nageleefd, en nog strikter dan bij andere artikelen gelden deze drie zuilen van de Wikipediafilosofie: neutraal standpunt, verifieerbaarheid en geen origineel onderzoek.”

“Een belangrijke vuistregel bij het weergeven en redigeren van informatie over bestaande personen is "doe geen kwaad" , oftewel: berokken geen schade. /../ Alle informatie over levende personen moet met terughoudendheid en afstandelijkheid worden geschreven, en met de hoogste achting voor de privacy van het onderwerp. “

Biografische Wikipedia artikelen kunnen informatie bevatten over zaken die doorgaans als persoonlijk of gevoelig worden gezien, zoals godsdienst, seksuele geaardheid, ziektes, strafblad. Welke persoonsgegevens in een lemma over een levende persoon worden opgenomen, hangt af van:

  • de data die openbaar beschikbaar zijn in een bron die door de Wikimediagemeenschap betrouwbaar wordt geacht.
  • geldende regels en afspraken op Wikipedia afwegingen van individuele Wikimedianen.

Deze informatie kan ook worden opgenomen in de zogenaamde infobox, waarin belangrijke feiten uit de biografie puntsgewijs worden opgesomd. Behalve biografische artikelen over levende personen kent Wikipedia ook de zogenaamde ‘lijst-artikelen’, waarvan sommige(ook) levende personen met een bepaald kenmerk opsommen:

Ten slotte worden artikelen (ook biografische artikelen) in een of meer categorieën geplaatst die een belangrijk aspect van de encyclopedische relevantie van de persoon karakteriseren, zoals ‘Nederlands belegger’ of ‘Transgender persoon’ of ‘Ex-moslim’of ‘Nederlands vlogger’.


Gegevens over levende personen op Wikidata

Voorbeeld: Wikidata-item over levende persoon

Wikidata is een vrij toegankelijke, mens- en machineleesbare database die in het publieke domein beschikbare gegevens bijeenbrengt, structureert en toegankelijk maakt. Wikidata is niet thematisch begrensd en bevat gegevens over levende personen.

De criteria voor opname van een data-item over een persoon in Wikidata zijn minder streng dan voor het opnemen van een biografisch lemma in Wikipedia. Niet elke wethouder van een kleinere gemeente krijgt een Wikipedia-artikel, maar er is geen bezwaar om alle wethouders in Wikidata op te nemen. https://www.wikidata.org/wiki/Wikidata:Notability/nl

De data worden verzameld uit verschillende bronnen en kunnen permanent worden aangevuld en geactualiseerd.

Ook Wikidata heeft richtlijnen voor het omgaan met gegevens over levende personen:

“Living individuals with records in Wikidata are for the most part not famous or celebrities; their privacy should be respected. Values for living individuals should generally not be supplied unless they can be considered widespread public knowledge or are openly supplied by the individual themselves (otherwise hidden supporting references are not sufficient). As an example, the fact that someone's address is accessible by looking at a domain name registration doesn't imply that it's considered widespread public knowledge for the sake of this policy.” https://www.wikidata.org/wiki/Wikidata:Living_people

Aan een wikidata-item over een persoon worden properties toegekend: beschrijvende kenmerken. Deze kunnen alle aspecten van het menselijk bestaan bestrijken: geboorteplaats, opleiding, taalvaardigheid, onderscheidingen, werkgevers, strafblad, familierelaties, godsdienst, politieke overtuigingen, seksuele oriëntatie, publicaties, ambten en functies ... Het is niet verplicht om voor ieder biografisch data-item alle mogelijke properties in te vullen, noch is het expliciet de bedoeling er zoveel mogelijk in te vullen. Echter, wanneer een data-item is aangemaakt omdat iemand wethouder is geworden, is het legitiem om ook naast informatie die direct te maken heeft met de politieke loopbaan ook informatie over geloof en seksuele oriëntatie toe te voegen -, als die info in het publieke domein bekend is en onderbouwd door betrouwbaar geachte bronnen.

Welke persoonsgegevens worden opgenomen, hangt af van:

  • de data die openbaar beschikbaar zijn in een betrouwbare bron. Als betrouwbare bron gelden datasets van de overheid of een respectable kennisinstelling, en serieuze publicaties.
  • geldende regels en afspraken op Wikidata
  • afwegingen van individuele Wikimedianen.

Een aantal properties wordt door de Wikidatagemeenschap gezien als potentieel privacy gevoelig (selectie)

religie (P140), geboortedatum (P569, etnische groep (P172), adres (P6375), seksuele geaardheid (P91), e-mailadres (P968), medische situatie (P1050), telefoonnummer (P1329), veroordeeld voor (P1399), Wikimedia-gebruikersnaam (P4174), levensstijl (P1576), websiteaccount op (P553), bloedgroep (P1853), permanente inwoner van (P5389), gewicht (P2067), nettowaarde (P2218), sociale klasse (P3716), Keybase-identificatiecode voor gebruikersnaam (P6837), partner (P451), checksum (P4092), geprefereerd voornaamwoord (P6553), voertuigidentificatienummer (P6322)

https://www.wikidata.org/wiki/Wikidata:WikiProject_Properties/Wikidata_properties_that_may_violate_privacy https://www.wikidata.org/wiki/Wikidata:WikiProject_Properties/Wikidata_properties_likely_to_be_challenged

Daarnaast is het op Wikidata ook mogelijk om familieverbanden aan te geven tussen personen waarover een data-item bestaat.


Gegevens over levende personen op Wikimedia Commons

Voorbeeld:  Wikimedia Commons categorie + persoonsgegevens

Wikimedia Commons is de mediabibliotheek van Wikimedia. Wikimedia Commons bevat beeld- en geluidsbestanden, ook over levende personen. Wikimedia Commons heeft een beleid betreffende het opnemen van materiaal waarop mensen herkenbaar zijn afgebeeld: https://commons.wikimedia.org/wiki/Commons:Photographs_of_identifiable_people. Het is mogelijk om aan de beschrijving van een beeld informatie toe te voegen over de personen die staan afgebeeld, ook als zij niet het echte onderwerp van de foto zijn (b.v. foto's van het publiek tijdens demonstraties, concerten etc.)

Voor sommige personen bevat Wikimedia Commons ook een infobox met persoonlijke informatie, die afkomstig zijn uit Wikidata. Daarnaast is het sinds kort mogelijk om afbeeldingen op Wikimedia Commons te vrij gedetailleerd te beschrijven door properties uit Wikidata toe te voegen. Te denken is dan aan afgebeelden personen, locatie, gebeurtenis, zelfs kleding. De beeldbibliotheek is hierop ook doorzoekbaar.


Verschillen tussen informatie over levende personen in Wikpedia en Wikidata

  • door de strengere criteria over relevantie bevat Wikipedia informatie over een kleiner aantal levende personen dan Wikidata
  • de informatie in Wikipedia en in Wikidata over een persoon is niet perse identiek. Wikidata kan informatie bevatten die niet in Wikipedia is vermeld, en vice versa.
  • de informatie over levende personen in Wikipedia is meer gecontextualiseerd dan die in Wikidata
  • de mogelijkheid voor lezers om gericht te zoeken naar personen die aan bepaalde criteria voldoen (godsdienst = X, en seksuele oriëntatie = Y, en woonplaats = Z) is in Wikidata veel groter dan in Wikipedia. Het zoekresultaat hangt af van in hoeverre de relevante properties zijn toegevoegd aan data-items over levende personen.


Juridische en ethische aspecten

Door WMNL geraadpleegde juristen zijn het erover eens dat het verzamelen van data zoals dat gebeurt in Wikidata en Wikipedia in principe is toegestaan ​​onder de AVG. De verzamelde gegevens zijn al beschikbaar in het publieke domein en Wikipedia/Wikidata worden verondersteld onder de vrijstelling te vallen die de AVG kent wat betreft dataverzameling voor wetenschappelijk werk, archiefdoeleinden of journalistiek. Wikimediaprojecten_en_de_AVG

Over de wenselijkheid van de huidige manier van dataverzameling zijn er blijkens een recente discussie binnen de Wikimedia-gemeenschap in grote lijnen twee standpunten:

  • het verzamelen van (gevoelige) data over levende personen is niet problematisch zolang deze gegevens al openbaar waren en er naar goede bronnen kan worden verwezen
  • het over jaren samenbrengen van (gevoelige) data over levende personen uit verschillende openbare bronnen is problematisch omdat het een nieuw niveau van informatie over de persoon creëert, waarbij de doorzoekbaarheid van met name Wikidata profilering en targeting vergemakkelijkt. Daarnaast wordt de vraag gesteld of dergelijke dataverzameling bijdraagt aan de missie van de Wikimedia-beweging.