Wikimedia Hackathon 2017/Verslag 1Veertje
Op 18 mei ben ik voor de Wikimedia Hackathon naar Wenen afgereisd. Bij deze hackathon heb ik geprobeerd het proces waarbij ongestructureerde gegevens over een evenement met Wikidata kan worden gematched. Dit is een situatie die ik zelf vaak tegen kom als ik evenementfoto’s op Flickr vind met een vrije licentie: op de website van de conferentie staan alle gegevens, op Flickr alleen dát de foto’s bij dat evenement zijn genomen. Het kan wat omslachtig klinken, maar wat volgt is hoe ik dit in het verleden aanpakte: Ik kopieerde de tekst over het evenement in de IDE SublimeText. Deze heeft de functionaliteit waarbij je met een Regular Expression stukken tekst in het document kan selecteren. Omdat ik op zoek ben naar namen van personen gebruikte ik hiervoor de volgende RegEx:
[A-Z]\w+(-[A-Z]\w+)?( ([A-Z]\w+))?[ -]((van|der?|van der?|el|'t|tot|bij|aan|voor|von) )?[A-Z]\w+( ([A-Z]\w+))?
In gewone-mensen-taal vertaald: Hoofdletter, gevolgd door dan wel hoofdletters en kleine letters, misschien een voorvoegsel gevolgd door een herhaling van misschien een of twee keer nogmaals die combinatie. De gevonden namen heb ik in het verleden veel te vaak handmatig een voor een in Wikidata ingevoerd.
Met het scriptje, wat op http://www.veradekok.nl/name-regex/ gehost wordt, worden deze handelingen geautomatiseerd. Er is nog wel ruimte voor verbetering: De Mediawiki API wordt nu gebruikt om te kijken of er al een pagina is met de naam van een persoon bestaat in plaats van door middel van een SPARQL-query. Tijdens de hackathon heb ik wel de SPARQL-workshop bijgewoond maar kon daar nog steeds niet een concreet antwoord krijgen over hoe je om moet gaan als je niet weet voor welke objecteigenschap de zoekterm bedoeld is. Lucas Werkmeister, een Wikimediaan uit Duitsland, heeft me hier wel bij proberen te helpen. Maar het is dus echt zo dat je de hele lijst van talen die ondersteund worden in Wikidata op moet noemen om een volledig overzicht te krijgen.
Dat ik in ieder geval niet zo veel handelingen zelf hoef uit te voeren heeft als voordeel dat het proces zelfs op de smartphone kan worden doorlopen. Ik volg een aantal Flickr accounts en krijg ook op mijn telefoon bericht als er nieuwe foto’s zijn. Dit kunnen afvinken terwijl ik in de trein zit is erg fijn.
Bij de Wikidata workshop werd mij nog door een andere cursist gevraagd hoe ik wikidata gebruik “als vrouw”. Eenzelfde proces als ik hierboven omschreven heb doorga ik ook als ik me voorbereid om bij een evenement zelf als fotograaf rond te gaan lopen. Vooral bij festivals zoals The Next Web of het IFFR moet je nou eenmaal keuzes maken wanneer je wat gaat zien en ik laat me daarin leiden door welke van de bekendheden wél al een Wikipedia-pagina hebben maar nog geen foto ter illustratie.
Dat was meer een antwoord op de eerste helft van de vraag, of mijn gender daar iets mee te maken heeft is een tweede. Zelf ben ik al redelijk snel nadat ik met bijdragen aan Wikipedia was begonnen op evenementen portretfoto’s van bekendheden te schieten. Inmiddels weet ik dat dit toch best uitzonderlijk is. Misschien heeft de ene uitzondering iets met de andere te maken maar dat is op dit moment nog maar een vraagteken. Tijdens de hackathon ben ik ook bij de WikiWomen meetup geweest. Dit was best gezellig maar had niet veel nieuws onder de zon.
Tijdens de hackathon heb ik Lea Voget van Wikimedia Duitsland nog gesproken. Ze was nieuwsgierig naar waar ik op dat moment en in het algemeen mee bezig was. Dit heb ik uitgelegd en ik heb haar toen op mijn YouTube kanaal gewezen waar ik enkele screencasts heb staan waarin je mij kan zien werken aan het categoriseren van afbeeldingen. Daar was ze erg in geïnteresseerd en zei dat ze het ging bekijken.
Een lokale Wikipediaan, Klaudia, had eerder op de dag eigenlijk dezelfde vraag gesteld. Voor haar heb ik ook nog een stukje audio ingesproken waarin ik in mijn beste Duits probeer uit te leggen dat ik me bezighoud met het illustreren van Wikipedia.
Multichill heeft me bij de hackathon nog even gekoppeld aan de Oostenrijkse Wikipediaan die zich het meest met Wiki Loves Monuments bezighoudt, Herzi Pinki. De diverse javascriptjes die hij gebruikt om pagina’s op te schonen waren wel interessant.
Aan het einde van de hackathon heb ik mijn scriptje ook nog even snel gepresenteerd. Hugo Lopez vond dat ik als developer er erg op vooruit was gegaan sinds hij mij ontmoet had bij de hackathon in Amsterdam 4 jaar geleden.
Deze opname heb ik ook nog op Facebook gepost, Jane023 reageerde daarop dat zij een soortgelijk proces doorloopt als ze schilderijen van Flickr aan het overzetten is. Ik moet nog eens met haar om de tafel gaan zitten.
De dag na de conferentie ben ik Wenen zelf nog ingegaan en heb ik geprobeerd het handjevol openbare kunstwerken die nog niet gefotografeerd waren op de kiek te zetten. Ik kon wel merken dat er een reden was waarom dit de laatste ongefotografeerde objecten waren aangezien ze moeilijk te vinden waren.