Wikidata: la nova pedra de Rosetta

Amb Wikidata estem davant d’un nou pas endavant en la democratització de l’accés a la informació.

Arxiu de mostres geològiques marines de l'Institut Alfred Wegener d'Investigació Polar i Marina (AWI), Alemanya 2007.

Arxiu de mostres geològiques marines de l’Institut Alfred Wegener d’Investigació Polar i Marina (AWI), Alemanya 2007. Font: Wikipedia

Amb més de 15 milions d’elements compilats en tan sols tres anys, Wikidata està cridada a convertir-se en el repositori central de dades obertes a escala mundial. L’esperada promesa del linked open data sembla ser que per fi ha arribat: una base de dades multilingüe, completament oberta, de domini públic, que pot ser llegida i actualitzada tant per humans com per màquines. Molta més informació gratuïta i a l’abast de molta més gent, en el seu idioma. Gràcies al seu sistema d’informació estructurada i en format obert, ens permet fer-li preguntes dinàmiques, com, per exemple, quines són les ciutats més grans del món amb una alcaldessa o quants ministres són al seu torn fills de ministres, entre moltes altres. Amb Wikidata estem davant d’un nou pas endavant en la democratització de l’accés a la informació. És per això que el més important ara són les preguntes que ens fem. Quina informació volem documentar? Com la podem arribar a contextualitzar? Com afecta aquesta nova eina la gestió del coneixement?

Amb l’arribada d’Internet, hem assumit que tota la informació queda a un clic de distància. Milers de persones d’arreu del món hi pengen les seves creacions de manera desinteressada. Guies, manuals, fotos, vídeos, tutorials, enciclopèdies i bases de dades. Tota la informació a l’abast. La Fundació Wikimedia promou diversos projectes amb l’objectiu que la suma de tot el coneixement arribi a tota la humanitat de manera gratuïta en la seva llengua, i la Viquipèdia n’és un dels projectes més reeixits. La seva versió en anglès va arribar als cinc milions d’entrades a l’octubre del 2015. Però aquesta versió és culturalment esbiaixada, amb una sobrerepresentació de la cultura occidental. De fet, només considera un 30 per cent dels epígrafs existents en la resta dels 287 idiomes que formen el projecte Viquipèdia, amb més de 34 milions d’articles en total. Molts dels articles sobre una cultura determinada només existeixen en la seva llengua. Només cal mirar els mapes d’elements geoposicionats. Hi ha molta feina a fer: s’ha arribat a estimar que una enciclopèdia completa avui dia hauria de tenir uns cent milions d’articles. Ara que sabem que es pot fer i que tot és a un simple clic, volem tenir la biografia de tots els escriptors hongaresos disponible en una llengua que entenguem, i ho volem ara. Les diferents comunitats wiki locals arreu del món intenten compilar de la millor manera possible la seva cultura en la seva llengua, però sovint tenen poca capacitat d’incidència en el corpus global del projecte. Hi ha milers d’articles sobre catalans en català a Viquipèdia, però no tants sobre cultura catalana en castellà, menys en francès i molts menys en anglès. Com podem difondre la nostra cultura a escala internacional si encara estem intentant compilar-la en la nostra pròpia llengua? Com podem accedir a informació que no està escrita en cap de les llengües que dominem? La defensa del multilingüisme en línia obre tantes oportunitats com reptes.

Mapa d’elements geolocalitzats a Wikidata, octubre 2015

Mapa d’elements geolocalitzats a Wikidata, octubre 2015

Les dades són maques. Les dades són informació

Per aquesta i moltes altres raons, el 2012 es va crear Wikidata, una base de dades col·laborativa i multilingüe que té l’objectiu de proporcionar una font comuna per a certs tipus de dades, com dates de naixement, coordenades, noms, registres d’autoritats, gestionada de manera col·laborativa per voluntaris d’arreu del món. Així, quan hi ha un canvi de govern, només cal actualitzar l’element corresponent de Wikidata i automàticament s’actualitzarà en totes aquelles aplicacions que hi estiguin vinculades, sigui Viquipèdia o qualsevol aplicació de tercers. No cal inventar la roda cada vegada. Aquest model de col·laboració ajuda a reduir la disglòssia cultural existent, ja que comunitats petites poden tenir un impacte global més gran d’una manera molt més eficient. A mitjà termini, tota consulta a Wikidata inclourà les dades d’arreu, no només d’aquelles cultures o comunitats històriques amb capacitat d’influència. Si per exemple fem una consulta sobre «doctors llicenciats abans dels 20 anys», no només ens mostrarà els doctors francesos o anglesos, sinó que també ens en podrà mostrar de taiwanesos o andorrans.

Aquest projecte obre tot un nou món de possibilitats tant per col·laborar-hi com per fer ús de les seves dades: Wikidata game ens permet fer milers de petites contribucions tot jugant, fins i tot des del mòbil, mentre esperem el bus. Inventaire permet a la gent compartir els seus llibres favorits, histropedia ens mostra una representació gràfica de la història. Científics d’arreu del món hi carreguen les seves bases de dades de recerca i el sector cultural està construint una base de dades amb totes les pintures del món. Tots aquests projectes funcionen amb el motor de Wikidata, que s’està convertint en un nou estàndard a escala mundial.

I per què Wikidata i no un altre? Sovint a Internet els estàndards no s’esdevenen per la seva capacitat de generar autoritat, sinó per la capacitat de generar tràfic i per la seva capacitat d’actualització. No guanya el millor, sinó el que concentra més gent i s’actualitza més ràpid, i aquest és un dels punts forts del projecte, que hi ha milers de voluntaris actualitzant constantment la informació. El resultat és que qualsevol aplicació o projecte relacionat amb les grans dades o big data ja es pot aprofitar de tot aquest coneixement estructurat, i de manera gratuïta. Assumint això, cal repensar quin paper hi volen tenir els agents de coneixement clàssics (universitats, centres de recerca, institucions culturals) i quin és o serà el rol dels repositoris d’autoritats a escala mundial, quan noves eines els estan mapant i interconnectant, tot creant una nova centralitat. Un dels reptes amb els quals es troben les institucions culturals és la manca de coincidència de criteris estandarditzats a l’hora de documentar una obra d’art dins el seu catàleg, per exemple: mides amb marc, sense marc, amb passepartout o sense, descripcions en format text en camps número… Cal ordenar les pròpies dades abans d’obrir-se al món: ser obert significa ser interoperable. Moltes institucions ja s’hi estan adaptant: gestores d’autoritats com VIAF ja col·laboren obertament amb Wikidata. El MoMA també ho incorpora al seu catàleg. A Catalunya, la Universitat de Barcelona, en col·laboració amb Amical Wikimedia, lidera un dels projectes pioners en aquest camp, amb l’objectiu de crear una base de dades en obert de tot el modernisme català.

Les dades no són coneixement. Les dades no són objectives

Les dades per si soles no són coneixement. Són informació. Amb l’aparició d’una nova ecologia molt densa de dades a l’abast de tothom correm el risc d’intentar simplificar excessivament el món: simplement descrivint-lo, encara que sigui de manera molt detallada, no tenim per què entendre’l. Sabent que Dostoievski va néixer el 1821, va morir el 1881 i que era existencialista no entenem ni Dostoievski ni l’existencialisme. Ara més que mai necessitem eines que ens ajudin a contextualitzar la informació, a tenir un criteri propi, a generar coneixement basant-nos en aquesta informació, i que fomentin una societat amb un fort esperit crític. Tampoc no cal oblidar que ‒per si mateixes‒ les dades no són objectives, encara que aparentin una suposada neutralitat. La selecció de dades a documentar és un biaix en si mateix. Analitzar o no el sexe, origen, religió, alçada, color d’ulls, posicionament polític, nacionalitat d’un grup humà pot condicionar l’anàlisi posterior. La codificació o no d’una dada en particular dins d’un conjunt pot informar i camuflar una realitat alhora. Sense interpretació les dades no serveixen de res.

Tothom coneix l’efecte que va tenir l’aparició de Viquipèdia sobre les enciclopèdies clàssiques en paper. Quins efectes tindrà Wikidata? Seguint la filosofia wiki, la feina es va fent de manera col·laborativa, asimètrica, però de manera continuada. Tothom pot col·laborar en la creació i el manteniment dels continguts, però també dels vocabularis, de les propietats dels elements i de les taxonomies amb què es classifica la informació. Estem decidint com organitzem la informació del món i ho estem fent d’una manera oberta i participativa, com un exemple del que es pot arribar a fer amb la tecnologia. Sabem que el coneixement humà evoluciona per acumulació, que la cultura occidental és essencialment heretada. La nostra realitat és d’una manera determinada gràcies als avenços tecnològics, socials, polítics i filosòfics dels qui ens van precedir. És per això que les generacions d’avui no hem de descobrir l’electricitat, aprofitem els esforços dels nostres avantpassats. En canvi, amb Internet per primera vegada podem ser partícips d’un dels fenòmens que marcarà la història de la humanitat: estem definint i generant un nou ecosistema informatiu sobre el qual es basarà una possible nova revolució cognitiva, amb la sort que hi podem participar, qüestionar-lo i millorar-ho mentre es genera. Entre tots podem participar en un projecte històric a l’alçada dels grans avenços de la humanitat. Podem crear una nova pedra de Rosetta que serveixi de clau oberta i transparent per desxifrar el món d’avui dia i qui sap si com a font documental per a generacions o civilitzacions futures. Fem-nos-en responsables.

Més debat a

Vegeu comentaris1

Deixa un comentari

Wikidata: la nova pedra de Rosetta