El futur són les dades

El futur del periodisme es basa en els seus orígens: en la recerca de noves fonts, en el relat objectiu dels fets i en l’anàlisi de les dades.

En un moment en què el periodisme viu una profunda crisi provocada per l’auge de les xarxes socials, els problemes de finançament i els creixents ERO en els mitjans, les I Primeres Jornades sobre Periodisme de Dades organitzades pel capítol espanyol de l’Open Knowledge Foundation van oferir una nova perspectiva per a la professió, un futur, paradoxalment, basat en els seus orígens: en la recerca de noves fonts, en el relat objectiu dels fets i en l’anàlisi de les dades.

Les jornades van tenir lloc els passats dies 24, 25 i 26 de maig a Madrid, Sevilla, Sant Sebastià i Barcelona: en aquesta última ciutat, el CCCB va ser l’escenari de la primera data, una trobada que va durar dotze hores i en què es van presentar alguns dels experts més importants en el periodisme de dades, entre ells Mar Cabra, coordinadora de l’esdeveniment, juntament amb la periodista Karma Peiró.

Mar Cabra, periodista d’investigació especialitzada en periodisme de dades i membre del Consorci Internacional de Periodistes d’Investigació (ICIJ), va començar la seva xerrada citant la màxima de The Guardian «Els fets són sagrats». I és que en el periodisme de dades no existeix l’opinió, només els fets i la informació objectiva extreta de les dades. Cabra va fer esment de tres exemples d’entitats que treballen amb dades, la Sunlight Foundation, MySociety i la Fundación Ciudadana Civio, i va mostrar diversos exemples d’històries periodístiques elaborades amb dades, entre ells:

  • Tu tasa de paro: un web que, analitzant xifres de l’INE, mostra quina és la taxa d’atur de cadascú. La idea està inspirada en un projecte semblant dut a terme a Nova York.
  • España en llamas: basat en documents del Ministeri d’Agricultura, en aquest mapa es poden veure els incendis registrats a Espanya entre el 2001 i el 2010. Va ser un projecte realitzat per Civio amb ajuda del crowdfunding.
  • How riot rumours spread on Twitter: un extraordinari exemple realitzat des de The Guardian que analitza, de manera gràfica, com neix i mor un rumor. En aquest cas, es van estudiar els rumors llançats des de Twitter durant els avalots de Londres del 2011.
  • Dollars for docs: un projecte de ProPublica, una organització de periodistes de dades amb base als Estats Units, que analitza quants diners rep de cada farmacèutica un metge de capçalera. Una informació essencial per saber per què prescriu un medicament determinat, quina companyia farmacèutica ofereix més diners, etc.
  • Whoknowswho: una iniciativa del canal britànic Channel4 que analitza els lligams entre persones que ocupen càrrecs en el poder i permet veure quines relacions hi ha entre ells.
  • Qué hacen los diputados: un projecte, que continua buscant finançament a través de crowdfunding, per poder analitzar què fan els diputats en el Congrés: què voten, quines propostes fan, etc.

Mar Cabra (la presentació de la qual es pot consultar en aquest enllaç) va esmentar la necessitat de col·laboració entre periodistes i programadors, una constant que es va mantenir al llarg de la jornada. I és que el periodista necessita algú que l’ajudi a explicar gràficament la història i a analitzar les dades, i el programador necessita qui trobi la història enmig de les dades. Però, d’on s’obtenen aquestes dades? Algunes pistes es poden trobar en blogs com The Guardian Datablog, La Nación Data Blog, Information is beautiful, (Re)Structuring Journalism, Between the spreadhseets i Spreadsheet Journalism.

La intervenció següent va ser a càrrec d’Eva Belmonte, periodista i autora del blog El BOE nuestro de cada día. Belmonte va començar la seva xerrada posant sobre la taula el periodisme actual, basat en les declaracions, els globus sonda, els tertulians i les filtracions interessades. Segons el seu parer, el periodisme basat en aquestes suposades fonts no afavoreix gaire la informació, perquè actua d’altaveu dels governs i poders de torn, mentre que les dades són objectives i, per tant, no hi ha opinió en les històries. El primer exemple que va posar és el web Tu derecho a saber, una plataforma que recull les peticions dels ciutadans a les institucions públiques. Belmonte va explicar que de totes les peticions recollides, més de la meitat (el 53%) encara no han obtingut resposta, cosa que fa paleses les mancances i el desinterès en matèria de transparència de les institucions espanyoles. I és que, si continuem amb les institucions, aquesta periodista va explicar que bona part d’elles, sobretot els ajuntaments, han començat a oferir informació pública a través dels seus portals (per exemple, el de l’Ajuntament de Barcelona), però que, tot sovint, aquesta informació no és manipulable. En el cas de Barcelona, de les més de dues-centes informacions, unes vuitanta estan en pdf, cosa que les converteix en una font gairebé inútil.

A més dels portals d’Open Data dels governs, la principal font d’informació és el BOE, el butlletí oficial de l’Estat, d’on Eva Belmonte extrau molta informació i que també va servir per crear dos projectes: El Indultómetro i Dónde van mis impuestos, tots dos creats per la Fundación Civio, que té com a finançament principal el crowdfunding, però que també disposa de donacions i que es va posar en marxa amb l’aportació financera inicial dels seus mateixos fundadors.

Belmonte també va aportar una mica d’autocrítica a la seva intervenció i va esmentar la necessitat que els periodistes citin les fonts correctament i, si això no és possible, les posin a la disposició dels lectors: «No es pot demanar transparència als governs i després quedar-se la informació.»

L’exemple de la premsa: les dades a The Guardian

John Burdon-Murdoch, membre de l’equip de dades del diari britànic The Guardian, va ser el següent a intervenir. Geògraf de formació i amb un màster en periodisme, va començar mostrant el famós gràfic que explica què fan amb les dades així que les han obtingut: què signifiquen, com les processen, com les poden convertir en una història, quines es poden combinar i de quina manera gràfica les poden mostrar.

La secció de dades de The Guardian és una de les més potents de la premsa actual perquè també va ser una de les primeres: Burdon-Murdoch va explicar que el periodisme va tenir la sort que els seus propietaris apostessin des del principi pel periodisme de dades i, per això, van crear un equip multidisciplinari en el qual treballen periodistes, programadors, informàtics i gent amb altres perfils tècnics. A més, al Regne Unit des de fa anys hi ha un compromís per part de l’administració d’oferir dades de manera gairebé immediata i transparent, cosa que facilita molt la feina.

John Burdon-Murdoch també va oferir una llista d’eines (totes gratuïtes) que l’equip del diari fa servir per elaborar la informació: per exemple, ScraperWiki, Tableau i CartoDB (un dels seus creadors, l’espanyol Sergio Álvarez Leiva, de Vizzuality, en va mostrar el funcionament en el taller que es va fer l’endemà a l’URL). Segons Burdon-Murdoch, el més important, després de la història, és saber com explicar-la i tenir present a qui se li explica: una cosa tan elemental com triar els colors dels gràfics pot ser un perjudici per als daltònics. I va acabar la seva xerrada amb un consell: que els periodistes aprenguin les nocions bàsiques dels fulls de càlcul per saber manipular la informació i, sobretot, per saber què se li pot demanar i què no al programador encarregat de convertir les dades en un gràfic.

La necessària col·laboració entre disciplines

Aquest tema, el de la col·laboració entre periodistes i programadors, també va aparèixer a la xerrada de Manuel Aristarán, periodista del diari argentí La Nación, que va explicar dos casos realitzats en aquest mitjà, el dels morts a les inundacions de La Plata i el projecte gastopublicobahiense.com. Tots dos van ser projectes que van rebatre la informació oficial, perquè es van basar en dades reals, les mateixes que havien fet servir les autoritats però que aquestes havien manipulat perquè s’ajustessin al seu missatge. I és que Aristarán va afirmar el abans ja havia dit John Burdon-Murdoch: que amb les dades el periodista és capaç de posar en dubte el que diu el govern, o l’empresa o l’autoritat corresponent, que és el que hauria de fer un bon periodista.

La xerrada següent va estar dedicada a un dels temes de periodisme de dades que han tingut més rellevància en els últims anys: el cas WikiLeaks. John Burdon-Murdoch i Mar Cabra van explicar com va arribar la informació i què va significar per al periodisme que s’«obrís la veda» a què altres possibles fonts oferissin dades sensibles. El segon exemple que van posar va ser l’anomenat Secrecy for sale, un cas que va permetre posar en marxa les informacions que encara ara estan generant informació sobre els paradisos fiscals. Aquest projecte va començar com un disc dur de 260 Gb en brut que l’ICIJ va rebre d’una font anònima amb connexions a Singapur i les Illes Verges britàniques. D’aquests gigues es va obtenir informació de 130.000 evasors i 122.000 empreses que feien servir paradisos fiscals. Tenint en compte que un terç de la riquesa mundial s’amaga en aquests paradisos, la informació era altament sensible; tanmateix, a Espanya, l’únic mitjà que es va interessar pel tema va ser El Confidencial, que li va dedicar un especial elaborat per la mateixa Mar Cabra.

El debat, llavors, es va centrar en l’ètica i la conveniència o no de publicar determinades dades, ja que és evident que es tracta d’informació confidencial. Tant Burn-Murdoch com Cabra van coincidir en què totes les dades que es publiquen han estat revisades per advocats. A Espanya, el problema radica en què la Llei de la transparència és molt estricta i, per tant, no afavoreix la publicació de dades, d’aquí que moltes de les informacions sensibles no puguin ser publicades.

Infografia vs. visualització de dades

L’última intervenció de la jornada va ser a càrrec de Sergio Álvarez Leiva, un dels fundadors de l’empresa espanyola Vizzuality, dedicada a la visualització de dades. Leiva va començar la seva xerrada explicant la diferència entre la infografia i la visualització de dades: mentre que la primera explica històries, la segona deixa aquestes històries en mans del lector, a fi que les construeixi a la seva mida. La infografia no és interactiva; en canvi, la visualització s’elabora amb un software perquè els números «ens serveixin per explicar històries». I va posar uns quants exemples de visualització de dades: Planet Hunters, un projecte realitzat amb l’ajuda de la gent per trobar nous planetes; How far is it to Mars?, que il·lustra la distància que és Mart de la Terra en píxels; Kepler’s Tally of Planets, que mostra tots els planetes que s’han descobert semblants a la Terra, i Good Morning!, una animació que il·lustra de manera espectacular qui i quan diu «bon dia» a Twitter. Quatre casos en els quals s’han construït històries a partir de xifres i que serveixen per veure el potencial de les noves eines de visualització.




Activitats paral·leles

Les I Jornades de Periodisme de Dades i Open Data també van tenir diverses activitats paral·leles. Al mateix CCCB, divendres a la tarda, es van presentar en un Barcamp diferents projectes que treballen amb dades, alguns dels quals ja són projectes tancats i d’altres continuen funcionant. Per exemple, s’hi va presentar el Tuitòmetre de Vilaweb, que va recollir els tuits emesos en relació amb les eleccions catalanes del 25N; BCN Citybeats, un curiós experiment que mostra sobre un mapa l’activitat en línia dels usuaris que geolocalitzen els seus tuits, check-ins i fotografies, o atNight, una altra aplicació que registra el moviment dels usuaris a Barcelona durant les hores nocturnes. També s’hi van donar exemples de portals de dades oberts, com ara Catalunya Dades.

De la mateixa manera, com a part de les jornades, el cap de setmana es van fer diversos tallers dedicats a explicar algunes de les eines que es van mostrar el dia anterior. Van ser tallers, en alguns casos molt tècnics, els assistents dels quals, en la seva majoria periodistes de formació, van coincidir en què una cosa tan senzilla com un full de càlcul facilitaria molt les coses si es tinguessin coneixements bàsics. Un dels tallers més profitosos va ser el de Michael Bauer, membre de l’Open Knowledge Foundation, que va explicar com extraure dades del web fent servir l’scraping i una de les aplicacions del navegador Chrome, anomenada precisament Scraper Extension. David Martín-Borregón, de Data’n’Press, va intentar explicar com extraure dades de Twitter per explicar una història, un taller que hauria estat més útil si s’haguessin tingut coneixements bàsics de programació. En canvi, la demostració de com funciona CartoDB, la sorprenent eina per mapar creada per Vizzuality, va tenir molt d’èxit perquè els assistents van poder comprovar in situ com elaborar el seu propi mapa personalitzable amb tota mena de dades.

Simultàniament a aquests tallers, que van tenir lloc a la Universitat Ramon Llull, es va dur a terme un Hackaton, és a dir, una marató de projectes que buscaven finançament o col·laboradors. El resultat d’aquests projectes es coneixerà el pròxim 3 de juny.

Les jornades també es van poder seguir per Internet amb l’etiqueta #jpd13. En aquest storify elaborat per Karma Peiró, una de les coordinadores de les jornades, es poden seguir alguns dels comentaris que es van fer durant els tres dies de l’acte.

Vegeu comentaris1

  • Web con información sobre visualización de datos-CCCB 2013 | composition | 02 octubre 2023

Deixa un comentari

El futur són les dades