Cómo ser un periodista de datos

Data journalism in action: the Wikileaks Afghanistan war logs. Click here to read more about how the Guardian's data journalism operation worked



 Cómo ser un periodista de datos. El formador y escritor de periodismo de datos Paul Bradshaw explica cómo iniciarse en el periodismo de datos, desde llegar a los datos hasta visualizarlos.

 El editor de datos de Guardian, Simon Rogers, explica cómo funciona nuestra operación de periodismo de datos
Periodismo de datos y visualización de datos


El periodismo de datos es enorme. No me refiero a “enorme” como en la moda, aunque se ha convertido en eso en los últimos meses, sino a “enorme” como en “incomprensiblemente enorme”. Representa la convergencia de una serie de campos que son importantes por derecho propio, desde la investigación de investigación y las estadísticas hasta el diseño y la programación. La idea de combinar esas habilidades para contar historias importantes es poderosa, pero también intimidante. ¿Quién puede hacer todo eso?

La realidad es que casi nadie está haciendo todo eso, pero hay suficientes partes diferentes del rompecabezas para que la gente se involucre fácilmente y parta de ahí. Para mí, esas partes se reducen a cuatro cosas:

1. Búsqueda de datos

La ‘búsqueda de datos’ puede implicar cualquier cosa, desde tener conocimientos y contactos expertos hasta poder utilizar habilidades de informes asistidos por computadora o, para algunos, habilidades técnicas específicas como MySQL o Python para recopilar los datos por usted.

2. Interrogando datos

Interrogar bien los datos significa que debe tener una buena comprensión de la jerga y el contexto más amplio dentro del cual se encuentran los datos, además de las estadísticas; estar familiarizado con las hojas de cálculo puede ayudar a ahorrar mucho tiempo.

3. Visualización de datos

Históricamente, visualizar y combinar datos ha sido responsabilidad de diseñadores y codificadores, pero un número cada vez mayor de personas con experiencia editorial están probando ambas cosas, en parte debido a una mayor conciencia de lo que es posible y en parte debido a la reducción de las barreras. a experimentar con ellos.

4. Mezcla de datos

Herramientas como ManyEyes para visualización y  Yahoo! Pipes para mashups, me ha permitido lograr que los estudiantes de periodismo se involucren rápidamente con las posibilidades, y muchos se contagian del problema del periodismo de datos poco después.

¿Cómo empezar?

Entonces, ¿dónde comienza un periodista de datos en ciernes? Una respuesta obvia sería “con los datos”, pero también hay una segunda respuesta: “Con una pregunta”.

Los periodistas deben equilibrar su papel en la respuesta a los eventos con su papel como buscadores activos de historias, y los datos no son diferentes. Aron Pilhofer, del New York Times, recomienda que “empiece con algo pequeño y con algo que ya sepa y haga. Y siempre, siempre, recuerde siempre que el objetivo aquí es el periodismo”. Charles Arthur de The Guardian sugiere “Encuentra una historia que se cuente mejor a través de números”, mientras que Jonathan Richards de The Times y Conrad Quilty-Harper de The Telegraph recomiendan encontrar tus pies y proponer ideas siguiendo  blogs sobre el terreno y asistiendo a reuniones. como Hacks/Hackers.

No hay escasez de datos que se publiquen en los que pueda poner sus dientes periodísticos. El movimiento de datos abiertos en el Reino Unido e internacionalmente está viendo una publicación continua de datos de interés periodístico, y es relativamente fácil encontrar conjuntos de datos publicados por reguladores, grupos de consumidores, organizaciones benéficas, instituciones científicas y empresas. También puede monitorear las respuestas a las solicitudes de Libertad de Información en Qué saben, y en los propios registros de divulgación de las organizaciones. Y, por supuesto, está el propio blog de datos de The Guardian.

Un segundo enfoque, sin embargo, es comenzar con una pregunta: “¿Las cámaras de velocidad cuestan o ahorran dinero?” por ejemplo, fue una pregunta de actualidad que se hizo recientemente en  Help Me Investigate, el sitio de periodismo de investigación de crowdsourcing que dirijo, y luego buscar los datos que podrían responderla (hasta ahora, eso proviene de una revisión del gobierno y un informe del DfT ). Enviar una solicitud de Libertad de Información también es una vía útil (asegúrese de solicitar los datos en CSV o un formato similar).

Cualquiera que sea el enfoque que adopte, es probable que el verdadero trabajo radique en encontrar los bits de información y datos adicionales para completar la imagen que está tratando de aclarar. Los datos gubernamentales, por ejemplo, a menudo estarán llenos de jerga y códigos que deberá comprender. Una llamada a la organización pertinente puede arrojar algo de luz. Si eso está tardando demasiado, una búsqueda avanzada de uno de los códigos más oscuros también puede ayudar, limitando su búsqueda, por ejemplo, al incluir site: gov.uk filetype: pdf (o limitaciones equivalentes para su búsqueda particular) al final.

También deberá contextualizar los datos iniciales con más datos. Supongamos que tiene información sobre los cambios en la factura salarial de un departamento del gobierno, por ejemplo: ¿se ha expandido la fuerza laboral del departamento? ¿Cómo se compara con otros departamentos gubernamentales? ¿Qué pasa con los salarios más amplios dentro de la industria? ¿Qué pasa con la inflación y los cambios en el costo de vida? Este contexto puede marcar la diferencia entre perder y detectar una historia.

Muy a menudo, sus datos deberán limpiarse: busque diferentes nombres para lo mismo, errores de ortografía y puntuación, campos mal formateados (por ejemplo, fechas con formato de texto), datos ingresados ​​incorrectamente e información que falta por completo. Herramientas como Freebase Gridworks pueden ayudar aquí.

En otras ocasiones, el conjunto de datos que necesita vendrá en un formato inconveniente, como PDF, Powerpoint o una página web bastante fea. Si tiene suerte, puede copiar y pegar los datos en una hoja de cálculo. Pero no siempre tendrás suerte.

En estos momentos, algunos conocimientos de programación son útiles. Aquí hay una escala móvil: en un extremo están aquellos que pueden escribir scripts desde cero que raspan una página web y almacenan la información en una hoja de cálculo. Alternativamente, puede usar un sitio web como Scraperwiki que ya tiene scripts de ejemplo que puede personalizar para sus fines, y una comunidad para ayudarlo. Luego están las herramientas en línea como Yahoo! Pipes y el complemento de the Firefox plugin OutWit Hub. Si los datos están en una tabla HTML, incluso puede escribir una fórmula de una línea en Google Spreadsheets para extraerlos. Si falla todo lo anterior, es posible que tenga que registrarlos a mano, pero haga lo que haga, asegúrese de publicar su hoja de cálculo en línea y bloguear sobre ella para que otros no tengan que repetir su arduo trabajo.

Una vez que tenga los datos que necesita para contar la historia, debe prepararlos para visualizarlos. Recorta todo lo periférico a lo que necesitas para visualizar tu historia. Hay docenas de herramientas en línea gratuitas que puede utilizar para hacer esto. ManyEyes y Tableau Public son buenos lugares para comenzar con los gráficos. Este póster de A. Abela (PDF) es una buena guía sobre qué gráficos funcionan mejor para diferentes tipos de datos.

Jugar. Si es bueno con un paquete de gráficos, intente hacer que la visualización sea más clara a través del color y el etiquetado. Y siempre incluya un fragmento de texto que proporcione un enlace a los datos y su fuente, porque las infografías tienden a separarse de su contexto original a medida que avanzan en la web.

Para los mapas, el maravilloso OpenHeatMap es muy fácil de usar, siempre que sus datos estén categorizados por país, autoridad local, circunscripción, región o condado. O puede utilizar Yahoo! Pipes para mapear los puntos de interés. Ambos son en realidad ejemplos de mashups, lo cual es útil si te gusta la palabra “mashups” y quieres usarla en fiestas. También hay otras herramientas, pero si desea tomarse en serio la combinación, deberá explorar el mundo de la programación y las APIs. En ese momento, puede sentarse y pensar: “El periodismo de datos es enorme”.

¿Y sabes qué? Dije eso una vez.

Paul Bradshaw es fundador, Help Me Investigate y Lector de Periodismo en Línea, Birmingham City University y enseña en City University en Londres. Publica el blog de periodismo online

[Si deseas apoyar al periodismo emergente para que siga creciendo y contribuyendo  a la sociedad, puedes hacer tu aporte en ⇒ Vaki]

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *