Skip to content

Latest commit

 

History

History
60 lines (37 loc) · 13.4 KB

examen-teorico.md

File metadata and controls

60 lines (37 loc) · 13.4 KB

Examen teórico Periodismo de datos 18-5

Raquel Suárez Gago

¿Quién es Philip Meyer?

Philip Meyer fue uno de los primeros y principales periodistas de datos de mediados del siglo pasado. Comenzó su trabajo en The Miami Herald, donde comenzó a trabajar en lo que hoy entenderíamos como periodismo de datos a propósito de una investigación sobre el coste de los seguros escolares contra huracanes e incendios. Descubrió mediante el análisis e interpretación de los datos que el 65% de la financiación de campañas electorales procedía precisamente de empresas vinculadas a estos seguros escolares.

Posteriormente, desarrollaría algunas aplicaciones informáticas para predecir los resultados electorales de Ohio, aunque no obtuvo buenos resultados. El punto es que comienza a interesarse en la aplicabilidad de la informática y los rigurosos métodos de investigación de las Ciencias Sociales para aplicarlos a sus investigaciones periodísticas. Entre las actividades más relevantes, intentará emplear datos tabulados, que como hemos visto en las clases, son hoy uno de los tipos de datos más frecuentes en datos de transparencia y gobierno abierto que podemos usar para el periodismo de datos.

A finales de los 60, investigará las revueltas en la ciudad de Detroit, concluyendo que aunque el inicio de las trifulcas sí fue racial, derivó en una conflictividad sostenida por la frustración de la sociedad en general. Descubre esto, no solo por largas entrevistas en profundidad, sino también por el método de Ciencias Sociales de la encuestación, que es el que nos compete en el marco de esta asignatura como particular del Periodismo de Datos. Siguió los métodos de la UCLA, pionera en la investigación en Ciencias Sociales.

¿Quién fue Florence Nightingale?

Florence Nightingale fue una enfermera y estadística del siglo XIX, normalmente conocida por ser la creadorea del primer modelo teórico de la enfermería y fundar así la enfermería moderna. Sin embargo, parte de su trabajo en este campo nos permite relacionarla, mediante ese análisis estadístico y su asociación a causas y a historias, al periodismo de datos. Quizá su trabajo más relevante sean los diagramas sobre las causas de fallecimiento en la Guerra de Crimea. En él, representó (es decir, usó la visualización de datos) los muertos y heridos en la guerra y las probabilidades que tenían de salvarse según varios factores para saber cómo debían ser tratados o si merecía la pena emplear tiempo y recursos en ellos en tal estado o centrarse en pacientes que sí podrían salvarse. De este modo, usó datos, estableció causalidades o probabilidades y visualizó todos estos elementos creando una historia que bien podría inspirarnos en el periodismo de datos.

Bloque C

  1. Para crear un directorio desde la terminal usamos el comando mkdir (make directory) seguido del nombre de dicho directorio como argumento (normalmente entrecomillado por si hubiese errores -espacios, tildes...- al ser texto literal). Sí podemos crear dos directorios de una sola vez, de dos maneras diferentes dependiendo a lo que nos refiramos. Por un lado, podemos usar los operadores && para indicar que queremos que dos acciones se realicen a la vez y en el mismo work directory. Es decir podríamos hacer mkdir "carpeta-1" && mkdir "carpeta-2"y se crearían esos dos nuevos directorios dentro de la misma ruta. Si lo que queremos es crear una carpeta dentro de otra carpeta que también tenemos que crear (no preexistente) lo que usaremos es la opción -p y separaremos los dos nombres del directorio con /. Es decir, para crear la "carpeta-2", dentro de "carpeta-1" escribiríamos mkdir -p "carpeta-1"/"carpeta-2".

  2. Para ver archivos y directorios ocultos tenemos que añadir la opción - a o -la al comando -ls (listar). Con lssolo listaríamos archivos y directorios visibles. La opción -a permite ver los ocultos y, -la los describe con detalle.

  3. Las rutas absolutas son rutas que parten del directorio raíz, mientras que las relativas tienen en cuenta el directorio de trabajo desde el que partimos. Para entender esto más fácilmente, hemos de tener en cuenta la estructura arbórea de la web y nuestro ordenador. Por ejemplo, para realizar el trabajo final de la asignatura, al enlazar rutas absolutas, tendríamos que haber descrito la ruta completa del archivo (desde el ordenador mnt/c/Users, etc.; u online, como ruta url, el link completo del repositorio); para las rutas relativas, simplemente tenemos que escribir el nombre del directorio o del archivo, porque la "parte anterior" de la ruta ya está incluida si estamos a ese mismo nivel.

  4. En Markdown, las almohadillas sirven para diferenciar jerárquicamente los headers o encabezamientos, mientras que en la shell sirven para comentar. En Markdown # precedido de texto indica que son encabezamientos. Dependiendo del número de almohadillas serán de primer nivel # (el principal), segundo nivel ##(como un subtítulo, jerárquicamente inferior), tercer nivel ###...

En la shell, sin embargo, sirven para comentar lo que estamos haciendo, siguiendo la filosofía del conocimiento abierto que explica cada paso llevado a cabo con el fin de que pueda replicarse (por otros o nosotros mismos si no entendemos por qué hemos configurado algo en el pasado de determinada manera). Es un texto que no se va a leer, son comentarios, no programa. Lo hicimos al editar los archivos de configuración de nano o bash, para entender por qué poníamos lo que poníamos.

  1. Una API es una Access Programming Interface o una interfaz de programación de acceso. Un ejemplo es, mismamente HTTP (protocolo de las url) o la de bash. Sirve de comunicación entre el usuario y la web. Por ejemplo, bash tiene de entrada, de salida y de errores (lo que escribimos en la terminal, lo que nos devuelve y cuando nos indica si ha habido un error). HTTP, "post", "get", "delete" y "put".

  2. Markdown es a un tiempo una sintaxis simple y un parseador que convierte dicha sintaxis en HTML (Github lo hace a través de Jekyll, es como hemos creado nuestra página web del trabajo final). Markdown fue creado por Dan Gruber porque el código HTML era más complejo de usar y leer.

Hemos usado Markdown como lenguaje estructurado en la totalidad de prácticas de la asignatura y en el presente examen (que se guardará como un documento .md). Como ya hemos indicado, # sirve para poner un título (## un subtítulo; ### un título a un nivel jerárquicamente inferior…). El texto entre ** ** es strong, importante, lo que comúnmente conocemos como “negrita” y * * podrá el texto en cursiva. Más adelante aprenderemos también a generar hipervínculos y visualizar imágenes. Con [] señalamos el texto que queremos que se muestre y a continuación, entre () la url o ruta vinculada. Para las imágenes es lo mismo colocando ! al principio del todo y dando como resultado final. También creamos listas desordenadas con - y ordenadas con 1, 2, etc.

  1. TSV significa valores separados por tabulador. Actualmente son más comunes los CSV, que en lugar de tabulador, utilizan comas para separar los datos. También podemos referirnos a *SV como esos datos separados o bien por tabulador, comas, punto y coma... indistintamente. El tabulador crea un espacio que podría ser equivalente a 4 o 5 espacios de la barra espaciadora y así evitaba errores, por ejemplo de texto (palabras separadas con ese espacio simple). Estos *SV se visualizan gracias a dicha separación (en este caso por tabuladores) en filas y colulmnas que crean una "tabla". Como anticipábamos al hablar de Philip Meyer, los *SV (más por comas, CSV, que por tabuladores) son el tipo de formato de datos más usados en datos abiertos que podemos utilizar para nuestras invesigaciones, aunque, al ser más simples, pueden funcionar peor o tener menos potencialidades que JSON o XML.

Pregunta de desarrollo: Qué es el periodismo de datos. Cómo se relaciona con la visualización de datos.

La visualización de datos forma parte del periodismo de datos (tanto en la parte de investigación y análisis como del producto final de historia periodística -algo así como una presentación de resultados), pero el periodismo de datos es algo más que las visualizaciones. Para entenderlo mejor, definiremos qué es el periodismo de datos, en qué consiste y qué relación tiene con la visualización.

Historia del periodismo de datos

De las dos primeras preguntas del examen puede deducirse cuáles son los componentes del periodismo de datos y por qué Florence Nightingale o Philip Meyer son pioneros (más o menos directos) en el mismo. El periodismo de datos usa, como su propio nombre indica, datos y estadísticas para contar una historia (causas y relaciones entre los datos y con un contexto más amplio) que se acompaña normalmente de una visualización. El periodismo de datos da un salto cualitativo con lo que conocemos como "CAR", Computer Assisted Reporting o periodismo asistido por ordenador (que es básicamente lo que se hace actualmente). Cuando se integran los procesadores informáticos en las redacciones, se puede trabajar mucho más fácilmente con un gran volumen de datos, filtrar los que nos interesan, ver sus interrelaciones, establecer conexiones... y no solo con números, sino también con texto u operadores booleanos. El periodismo de datos moderno nace la primera década del presente siglo, en torno a 2006-2008, con el desarrollo de softwares de código abiero y los Open Data. Además de la potencialidad del ordenador, comenzamos a poder acceder de manera fácil y gratuita a grandes conjuntos de datos que podemos tratar con softwares igualmente abiertos y, bajo el amparo de la filosofía del conocimiento compartido, podemos acceder a ellos, compartirlos, modificarlos, volverlos a compartir... En España, la Ley de Transparencia vendría más tarde que en el resto de Europa, en 2013, pero hoy es un concepto muy extendido. Entre las denominaciones de este periodismo de datos encontramos esta misma (eliminando la parte de "computer assisted", que se sobreentiende, porque es la que sigue primando hoy día por las potencialidades comentadas), los news nerdery o "frikis de las redacciones", los hackers, los journocorders (juego de palabras entre periodista y programador) o el "periodismo de bases de datos", ya que es como generalmente trabajaremos hoy día: con grandes bases de datos que filtraremos, seleccionaremos, visualizaremos algunos de sus valores...

Componentes del periodismo de datos

Podemos diferenciar entonces tres componentes del periodismo de datos:

  • Investigación: es en lo que se basa el periodismo, en lo que se basará realmente la historia en sí.
  • Los datos en los que basamos esa investigación (que también es cualitativa, interpretativa).
  • La visualización de los datos que cumple una doble función: 1) entender mejor los datos (el análisis previo a escribir la historia) y 2) presentar las relaciones entre los datos que contribuyen a ilustrar o comprender nuestra investigación.

La visualización de la información.

Como venimos comentando, la visualización forma parte del periodismo de datos en dos sentidos: 1) para facilitar el análisis e interpretación de los datos 2) como acompañamiento visual de la historia que refuerza su entendimiento. Hemos de señalar también que la visualización comprende varios aspectos.

Podemos considerar, por ejemplo, visualización de los datos a la distribución de los mismos en una tabla que los distribuya en filas y columnas. Lo normal es que esta tabla tenga cabeceras en la primera celda de cada columna que nos indique a qué corresponde cada dato (qué tipo de información aporta ese variable) y cómo se relaciona con las filas. Esta visualización y nos da pistas, por ejemplo, en la primera fase de análisis, sobre cuáles pueden ser los datos más importantes o llamativos para crear una historia basada en la base de datos escogida sobre la que hemos realizado esa visualización. Si la filtramos hasta que quedan pocos valores y son muy relevantes y claros, la misma tabla también podría utilizarse como producto final de un artículo.

Sin embargo, lo más común es entender como visualizaciones los gráficos (lineales, de área, de sectores... interactivos o no...) sobre los que se "pintan" los valores de esa tabla, que permiten hacerla mucho más comprensible a un primer golpe de vista. Por eso, se suelen utilizar bastante en la presentación final de nuestra investigación periodística. No obstante, también hemos de ver que las gráficas son muy útiles para el análisis e interpretación de los datos, porque vemos mucho más rápida y fácilmente si hay una tendencia al alza o a la baja... si hay un dato irregular (muy por encima o muy por debajo de la media o irregular en la tendencia) cuyas causas podamos investigar periodísticamente y generar una historia...

Conclusión

Es vital, sobre los datos, crear visualizaciones que nos alerten sobre por dónde puede ir nuestra historia y qué debemos investigar. Es así como se fusionan los tres componentes del periodismo de datos: periodismo, datos y visualización. No podemos hacer periodismo sin investigación y una historia atractiva y relevante y el periodismo de datos necesita, obviamente, esos datos que lo sustenten. La visualización nos ayuda a entenderlos como periodistas (en la fase de elaboración e investigación) y a presentarlos de forma más clara y atractiva a los lectores o espectadores (en la fase de publicación).