- Instala R y RStudio si no los tienes instalados ya. Abre RStudio y comprueba la versión de R qué tienes instalada. ¿Dónde aparece esta información?
-
Instalar la librería tidyverse
-
La librería tidyverse es en realidad una colección de muchas otras. La lista completa se puede ver aquí: https://www.tidyverse.org/packages/. Comprobar en la pestaña Packages la versión de tidyverse
-
Cargar la librería tidyverse. ¿Qué librerías se están cargando en realidad?
Sabiendo que la función que calcula la media en R es mean
:
-
Acceder a la ayuda de la función
-
¿Cuántos parámetros obligatorios tiene? ¿Cuántos opcionales?
-
Copiar el código de la sección de ayuda en un nuevo fichero de texto con nombre
media.R
-
Ejecuta el fichero de texto. ¿Cómo puedes saber que se ha ejecutado correctamente? Mira en la pestaña
Environment
-
Ejecutar la última línea del fichero. ¿Cuál es el resultado?
-
Crear un fichero R Markdown que tenga una celda con el código contenido en el fichero
media.R
-
Genera un fichero HTML y PDF a partir del R Markdown
-
Ejecuta el script
media.R
. ¿Cuántos objetos se crean en el entorno? -
¿De qué tipo son los objetos que se crean?
-
Eliminar del entorno el objeto
x
-
¿Qué sucede con el resto de los objetos si reiniciamos la sesión de R (Session > Restart R)?
Con el dataframe “airquality” que viene incluido en R:
-
Calcular el número de filas y columnas
-
Ver el nombre de cada una de las columnas
-
Calcular el mínimo, máximo, media, mediana, y el primer y tercer cuartil de cada columna (usar la función
summary
)
-
Cargar la librería
tibble
-
Convertir el dataframe mtcars, que viene cargado en R, a tibble (usa la función
as_tibble()
) -
¿Cuáles son las diferencias visuales entre mtcars y su versión tibble?
El conjunto de datos starwars
(incluido en dplyr) contiene información sobre los personajes de la saga de Star Wars. Utilizando ese dataframe:
-
Seleccionar las filas 5 y de las 10 a la 20
-
Seleccionar las filas de personajes que tienen más de 100 años (columna
birth_year
) o color de piel verde -
Seleccionar las filas que tienen un valor de la columna
sex
distinto de "male" y "female". Además, tampoco pueden tenerNA
en esa columna
Con el dataframe starwars
(viene incluido en la librería dplyr)
- Seleccionar las columnas
name
,height
ymass
- Seleccionar todas las columnas menos
films
,vehicles
ystarships
- Seleccionar todas las columnas que terminan en "_color"
Con conjunto de datos starwars:
-
Seleccionar las columnas que contienen la palabra
color
-
¿Cuáles son los 5 personajes más bajos? ¿Qué le ocurre a las funciones
slice_min
yslice_max
cuándo hay empates?
-
Ordenar las filas del dataframe starwars por los valores de la columna
height
de menor a mayor. ¿Hay valores repetidos en esa columna? -
Deshacer los empates ordenando por los valores de la columna
mass
de mayor a menor
-
Las columnas
mass
yheight
del dataframe starwars representan el peso en kg y la estatura en cm. Crear una nueva columna imc que contenga el índice de masa corporal, que se calcula como peso(kg)/altura(m)^2 -
Modificar el código anterior para crear también otra columna,
log_by
, que tenga el logaritmo de la columnabirth_year
Reescribir la secuencia de operaciones siguiente usando el operación tuberia (%>%)
library(dplyr)
df1 <- filter(starwars, birth_year > 100 | skin_color == "green")
df2 <- select(df1, name, height, mass)
df3 <- mutate(df2, imc = mass / (height/100)^2)
df4 <- arrange(df3, height, desc(mass))
-
Cargar las librerías ggplot2 y dplyr
-
Consultar la ayuda de la función
cor
, que calcula la correlación -
Calcular la correlación de las columnas hwy y cty usando summarize
Con el dataframe airquality
que viene incluido en R:
-
Obtén la columna de temperatura
-
Obtén el dataframe resultado de eliminar las columnas con información de fecha
-
Obtén un dataframe con la información únicamente de agosto
-
Obtén un dataframe con los valores de viento y temperatura para el mes de agosto