Cuando trabajas con estadísticas de series temporales, es habitual que en algún momento te enfrentes con esta cuestión: ¿es igual hacer «promedios de promedios» que hacer promedios con todos los datos de la serie? Voy a poner un ejemplo para que nos entendamos mejor….Si quiero obtener la temperatura promedio de un periodo de años, ¿es igual calcularla a partir de los promedios anuales o mensuales que de los promedios diarios?
La respuesta es que todo depende del número de datos con el que hayas calculado esos promedios anuales o mensuales. Supongamos que tienes el valor del promedio mensual de temperaturas para toda la serie. Si todos los meses tenían la misma disponibilidad de datos, es decir, el número de datos con el que calculas cada uno de esos promedios mensuales es el mismo para todos los meses, entonces puedes hacer el promedio total a partir de los mensuales. Sin embargo, si por ejemplo durante un mes hubo unas semanas sin medidas de temperatura, o tienes falta de datos en una temporada por alguna razón…..entonces ya no tienes el mismo número de datos en cada mes y, por lo tanto, el promedio total a partir de esos promedios mensuales no te saldrá igual que si haces el promedio total a partir de todos los datos diarios. Escrito así parece un lío, pero es muy fácil de verlo sobre el papel. Vamos a poner un ejemplo con números para entenderlo mejor.
Ejemplo: Tengo tres conjuntos de medidas.