cabecera

Miscelánea.

Wednesday, July 29, 2009

Mentiras y verdades estadísticas (II)

Este año, en un ejemplar ejercicio de sadismo, me he molestado en explicar en clase qué es y para qué sirve la desviación estándar. Imagínense el terror primigenio de un grupo de chavales de catorce años que apenas sabe dividir enfrentados a un montón de letritas raras, sin números por ninguna parte, y con nuevo, reluciente e incomprensible vocabulario.

Como Vds parecen más simpáticos y sus padres no creo que vengan a gritarme, intentaré explicar las cosas sin volverlos locos. Empezaré con la dispersión.


Voy a poner dos ejemplos sencillos.

Imaginen que entramos por sorpresa en una de mis aulas de 2º de la ESO y, abstrayéndonos del chandalismo y del ambiente a sauna, sumamos las edades de los niños y calculamos la media. Como el gobierno no permite que los chicos repitan más de dos cursos, las edades van a estar entre trece y dieciséis años y el promedio probablemente ronde los catorce.

Ahora, armados de un creciente espíritu investigador, entramos en la sala de profesores a la hora del recreo y repetimos la operación. Antes, eso sí, hay que salir fuera a pescar a la media docena larga de fumadores y a los pobres que están de guardia en el patio. En un colegio normal habrá unos sesenta profesores con edades entre los veinticinco y los sesenta y cinco años, así que la media será de unos cuarenta, a ojo de buen cubero.

En ambos grupos la gente tiene edades más o menos similares, no hay vampiros ni bebés ni demás cosas extrañas. Sin embargo, en el primer caso la diferencia entre los más jóvenes y los más viejos es pequeña, mientras en el segundo caso hay bastantes profesores con edades que duplican las de varios compañeros.

Así, las edades de los alumnos son poco dispersas y las de los profesores lo contrario. En el primer caso la media de edad representa muy bien a los chicos, ya que todos tienen cerca de catorce años. En el segundo, por contra, hay muchísimos profesores con edades que no son nada cercanas a esos cuarenta años del promedio. La media indica que no hay vampiros ni árboles milenarios dando clase, pero poco más.

Todo de sentido común, como ven.



Cuando hablaba ayer de que podemos sacar montones de datos de una población y que usábamos algunos promedios para caracterizarla, dije que la media era el más sencillo de todos. El segundo que sigue es la desviación estándar (*). Es un numerajo que si es pequeño indica que hay poca dispersión y que la media es algo muy relevante que representa bien al grupo, que será muy homogéneo. Por contra, si es grande entonces la media es un dato regular, malo o un fiasco (**), el grupo será muy heterogéneo, etc.

Entonces, cuando queremos saber si la media es representativa, calculamos esa desvación (***). Y esto hay que hacerlo siempre-siempre-siempre. Porque es muy importante.

¿Qué ocurre?

Que no se hace, o se hace y no se presta atención, o no se sabe interpretar.

Bueno, ahora que sabemos qué son la media y la dispersión, ya sólo queda responder a una serie de preguntas para acabar: ¿He de demandar a mi profesor de secundaria por no explicarme todo esto? ¿Importa algo que la dispersión sea de una u otra manera? ¿Qué lleva a un hombre adulto a soltar estos rollacos a medio día? ¿Realmente esto sólo sirve para descubrir cuándo se nos ha colado un vampiro en un aula?

¡Atención, el post importante es el próximo! ¡Ahí es dónde la Verdad será revelada!

(*) ¡No pienso explicar cómo se calcula, para eso está la wikipedia!
(**) Como en el caso de ayer, con niños y vampiros mezclados.
(***) ¡He dicho que a la wikipedia!

PS: Por cierto, si fuésemos científicos serios y estuviésemos estudiendo una población, si tuviésemos una dispersión grande nos preocuparíamos, sabríamos que sabemos poquísimos de esos individios y calcularíamos otros promedios cada vez más complicados. De modo que, cuanto más heterogéneo es un grupo más datos son necesarios para describirlo bien. Suena coherente, ¿no?

Labels: , ,

14 Comments:

At 29 July, 2009 19:52 , Blogger ca_in said...

No has puesto el enlace pertinente a la wikipedia, y apostaría a que ni siquiera te has asegurado de que la wikipedia explica cómo hacer esos cálculos.

 
At 29 July, 2009 20:09 , Blogger javi said...

Como en el siguiente post nos expliques el teorema central del limite con monitos y vampiros te hare la ola.

 
At 29 July, 2009 20:20 , Blogger Efe Morningstar said...

Caín, por quién me tomas, claro que no lo he mirado. Pero seguro que viene... Y si no viena da igual, ¡lo hacen las calculadoras!

Y antes de que lo digas: lo que no hace la calculadora es explicarte qué es ni para qué sirve. Ejhem.

Javi, el TCL lo explico yo en dos patadas: cuando arrejuntas muchas muchas muchas cositas y seleccionas muchos subgrupos de ellas, los promedios de estos grupos se distribuyen normalmente.

¡Para saber más, a segundo de bachillerato de nuevo!

 
At 30 July, 2009 00:08 , Anonymous M&m said...

Yo soy de la época del B.U.P. y el C.O.U. y no me explicaron todo esto (como mucho, la media, y en diez minutos), ¿era parte obligatoria del temario???.

Peeeero... sí lo aprendí durante la carrera en esa gran asignatura que llamaron "Estadística Aplicada". Sólo que reconozco que recuerdo nada más que algunos conceptos básicos.

A ver si la lección de mañana es novedad. Estaría curioso aprender del tema a estas alturas...

Ah, por cierto, caras esas gráficas, para estos tiempos de craisis...

 
At 30 July, 2009 01:08 , Blogger Cattz said...

Mooola. Yo de esto ya no di nada en BUP. Ni en la carrera. Tal vez en economía, pero no presté mucha atención.

 
At 30 July, 2009 01:38 , Blogger Efe Morningstar said...

M&m, la estadística se daba y se da con más profundidad en el bachillerato de letras, porque se considera que tiene aplicación directa en las CCSS.

Nah, mañana no hay ninguna novedad, sólo quiero poner algunos ejemplos varidos, no muchos. Mmmm... Ya está escrito, indeed.

¿Crisis...? ¿Qué crisis...? ¿¿No somos todos funcionarios??

Cattz, mujer, en el cole enseñan a calcular cosas, no a interpretar los resultados. Las sutilezas tienden a perderse entre el barullo, ya sabes.

De todos modos, lo que estoy contando es de bachillerato, no más allá, así que debería entenderlo todo el mundo.

 
At 30 July, 2009 02:17 , Anonymous M&m said...

Será eso, que yo hice bachillerato de ciencias y me comí las mates gordas, se supone. Perdone mi ignorancia, profe, pero, ¿qué son las CCSS? Me han sonado a las SS y me ha dado como miedo. Aún así en la rama de Ciencias la estadística es básica para hacer algunas investigaciones, no veo por qué habría de excluirse.

Qué mala prensa tiene la palabra funcionario, que más que un adjetivo parece un empleo de vagos en sí... Yo lo intento, pero no se deja. Soy eventual-proyecto. No pierdo la ilusión.

Ah, y entender, se entiende. :)

 
At 30 July, 2009 02:27 , Blogger Efe Morningstar said...

¡CCSS = Ciencias Sociales!

¿No usabas ese acrónimo en el colegio?

Bueno, tienes razón en que estudiar algo de estadística básica es bastante útil en general. Creo que no se daba más en la rama de ciencias porque no cabía.

Y, bueno, ahora ya no cabe nada de nada, porque se empieza con los polinomios a los 16 años... Tú dirás.

 
At 30 July, 2009 08:59 , Anonymous Nelson said...

Señor demiurgo:¡soy John Rambo! Estimo baladí explicar el porqué de tan peregrina afirmación.
Srta. Cattz: la próxima vez que tenga el inmenso placer de verla, Dios mediante, trataré de enmendar el calificativo impuesto por el ciborg que todos veneran (no sé por qué se aparece ante mis ojos la María de Metrópolis con las formas de Efe arengando al populacho y ...)

 
At 30 July, 2009 11:49 , Anonymous M&m said...

No, en mis años todo se reducía a palábras bisílabas de cuatro letras y llanas, fácilmente pronunciables: soci, mate, natu, reli, dibu...

Los acrónimos no son mi fuerte, ha llegado un momento que no sé de qué puñetas me hablan: CPU, ATM, ATP, TLB, PTC, MP3...

 
At 30 July, 2009 12:48 , Blogger Efe Morningstar said...

Señor Baladí, sepa Vd. que estoy recogiendo firmas para solicitar por la vía oficial que sean destruidos todos sus diccionarios.

M&m, no recuerdo esos años de los que hablas, salvo como flashes en los que todo se parece demasiado a Carrie.

De hecho sospecho que, realmente, lo que recuerdo es Carrie.

Dios mío, creo que soy un replicante... ¡Rápido, que alguien me pregunte por una tortuga boca arriba!

 
At 30 July, 2009 13:34 , Anonymous M&m said...

Oh, Dios, he puesto una tilde en la palabra "palabras".

Mierda, qué contrariedad.

¿Se puede decir mierda aquí? Perdón.

 
At 30 July, 2009 14:00 , Blogger Kalitro said...

¿Y la chi-cuadrado para cuándo?

 
At 30 July, 2009 14:21 , Blogger Efe Morningstar said...

M&m, mal, muy mal. En cuanto construya unas galeras, serás la primera en bogar a bordo.

Kali, la chi-cuadrado para nunca. ¿Qué quieres?, ¿que pierda aún más lectores? ¿Quién paga tu sueldo? ¿La competencia...?

¿¡Los malvados gnomos acaso!?

PS: Actualizada la tercera y última (espero) parte.

 

Post a Comment

Subscribe to Post Comments [Atom]

Links to this post:

Create a Link

<< Home