sábado, 2 de mayo de 2015

Tablas de frecuencias, Conceptos previos

Frecuencias

Una vez que se han recolectado los datos, debe organizarse y resumirse la información en una tabla de frecuencias, de forma adecuada y útil, para su posterior estudio. Una tabla de frecuencias es una ordenación simplificada de los datos estadísticos, en la que a cada valor se le asigna un número que representa la cantidad de veces que ha aparecido. Dicho número recibe el nombre de frecuencia, de la cual existen varios tipos:

Frecuencia absoluta (fi).

Es el número de veces que se repite una característica o valor dentro de un conjunto de datos, trátese de una población o de una muestra. A cada uno de estos valores se le conoce como clase.

Frecuencia relativa (hi).

Es el cociente entre cada frecuencia absoluta y el número total de datos (n, si es una muestra, o N, si es una población).

hi = fi/n          hi = fi/N

La frecuencia relativa puede expresarse también en forma de porcentaje.

hi% = hx 100%


Frecuencia absoluta acumulada (Fi).

Presenta un saldo acumulado de las frecuencias absolutas de los intervalos. Se calcula sumando la frecuencia absoluta acumulada anterior, más la frecuencia absoluta actual. En otras palabras, es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Fi = Fi-1 + fi

Frecuencia relativa acumulada (Hi).

Presenta un saldo acumulado de las frecuencias relativas de cada intervalo de clase. Se calcula sumando la frecuencia relativa acumulada anterior, más la frecuencia relativa actual. En otras palabras, es la suma de las frecuencias relativas de todos los valores inferiores o iguales al valor considerado.
Hi = Hi-1 + h
Así como con la frecuencia relativa, la frecuencia relativa acumulada puede expresarse como un porcentaje. 
Hi% = Hi x 100%

Valor mínimo, Valor máximo y Rango.

Tratándose de variables cuantitativas, el valor mínimo y el valor máximo son la menor y la mayor cantidad que toma una variable en un conjunto de datos. El rango (R) es la diferencia existente entre esos valores máximo y mínimo.
R = Xmáx − Xmín

Ejemplo: Los siguientes datos corresponden a la talla, en centímetros, de una muestra de 30 recién nacidos durante el mes de enero de este año en cierto hospital:
54, 49, 49, 52, 49, 40, 50, 47, 50, 51, 49, 47, 51, 40, 47, 46, 48, 45, 51, 51, 47, 50,
48, 51, 51, 50, 48, 49, 47, 53.
Puede observarse que los valores mínimo y máximo son:
     Xmín = 40
     Xmáx = 54
De donde, el rango es:
     R = Xmáx − Xmín = 54 − 40 = 14

Anterior entrada: Truncamiento y redondeo de números decimales

Licencia de Creative Commons
Estadística con Iwai by Juro Iwai is licensed under a Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional License.

viernes, 10 de abril de 2015

Truncamiento y redondeo de números decimales

Aproximación de números decimales.

Cuando se tiene un número decimal con demasiadas cifras, no resulta cómodo, ni deseable trabajar con todas ellas (menos aun si el número de cifras llegase a ser infinito), siendo preferible hacerlo con una versión corta, abreviada o aproximada de ese número; es decir, con una menor cantidad de cifras decimales.
Un conocido ejemplo es el del número π (pi), definido como la relación entre la longitud de una circunferencia y su diámetro (dicho de otra manera, π es el número de veces que el diámetro de una circunferencia está contenido en el perímetro de la misma). A pesar de que, usualmente, se utiliza a 3,14 o a 3,1416 como aproximaciones de π, se trata en realidad de un número irracional, del cual se han podido calcular, hasta la fecha, más de diez billones de cifras. El número π, con tan solamente sus primeras 50 cifras decimales, es:

π=3,14159265358979323846264338327950288419716939937510

Como se entenderá, sería muy incómodo tratar con tal cantidad de cifras y, en su lugar, se toma una aproximación que contenga unas cuantas de ellas, dependiendo de los cálculos requeridos.
La aproximación de un número cualquiera a un número con menos cifras, puede efectuarse de dos formas diferentes: por truncamiento o por redondeo.

Truncamiento.

Se entiende por truncamiento, la reducción del número de dígitos a la derecha del separador decimal, descartando aquellos de menor valor (menos significativos). En otras palabras, si se quiere aproximar un número mediante truncamiento, se deja el número deseado de decimales, quitando los demás.

Ejemplo 1: Aproximar el número π con 6 cifras decimales, mediante truncamiento.
Solución: Se toman las primeras 6 cifras de π, después de la coma, que es el separador decimal,  y se omiten las demás, resultando π=3,141592.

Ejemplo 2: Aproximar el número π con 5 cifras decimales, mediante truncamiento.
Solución: Se toman las primeras 5 cifras de π, después de la coma, obteniéndose π=3,14159.

Ejemplo 3: Aproximar el número π con 4 cifras decimales, mediante truncamiento.
Solución: Se toman las primeras 4 cifras de π, después de la coma, que es el separador decimal,  y se omiten las demás, resultando π=3,1415.

Ejemplo 4: Aproximar el número π con 2 cifras decimales, mediante truncamiento.
Solución: Se toman las primeras 2 cifras de π, después de la coma, obteniéndose π=3,14.

Redondeo.

Mediante el redondeo, también se logra la reducción de dígitos después del separador decimal. Para ello, se siguen dos sencillas reglas:

  • Si la primera de las cifras que se suprime es mayor o igual que 5, se aumenta en uno la última cifra que se deja.
  • Si la primera de las cifras que se suprime es menor que 5, la última cifra que se deja no varía y queda tal y como estaba.

Ejemplo 1: Aproximar el número π con 6 cifras decimales, mediante redondeo.
Solución: Se revisa la  séptima cifra de π, después de la coma, que es la primera que se omite;  como esta cifra es 6, y 6 es mayor o igual que 5, se aplica la primera regla. En consecuencia, la última cifra que se deja, que es 2, se aumenta en uno y se convierte en 3, quedando π=3,141593.

Ejemplo 2: Aproximar el número π con 5 cifras decimales, mediante redondeo.
Solución: Se revisa la  sexta cifra de π, después de la coma, que es la primera que se omite;  como esta cifra es 2, y 2 es menor que 5, se aplica la segunda regla. Por tanto, la última cifra que se deja, que es 9, permanece sin cambio alguno, siendo π=3,14159.

Ejemplo 3: Aproximar el número π con 4 cifras decimales, mediante redondeo.
Solución: Esta vez se analiza la  quinta cifra de π, después de la coma;  esta cifra es 9, por lo que se aplica la primera regla. La última cifra que se deja, que es 5, se aumenta en uno y se convierte en 6, quedando π=3,1416.

Ejemplo 4: Aproximar el número π con 2 cifras decimales, mediante redondeo.
Solución: La  tercera cifra de π, después de la coma, es 1 y se aplica la segunda regla, dejando inalterada la última cifra que se deja, que es 4; ahora, π=3,14.


Obsérvese que, en algunos casos, la aproximación por truncamiento y la aproximación por redondeo arrojan el mismo resultado; sin embargo, debe recordarse que se trata de dos procedimientos diferentes.


Error en la aproximación.

Al aproximar un número, se introduce un error, debido a la omisión de cifras decimales con respecto al valor exacto, pudiendo ser el error por truncamiento hasta el doble del error máximo que se puede tener usando redondeo. Este error puede cuantificarse como un error absoluto o como un error relativo.


  • Error absoluto: es el valor absoluto de la diferencia entre el valor exacto y la aproximación.

Ea = | Vexacto - Vaproximado |

  • Error relativo: es el valor absoluto del cociente entre el error absoluto y el valor exacto.
Er = | Ea / Vexacto |


Si se desea conocer el error en forma de porcentaje, deberá multiplicarse por 100%.

Ejemplo 4: Considérese el número 12,435. Calcúlese el error cuando se aproxima por redondeo a dos cifras decimales (después de la coma).
Solución: Una vez redondeado, el número es 12,44. El error absoluto será:
Ea = | 12,435 - 12,44 | = 0,005 o, equivalentemente, 0,5%.
Y el error relativo:
Er = | 0,005 / 12,435 | =0,0004 o, equivalentemente, 0,04%.

Anterior entrada: Conceptos básicos de estadística, parte III
Siguiente entrada: Tablas de frecuencias, Conceptos previos
Licencia de Creative Commons
Estadística con Iwai by Juro Iwai is licensed under a Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional License.

sábado, 4 de abril de 2015

Conceptos básicos de estadística, parte III

Estadística descriptiva y estadística inferencial.

La estadística aplicada comprende dos grandes ramas, que son: la estadística descriptiva y la inferencial.

1. Estadística descriptiva o deductiva.

Se emplea para resumir de forma numérica o gráfica un conjunto de datos obtenidos a partir de una población o muestra, restringiéndose a describir fácil y rápidamente aquellos que se analizan. Así, cuando se aplica a una muestra, se limita a describir los datos en ella, sin que se pueda generalizar hacia la población la información encontrada.


2. Estadística inferencial o inductiva.

Permite realizar descripciones, predicciones, comparaciones, generalizaciones y conclusiones o inferencias sobre una población, basándose en los datos simplificados y analizados de una muestra. Se vale de los resultados obtenidos mediante la estadística descriptiva y se apoya en el cálculo probabilístico.

Investigación estadística.

Como en toda investigación, debe cumplirse el paso previo, obvio e indispensable de formular el problema; para esto, es necesario responder a cuatro interrogantes básicos:
  • ¿Qué se pretende investigar? Se define y delimita aquí el tema de la investigación.
  • ¿Por qué hacerlo? La adecuada respuesta a esta pregunta da pie a la justificación de la investigación.
  • ¿Para qué se se hace? En otras palabras, ¿qué se quiere lograr con la investigación? De  aquí surgen los objetivos generales y específicos.
  • ¿Cómo se hará? Se refiere a las diferentes estrategias que se implementarán para abordar la investigación.


Pasos de la investigación estadística.

Una vez que se tiene lista la formulación del problema, la investigación estadística implica una serie de pasos, a saber:
  1. Selección y determinación de la población o muestra y de las características que se desean estudiar. Cuando se desea o requiere tomar una muestra, la determinación de su tamaño adecuado es un factor importante durante la recolección de datos, dentro de una investigación estadística. Para ello existen diversas metodologías que involucran conceptos como la probabilidad de ocurrencia o no ocurrencia de un evento; sin embargo, se han diseñado tablas que estiman de una manera muy cercana el tamaño de la muestra, de acuerdo con el tamaño de la población, el nivel de confianza deseado y el error de estimación.
  2. Obtención de los datos. Se estructura el diseño de los instrumentos de recolección de la información o los datos; puede hacerse por observación directa, aplicación de encuestas y entrevistas, consulta a registros, tests, realización de experimentos, etc.
  3. Clasificación, tabulación y organización de los datos. Una vez recolectados, los datos deben ser clasificados para verificar si son exactos, completos, precisos y representativos. Luego, son tabulados y organizados para su presentación resumida en forma de enunciados, tablas y/o gráficos, de forma que se facilite su lectura y comprensión.
  4. Análisis descriptivo de los datos, complementado con indicadores estadísticos como medidas de tendencia central, de dispersión, de posición y de forma.
  5. Análisis inferencial de los datos, involucrando elementos probabilísticos para inferir  conclusiones de una muestra hacia la población. Dependiendo del estudio que se haga y los objetivos planteados, es posible que no se requiera hacer un análisis inferencial y se proceda directamente con el informe final.
  6. Informe final, en el que se consignan los hallazgos y conclusiones del estudio. 

Anterior entrada: Conceptos básicos de estadística, parte II

Siguiente entrada: Truncamiento y redondeo de números decimales

Licencia de Creative Commons
Estadística con Iwai by Juro Iwai is licensed under a Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional License.

sábado, 28 de marzo de 2015

Conceptos básicos de estadística, parte II

Censo y Muestreo.

Existen dos formas de estudiar las poblaciones: por censo y por muestreo. En el censo se consideran todos y cada una uno de los elementos de una población, mientras que en el muestreo se analiza una proporción reducida y representativa de ella.


Mientras que los censos son muy útiles para el estudio de poblaciones pequeñas, podría decirse que son más las ventajas del muestreo frente al censo; algunas de ellas son:

● Costo: El estudio de todos los elementos de una población requiere de una mayor cantidad de recursos en comparación con el estudio de una muestra.
● Rapidez: Cuando se trabaja con una muestra, la información puede ser recolectada y procesada más rápidamente que cuando se realiza un censo.
● Exactitud: En principio podría parecer contradictorio que un muestreo pudiera ser más exacto que un censo; sin embargo, el panorama se aclara cuando se considera que las características de la población pueden variar si el estudio llegara a prolongarse por demasiado tiempo. Además, en términos generales, la información recogida por muestreo tiene mayor precisión que aquella recogida entre todos los miembros de la población objeto de estudio, dado que un menor número de elementos que constituye la muestra permite un trabajo de mejor calidad, alcanzándose un mayor control en cada una de las etapas de recolección y tratamiento de los datos. Como el volumen de trabajo se reduce, se puede emplear personal calificado y realizar una supervisión cuidadosa del trabajo de campo y del procesamiento de la información.
● Posibilidad de realizarse: En algunas ocasiones, simplemente no es posible estudiar todos y cada uno de los elementos de una población, ya sea porque ésta es infinita o al menos tan grande que excede las posibilidades del investigador; también ocurre a menudo que las pruebas a las que hay que someter a los individuos son  de carácter destructivo, como en el ejemplo de los huevos de la granja, en el que se debe examinar su contenido, la duración de una batería o una bombilla, en la que estos se prueban hasta que dejan de funcionar, pruebas de impacto sobre cascos de motociclistas, etc.



Variables Cualitativas y Cuantitativas.

Se llama variable estadística a cada una de las características o cualidades que poseen los individuos de una población. Éstas pueden ser de dos clases:
  • Cualitativas: Se refieren a características o cualidades que no pueden ser medidas con números. Entre ellas, se diferencian dos tipos:
    • Nominales: No admiten un criterio de orden; por ejemplo, el estado civil de una persona (soltero, casado, viudo, separado, unión libre), la nacionalidad  de los jugadores de determinada liga de fútbol (argentino, boliviano, chileno, colombiano, ecuatoriano, español, peruano, etc.), el sexo de una persona (masculino o femenino), los colores más vendidos por un fabricante de pinturas, etc.
    • Ordinales o cuasicuantitativas: Existe un orden entre ellas; es decir, pueden ordenarse de acuerdo con alguna escala establecida; por ejemplo, las medallas obtenidas en una prueba olímpica (oro, plata y bronce), el grado de satisfacción con respecto a un servicio recibido (muy satisfecho, satisfecho, indeciso, insatisfecho, muy insatisfecho) o la escala sismológica modificada de Mercalli, que clasifica un sismo desde muy débil hasta catastrófico.

  • Cuantitativas: Se expresan mediante un número, pudiéndose por tanto realizar operaciones aritméticas con ellas. Pueden ser también de dos tipos: 
    • Discretas: Toman solamente valores aislados, dentro de un conjunto numerable; es decir, no acepta valores intermedios, por fuera de ese conjunto, entre dos valores específicos; por ejemplo, el número de autos vendidos semanalmente en un concesionario: 0, 1, 2, 3, 4, 5, 6, ... o la altura, en pisos, de los edificios en un sector comercial: 8, 9, 10, 11, ...
    • Continuas: Pueden tomar cualquier valor dentro de un intervalo comprendido entre dos números; entre cualquier par de valores observables, siempre existirá un tercer valor posible que pueda tomar la variable. El valor observado depende, en gran medida, de la precisión de los instrumentos de medición. Ejemplo de este tipo de variables son: la altura de las casas en un barrio residencial: 10.5m, 10,6m, 10.65m, 11.743m, ... o el peso de una docena de manzanas: 1.8Kg, 1.8671Kg, 1.894Kg, 1,92Kg, ... Sin importar qué par de valores se tome, siempre existe la posibilidad de que ocurra uno intermedio entre ellos.

Diferencia entre variable, valor y dato.

Como se acaba de describir, variable es cada característica de los individuos de una población. A cada uno de los distintos resultados que se puede obtener en un estudio estadístico, se le llama valor. Finalmente, cada uno de los valores obtenidos durante la realización de un estudio estadístico, es un dato.
Téngase como ejemplo el caso del lanzamiento de una moneda, para observar qué lado cae hacia arriba. El lado de la moneda que cae hacia arriba, será entonces la variable. Los valores serán los dos posibles resultados, cara y sello (omítase la eventualidad de que caiga de canto). Los datos serán todos los resultados que en efecto se obtuvieron al momento de realizar las pruebas (sello, cara, cara, cara, sello, cara, sello, sello, ...). En un segundo caso, un fabricante produce un modelo de sillas en tres colores: amarillo, azul y rojo, y se hace un estudio para conocer cuál de estos es el más vendido; aquí, la variable es el color de la silla; los valores son amarillo, azul y rojo; los datos son los colores de las sillas que efectivamente han sido vendidas y que han sido tenidas en cuenta para el estudio (azul, roja, roja, roja, amarilla, azul, roja, azul, ...).

Anterior entrada: Conceptos básicos de estadística, parte I
Siguiente entrada: Conceptos básicos de estadística, parte III


Licencia de Creative Commons
Estadística con Iwai by Juro Iwai is licensed under a Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional License.

lunes, 23 de marzo de 2015

Conceptos básicos de estadística, parte I

Definición de Estadística.


De acuerdo con la Enciclopedia Británica, la Estadística es la "ciencia de recolectar, analizar, presentar e interpretar datos... Los datos son los hechos y cifras que son recogidos, analizados y resumidos para su presentación e interpretación". Para la Real Academia Española, la Estadística es el "estudio de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación de las sociedades humanas", o bien "la rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades".
La estadística se aplica en los programas de Gobierno, Ingeniería, Agronomía, Economía, Medicina, Biología, Psicología, Pedagogía, Sociología, Física, etcétera; no hay alguna ciencia que no la use o profesión que no la aplique.
Siendo la estadística aplicable a todos los campos de la actividad humana, es apenas natural que se tenga como asignatura indispensable en todas las áreas y carreras del conocimiento, a nivel intermedio y profesional. La estadística aplicada tiene frecuentemente como objetivo responder a preguntas concretas sobre el comportamiento de conjuntos muy amplios o inaccesibles de individuos, como por ejemplo:
  • ¿Qué proporción de electores votaría por determinado candidato, si las elecciones fueran hoy?
  • ¿Se comportan los conductores de forma amable o agresiva mientras están al volante?
  • ¿Qué porcentaje de ciudadanos destina más del 50% del presupuesto familiar en gastos de vivienda?
  • ¿Cumple una clase de tubería en particular con las especificaciones de la norma ISO?




Población, Individuo y Muestra.

Imagínese que el dueño de la granja avícola "El huevo dorado" garantiza que los huevos que allí se venden contienen no menos de 12gr. de proteína por cada 100gr. de producto. Si se quisiera verificar tal afirmación en todos los huevos que salen de la granja, sería necesario destruir cada uno de ellos, para examinar su contenido. Una mejor opción consiste en tomar unos cuantos, en representación de todos, y realizar sobre estos pocos las pruebas requeridas. El anterior caso pone de manifiesto que no siempre es posible (o conveniente) realizar un estudio estadístico sobre todos los elementos de interés, debiéndose tratar, la mayoría de las veces, solamente con algunos de ellos. Es aquí donde cobran importancia los conceptos de población, individuo y muestra:






  • Población: Es el conjunto de todos los elementos (personas, objetos, animales, etc.) sometidos a un estudio estadístico. Puede referirse a cualquier conjunto de elementos de los cuales se pretende indagar y conocer alguna característica (o un grupo de ellas), y para el cual serán válidas las conclusiones obtenidas en la investigación.
  • Individuo: Es cada uno de los elementos que componen una población y que porta información sobre el fenómeno estudiado.
  • Muestra: Es una parte o un subconjunto representativo y finito de la población de referencia, científicamente seleccionado; por tanto, el número de individuos de una muestra es menor que el de la población.


Supóngase, por ejemplo, que se desea conocer con qué frecuencia (días) y en qué cantidad (litros o galones) se aprovisionan de combustible los autos de cierta ciudad del país. Ante la evidente dificultad de recabar información sobre toda la población, representada en la gráfica por los autos dentro del recuadro verde, se acude a hacerlo sobre una muestra, correspondiente a los autos dentro de la figura azul; cada uno de esos autos, como el del recuadro rojo, es un individuo, no importa si está o no incluido en la muestra.

Individuo, población y muestra en un Prezi.

Siguiente entrada: Conceptos básicos de estadística, parte II




Licencia de Creative Commons
Estadística con Iwai by Juro Iwai is licensed under a Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional License.