Mostrando las entradas con la etiqueta dato. Mostrar todas las entradas
Mostrando las entradas con la etiqueta dato. Mostrar todas las entradas

sábado, 2 de mayo de 2015

Tablas de frecuencias, Conceptos previos

Frecuencias

Una vez que se han recolectado los datos, debe organizarse y resumirse la información en una tabla de frecuencias, de forma adecuada y útil, para su posterior estudio. Una tabla de frecuencias es una ordenación simplificada de los datos estadísticos, en la que a cada valor se le asigna un número que representa la cantidad de veces que ha aparecido. Dicho número recibe el nombre de frecuencia, de la cual existen varios tipos:

Frecuencia absoluta (fi).

Es el número de veces que se repite una característica o valor dentro de un conjunto de datos, trátese de una población o de una muestra. A cada uno de estos valores se le conoce como clase.

Frecuencia relativa (hi).

Es el cociente entre cada frecuencia absoluta y el número total de datos (n, si es una muestra, o N, si es una población).

hi = fi/n          hi = fi/N

La frecuencia relativa puede expresarse también en forma de porcentaje.

hi% = hx 100%


Frecuencia absoluta acumulada (Fi).

Presenta un saldo acumulado de las frecuencias absolutas de los intervalos. Se calcula sumando la frecuencia absoluta acumulada anterior, más la frecuencia absoluta actual. En otras palabras, es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Fi = Fi-1 + fi

Frecuencia relativa acumulada (Hi).

Presenta un saldo acumulado de las frecuencias relativas de cada intervalo de clase. Se calcula sumando la frecuencia relativa acumulada anterior, más la frecuencia relativa actual. En otras palabras, es la suma de las frecuencias relativas de todos los valores inferiores o iguales al valor considerado.
Hi = Hi-1 + h
Así como con la frecuencia relativa, la frecuencia relativa acumulada puede expresarse como un porcentaje. 
Hi% = Hi x 100%

Valor mínimo, Valor máximo y Rango.

Tratándose de variables cuantitativas, el valor mínimo y el valor máximo son la menor y la mayor cantidad que toma una variable en un conjunto de datos. El rango (R) es la diferencia existente entre esos valores máximo y mínimo.
R = Xmáx − Xmín

Ejemplo: Los siguientes datos corresponden a la talla, en centímetros, de una muestra de 30 recién nacidos durante el mes de enero de este año en cierto hospital:
54, 49, 49, 52, 49, 40, 50, 47, 50, 51, 49, 47, 51, 40, 47, 46, 48, 45, 51, 51, 47, 50,
48, 51, 51, 50, 48, 49, 47, 53.
Puede observarse que los valores mínimo y máximo son:
     Xmín = 40
     Xmáx = 54
De donde, el rango es:
     R = Xmáx − Xmín = 54 − 40 = 14

Anterior entrada: Truncamiento y redondeo de números decimales

Licencia de Creative Commons
Estadística con Iwai by Juro Iwai is licensed under a Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional License.

sábado, 28 de marzo de 2015

Conceptos básicos de estadística, parte II

Censo y Muestreo.

Existen dos formas de estudiar las poblaciones: por censo y por muestreo. En el censo se consideran todos y cada una uno de los elementos de una población, mientras que en el muestreo se analiza una proporción reducida y representativa de ella.


Mientras que los censos son muy útiles para el estudio de poblaciones pequeñas, podría decirse que son más las ventajas del muestreo frente al censo; algunas de ellas son:

● Costo: El estudio de todos los elementos de una población requiere de una mayor cantidad de recursos en comparación con el estudio de una muestra.
● Rapidez: Cuando se trabaja con una muestra, la información puede ser recolectada y procesada más rápidamente que cuando se realiza un censo.
● Exactitud: En principio podría parecer contradictorio que un muestreo pudiera ser más exacto que un censo; sin embargo, el panorama se aclara cuando se considera que las características de la población pueden variar si el estudio llegara a prolongarse por demasiado tiempo. Además, en términos generales, la información recogida por muestreo tiene mayor precisión que aquella recogida entre todos los miembros de la población objeto de estudio, dado que un menor número de elementos que constituye la muestra permite un trabajo de mejor calidad, alcanzándose un mayor control en cada una de las etapas de recolección y tratamiento de los datos. Como el volumen de trabajo se reduce, se puede emplear personal calificado y realizar una supervisión cuidadosa del trabajo de campo y del procesamiento de la información.
● Posibilidad de realizarse: En algunas ocasiones, simplemente no es posible estudiar todos y cada uno de los elementos de una población, ya sea porque ésta es infinita o al menos tan grande que excede las posibilidades del investigador; también ocurre a menudo que las pruebas a las que hay que someter a los individuos son  de carácter destructivo, como en el ejemplo de los huevos de la granja, en el que se debe examinar su contenido, la duración de una batería o una bombilla, en la que estos se prueban hasta que dejan de funcionar, pruebas de impacto sobre cascos de motociclistas, etc.



Variables Cualitativas y Cuantitativas.

Se llama variable estadística a cada una de las características o cualidades que poseen los individuos de una población. Éstas pueden ser de dos clases:
  • Cualitativas: Se refieren a características o cualidades que no pueden ser medidas con números. Entre ellas, se diferencian dos tipos:
    • Nominales: No admiten un criterio de orden; por ejemplo, el estado civil de una persona (soltero, casado, viudo, separado, unión libre), la nacionalidad  de los jugadores de determinada liga de fútbol (argentino, boliviano, chileno, colombiano, ecuatoriano, español, peruano, etc.), el sexo de una persona (masculino o femenino), los colores más vendidos por un fabricante de pinturas, etc.
    • Ordinales o cuasicuantitativas: Existe un orden entre ellas; es decir, pueden ordenarse de acuerdo con alguna escala establecida; por ejemplo, las medallas obtenidas en una prueba olímpica (oro, plata y bronce), el grado de satisfacción con respecto a un servicio recibido (muy satisfecho, satisfecho, indeciso, insatisfecho, muy insatisfecho) o la escala sismológica modificada de Mercalli, que clasifica un sismo desde muy débil hasta catastrófico.

  • Cuantitativas: Se expresan mediante un número, pudiéndose por tanto realizar operaciones aritméticas con ellas. Pueden ser también de dos tipos: 
    • Discretas: Toman solamente valores aislados, dentro de un conjunto numerable; es decir, no acepta valores intermedios, por fuera de ese conjunto, entre dos valores específicos; por ejemplo, el número de autos vendidos semanalmente en un concesionario: 0, 1, 2, 3, 4, 5, 6, ... o la altura, en pisos, de los edificios en un sector comercial: 8, 9, 10, 11, ...
    • Continuas: Pueden tomar cualquier valor dentro de un intervalo comprendido entre dos números; entre cualquier par de valores observables, siempre existirá un tercer valor posible que pueda tomar la variable. El valor observado depende, en gran medida, de la precisión de los instrumentos de medición. Ejemplo de este tipo de variables son: la altura de las casas en un barrio residencial: 10.5m, 10,6m, 10.65m, 11.743m, ... o el peso de una docena de manzanas: 1.8Kg, 1.8671Kg, 1.894Kg, 1,92Kg, ... Sin importar qué par de valores se tome, siempre existe la posibilidad de que ocurra uno intermedio entre ellos.

Diferencia entre variable, valor y dato.

Como se acaba de describir, variable es cada característica de los individuos de una población. A cada uno de los distintos resultados que se puede obtener en un estudio estadístico, se le llama valor. Finalmente, cada uno de los valores obtenidos durante la realización de un estudio estadístico, es un dato.
Téngase como ejemplo el caso del lanzamiento de una moneda, para observar qué lado cae hacia arriba. El lado de la moneda que cae hacia arriba, será entonces la variable. Los valores serán los dos posibles resultados, cara y sello (omítase la eventualidad de que caiga de canto). Los datos serán todos los resultados que en efecto se obtuvieron al momento de realizar las pruebas (sello, cara, cara, cara, sello, cara, sello, sello, ...). En un segundo caso, un fabricante produce un modelo de sillas en tres colores: amarillo, azul y rojo, y se hace un estudio para conocer cuál de estos es el más vendido; aquí, la variable es el color de la silla; los valores son amarillo, azul y rojo; los datos son los colores de las sillas que efectivamente han sido vendidas y que han sido tenidas en cuenta para el estudio (azul, roja, roja, roja, amarilla, azul, roja, azul, ...).

Anterior entrada: Conceptos básicos de estadística, parte I
Siguiente entrada: Conceptos básicos de estadística, parte III


Licencia de Creative Commons
Estadística con Iwai by Juro Iwai is licensed under a Creative Commons Reconocimiento-CompartirIgual 4.0 Internacional License.