viernes, 14 de marzo de 2008

teorema de chebyshev

Teorema De Chebyshev
señala la probabilidad de que variable aleatoria difiera de su media en t veces la desviacion estandar es por lo menos iguala 1/t)
o Teorema de Chebyshev: Para un conjunto cualquiera de observaciones (muestra o población), la proporción mínima de los valores que se encuentran dentro de k desviaciones estándares desde la media es al menos 1 – 1/k2, donde k es una constante mayor que 1.

En probabilidad, la desigualdad de Chebyshev es un resultado estadístico que ofrece una cota inferior a la probabilidad de que el valor de una variable aleatoria con varianza finita esté a una cierta distancia de su esperanza matemática o de su media; equivalentemente, el teorema proporciona una cota superior a la probabilidad de que los valores caigan fuera de esa distancia respecto de la media. El teorema es aplicable incluso en distribuciones que no tienen forma de "curva de campana" y acota la cantidad de datos que están o no "en medio".
Teorema: Sea X una variable aleatoria de media μ y varianza finita σ². Entonces, para todo número real k > 0,
k\sigma)\leq\frac{1}{k^2}." src="http://upload.wikimedia.org/math/a/b/c/abc4ac8eeb75c0db369ab6c6f8be19ec.png">
Sólo los casos con k > 1 proporcionan información útil.
Para ilustrar este resultado, supongamos que los artículos de Wikipedia tienen una extensión media de 1000 caracteres y una desviación típica de 200 caracteres. De la desigualdad de Chebyshev se deduce que al menos el 75% de los artículos tendrán una extensión comprendida entre 600 y 1400 caracteres (k = 2).
Otra consecuencia del teorema es que para cada distribución de media μ y desviación típica finita σ, al menos la mitad de los valores caerán en el intervalo (μ-√2 σ, μ+√2 σ).
Las cotas proporcionadas por la desigualdad de Chebyshev, en general, no se pueden mejorar; es posible construir una variable aleatoria cuyas cotas de Chebyshev sean exactamente iguales a las probabilidades reales. Sin embargo, en general el teorema proporcionará cotas poco precisas.
El teorema puede ser útil a pesar de las cotas imprecisas porque se aplica a una amplia gama de variables que incluye las que están muy alejadas de la distribución normal, y porque las cotas son fáciles de calcular. El teorema se emplea para demostrar la ley débil de los números grandes.
El teorema recibe su nombre del matemático Pafnuty Chebyshev.

COMENTARIO:
yo entendí que el teorema de chebyshev es un resultado estadistico ofrece una asociacion inferior a que de la probabilidad de que el valor de la variable aleatoria con varianza finita este a cierta distancia de la media y que se emplea para demostrar la ley debil de los numeros grandes y que recibe ese nombre por el matematico Pafnuty Chebyshev.

sábado, 8 de marzo de 2008

diagrama de caja

Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos.
En un gráfico que se suministra información sobre la mediana, El cuartil Q1 y Q3, sobre la existencia de atípicos y la simetría de la distribución.

Como dibujaarlo:
Ordenar los datos y obtener el valor mínimo, el máximo, y los cuartiles Q1, Q2 y Q3.
Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana (Q2) mediante una línea.
Calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos.
Considerar como atípicos los puntos localizados fuera del intervalo (Li, Ls).
Dibujar las líneas que van desde cada extremo del rectángulo central hasta el valor más alejado no atípico.
Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).

Utilidades
Proporcionan una visión general de la simetría de la distribución de los datos, si la media no está en el centro del rectángulo, la distribución no es simétrica.
Son útiles para ver la presencia de valores atípicos.

CLASIFICACION DE LAS VARIABLES

En un estudio científico, podemos clasificar las variables según la escala de medición o la influencia que asignemos a unas variables sobre otras y por esta razón .
Según la escala de medición:
Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas. Las variables cuas además pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Un ejemplo es el número de hijos.
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso o la altura, que solamente limitado por la precisión del aparato medidor, en teoría permiten que siempre existe un valor entre dos cualesquiera.
Según la influencia que asignemos a unas variables sobre otras, podrán ser:
Variables independientes: Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de confusión, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.
Variables dependientes: Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes.