jueves, 6 de agosto de 2009

probabilidad

Probabilidad
1. Experimentos aleatorios. Espacio maestral.
Experimentos o fenómenos aleatorios son los que pueden dar lugar a varios resultados, sin que pueda ser previsible enunciar con certeza cuál de éstos va a ser observado en la realización del experimento.
Si dejamos caer una piedra o la lanzamos, y conocemos las condiciones iniciales de altura, velocidad, etc., sabremos con seguridad dónde caerá, cuánto tiempo tardará, etc. Es una experiencia determinista. Si echamos un dado sobre una mesa, ignoramos qué cara quedará arriba. El resultado depende del azar. Es una experiencia aleatoria.
Suceso aleatorio es un acontecimiento que ocurrirá o no, dependiendo del azar.
La vida cotidiana está plagada de sucesos aleatorios. Muchos de ellos, de tipo sociológico (viajes, accidentes, número de personas que acudirán a un gran almacén o que se matricularán en una carrera...) aunque son suma de muchas decisiones individuales, pueden ser estudiados, muy ventajosamente, como aleatorios.
Espacio muestral es el conjunto formado por todos los posibles resultados de un experimento aleatorio. En adelante lo designaremos por E.
A la colección de resultados que se obtiene en los experimentos aleatorios se le llama espacio muestral.
Ejemplos:
En un dado, E={1,2,3,4,5,6}
En una moneda, E={C,+}
Para empezar, vamos a prestar atención a experiencias aleatorias sencillas como lanzar dados o monedas, extraer cartas de una baraja, sacar bolas de urnas,...
Ejercicio 1-1:Describe el espacio muestral asociado a cada uno de los siguientes experimentos aleatorios:
Lanzar tres monedas.
Lanzar tres dados y anotar la suma de los puntos obtenidos.
Extracción de dos bolas de una urna que contiene cuatro bolas blancas y tres negras.
El tiempo, con relación a la lluvia, que hará durante tres días consecutivos.
Sucesos.
En el Ejercicio 1.1 del capítulo anterior podemos ver que el espacio muestral asociado al lanzamiento de tres dados y anotar la suma de los puntos obtenidos es:
E={3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18}
Podemos considerar algunos subconjuntos de E, por ejemplo:
Salir múltiplo de 5:
A={5,10,15}
Salir número primo:
C={2,3,5,7,11,13,17}
Salir mayor o igual que 12:
D={12,13,14,15,16,17,18}
Todos estos subconjuntos del espacio muestral E los llamamos sucesos. Suceso de un fenómeno o experimento aleatorio es cada uno de los subconjuntos del espacio muestral E.
Los elementos de E se llaman sucesos individuales o sucesos elementales.
También son sucesos el suceso vacío o suceso imposible , Ø, y el propio E, suceso seguro.
Al conjunto de todos los sucesos de una experiencia aleatoria lo llamaremos S.
Si E tiene un número finito, n, de elementos, el número de sucesos de E es 2n.
Ejemplos:
{1,2},{2,4,6},{3,5} son sucesos. {1},{2}, {3}..., son sucesos individuales.
En un dado hay 26 = 64 sucesos.
En una moneda hay 22 = 4 sucesos, que son: Ø, {C},{+}, {C,+}
Es decir, S={Ø,{C},{+},{C,+}}
Ejercicio 2.1-1:Se considera el sexo de los hijos de las familias de tres hijos. Sea A el suceso el hijo mayor es una Solución:
Llamando C a obtener cara y X a la obtención de cruz, obtenemos el siguiente espacio muestral:
E={(CCC),(CCX),(CXC),(XCC),(CXX),(XCX),(XXC),(XXX)}
E={3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18}
Llamando B a sacar bola blanca y N a sacar bola negra, tenemos:
E={BB,BN,NN}
Si llamamos L al día lluvioso y N al día sin lluvia, para tres días consecutivos se obtiene el siguiente espacio muestral:
E={(LLL),(LLN),(LNL),(NLL),(LNN),(NLN),(NNL),(NNN)}
hembra, y B el suceso los dos hijos pequeños son varones. ¿Cuáles son los elementos de A y B?
Ejercicio 2.1-2:Tenemos una urna con nueve bolas numeradas del 1 al 9. Realizamos el experimento, que consiste en sacar una bola de la urna, anotar el número y devolverla a la urna. Consideramos los siguientes sucesos: A="salir un número primo" y B="salir un número cuadrado". Responde a las cuestiones siguientes:
Calcula los sucesos y .
Los sucesos A y B, ¿son compatibles o incompatibles?.
Encuentra los sucesos contrarios de A y B.
Solución:
Los sucesos A y B están formados por los sucesos elementales que pueden verse a continuación:
A = {2,3,5,7}B = {1,4,9}
A partir de estos conjuntos, tenemos:
La unión e intersección de A y B son:
= {1,2,3,4,5,7,9}= Ø
Al ser = Ø, los sucesos A y B son incompatibles.
El suceso contrario de A es = {1,4,6,8,9}El suceso contrario de B es = {2,3,5,6,7,8}

Estadistica

Estadística
1. Conceptos Básicos
2. Medición de Caracteres
3. Estadísticas Primarias
Conceptos Básicos:
Estadística:
La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros datos numéricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra.
"La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares". (Gini, 1953.
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.
Población:
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).
Ejemplo:
Los miembros del Colegio de Ingenieros del Estado Cojedes.
El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que está formada por un limitado número de elementos, por ejemplo; el número de estudiante del Núcleo San Carlos de la Universidad Nacional Experimental Simón Rodríguez.
Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra.
Muestra:
"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Cojedes.
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Por último se aprobado que el examen de una población entera todavía permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.
Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer referencias sobre la población que está representada por la muestra. En consecuencia muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo.
Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población.
Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.
Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.
Ejemplo;
Consideremos como una población a los estudiantes de educación del Núcleo San Carlos de la UNESR, determinando por lo menos dos caracteres ser estudiados en dicha población;
· Religión de los estudiantes
· Sexo.
Tipos de muestreo
Existen dos métodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este último todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir como tomar una muestra aleatoria más adelante. Las muestras de juicio evitan el análisis estadístico necesario para hacer muestras de probabilidad.
Variables y Atributos:
Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante números. Son caracteres susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario, la edad, etc.
Según, Murray R. Spiegel, (1992) "una variable es un símbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante."
Todos los elementos de la población poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos números o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable.
Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es decir que no se pueden expresar mediante un número.
IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas características que pueden presentarse en individuos que constituyen un conjunto.
La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades".
Ejemplo;
El estado civil de cada uno de los estudiantes del curso de estadísticas I, no se presenta en la misma modalidad en todos.
Formas de Observar la Población:
1. Atendiendo a la fuente se clasifican en directa o indirecta.
o Observación directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los resultados obtenidos se consideran datos estadísticos originales. Para Ernesto Rivas González (1997) "Investigación directa, es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus resultados se consideran datos estadísticos originales, por esto se llama también a esta investigación primaria".
Ejemplo; el seguimiento de la población agrícola por año, llevado en una determinada granja.
o Observación Indirecta: es aquella donde la persona que investiga hace uso de datos estadísticos ya conocidos en una investigación anterior, o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos.
Ejemplo; si un investigador pretende estudiar la producción por años de una granja avícola, en sus últimos cinco años de producción, tendría que hacer un seguimiento, a tal fin recurriría a las observaciones que posee la oficina administrativa de la granja durante estos cinco años, o dirigirse a la oficina de estadística, llevada en el ministerio de producción y comercio (M.P.C) de la localidad donde está registrada dicha granja. Es de notar que el investigador se vale de observaciones realizadas por terceros.
1. Atendiendo a la periodicidad, puede ser continua, periódica o circunstancial.
o Una observación continua; como su nombre lo indica es aquella que se lleva acabo de un modo permanente.
Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van registrando a medida que van produciéndose.
o Una observación periódica; es aquélla que se lleva a cabo a través de períodos de tiempo constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años, etc. Lo que debemos destacar es que los períodos de tiempo tomados como unidad deben tomarse constantes en los posibles.
Ejemplo; el registro llevado por la Oficinas de Control de Estudios de la UNESR, en cuanto a la inscripción de los estudiantes por semestre.
o La observación circunstancial, es aquella que se efectúa en forma ocasional o esporádica, esta observación hecha más por una necesidad momentánea, que de carácter regular o permanente.
Ejemplo; la obtención de números de aulas utilizadas y no utilizadas en los colegios pertenecientes al municipio San Carlos del Estado Cojedes.
1. Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta
o Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad de los elementos de la población se habla de una observación exhaustiva.
o Observación Parcial. Dados que las poblaciones en general son grandes, la observación de todos sus elementos se ve imposibilitada. La solución para superar este inconveniente es observar una parte de esta población.
o Observación Mixta. En este tipo de observación se combinan adecuadamente la observación exhaustiva con la observación parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran básicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la población es muy grande, parte de ella se observa parcialmente.
Censo:
Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población.
Para Levin & Rubin (1996) "Algunas veces es posible y práctico examinar a cada persona o elemento de la población que deseamos describir. A esto lo llamamos una numeración completa o censo. Utilizamos el muestre cuando no es posible contar o medir todos los elementos de la población.
Si es posible listar (o enumerar) y observar cada elemento de la población, los censos se utilizan rara vez porque a menudo su compilación es bastante difícil, consume mucho tiempo por lo que resulta demasiado costoso.
Encuesta:
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales.
El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas, 1974).
Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un gran número de personas".
Estadística Descriptiva:
Tienen por objeto fundamental describir y analizar las características de un conjunto de datos, obteniéndose de esa manera conclusiones sobre las características de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observación de todos los elementos de una población (observación exhaustiva) sino también a la descripción de los elementos de una muestra (observación parcial).
En relación a la estadística descriptiva, Ernesto Rivas Gonzáles dice; "Para el estudio de estas muestras, la estadística descriptiva nos provee de todos sus medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrán la misma exactitud que tienen para la muestra, es decir al estimarse para el universo vendrá dada con cierto margen de error; esto significa que el valor de la medida calculada para la muestra, en el oscilará dentro de cierto límite de confianza, que casi siempre es de un 95 a 99% de los casos.
Estadística Inductiva:
Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el fin de inducir o inferir el comportamiento o característica de la población, de donde procede, por lo que recibe también el nombre de Inferencia estadística.
Según Berenson y Levine; Estadística Inferencial son procedimientos estadísticos que sirven para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando un grupo menor de ellos (muestra).
El objetivo de la inferencia en investigación científica y tecnológica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeñas compuestas por los mismos elementos.
En relación a la estadística descriptiva y la inferencial, Levin & Rubin (1996) citan los siguientes ejemplos para ayudar a entender la diferencia entre las dos.
Supóngase que un profesor calcula la calificación promedio de un grupo de historia. Como la estadística describe el desempeño del grupo pero no hace ninguna generalización acerca de los diferentes grupos, podemos decir que el profesor está utilizando estadística descriptiva. Graficas, tablas y diagramas que muestran los datos de manera que sea más fácil su entendimiento son ejemplos de estadística descriptiva.
Supóngase ahora que el profesor de historia decide utilizar el promedio de calificaciones obtenidas por uno de sus grupos para estimar la calificación promedio de las diez unidades del mismo curso de historia. El proceso de estimación de tal promedio sería un problema concerniente a la estadística inferencial.
Los estadísticos se refieren a esta rama como inferencia estadística, esta implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez.
UNIDAD II
Medición de Caracteres
Medición
Existen diversas definiciones del término "medición", pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la cuantificación y el proceso mismo de la construcción de una escala o instrumento de medición.
En general, se entiende por medición la asignación de números a elementos u objetos para representar o cuantificar una propiedad. El problema básico está dado por la asignación un numeral que represente la magnitud de la característica que queremos medir y que dicho números pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas "números". Es evidente que el mundo resultaría caótico si no pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la físico saber que el hierro tiene una alta temperatura de fusión.


Niveles o Escalas de mediciones
Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la asignación, puramente arbitraria de números o símbolos a cada una de las diferentes categorías en las cuales podemos dividir el carácter que observamos, sin que puedan establecerse relaciones entre dichas categorías, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan números, puede ser una de las razones por las cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo San Carlos de acuerdos a la carrera que cursan.
Carrera
Número asignada a la categoría
Educación
1
Administración
2
Se ha de tener presente que los números asignados a cada categoría sirven única y exclusivamente par identificar la categoría y no poseen propiedades cuantitativas.
Escala Ordinal:
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los números asignándolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B.
La asignación de números a las distintas categorías no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre éstas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como por ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el orden de llegada, estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada número representará una categoría en general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los números asignados guardan la misma relación que el orden de llegada a la consulta.


Escalas de intervalos iguales:
la escala de intervalos iguales, está caracterizada por una unidad de medida común y constante que asigna un número igual al número de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta escala, además de poseer las características de la escala ordinal, encontramos que la asignación de los números a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculársele todas las medidas estadísticas a excepción del coeficiente de variación.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.
Escala de coeficientes o Razones:
El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los números asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B.
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos.
Las variables y su medición:
Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable es discreta".
Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numéricamente la magnitud de dichas variaciones. Por intuición y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas
Las variables continuas se caracterizan por el hecho de que para todo para de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.)
Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.
Para ver el gráfico seleccione la opción "Descargar" del menú superior
Ejemplo:
En el preescolar Blanca de Pérez, ubicado en la urbanización Monseñor Padilla de esta ciudad se procedió a recoger las medidas de talla y peso de los niños que a este asisten.
Niño Peso Talla
José 18,300 1,15
Julio 20,500 1,20
Pedro 19,000 1,10
Luis 18,750 1,18
.Las variables discretas serán aquellas que pueden tomar solo un número limitado de valores separados y no continuos; son aquellas que solo toman un determinado números de valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por ejemplo el número de estudiantes de una clase es una variable discreta ya que solo tomará los valores 1, 2, 3, 4... Nótese que no encontramos valor como 1,5 estudiantes
UNIDAD III
Estadísticas Primarias
Datos Estadísticos:
Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenómeno que queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo que es muy difícil en general, obtener conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y rápida información con propósitos de descripción o análisis, estos deben organizarse de una manera sistemática; es decir, se requiere que los datos sean clasificados. Esta clasificación u organización puede muy bien hacerse antes de la recopilación de los datos.
Ejemplo:
Si se quiere conocer las características de los estudiantes del Núcleo San Carlos de la UNESR, que solicitan préstamo a la biblioteca de dicha Universidad, la recolección de la información debe clasificar a cada estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificación marca la pauta de la clase de datos que debe ser obtenido.
Clasificación de los datos
Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y geográficos.
Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad.
Ejemplo:
Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.
Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos.
Ejemplo:
Se clasifican los estudiantes del Núcleo San Carlos de la UNESR de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes.
Datos cronológicos: cuando los valores de los datos varían en diferentes instantes o períodos de tiempo, los datos son reconocidos como cronológicos.
Ejemplo:
Al registrar los promedios de notas de los Alumnos del Núcleo San Carlos de la UNESR en los diferentes semestres.
Datos geográficos: cuando los datos están referidos a una localidad geográfica se dicen que son datos geográficos.
Ejemplo
El número de estudiantes de educación superior en las distintas regiones del país.
Fuentes de datos Estadísticos:
Los datos estadísticos necesarios para la comprensión de los hechos pueden obtenerse a través de fuentes primarias y fuentes secundarias.
Fuentes de datos primarias: es la persona o institución que ha recolectado directamente los datos.
Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades que no han recolectado directamente la información.
Las fuentes primarias más confiables, son las efectuadas por oficinas gubernamentales encargadas de tal fin.
En la práctica, es aconsejable utilizar fuentes de datos primarias y en última instancia cuando estas no existan, usar estadísticas de fuentes secundarias. Con este último tipo no debemos pasar por alto que la calidad de las conclusiones estadísticas depende en grado sumo de la exactitud de los datos que se recaben. De anda serviría usar técnicas estadísticas precisas y refinadas para llegar a conclusiones valederas, si estas técnicas no son aplicadas a datos adecuados o confiables.
Cuando un investigador quiere obtener datos estadísticos relativo a un estudio que desea efectuar, puede elegir entre una fuente primaria o en su defecto, una secundaria. O recopilar los datos por sí mismo. La posibilidad mencionada en último término podrá deberse bien a la inexistencia de los datos o bien a que esto no se encuentra discriminado en la forma requerida.
Ejemplo:
Si un investigador quiere conocer el número de alumnos repitientes en educación media, clasificados por ciclos, para los últimos diez años, el investigador puede usar una fuente primaria, tal como la memoria y cuenta el Ministerio de Educación cada año.


Método para la recolección de datos:
En estadística se emplean una variedad de métodos distintos para obtener información de los que se desea investigar. Discutiremos aquí los métodos más importantes, incluyendo las ventajas y limitaciones de estos.
La entrevista personal: los datos estadísticos necesarios para una investigación, se reúnen frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente, directamente a la persona investigada. El investigador efectuará a esta persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde anotará las respuestas correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite obtener una información más veraz y completa que la que proporcionan otros métodos, debido a que al tener contacto directo con la persona entrevistada, el entrevistador podrá aclarar cualquier duda que se presente sobre el cuestionario o investigación.
Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las preguntas al nivel intelectual de las personas entrevistadas.
Una de las desventajas de este método se debe a que si el entrevistador no obra de buena fe o no tiene un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas.
Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes o entrenadores y los supervisores de estos, sobre todo si se trata de una investigación extensa.
Cuestionarios por correo: consiste en enviar por correo el cuestionario acompañado por el instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las preguntas, sino también una breve explicación del objeto de la encuesta con el fin de evitar interpretaciones erróneas.
Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no hay que incluir gastos de entrenamiento de personal, el único gasto sería el de franqueo postal.
Dentro de las desventajas de este procedimiento podemos señalar que solo un porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia que la información se obtenga con una serie de errores difíciles de precisar por el investigador.
Entrevista por teléfono: como lo indica su nombre, este método consiste en telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este método es bastante simple y económico, ya que el entrenamiento y supervisión de las personas encargadas de efectuar las preguntas es siempre fácil.
Entre las limitaciones que presenta este método podemos señalar el número de preguntas que pueden formularse es relativamente limitado; además las investigaciones efectuadas por este método tienen un carácter selectivo, debido a que muchas de las personas que potencialmente podrían ser investigadas no posee servicio telefónico, por lo que quedan sin la posibilidad de ser entrevistados.

Instrumentos para la recolección de datos:
Cuestionarios:
Cualquiera que sea el método por el que se decida el investigador para recabar información, es necesario elaborar un estudio de preguntas.
Los cuestionarios en general, constan de las siguientes partes:
a. La identificación del cuestionario: nombre del patrocinante de la encuesta, (oficial o privada), nombre de la encuesta, número del cuestionario, nombre del encuestador, lugar y fecha de la entrevista.
b. Datos de identificación y de carácter social del encuestado: apellidos, nombres, cédula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instrucción, ocupación actual, ingresos, etc.
c. Datos propios de la investigación, son los datos que interesa conocer para construir el propósito de la investigación.
Como es natural, estas partes, así como las preguntas, varían de acuerdo a la finalidad de la encuesta. En algunos tipos de investigación, la parte referente a los datos personales es eliminada por no tener ningún tipo de interés para el estudio.
Consideraciones que debemos tomar en cuenta:
· El cuestionario debe ser conciso; tratar en los posibles de que con el menor número de preguntas, se obtenga la mejor información.
· Claridad de la redacción; evitar preguntas ambiguas o que sugieran respuestas incorrectas, por lo que deben estar formuladas las preguntas de la forma más sencilla.
· Discreción: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado.
· Facilidad de contestación: se deben evitar, en lo posible, las preguntas de respuestas libres o abiertas y también la formulación de preguntas que requieran cálculos numéricos por parte del entrevistado.
· Orden de las preguntas: estas deben tener una secuencia y un orden lógico, agruparlas procurando que se relacionen unas con otras.
Series o distribuciones estadísticas:
Anteriormente hemos señalado que la estadística, no se encarga del estudio de un hecho aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigación se obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lógica, con el fin de facilitar el análisis de los mismos esta colección de datos numéricos obtenidos de la observación, que se clasifican y ordenan según un determinado criterio, se denominan "series estadísticas", también conocidas como "distribución estadística".
Clasificación de las series estadísticas:
1. Series temporales o cronológicas; estas se definen como una masa o conjunto de datos producto de la observación de un fenómeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo.
Ejemplo:
Producción nacional de madera en Rola en m³
Rollizos (periodo 1993 – 1998)
Años
Producción (m³ rollizos)
1993
1.161.061,454
1994
981.668,626
1995
1.087.926,142
1996
1.440.306,250
1997
1.618.075,000
1998
1.027.177,876
Fuente: MARN – D.G.S Recurso Forestal. 1999
CVG – PROFORCA
Es importante resaltar que cuando se trata de series temporales o cronológicas, se debe especificar el instante o el periodo de tiempo a los que se refiere los caracteres en estudio.
Cuando nos referimos a instantes de tiempo, por el hecho de que la observación se hace en un momento específico de tiempo.
Ejemplo:
Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada año entre 1997 – 2001.
2. Series atemporales; cuando las observaciones de un fenómeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal. Aquí el tiempo no va incluido a cada observación, puesto que es el mismo tiempo para todas ellas. Este tipo de observación proporciona una "visión instantánea" de los fenómenos o caracteres de los componentes del colectivo en estudio.
Ejemplo:
Las notas de las participantes en la materia de estadística I en el periodo académico que terminó en septiembre del 2001.
2.1) series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que componen la población o muestra bajo análisis, observamos que en general, hay un número de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este número de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia.
El procedimiento mediante el cual se realiza el conteo, para así determinar el número de veces que cada dato se repite, recibe el nombre de tabulación.
Ejemplo:
Consideremos las edades de 20 niños, pertenecientes al Preescolar Blanca de Pérez, ubicado en la urbanización Monseñor Padilla
5
6
5
4
3
6
3
4
5
4
3
4
6
5
3
4
3
6
4
6
Tabulando los datos tenemos
Niños distribuidos por edades:
Edad (variable)
Nº de niños (Frecuencia)
3
5
4
6
5
4
6
5
Total =
20
Al agrupar los resultados de las observaciones en término de las veces que éstos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativa y cuantitativa, según que los caracteres de estudio se refieran a atributos o variable respectivamente.
2.2.1) Series de frecuencia acumulativa: son comúnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de modalidades.
Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carácter de tipo cualitativo y se procede a agruparlos según las distintas modalidades que toma el atributo, "frecuencia cualitativa".
Ejemplo:
Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadística I, respecto a su estado civil.
Estudiantes de la materia Estadísticas I, clasificados por su estado civil.
Estado civil
Nº de Estudiantes (frecuencia)
Solteros
18
Casados
12
Viudos
1
Divorciados
4
2.1.2) Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable.
Ejemplo:
Tomamos nuevamente los 35 estudiantes de la materia estadística I, respecto a su edad.
Edad (en años)
Nº de estudiantes (frecuencia)
19
12
20
2
25
8
28
6
32
4
42
3
Total =
35
2.2) series especiales o geográficas: es aquella que está formada por los valores que toman una variable en función del espacio geográfico.