[Previo por Fecha] [Siguiente por Fecha] [Previo por Hilo] [Siguiente por Hilo]
[Hilos de Discusión] [Fecha] [Tema] [Autor]On Tue, 2003-10-14 at 01:21, linuxlst en netropology com wrote: > On 15 Oct 2003 00:33:22 -0500 "Jorge L. Rivas" wrote: > > > > > Contestándole en particular a Juan Francisco Vázquez: A pesar de ser un > > buen proyecto, no creo que el “Contador de Usuarios de Linux > > (CUL)“ sea > > una fuente confiable de datos estadísticos. El problema, desde mi punto > > de vista, reside en que la muestra es muy pequeña (2361 usuarios) para > > hacer una buena inferencia estadística. > > Ojo, las estadsticas que se presentan en el Counter Linux no son > inferencias, ni estimaciones, es decir no se basan en ninguna muestra > slo es Estadstica Descriptiva cuyos datos no se toman de una poblacin > o universo, simplemente presentan los datos de los usuarios que se han > registrado. Ojos, tengo 2.. pero te presto uno para que leas bien pues nunca dije que los DATOS fueran inferencias. Dije que NO se pueden sacar buenas inferencias de esos datos, pues no son representativos de la población de usuarios de GNU/Linux en México, no pueden ser tomados como base para un estudio estadístico inferencial confiable, etc. Sigue Leyendo... Ahora, ya que lo que OBVIAMENTE deseamos es determinar una medida de la adopción de GNU/Linux (pregunta 2 del próximo master), descarto y recontradescarto (sic) tu propuesta de usar el CUL para la obtención de datos. Tu mismo me das la razón al decir que, y cito: "simplemente presentan los datos de los usuarios que se han registrado" Para obtener inferencias (que es lo que queremos hacer y lo pongo otra vez por si no lo entendiste) es necesario tener una muestra con la característica principal de la "representatividad". Yo puedo, arbitrariamente, tomar el dato de los 2361 usuarios como mi muestra y mi población igual a la población total de nuestro país (dejando a un lado su validez). Partí, pues, de ahí para llegar a la conclusión de que esa muestra arbitraria no era representativa y por lo tanto que el CUL, por si solo, no era una fuente confiable de datos para un estudio más a fondo. > > > Además de tener el tamaño correcto, la muestra debe dar una oportunidad > > igual a cada objeto de la población (mexicano pues) de ser incluido en > > la muestra. El CUL recibe sus datos vía Internet lo que excluye un > > porcentaje de la población que no cuenta con acceso. > > Jeje!!!, si y no... primero ojo, los datos presentados en el Cunter Linux > no son resultados generados del uso de Inferencia Estadstica (calculo de > estimadores), ahora, respecto al comentario de que Aquí pues era la segunda parte de mi afán por llegar a la conclusión de que esa muestra no era representativa. > > "La muestra debe de dar una oportunidad igual a cada objeto de la > poblacin", bueno pues una muestra no nesariamente debe de cumplir este > requisito, hay diferentes tcnicas de muestreo como > > Aleatorio Simple (que es el que comentas) > Muestreo Estratificado > Muestreo Sistemtico > Submuestreo con unidades de diferentes tamaos > etc. etc. > (jeje!! todos ellos tomados de mi libro > de muestreo > Tecnicas de Muestreo de William G. Cochran > ups!! ya ten aos que no lo vea :'-( ) > > > > Estimar la tasa de adopción de GNU/Linux en particular y del Software > > Libre en general es una tarea difícil, cuasi imposible, ya que no existe > > una fuente centralizada de información. > > Exacto!!! pero no pueden negar que es una buena referencia, > no la mejor pero si una buena referencia, al menos sabes que los datos > presentados son los intervalos mnimos y eso es bueno saberlo. Como dices solo son datos de los usuarios que entran al sitio. Peor aún, existen datos repetidos, probablemente no actualizados (me refiero a la gente que no actualiza su situación), etc. No creo que sirvan esos mínimos. > > > ¿Qué datos podríamos usar para estimar (o como dicen en ingles: > > guesstimate) la tasa de adopción en nuestro país? > > > Haciendo comparaciones en un periodo de tiempo de: > > > > * Numero de distribuciones oficiales vendidas en México (por > > Internet, tiendas) > > > > * Crecimiento del numero de Grupos de Usuarios (GUL's) en el país. > > > > * Numero de usuarios en los GUL's: crecimiento del numero miembros > > (no se si todos los GUL's tengan esa información) > > > > * Numero de discos distribuidos por los GUL's > > > > * Cuantas listas de usuarios hay, cuantos miembros tienen y > > cuantos se agregan cada mes. > > > > * Numero de empresas dedicadas al soporte o distribución de > > productos basados en GNU/Linux > > > > * Entre otros, similares a los del CUL pero enfocándonos > > únicamente a nuestro país > > OK... y cual va a ser tu fuente de informacin para sacar todos estos > datos y despus hacer tus muestreos con los que hars tus estimaciones?. - Entrevistas a los GULS - Puedes pedir informes a las distribuidoras en México de RedHat, SuSe, etc. - Contactar a los administradores de las listas de correo - etc > > > Por ultimo, también podría ser conveniente hacer comparaciones entre > > México y otros países. Pero mientras no hagamos un censo o encuesta para > > determinar la penetración de GNU/Linux, no existirá certeza. > > Efectivamente, pero entonces no desechemos la informacin con la que s > contamos (entre otras la de Linux Cunter) que te puede dar alguna > idea de tooodas tus preguntas, s, s tus estimadores puntuales tal vez > no sean "consistentes", "suficientes", sera "un estimador sesgado", etc, > etc, y si tus estimadores son por intervalos el coeficiante de confianza > (probabilidad de que un intervalo de confianza contenga a tu estimador) > puede ser muy baja, s, s puede pasar todo esto, pero mientras no > tengamos el censo (que esta caon) o muestra(s) necesaria(s) para generar > estadsticas confiables, pues utilicemos la infomracin que se tiene. > No se trata de tirarlos a la basura, los datos ahí están, es simplemente que se pueden obtener otros datos mejores o más representativos. > > > PD: Como es costumbre en estos días de gran preocupación me pregunto a > > mi mismo: Mi mismo, ¿Será este un buen tema de tesis? > > jeje!!!, pues si te gusta la matemtica aplicada, igual y s.. > es un reto desde cmo definir el poblacin de la que tomaras tu muestra, > y ya no digamos el tipo de estimador, distribuiciones, etc. > tipos de estadsticas, etc. etc. > La tesis es para obtener el grado de Licenciatura en Matematicas Aplicadas y Computación (por eso me puedo ir para cualquiera de los dos lados...) Cualquier propuesta, favor de enviarla a mi correo. Saludos Jorge L. Rivas www.xiniom.com > Saludos. > > Francisco Vzquez > > This message powered by EMUMAIL. -- http://www.EMUMAIL.com > _______________________________________________ Ayuda mailing list Ayuda en linux org mx Para salir de la lista: http://mail.linux.org.mx/mailman/listinfo/ayuda/