Vistas de página en total

domingo, 4 de junio de 2017

REFLECTION

This last publication is a simple reflection of everything learned during the quarter, that there are still many others to know about this wide field.

In the first place and being honest, the subject during the classes did not seem difficult, but of course as always happens, the study of "to push the elbows" is left for the end, reason why the vision of Statistic has changed, say now I already consider it extensive and complicated. In this subject it is very important to practice because there are many different problems and many different formulas that can confuse you.

In the second place, I want to talk about the SEMINARS, they have been complicated because doing any work outside the hours of the faculty removes own time and always work some more than others; In addition the idea of ​​having to expose before the group (a regret that it was a small group) did not please any of the members, and more to know that the more timid had to talk about the final research work (a work of 40 slides Y 25 sheets of Word). Although it is true, we have also been able to learn a job with another type of program that we are not used to and that we could use in the future.

Finally I can only say that after a hard work during the quarter and during the year in general, today June 4, 2017 finalizes the publications of Statistics and begin shortly the final exams.

I only have to say, that with hard work and constancy I feel everything before and after, and that...


WHEN YOU SAY: YOU CANNOT... RESPOND: OBSERVE HOW I DO IT




THANK YOU TO ALL PEOPLE WHO HAVE FOLLOWED ME ALL THIS TIME

REFLEXIÓN

Esta última publicación es una simple reflexión de todo lo aprendido durante el cuatrimestre, que aún quedan muchas otras por conocer de este campo tan amplio.

En primer lugar y siendo sincera, la asignatura durante las clases no parecían difíciles, pero claro como siempre suele pasar, el estudio de “hincar los codos” se deja para el final, por lo que la visión de Estadística ha cambiado, digamos que ahora ya la considero extensa y complicada. En esta asignatura es muy importante practicar porque existen muchos problemas diferentes, y muchas fórmulas distintas que pueden hacer confundirte.

En segundo lugar, quiero hablar de los SEMINARIOS, han sido complicados porque realizar cualquier trabajo fuera del horario de la facultad quita tiempo propio y siempre suelen trabajar unos más que otros; además la idea de tener que exponer delante del grupo (a pesar de que era un grupo reducido) no nos agradaba a ninguno de los miembros, y más saber que los más tímidos tenían que hablar del trabajo final de investigación (un trabajo de 40 diapositivas y 25 hojas de Word). Aunque sí es cierto, que también hemos podido aprender a trabajar con otro tipo de programa del que no estamos acostumbrado y que en un futuro podríamos usar.

Finalmente solo me queda decir que tras un duro trabajo durante el cuatrimestre y durante el año en general, hoy día 4 de junio de 2017 finaliza las publicaciones de Estadística y comienzan en breve los exámenes finales.


Solo me queda decir, que con trabajo duro y constancia todo se consigue antes o después, y que…



GRACIAS A TODAS LAS PERSONAS QUE ME HAN SEGUIDO TODO ESTE TIEMPO.

sábado, 3 de junio de 2017

SEMINAR 5

SEMINAR 5

The last seminar was held on May 22, 2017, the two hours that lasted were dedicated to the exhibition of all research work. Focusing on what our group did, "The consumption of narghile in society," we could deduce that the null hypotheses that we raised should be rejected, and above all that the majority of the population had regularly tried or consumed hookah compared to tobacco that Had a higher percentage.

Each work should have the following sections:

Title
Authors and affiliation
Introduction.
Theoretical framework.
Material and method.
Goals.
Hypothesis.
Results.
Discussion.
Conclusion.
Thanks.
Bibliographic references.

Below are a series of graphs and diagrams that represent numerous data that we compare and the results that we obtained.

People who have ever eaten hookah.




Reason why they started smoking and with whom they used to smoke.



They own their own hookah, 25%.





Twelve percent of the population used to hook the pipe with some of the things mentioned in the bar diagram.





We were surprised to learn that 15% of the population did not care that children under 12 years of age smoke hookah.


In the conclusions we drew we realized that the majority considered that smoking was less harmful than consuming tobacco because they also thought that it contained natural components. We learned from the Chi Square test that hookah and tobacco consumption are related.
Another important data that we observed was that they started consuming between the ages of 14 and 16, while others tried it at 7-8 years; Nevertheless the majority consumed with more regularity between the 16 and the 20 years, quite worrying numbers in general.
Finally we reject the 5 null hypotheses that we put forward:

1st null hypothesis: it is rejected --> if there is a relation between hookah and tobacco
2nd null hypothesis: it is rejected --> cause dependency
3rd null hypothesis: it is rejected --> less certain than cigarettes
4th hypothesis null: it is rejected --> inhale hookah smoke may not harmless
5th hypothesis null: it is rejected --> only one session is detrimental to health

This is only a part of the extensive work we do, a survey of 28 questions to 434 people, from acquaintances, friends, various educational centers, to unknown social networks (Facebook, Whatsapp, Google Form ...), thanks to it Seville, Málaga, Valencia and other communities were able to carry out our questionnaire.

If you want to know something more about the history of hookah do not hesitate to comment, thank you very much.

SEMINARIO 5

SEMINARIO 5 

El último seminario se realizó el día 22 de mayo de 2017, las dos horas que duraba se dedicaron a la exposición de todos los trabajos de investigación. Centrándonos en el que hizo nuestro grupo, “El consumo del narguile en la sociedad”, pudimos deducir que las hipótesis nulas que planteamos debían rechazarse, y sobre todo que la mayoría de la población había probado o consumía regularmente cachimba en comparación con el tabaco que tenía un porcentaje mayor.
Cada trabajo debía contar con los siguientes apartados:
Titulo
Autores y afiliación
Introducción.
Marco teórico.
Material y Método.
Objetivos.
Hipótesis.
Resultados.
Discusión.
Conclusión.
Agradecimientos.
Referencias bibliográficas.


A continuación aparecen una serie de gráficas y diagramas que representan numerosos datos que comparamos entre sí y los resultamos que obtuvimos. 

Personas que han consumido alguna vez cachimba.






Razón por la que comenzaron a fumar y con quién solían fumar. 


Poseen cachimba propia, 25%.



Un 12% de la población aliñaba la cachimba con alguna de las cosas mencionadas en el diagrama de barras.




Nos sorprendió conocer que un 15% de la población no le importaba que menores de 12 años fumaran narguile.


Dentro de las conclusiones que sacamos nos dimos cuenta que la mayoría consideraba que fumar era menos perjudicial que consumir tabaco porque además pensaban que contenía componentes naturales. Supimos por el Test de Chi Cuadrado que el consumo de narguile y el de tabaco guardan relación.

Otro de los datos importantes que observamos fue que iniciaban el consumo entre los 14 y los 16 años, mientras que otros lo probaban a los 7-8 años; no obstante la mayoría consumía con más regularidad entre los 16 y los 20 años, unas cifras bastante preocupantes en general.
Finalmente rechazamos las 5 hipótesis nulas que planteamos:

1ª hipótesis nula: se rechaza --> si hay relación entre narguile y tabaco
2ª hipótesis nula: se rechaza --> causa dependencia
3ª hipótesis nula: se rechaza --> menos seguro que cigarrillos
4ª hipótesis nula: se rechaza --> inhalar humo de cachimba puede no es inocuo
5ª hipótesis nula: se rechaza --> sólo una sesión es perjudicial para la salud 

Esto es solo una parte del extenso trabajo que realizamos, una encuesta de 28 preguntas a 434 personas, desde conocidos, amigos, varios centros educativos, hasta a desconocidos por redes sociales (Facebook, Whatsapp, Google Formulario…), gracias a ello personas de Sevilla, Málaga, Valencia y otras comunidades fueron capaces de realizar nuestro cuestionario.

Si te apetece conocer algo más de la historia del narguile no dudes en poner un comentario, muchas gracias. 






lunes, 29 de mayo de 2017

SEMINAR 4

SEMINAR 4 


In seminar 4, held on March 30, we focus on:

Recoding variables
• Calculations of central tendency and dispersion quantitative variables
• Frequency distribution and confidence interval calculations
• Calculation Graphing of sectors, bar charts and histograms
Hypothesis test contrast.

A) Chi Square
B) T Student
C) ANOVA test
D) Linear Regression


It is true that this seminar was ahead of schedule with regard to the large group classes because we were a little behind but this served to better understand what soon we were going to give. Therefore mentioning certain terms will suffice because in other related publications appear again and more broadly.


To begin with we have the measures of position, which as we know are the percentiles, deciles and quartiles. 

On the contrary in the measures of centralization we have the median, fashion and average; And finally within the dispersion measures is the variance, standard deviation and path or sampling range.

We also review the inferential statistics, the types of variables... But we can say that the most interesting was the tests of contrast of hypotheses:



• First, CHI QUADRADO, we learned to do it in paper but also in Epi Info to use it in the research work. Observing the results we will accept or not the null hypothesis. We use it in QUALITATIVE-QUALITATIVE.

• T DE STUDENT secondly used in QUALITATIVE-QUANTITATIVE cases; Like the previous case we can also insert in our program this table.

ANOVA TEST, for more than two variables.

LINEAL REGRESIONES, where we draw the clouds of points and as in all cases we do also in our program of work. QUANTITATIVE-QUANTITATIVE.

And this was everything we saw in seminar 4, in just two hours gave us time to look over each example but it was not until the large group classes when we finished consolidating the terms and formulas and above all to do more example in Role that ultimately is what serves us in this subject, practice.


SEMINARIO 4

SEMINARIO 4 

En el seminario 4, realizado el día 30 de marzo, nos centramos en:

  • Recodificación de variables
  •  Cálculos de medidas de tendencia central y dispersión variables cuantitativas
  •  Cálculos de distribuciones de frecuencia y de intervalos de confianza
  •  Cálculos y elaboración de gráficas de sectores, diagramas de barras e histogramas
  • Contraste de hipótesis mediante test.
a)      Chi Cuadrado
b)      T de Student
c)       Test ANOVA
d)      Regresión lineal

Es cierto que en este seminario se adelantó temario con respecto a las clases de grupo grande porque estábamos un poco atrasados pero esto nos sirvió para entender mejor lo que pronto íbamos a dar. Por tanto con mencionar ciertos términos serán suficientes porque en otras publicaciones relacionadas aparecen de nuevo y de forma más amplia. 

Para empezar tenemos las medidas de posición, que como sabemos ya son los percentiles, deciles y cuartiles. 



Por el contrario en las medidas de centralización tenemos la mediana, moda y media; y por último dentro de las medidas de dispersión se encuentra la varianza, desviación típica y recorrido o rango muestral. 


          Repasamos además la estadística inferencial, los tipos de variables… Pero podemos decir que lo más interesante fue las pruebas de contraste de hipótesis: 

·    En primer lugar, CHI CUADRADO, aprendimos a realizarlo en papel pero también en Epi Info para usarlo en el trabajo de investigación. Al observar los resultados aceptaremos o no la hipótesis nula. La utilizamos en CUALITATIVA-CUALITATIVA.

·    T DE STUDENT en segundo lugar que se usan en casos CUALITATIVA-CUANTITATIVA; como el caso anterior también podemos insertar en nuestro programa esta tabla.

·      TEST DE ANOVA, para más de dos variables.

·     REGRESIONES LINEALES, donde dibujamos las nubes de puntos y como en todos los casos lo hacemos también en nuestro programa de trabajo. 

Y esto fue todo lo que vimos en el seminario 4, en apenas dos horas nos dio tiempo a ver por encima cada ejemplo pero no fue hasta las clases de grupo grande cuando terminamos de consolidar los términos y formulas y sobre todo a hacer más ejemplo en papel que a fin de cuentas es lo que nos sirve en esta asignatura, la práctica. 


martes, 23 de mayo de 2017

LESSON 10

UNIT 10: HYPOTHESIS STATISTICS. HYPOTHESIS TEST.


1. CONTRIBUTIONS OF HYPOTHESIS

To control random errors, in addition to the calculation of confidence intervals, we have a second tool in the process of statistical inference: hypothesis tests or contrasts.

With the contrasts of the strategy hypothesis is as follows:
- We establish a priori a hypothesis near the value of the parameter.
- Performs the collection of data.
- We analyze the coherence between the previous hypothesis and the data obtained.

Tools to answer research questions: allows to quantify the compatibility between an established hypothesis and the results obtained.
Whatever the desires of the researchers, the hypothesis test will always contrast the null hypothesis.
Type of statistical analysis according to the type of variables involved in the study



2. HYPOTHESIS ERRORS.

The hypothesis test measures the probability of error that I make if I reject the null hypothesis.
With the same sample we can accept or reject the null hypothesis. Everything depends on an error, which we call α.

• The error α is the probability of mistakenly rejecting the null hypothesis.
• The smallest error at which we can reject H0 is the error p. (P is synonymous with minimized α)
We usually reject H0 for a maximum α level of 5% (p <0.05). Above 5% of error, we accept the null hypothesis. This is what we call "statistical significance".


3. TYPES OF ERRORS IN HYPOTHESIS TEST.



The most important error for us is the alpha type. We accept that we can be mistaken up to 5%.


4. CHI-SQUARE HYPOTHESIS TEST.

To compare qualitative variables (dependent and independent).





5. STUDENT TEST (comparison of means)

It is used when the independent variable is qualitative (dichotomous) and the dependent variable is continuous quantitative. It only serves to compare two groups.


6. JOINT STUDY OF TWO VARIABLES.

For this we collect the data in some tables:
· In each row we have the data of an individual. Each column represents the values ​​that a variable takes on them. Individuals are not displayed in any particular order.
· These observations can be represented in a scatter diagram. In them each individual is a point whose coordinates are the values ​​of the variables.


7. DISPERSION AND POINT CLOUD DIAGRAM.

If we have the heights and weights of x individuals represented in a scatter diagram I place them on a graph to observe the distribution they have since there is a RELATIONSHIP BETWEEN BOTH VARIABLES.




8. PREDICTION OF VARIABLES IN THE FUNCTION OF ANOTHER.

Apparently the weight increases X kg for each Y cm of height


9. SIMPLE LINEAR REGRESSION: CORRELATION AND DETERMINATION.

· It is a question of studying the linear association between two quantitative variables.
· Example: influence of age on systolic blood pressure
· Deterministic linear models: the independent variable determines the value of the dependent variable. Then for each value of the independent variable there would be only one value of the dependent.
· Probabilistic linear models: for each value of the independent variable there is a probability distribution of values ​​of the dependent, with a probability between 0 and 1.
· There is no deterministic model: there is a cloud of points and we look for the line that best explains the behavior of the dependent variable as a function of the independent variable.

· Correlation coefficient (Pearson and Speerman): Non-dimensional number (between -1 and 1) that measures the strength and the meaning of the linear relationship between variables,
R = ß1 x Sx / Sy

· Coefficient of determination: dimensionless number (between 0 and 1) giving idea of ​​the relationship between linearly related variables, is r2.





TEMA 10

TEMA 10: HIPÓTESIS ESTADÍSTICAS. TEST DE HIPÓTESIS.

1. CONTRASTES DE HIPÓTESIS

Para controlar los errores aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda herramienta en el proceso de inferencia estadística: los test o contrastes de hipótesis..
Con los contrastes (test) de hipótesis la estrategia es la siguiente:
-          Establecemos a priori una hipótesis cerca del valor del parámetro.
-          Realizamos la recogida de datos.
-          Analizamos la coherencia entre la hipótesis previa y los datos obtenidos.
Son herramientas estadísticas para responder a preguntas de investigación: permite cuantificar la compatibilidad entre una hipótesis previamente establecida y los resultados obtenidos.
Sean cuales sean los deseos de los investigadores, el test de hipótesis siempre va a contrastar la hipótesis nula.

Tipo de análisis estadísticos según el tipo de variables implicadas en el estudio






2. ERRORES DE HIPÓTESIS.

El test de hipótesis mide la probabilidad de error que cometo si rechazo la hipótesis nula.
Con una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende de una error, al que llamamos α.
·         El error α es la probabilidad de equivocarnos al rechazar la hipótesis nula.
·         El error α más pequeño al que podemos rechazar H0 es el error p. (p es sinónimo de α minimizada)
Habitualmente rechazamos H0 para un nivel α máximo del 5% (p< 0.05). Por encima del 5% de error, aceptamos la hipótesis nula. Es lo que llamamos “significación estadística”.


3. TIPOS DE ERRORES EN TEST DE HIPÓTESIS.



El error más importante para nosotros es el tipo alfa. Aceptamos que podemos equivocarnos hasta un 5%.


4. TEST DE HIPÓTESIS CHI-CUADRADO.

Para comparar variables cualitativas (dependiente e independiente).


5. TEST DE STUDENT (comparación de medias)

Se utiliza cuando la variable independiente es cualitativa (dicotómica) y la variable dependiente es cuantitativa continua. Solo sirve para comparar dos grupos.



6. ESTUDIO CONJUNTO DE DOS VARIABLES.

Para ello recogemos los datos en unas tablas:
·         En cada fila tenemos los datos de un individuo. Cada columna representa los valores que toma unas variables sobre los mismos. Los individuos no se muestran en ningún orden particular.
·         Dichas observaciones pueden ser representadas en un diagrama de dispersión. En ellos cada individuo es un punto cuyas coordenadas son los valores de las variables.



7. DIAGRAMA DE DISPERSIÓN Y NUBE DE PUNTOS.

Si tenemos las alturas y los pesos de x individuos representados en un diagrama de dispersión los coloco en una gráfica para observar la distribución que tienen ya que existe una RELACIÓN ENTRE AMBAS VARIABLES.





8. PREDICCIÓN DE UNA VARIABLES EN FUNCIÓN DE OTRA.

Aparentemente el peso aumenta X Kg por cada Y cm de altura





9. REGRESIÓN LINEAL SIMPLE: CORRELACIÓN Y DETERMINACIÓN.

·         Se trata de estudiar la asociación lineal entre dos variables cuantitativas.
·         Ejemplo: influencia de la edad en las cifras de tensión arterial sistólica
·         Modelos lineales deterministas: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente solo habría un valor de la dependiente.
·         Modelos lineales probabilísticos: para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.
·         No hay modelo determinista: hay una nube de puntos y buscamos la recta que mejor explica l comportamiento de la variable dependiente en función de la variable independiente.

·         Coeficiente de correlación (Pearson y Speerman) : Número adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación lineal entre variables,
r = ß1 x Sx /Sy
·         Coeficiente de determinación: número adimensional (entre 0 y 1) que da idea de la relación entre las variables relacionadas linealmente, es r2.