This last
publication is a simple reflection of everything learned during the quarter,
that there are still many others to know about this wide field.
In the first
place and being honest, the subject during the classes did not seem difficult,
but of course as always happens, the study of "to push the elbows" is
left for the end, reason why the vision of Statistic has changed, say now I
already consider it extensive and complicated. In this subject it is very
important to practice because there are many different problems and many different
formulas that can confuse you.
In the second
place, I want to talk about the SEMINARS, they have been complicated because
doing any work outside the hours of the faculty removes own time and always
work some more than others; In addition the idea of having to expose before
the group (a regret that it was a small group) did not please any of the
members, and more to know that the more timid had to talk about the final
research work (a work of 40 slides Y 25 sheets of Word). Although it is true,
we have also been able to learn a job with another type of program that we are
not used to and that we could use in the future.
Finally I can
only say that after a hard work during the quarter and during the year in
general, today June 4, 2017 finalizes the publications of Statistics and begin
shortly the final exams.
I only have to
say, that with hard work and constancy I feel everything before and after, and
that...
WHEN YOU SAY:
YOU CANNOT... RESPOND: OBSERVE HOW I DO IT
THANK YOU TO
ALL PEOPLE WHO HAVE FOLLOWED ME ALL THIS TIME
Esta última
publicación es una simple reflexión de todo lo aprendido durante el
cuatrimestre, que aún quedan muchas otras por conocer de este campo tan amplio.
En primer
lugar y siendo sincera, la asignatura durante las clases no parecían difíciles,
pero claro como siempre suele pasar, el estudio de “hincar los codos” se deja
para el final, por lo que la visión de Estadística ha cambiado, digamos que
ahora ya la considero extensa y complicada. En esta asignatura es muy
importante practicar porque existen muchos problemas diferentes, y muchas fórmulas
distintas que pueden hacer confundirte.
En segundo
lugar, quiero hablar de los SEMINARIOS, han sido complicados porque realizar
cualquier trabajo fuera del horario de la facultad quita tiempo propio y
siempre suelen trabajar unos más que otros; además la idea de tener que exponer
delante del grupo (a pesar de que era un grupo reducido) no nos agradaba a
ninguno de los miembros, y más saber que los más tímidos tenían que hablar del
trabajo final de investigación (un trabajo de 40 diapositivas y 25 hojas de
Word). Aunque sí es cierto, que también hemos podido aprender a trabajar con
otro tipo de programa del que no estamos acostumbrado y que en un futuro
podríamos usar.
Finalmente
solo me queda decir que tras un duro trabajo durante el cuatrimestre y durante
el año en general, hoy día 4 de junio de 2017 finaliza las publicaciones de
Estadística y comienzan en breve los exámenes finales.
Solo me queda
decir, que con trabajo duro y constancia todo se consigue antes o después, y
que…
GRACIAS A
TODAS LAS PERSONAS QUE ME HAN SEGUIDO TODO ESTE TIEMPO.
The last
seminar was held on May 22, 2017, the two hours that lasted were dedicated to
the exhibition of all research work. Focusing on what our group did, "The
consumption of narghile in society," we could deduce that the null
hypotheses that we raised should be rejected, and above all that the majority
of the population had regularly tried or consumed hookah compared to tobacco
that Had a higher percentage.
Each work
should have the following sections:
Title
Authors and
affiliation
Introduction.
Theoretical
framework.
Material and
method.
Goals.
Hypothesis.
Results.
Discussion.
Conclusion.
Thanks.
Bibliographic
references.
Below are a
series of graphs and diagrams that represent numerous data that we compare and
the results that we obtained.
People who have ever eaten
hookah.
Reason why they started smoking
and with whom they used to smoke.
They own their own hookah, 25%.
Twelve percent
of the population used to hook the pipe with some of the things mentioned in
the bar diagram.
We were
surprised to learn that 15% of the population did not care that children under
12 years of age smoke hookah.
In the
conclusions we drew we realized that the majority considered that smoking was
less harmful than consuming tobacco because they also thought that it contained
natural components. We learned from the Chi Square test that hookah and tobacco
consumption are related.
Another
important data that we observed was that they started consuming between the
ages of 14 and 16, while others tried it at 7-8 years; Nevertheless the
majority consumed with more regularity between the 16 and the 20 years, quite
worrying numbers in general.
Finally we
reject the 5 null hypotheses that we put forward:
1st null hypothesis: it is
rejected --> if there is a relation between hookah and tobacco
2nd null hypothesis: it is
rejected --> cause dependency
3rd null hypothesis: it is
rejected --> less certain than cigarettes
4th hypothesis null: it is
rejected --> inhale hookah smoke may not harmless
5th hypothesis null: it is
rejected --> only one session is detrimental to health
This is only a
part of the extensive work we do, a survey of 28 questions to 434 people, from
acquaintances, friends, various educational centers, to unknown social networks
(Facebook, Whatsapp, Google Form ...), thanks to it Seville, Málaga, Valencia
and other communities were able to carry out our questionnaire.
If you want to
know something more about the history of hookah do not hesitate to comment,
thank you very much.
El último
seminario se realizó el día 22 de mayo de 2017, las dos horas que duraba se
dedicaron a la exposición de todos los trabajos de investigación. Centrándonos
en el que hizo nuestro grupo, “El consumo del narguile en la sociedad”, pudimos
deducir que las hipótesis nulas que planteamos debían rechazarse, y sobre todo
que la mayoría de la población había probado o consumía regularmente cachimba
en comparación con el tabaco que tenía un porcentaje mayor.
Cada trabajo
debía contar con los siguientes apartados:
Titulo
Autores y afiliación
Introducción.
Marco teórico.
Material y Método.
Objetivos.
Hipótesis.
Resultados.
Discusión.
Conclusión.
Agradecimientos.
Referencias bibliográficas.
A continuación
aparecen una serie de gráficas y diagramas que representan numerosos datos que
comparamos entre sí y los resultamos que obtuvimos.
Personas que
han consumido alguna vez cachimba.
Razón por la
que comenzaron a fumar y con quién solían fumar.
Poseen cachimba propia, 25%.
Un 12% de la
población aliñaba la cachimba con alguna de las cosas mencionadas en el
diagrama de barras.
Nos sorprendió
conocer que un 15% de la población no le importaba que menores de 12 años
fumaran narguile.
Dentro de las
conclusiones que sacamos nos dimos cuenta que la mayoría consideraba que fumar
era menos perjudicial que consumir tabaco porque además pensaban que contenía
componentes naturales. Supimos por el Test de Chi Cuadrado que el consumo de
narguile y el de tabaco guardan relación.
Otro de los
datos importantes que observamos fue que iniciaban el consumo entre los 14 y
los 16 años, mientras que otros lo probaban a los 7-8 años; no obstante la
mayoría consumía con más regularidad entre los 16 y los 20 años, unas cifras
bastante preocupantes en general.
Finalmente
rechazamos las 5 hipótesis nulas que planteamos:
1ª hipótesis
nula: se rechaza --> si hay relación entre narguile y tabaco
2ª hipótesis
nula: se rechaza --> causa dependencia
3ª hipótesis
nula: se rechaza --> menos seguro que cigarrillos
4ª hipótesis
nula: se rechaza --> inhalar
humo de cachimba puede no es inocuo
5ª hipótesis
nula: se rechaza --> sólo
una sesión es perjudicial para la salud
Esto es solo
una parte del extenso trabajo que realizamos, una encuesta de 28 preguntas a
434 personas, desde conocidos, amigos, varios centros educativos, hasta a
desconocidos por redes sociales (Facebook, Whatsapp, Google Formulario…),
gracias a ello personas de Sevilla, Málaga, Valencia y otras comunidades fueron
capaces de realizar nuestro cuestionario.
Si te apetece conocer algo más de
la historia del narguile no dudes en poner un comentario, muchas gracias.
• Calculations of central tendency and dispersion
quantitative variables
• Frequency distribution and confidence interval calculations
• Calculation Graphing of sectors, bar charts and
histograms
• Hypothesis test contrast.
A) Chi Square
B) T Student
C) ANOVA test
D) Linear Regression
It is true
that this seminar was ahead of schedule with regard to the large group classes
because we were a little behind but this served to better understand what soon
we were going to give. Therefore mentioning certain terms will suffice because
in other related publications appear again and more broadly.
To begin with
we have the measures of position, which as we know are the percentiles, deciles
and quartiles.
On the
contrary in the measures of centralization we have the median, fashion and
average; And finally within the dispersion measures is the variance, standard
deviation and path or sampling range.
We also review the inferential
statistics, the types of variables... But we can say that the most interesting
was the tests of contrast of hypotheses:
• First, CHI QUADRADO, we learned to do it in paper but also in Epi Info to
use it in the research work. Observing the results we will accept or not the
null hypothesis. We use it in QUALITATIVE-QUALITATIVE.
• T DE STUDENT secondly used in QUALITATIVE-QUANTITATIVE cases;
Like the previous case we can also insert in our program this table.
• ANOVA TEST, for more than two variables.
• LINEAL REGRESIONES, where we draw the clouds of points and as in
all cases we do also in our program of work. QUANTITATIVE-QUANTITATIVE.
And this was
everything we saw in seminar 4, in just two hours gave us time to look over
each example but it was not until the large group classes when we finished
consolidating the terms and formulas and above all to do more example in Role
that ultimately is what serves us in this subject, practice.
En el seminario 4, realizado el
día 30 de marzo, nos centramos en:
Recodificación de variables
Cálculos de medidas
de tendencia central y dispersión variables cuantitativas
Cálculos de distribuciones
de frecuencia y de intervalos de confianza
Cálculos y
elaboración de gráficas de sectores, diagramas de barras e
histogramas
Contraste de hipótesis mediante test.
a)Chi Cuadrado
b)T de Student
c)Test ANOVA
d)Regresión lineal
Es cierto que
en este seminario se adelantó temario con respecto a las clases de grupo grande
porque estábamos un poco atrasados pero esto nos sirvió para entender mejor lo
que pronto íbamos a dar. Por tanto con mencionar ciertos términos serán
suficientes porque en otras publicaciones relacionadas aparecen de nuevo y de forma
más amplia.
Para empezar tenemos las medidas de posición, que como sabemos ya son los percentiles, deciles y cuartiles.
Por el
contrario en las medidas de centralización tenemos la mediana, moda y media; y
por último dentro de las medidas de dispersión se encuentra la varianza,
desviación típica y recorrido o rango muestral.
Repasamos además la estadística
inferencial, los tipos de variables… Pero podemos decir que lo más interesante
fue las pruebas de contraste de hipótesis:
·En primer lugar, CHI CUADRADO, aprendimos a realizarlo en papel pero también en Epi
Info para usarlo en el trabajo de investigación. Al observar los resultados
aceptaremos o no la hipótesis nula. La utilizamos en CUALITATIVA-CUALITATIVA.
·T DE STUDENT
en segundo lugar que se usan en casos CUALITATIVA-CUANTITATIVA; como el caso
anterior también podemos insertar en nuestro programa esta tabla.
·TEST DE
ANOVA, para más de dos variables.
·REGRESIONES
LINEALES, donde dibujamos las nubes de puntos y como en todos los casos lo
hacemos también en nuestro programa de trabajo.
Y esto fue
todo lo que vimos en el seminario 4, en apenas dos horas nos dio tiempo a ver
por encima cada ejemplo pero no fue hasta las clases de grupo grande cuando
terminamos de consolidar los términos y formulas y sobre todo a hacer más
ejemplo en papel que a fin de cuentas es lo que nos sirve en esta asignatura,
la práctica.
To control random errors, in
addition to the calculation of confidence intervals, we have a second tool in
the process of statistical inference: hypothesis tests or contrasts.
With the contrasts of the strategy
hypothesis is as follows:
- We establish a priori a
hypothesis near the value of the parameter.
- Performs the collection of data.
- We analyze the coherence between
the previous hypothesis and the data obtained.
Tools to answer research questions:
allows to quantify the compatibility between an established hypothesis and the
results obtained.
Whatever the desires of the
researchers, the hypothesis test will always contrast the null hypothesis.
Type of statistical analysis
according to the type of variables involved in the study
2.
HYPOTHESIS ERRORS.
The hypothesis test measures the
probability of error that I make if I reject the null hypothesis.
With the same sample we can accept
or reject the null hypothesis. Everything depends on an error, which we call α.
• The error α is the probability of
mistakenly rejecting the null hypothesis.
• The smallest error at which we
can reject H0 is the error p. (P is synonymous with minimized α)
We usually reject H0 for a maximum
α level of 5% (p <0.05). Above 5% of error, we accept the null hypothesis.
This is what we call "statistical significance".
3.
TYPES OF ERRORS IN HYPOTHESIS TEST.
The most important error for us is
the alpha type. We accept that we can be mistaken up to 5%.
4.
CHI-SQUARE HYPOTHESIS TEST.
To compare qualitative variables
(dependent and independent).
5.
STUDENT TEST (comparison of means)
It is used when the independent
variable is qualitative (dichotomous) and the dependent variable is continuous
quantitative. It only serves to compare two groups.
6.
JOINT STUDY OF TWO VARIABLES.
For this we collect the data in
some tables:
· In each row we have the data of
an individual. Each column represents the values that a variable takes on
them. Individuals are not displayed in any particular order.
· These observations can be
represented in a scatter diagram. In them each individual is a point whose
coordinates are the values of the variables.
7.
DISPERSION AND POINT CLOUD DIAGRAM.
If we have the heights and weights
of x individuals represented in a scatter diagram I place them on a graph to
observe the distribution they have since there is a RELATIONSHIP BETWEEN BOTH
VARIABLES.
8.
PREDICTION OF VARIABLES IN THE FUNCTION OF ANOTHER.
Apparently the weight increases X
kg for each Y cm of height
9.
SIMPLE LINEAR REGRESSION: CORRELATION AND DETERMINATION.
· It is a question of studying the
linear association between two quantitative variables.
· Example: influence of age on
systolic blood pressure
· Deterministic linear models: the
independent variable determines the value of the dependent variable. Then for
each value of the independent variable there would be only one value of the
dependent.
· Probabilistic linear models: for
each value of the independent variable there is a probability distribution of
values of the dependent, with a probability between 0 and 1.
· There is no deterministic model:
there is a cloud of points and we look for the line that best explains the
behavior of the dependent variable as a function of the independent variable.
· Correlation coefficient (Pearson
and Speerman): Non-dimensional number (between -1 and 1) that measures the strength
and the meaning of the linear relationship between variables,
R = ß1 x Sx / Sy
· Coefficient of determination:
dimensionless number (between 0 and 1) giving idea of the relationship
between linearly related variables, is r2.
TEMA 10: HIPÓTESIS ESTADÍSTICAS. TEST DE HIPÓTESIS.
1. CONTRASTES
DE HIPÓTESIS
Para controlar los errores
aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda
herramienta en el proceso de inferencia estadística: los test o contrastes de
hipótesis..
Con los contrastes (test) de
hipótesis la estrategia es la siguiente:
-Establecemos
a priori una hipótesis cerca del valor del parámetro.
-Realizamos
la recogida de datos.
-Analizamos
la coherencia entre la hipótesis previa y los datos obtenidos.
Son herramientas estadísticas para
responder a preguntas de investigación: permite cuantificar la compatibilidad
entre una hipótesis previamente establecida y los resultados obtenidos.
Sean cuales sean los deseos de los
investigadores, el test de hipótesis siempre va a contrastar la hipótesis nula.
Tipo de análisis estadísticos según
el tipo de variables implicadas en el estudio
2. ERRORES
DE HIPÓTESIS.
El
test de hipótesis mide la probabilidad de error que cometo si rechazo la hipótesis
nula.
Con
una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende de
una error, al que llamamos α.
·El
error α es la probabilidad de equivocarnos al rechazar la hipótesis nula.
·El
error α más pequeño al que podemos rechazar H0 es el error p. (p es
sinónimo de α minimizada)
Habitualmente rechazamos H0
para un nivel α máximo del 5% (p< 0.05). Por encima del 5% de error,
aceptamos la hipótesis nula. Es lo que llamamos “significación estadística”.
3. TIPOS
DE ERRORES EN TEST DE HIPÓTESIS.
El error más importante para
nosotros es el tipo alfa. Aceptamos que podemos equivocarnos hasta un 5%.
4. TEST
DE HIPÓTESIS CHI-CUADRADO.
Para comparar variables
cualitativas (dependiente e independiente).
5. TEST DE STUDENT (comparación de medias)
Se
utiliza cuando la variable independiente es cualitativa (dicotómica) y la
variable dependiente es cuantitativa continua. Solo sirve para comparar dos
grupos.
6. ESTUDIO CONJUNTO
DE DOS VARIABLES.
Para ello
recogemos los datos en unas tablas:
·En
cada fila tenemos los datos de un individuo. Cada columna representa los
valores que toma unas variables sobre los mismos. Los individuos no se muestran
en ningún orden particular.
·Dichas
observaciones pueden ser representadas en un diagrama de dispersión. En ellos
cada individuo es un punto cuyas coordenadas son los valores de las variables.
7. DIAGRAMA DE
DISPERSIÓN Y NUBE DE PUNTOS.
Si tenemos
las alturas y los pesos de x individuos representados en un diagrama de
dispersión los coloco en una gráfica para observar la distribución que tienen
ya que existe una RELACIÓN ENTRE AMBAS VARIABLES.
8. PREDICCIÓN DE UNA VARIABLES EN FUNCIÓN DE
OTRA.
Aparentemente
el peso aumenta X Kg por cada Y cm de altura
9. REGRESIÓN LINEAL
SIMPLE: CORRELACIÓN Y DETERMINACIÓN.
·Se
trata de estudiar la asociación lineal entre dos variables cuantitativas.
·Ejemplo:
influencia de la edad en las cifras de tensión arterial sistólica
·Modelos lineales
deterministas:
la variable independiente determine el valor de la variable dependiente.
Entonces para cada valor de la variable independiente solo habría un valor de
la dependiente.
·Modelos lineales
probabilísticos:
para cada valor de la variable independiente existe una distribución de
probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.
·No hay modelo
determinista:
hay una nube de puntos y buscamos la recta que mejor explica l comportamiento
de la variable dependiente en función de la variable independiente.
·Coeficiente
de correlación (Pearson y Speerman) : Número
adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación
lineal entre variables,
r = ß1 x Sx /Sy
·Coeficiente
de determinación: número adimensional (entre 0 y 1) que da
idea de la relación entre las variables relacionadas linealmente, es r2.