No video

Cómo comprobar los supuestos en R y Rstudio. [Chupitos de R]

  Рет қаралды 20,316

Pablo Vallejo Medina

Pablo Vallejo Medina

Күн бұрын

#supuestos #assumptions #normalidad
*En torno, no entorno.
Si te gusta mi contenido y quieres, puedes pagarme un café en: ko-fi.com/chup... así no me dormiré mientras hago los chupitos.
En este videotutorial os explico por qué son importantes los supuestos paramétricos. Os explicaré cuáles son los supuestos para el OLS y sobre todo cómo evaluarlos.
Realmente solo hay 4 supuestos básicos.
La linealidad.
La normalidad de los residuos.
La homescedasticidad de los residuos.
La independencia.
Con estos cuatro supuestos damos cobertura a todas las opciones dentro del OLS. Sino nos tocará emplear métodos robustos, transformaciones, o pruebas no paramétricas.
Como siempre toda la sintaxis en:
github.com/pab...
Artículo de referencia:
peerj.com/arti...
durbinWatson, Breusch-Pagan Test For Homoscedasticity, Non-constant Variance Score Test, shapiro

Пікірлер: 72
@superpaisa25
@superpaisa25 3 жыл бұрын
te felicito, nunca habia entendido este tema de los supuestos, ni la interpretacion de las graficas. De los mejores videos del tema de RL que he visto. Muchas gracias Pablo.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Muchas gracias, un saludo.
@albertomariscal7679
@albertomariscal7679 6 ай бұрын
Muy bueno el video gran aporte a la investigación. Saludos y sigue adelante por favor.
@PabloVallejoMedina
@PabloVallejoMedina 6 ай бұрын
Gracias, ya he vuelto a grabar videos. En breve los iré subiendo.
@tcoll568
@tcoll568 2 жыл бұрын
Eres un crack, Pablo, no te haces una idea de lo que he podido aprender gracias a tu canal, el mejor que he visto de R en español! PD: Una pena que ya no siga en activo
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Muchas gracias. Pues quiero retomar. Tuve un hijo, una mudanza intercontinental y varias cosas más que me han dificultado continuar con el proyecto. Pero como ves, no estoy desaparecido, ojalá pueda volver.
@tcoll568
@tcoll568 2 жыл бұрын
@@PabloVallejoMedina Bueno parece que son cambios a mejor. Tus fieles seguidores estaremos expectantes de la vuelta a los terrenos de juego
@eloyolivavasquez6870
@eloyolivavasquez6870 3 жыл бұрын
Muy bueno el video, bastante claro. Hay un tema que me llama mucho la atención cuando se verifican los supuestos de la regresión (o cualquier prueba paramétrica) y es el uso de los valores p no significativos. En realidad un valor p solo es informativo cuando es inferior a alfa (usualmente 0.05), por lo que un valor superior no nos dice nada respecto a los datos y tampoco sobre si se cumple el supuesto del modelo. Esto es super importante porque puede llevarnos a asumir que un modelo es adecuado, cuando no lo es. Saludos!!
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Síi, a mi me parece a fin de cuenta una cosa super subjetiva. Por eso apoyarse en cuestiones visuales es clave, con todo y con eso fallamos. Pero al menos cumplir unos mínimos ;)
@josephvrz
@josephvrz Жыл бұрын
Excelente explicación
@PabloVallejoMedina
@PabloVallejoMedina Жыл бұрын
Muchas gracias!!
@cristhianrivera279
@cristhianrivera279 3 жыл бұрын
Excelente trabajo, Pablo. Ahora tengo más herramientas para estudiar y usar.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
ME alegra ;)
@xsxs8198
@xsxs8198 2 жыл бұрын
Excelente video! Me ayudo muchisimo en mi trabajo!
@gustavobarboza135
@gustavobarboza135 3 жыл бұрын
Muy bien Pablo te felicito
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Muchas gracias ;)
@sfc6772
@sfc6772 2 жыл бұрын
Saludos. Buena explicación. Respecto a la linealidad usan la prueba RESET de Ramsey (librería (lmtest)) para determinar si la regresión lineal está bien especificada. Tambien test de Mandel.
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Muchas gracias!!!
@ruthmilagrosalejoscabrera2059
@ruthmilagrosalejoscabrera2059 2 жыл бұрын
Excelente video Pablo! super entendible, gracias!!!
@PabloVallejoMedina
@PabloVallejoMedina Жыл бұрын
De nada, un saludo!!!
@barreraarriagadaignaciojav3239
@barreraarriagadaignaciojav3239 2 жыл бұрын
Muy buen video.
@luisroca835
@luisroca835 3 жыл бұрын
Lo máximo! Videos como estos son invaluables!
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Has oído @KZfaq, por que no me quieres monetizar!!! Un saludo!
@luisroca835
@luisroca835 3 жыл бұрын
@@PabloVallejoMedina es una buena pregunta. Lo haré! Sabes si hay manera de poner like pero sin que se añada a tus favoritos. Esa es la principal razón por la que no pongo like.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
@@luisroca835 No ni idea. No te preocupes ;).
@luisroca835
@luisroca835 3 жыл бұрын
@@PabloVallejoMedina tienes toda la razón! Es lo mínimo que puedo hacer. Todos tus vídeos son buenos!
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
@@luisroca835 No tranquilo, siéntete libre de darle like o no. Con que te guste el material es toda una alegría ;)
@CarlosMestanzaNovoa
@CarlosMestanzaNovoa 3 жыл бұрын
Me gusto el video, muy informativo. Tengo algunas observaciones que sería interesante discutir. Si los residuos son normales la variable respuesta debería ser normal porque el cálculo de los residuos se hace de forma lineal (resta) y los residuos heredarán la distribución de la variable respuesta. En mi institución recomiendan utilizar Anderson-Darling para comprobar la normalidad cuando los tamaños muestreales son mayor 30 y la prueba de Shapiro cuando son menores o iguales a 30. Los residuos estudentizados son de más uso para detección de valores influyentes, pero si los usas para evaluar la normalidad no se si esto afecta al resultado de la prueba (algo como normalizar los residuos). Saludos.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Hola, muchas gracias. Si en principio como tu dices se debería de poder extrapolar la normalidad de los errores a la de la variable. Aunque esto solo será así con variables continuas y que sigan distribuciones lineales. Es decir es riesgoso. Prefiero la fuente. Respecto a las técnicas hay muuuuchas. Pero con total honestidad. Yo que trabajo con muestras grandes casi siempre, no le paro bolas a este supuesto casi nunca. NO cambia nada, y su violación no suele comprometer nada ;) Pero no puedes poner eso Pablo... está bien entonces pon: la laxitud sobre este supuesto está en parte supeditada al tamaño muestral y a la intencionalidad del investigador.
@litaesthercastilloyepes2374
@litaesthercastilloyepes2374 2 жыл бұрын
Muchas Gracias me encantan tus videos👍 por que siempre pones el script que ahí siempre yo me equivoco y es de gran ayuda
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Un placer ;)
@carobrior
@carobrior 2 жыл бұрын
Excelente video y muy clara explicación. Que lastima que solo se puede dar 1 me gusta :D.
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
1 me gusta y un comentario son perfectos ;)
@RaidellAvello
@RaidellAvello 3 жыл бұрын
Excelente. Saludos!
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Muchas gracias Raidell ;)
@paulmm6878
@paulmm6878 3 жыл бұрын
Gracias Pablo...
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Un saludo Cristhian ;)
@freddycful
@freddycful 3 жыл бұрын
Gracias. Saludos
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
De nada ;)!!!
@briannormanpenacalero9583
@briannormanpenacalero9583 3 жыл бұрын
Excelente! Todo muy claro :) Esta función del paquete performance (check_model) también puede ayudar a la visualización de supuestos en regresión :) github.com/easystats/performance#comprehensive-visualization-of-model-checks
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Esa función también está genial. Hay opciones que se quedan por fuera sino sería imposible. Muchas gracias como siempre.
@deradelo
@deradelo 3 жыл бұрын
Muchas gracias, muy claro.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Un saludo, muchas gracias ;)
@darioarquero5879
@darioarquero5879 Жыл бұрын
Hola,. Estoy necesitando comprobar los supuestos en estadística bayesiana. Tenes algún video al respecto? Gracias!
@juanma415
@juanma415 3 жыл бұрын
¡Muy buen video! Like y Subscripción. Mi duda sería por qué hay tantos pero tantos videos en KZfaq donde la gente aplica el test de normalidad y homocedasticidad a la variable respuesta en vez de a los residuos. Tengo que decir que muchas veces el p value es el mismo cuando se le aplica a las variables que a los residuos, eso sí.
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Hola, síIIII es cierto. A ver muchas veces va a ser igual, pero inténtalo cuando tengas una regresión logística binomial. Cuando la variable es dicotómica ya estamos agrandando el error. Pero vaya, yo mismo me equivoco en muchas cosas en los videos y como youtube le sienta muy mal que borremos los vídeos así se quedan (como máximo con una adenda ;).
@kathiagr8152
@kathiagr8152 2 жыл бұрын
Hola Pablo: excelente video, pero siempre he tenido una duda sobre los supuestos, ya que pienso que hay dos que son redundantes y es la autocorrelacion y la independencia; si mis residuos son incorrelados, es que son independientes. Sácame de esta duda existencial que tengo. :))))))
@PabloVallejoMedina
@PabloVallejoMedina 2 жыл бұрын
Hola Kathia, sí pero no ;). échale un ojo a este paper -que está en la descripción-. Seguro te saca de dudas. peerj.com/articles/3323/
@im6209
@im6209 3 жыл бұрын
Hola Pablo, de pronto, sabes en qué literatura puedo encontrar eso que comentabas de que los supuestos se comprueban es a los residuos y no a las variables?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Claro, cualquier libro serio de metodología. Pero si necesitas un soporte para un paper, creo que este está bien: peerj.com/articles/3323/
@agriculturalocal3072
@agriculturalocal3072 3 жыл бұрын
Excelente video. Me queda una duda, porqué no usar Levene para la homocedasticidad? Saludos!!!
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Hola, muchas gracias. He dicho yo que no se deba usar Levene? a ver este tipo de análisis tienen el problema de que todo recae en el pvalue y por tanto en el tamaño muestral. Es un análisis válido, pero creo que hay otros más completos. Acá te dejo algo en inglés que sigue con mi idea: It relies too much on p-values, and therefore, sample sizes. If the sample size is large, Levene’s will have a smaller p-value than if the sample size is small, given the same variances.So it’s very likely that you’re overstating a problem with the assumption in large samples and understating it in small samples. You can’t ignore the actual size difference in the variances when making this decision. So sure, look at the p-value, but also look at the actual variances and how much bigger some are than others. (In other words, actually look at the effect size, not just the p-value). The ANOVA is generally considered robust to violations of this assumption when sample sizes across groups are equal. So even if Levene’s is significant, moderately different variances may not be a problem in balanced data sets. Keppel (1992) suggests that a good rule of thumb is that if sample sizes are equal, robustness should hold until the largest variance is more than 9 times the smallest variance. This robustness goes away the more unbalanced the samples are. So you need to use judgment here, taking into account both the imbalance and the actual difference in variances.
@eduardomoya8447
@eduardomoya8447 3 жыл бұрын
Hola Pablo. Muy buen video!! Tengo una consulta esto podria hacerse de la misma manera para untest de asociacion de variables parametricas?( t-test, anova, pearson, etc?) O solo modelos de regresion? Recuerdo que un chupito dijiste que todo era regresion, aunque no entiendo porque pero te creo jajaja. Saludos desde Chile, voy siguiendo los videos lento pero seguro💪🏻 y estoy suscrito con likes en cada uno
@eduardomoya8447
@eduardomoya8447 3 жыл бұрын
Me refiero a los comandos, no que en cada prueba haya que evaluar estos supuestos
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
Jajajja, tooodo es regresión. Llegará un punto en que te darás cuenta y cuando eso suceda estarás por encima del bien y del mal ;). Para todas las paramétricas debería ser así. Pero se puede flexibilizar un poco algunos, sobre todo a grandes tamaños muestrales.
@eduardomoya8447
@eduardomoya8447 3 жыл бұрын
@@PabloVallejoMedina jajajaj muchas gracias Pablo, espero que puedas seguir subiendo videos como antes, cuando saque mi primer artículo cientifico pondré en agradecimientos a Chupitos de R😂
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
@@eduardomoya8447 Sí, estoy en un momento convulso de mi vida y no tengo ni tiempo ni energía para subir más. Pero en septiembre volveré.
@mahavisnubonza3183
@mahavisnubonza3183 6 ай бұрын
Hola brother. Saludos desde Colombia....tengo una duda si en mi prueba Shapiro. Mi p-value es menor a 0.05. Que puedo hacer como debo proceder si la normalidad de mis residuos no son normales....te agradezco mucho cualquier comentario
@antt5602
@antt5602 6 ай бұрын
Una opcion es realizar la "transformacion" de tu variable de respuesta (Y)...
@gabrielaaguilarpalula4148
@gabrielaaguilarpalula4148 2 жыл бұрын
Hola, gracias por el video, me saco de un apuro, es solo que no puedo correr en R durbinWatsonTest ni tampoco la prueba de Breusch-Pagan bptest, ya instale la paqueteria MASS Cual podría ser la razón?
@fabriciomiergoyes9938
@fabriciomiergoyes9938 2 жыл бұрын
library(lmtest)
@gabrielaaguilarpalula4148
@gabrielaaguilarpalula4148 2 жыл бұрын
@@fabriciomiergoyes9938 gracias
@RenatoNunuraC
@RenatoNunuraC Жыл бұрын
Hola! Tengo una consulta para utilizar el shapiro.test. Quise ejecutar la prueba de normalidad pero el programa me limita a un tamaño muestral de 3 hasta 5000 y justo mi proyecto tiene más de 8K. Existirá otro test de shapiro para poder aplicarlo a mi tamaño de muestra? Saludos y gracias!
@PabloVallejoMedina
@PabloVallejoMedina Жыл бұрын
Hola Renato, yo nunca utilizaría ese test para una muestra tan grande. Más de 50 personas ya no se recomienda usar Shapiro. Tienes un tamaño muestral muy grande yo me decantaría por un multimétodo multifuente: Kolmogorov-Smirnov y modificación de Lillefors. La función lillie.test() del paquete nortest permite aplicarlo. Test de normalidad de Jarque-Bera ... jarque.bera.test() del paquete tseries y el gráfico Q-Q. Con eso te vas a hacer una idea más correcta. Un saludo.
@RenatoNunuraC
@RenatoNunuraC Жыл бұрын
@@PabloVallejoMedina Muchas gracias por la explicación Pablo!
@israelconstanteamores4816
@israelconstanteamores4816 3 жыл бұрын
Muchas gracias. ¿Cuál va a ser el siguiente vídeo?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
T test de muestras relacionadas. Ya está grabado. Luego imputación de valores perdidos utilizando forest
@israelconstanteamores4816
@israelconstanteamores4816 3 жыл бұрын
@@PabloVallejoMedina Muchas gracias, Pablo.
@oscargomezgonzalez8373
@oscargomezgonzalez8373 3 жыл бұрын
Hola a todos :D ¿por qué en el 17:53 dice que "3.48...e-14" es menor que cero si comienza con 3.48? lo mismo en 22:05. ¿A caso "3.48...e-14" debe entenderce como "0.00000000000000348..."?
@PabloVallejoMedina
@PabloVallejoMedina 3 жыл бұрын
No he contando los ceros, pero sí, estas en lo cierto. Es eso.
@oscargomezgonzalez8373
@oscargomezgonzalez8373 3 жыл бұрын
@@PabloVallejoMedina Muchas gracias :D que maravilloso tu apoyo
@user-to8sy1dh7f
@user-to8sy1dh7f 11 ай бұрын
te odio aurelio guevara
Cómo hacer t-test de muestras relacionadas en Rstudio  [Chupito de R]
13:59
Pablo Vallejo Medina
Рет қаралды 4,7 М.
11. Regresión lineal simple ¿Qué hacer si no se cumplen los supuestos?
16:26
Bony Just Wants To Take A Shower #animation
00:10
GREEN MAX
Рет қаралды 7 МЛН
The Giant sleep in the town 👹🛏️🏡
00:24
Construction Site
Рет қаралды 20 МЛН
wow so cute 🥰
00:20
dednahype
Рет қаралды 30 МЛН
Schoolboy Runaway в реальной жизни🤣@onLI_gAmeS
00:31
МишАня
Рет қаралды 3,9 МЛН
Cómo hacer una regresión en R y Rstudio [Chupito de R]
25:21
Pablo Vallejo Medina
Рет қаралды 6 М.
Pruebas de normalidad en R (pruebas estadísticas y gráficos)
16:57
Damián Villaseñor Amador
Рет қаралды 11 М.
Análisis de Componentes Principales (PCA) en R y Rstudio [Chupito de R] pca
21:38
Cómo hacer correlaciones en Rstudio y R. [Chupito de R]
16:25
Pablo Vallejo Medina
Рет қаралды 41 М.
Análisis Factorial Confirmatorio (AFC) en R y RStudio. [Chupito de R]
20:09
Pablo Vallejo Medina
Рет қаралды 19 М.
Introducción a ggplot2 [Chupitos de R]
23:33
Pablo Vallejo Medina
Рет қаралды 20 М.
[K means] Análisis de Clúster en R y Rstudio. [Chupitos de R]
22:51
Pablo Vallejo Medina
Рет қаралды 59 М.
Introducción al meta análisis en R. [Chupito de R] [meta-análisis]
42:14
Pablo Vallejo Medina
Рет қаралды 16 М.
Bony Just Wants To Take A Shower #animation
00:10
GREEN MAX
Рет қаралды 7 МЛН