Thursday 16 February 2017

Déménagement Moyenne Modèle Stata

Bienvenue à l'Institut de recherche et d'éducation numériques Analyse des mesures répétées avec Stata Data: large et longue Les données de mesures répétées se présentent sous deux formats différents: 1) large ou 2) long. Dans le format large, chaque sujet apparaît une fois avec les mesures répétées dans la même observation. Pour les données dans le format long il ya une observation pour chaque période de temps pour chaque sujet. Voici un exemple de données dans le format large pour quatre périodes. Dans l'exemple ci-dessus, y1 est la variable de réponse au temps un. Dans la forme longue les données ressemblent à ceci. Notez que le temps est une variable explicite avec des données de formulaire long. Ce format est appelé personne-période données par certains chercheurs. Stata analyse les mesures répétées à la fois pour l'anova et pour les modèles mixtes linéaires sous forme longue. D'autre part, SAS et SPSS analysent habituellement anova de mesure répétée dans la forme large. Cependant, SAS et SPSS exigent l'utilisation de longs modèles mixtes de données. L'exemple de jeu de données Notre exemple de jeu de données est habilement appelé repeatmeasures et peut être téléchargé avec la commande suivante. Il y a un total de huit sujets mesurés à quatre points de temps chacun. Ces données sont dans un format large où y1 est la réponse au temps 1, y2 est la réponse au temps 2, et ainsi de suite. Les sujets sont divisés en deux groupes de quatre sujets en utilisant la variable trt. Voici les statistiques descriptives de base à chacun des quatre points de temps combinés et éclatés par groupe de traitement. Ensuite, nous représenterons graphiquement les huit moyens de cellule avec l'utilisateur écrit la commande, profile. Vous pouvez télécharger cette commande en tapant findit profileplot est la fenêtre de commande Stata. Maintenant, regardons les matrices de corrélation et de covariance des réponses au fil du temps. Mesure répétée anova suppose que la structure de covariance intra-sujet est composée symétrique. La matrice de covariance ci-dessus ne semble pas avoir de symétrie composée. Nous discuterons de la covariance intra-sujet plus en détail plus tard dans la présentation. Reformuler de large à long Maintenant que nous avons examiné certaines des statistiques descriptives nous pouvons remodeler les données en long formulaire à l'aide de la commande reshape. L'option i () donne la variable qui identifie le sujet tandis que l'option j () crée une nouvelle variable qui indique la période. Maintenant que nous avons remodelé les données nous pouvons passer à des mesures répétées anova. Repeated mesures anova Dans le langage anova cette conception a à la fois entre les sujets et les effets à l'intérieur, c'est-à-dire il est un modèle d'effets mixtes. En particulier, cette conception est parfois appelée analyse factorielle de la variance factorielle. Dans Stata, avec les données sous forme longue, nous devons spécifier les termes d'erreur pour les deux effets entre sujet et à l'intérieur du sujet. En règle générale, la règle est qu'il existe un seul terme d'erreur pour tous les effets entre sujets et un terme d'erreur distinct pour chacun des facteurs intra-sujets et pour l'interaction des facteurs intra-sujets. Notre modèle est relativement simple avec seulement deux termes d'erreur. L'effet inter-sujet est le traitement (trt) et son terme d'erreur est sujet imbriqué dans le traitement (id trt). Le temps du facteur dans le sujet. Son terme d'erreur est l'erreur résiduelle pour le modèle. Mesures répétées anova ont une hypothèse que la structure de covariance intra-sujet est composé symétrique, également connu comme, échangeable. Avec la symétrie composée, on s'attend à ce que les variances à chaque fois soient égales et toutes les covariances soient égales entre elles. Si la structure de covariance intra-sujet n'est pas symétrique composée alors les valeurs p obtenues à partir des mesures répétées anova peuvent ne pas refléter avec précision les vraies probabilités. Stata vous permet de tenir compte de l'absence de symétrie composée en incluant l'option repeat () dans la commande anova qui calcule les valeurs p pour les tests F conservateurs. Nous discuterons plus en profondeur des structures de covariance plus tard dans la présentation. Voici la commande anova pour nos données. L'interaction traitement-par-temps est significative, tout comme les deux effets principaux pour le traitement et le temps. La sortie comprend les valeurs de p pour trois différents tests F conservateurs: 1) Huynh-Feldt, 2) Greenhouse-Geisser et 3) Boxes conservateur F. Ces valeurs sont des indicateurs de la valeur p est même si les données ne se réunissent pas L'hypothèse de symétrie composée. Nous pouvons visualiser la matrice de covariance intra-sujet groupée en énumérant la matrice Srep. L'inspection de la matrice de covariance intra-sujet combinée met en doute la validité de l'hypothèse de symétrie composée. Heureusement, les valeurs de p pour le test F conservateur indiquent encore des effets significatifs pour l'interaction trttime et l'effet principal du temps. Tests d'effets simples Puisque l'interaction traitement-par-temps est significative, nous devrions essayer d'expliquer l'interaction. Une façon de le faire est d'utiliser le test de simples effets. Nous commencerons par examiner l'effet du temps à chaque niveau de traitement. L'effet du temps à chaque traitement L'effet simple du temps a trois degrés de liberté pour chaque niveau du traitement pour un total de six degrés de liberté. Ce test d'effets simples utilisera l'erreur résiduelle pour le modèle comme son terme d'erreur. Nous utiliserons la commande de contraste pour effectuer le test des effets simples. Paire de suivis Puisque chacun des tests d'effets simples implique quatre points de temps suivra avec comparaisons par paires en utilisant la commande marges avec l'option pwcompare. Anova avec terme d'erreur groupé Les tests de traitement à chaque point de liaison nécessitent l'utilisation de l'erreur groupée. Autrement dit, pooling id trt et l'erreur résiduelle. Cela est facilement possible en supprimant id trt de la commande anova. Notez que les degrés de liberté résiduels sont maintenant 24. L'effet du traitement à chaque instant Maintenant, nous pouvons exécuter les effets simples du traitement à chaque fois, encore à l'aide de la commande de contraste. Puisqu'il ya deux niveaux de traitement à chaque point de temps, il ya un total de quatre degrés de liberté. Puisque chaque test est un degré de liberté, nous n'avons pas à faire de tests de suivi. Graphique d'interaction Un graphique de l'interaction est toujours utile. Nous allons utiliser la commande margins et marginsplot pour produire l'intrigue. Inconvénients de mesures répétées anova Mesures répétées anova souffre de plusieurs inconvénients parmi lesquels sont, ne permet pas des observations inégales au sein de l'utilisateur sujet doit déterminer le terme d'erreur correct pour chaque effet suppose symétrie composée structure de covariance échangeable Une alternative aux mesures répétées anova est à exécuter L'analyse en tant que modèle mixte de mesures répétées. Nous allons le faire en utilisant la commande xtmixed. Notez que nous n'avons pas à spécifier les termes d'erreur, nous avons seulement besoin de spécifier le nom de la variable sur laquelle les données sont répétées, dans ce cas, id. Voici à quoi ressemble la commande xtmixed. Notez que nous utilisons l'option reml pour que les résultats soient comparables aux résultats de l'anova. En plus des estimations des effets fixes, nous obtenons deux effets aléatoires. Il s'agit de la variance des interceptions et de la variance résiduelle qui correspondent respectivement aux variances entre sujets et entre sujets. Xtmixed produit des estimations pour chaque terme dans le modèle individuellement. Pour obtenir des tests conjoints (multi degré de liberté) de l'interaction et des effets principaux, nous utiliserons la commande de contraste. Graphique d'interaction Permet de représenter graphiquement l'interaction en utilisant les mêmes marges et les mêmes instructions de marginsplot que précédemment. Test des effets simples Une fois encore, nous pouvons utiliser des tests d'effets simples pour comprendre l'interaction significative. Temps à chaque traitement Comme chacun de ces tests d'effets simples utilise trois degrés de liberté, nous suivrons des comparaisons par paires. Le traitement à chaque test de temps post-hoc des tendances Une autre façon de regarder ces résultats serait d'examiner la tendance au fil du temps pour chacun des deux groupes. Nous le faisons en utilisant la p. Opérateur de contraste qui donne des coefficients d'utilisation de polynômes orthogonaux. Nous gardons l'opérateur que nous avons utilisé dans les tests d'effets simples pour donner les résultats par traitement. Les résultats montrent une tendance linéaire significative pour le traitement 1 et le traitement 2. Le traitement 2 présente une tendance quadratique significative alors que le traitement 1 a une tendance cubique significative. Test post-hoc de l'interaction partielle Une autre alternative consiste à examiner les interactions partielles entre le traitement et le temps. Nous allons examiner les deux traitements et deux points de temps pour chaque test. Pour comprendre nos tests d'interaction partielle, il est utile de visualiser le graphique de l'interaction. Le premier test examine les deux lignes entre le temps 1 et le temps 2. Le test suivant examine les lignes entre le temps 2 et le temps 3. Et le test final examine les deux lignes entre le temps 3 et le temps 4. Pour chacun des Les interactions partielles que nous testons si l'interaction entre les quatre cellules est significative. La façon de mettre en place les tests d'une interaction partielle est d'utiliser l'a. (Adjacent) opérateur de contraste avec l'interaction pour. L'explication est beaucoup plus complexe que le concept. Les résultats indiquent qu'il n'y a pas d'interaction entre le temps 1 et le temps 2 ou entre le temps 2 et le temps 3. Cependant, il ya une interaction entre les temps 3 et 4. Les structures de covariance intra-sujet Nous avons dit plus tôt que nous reviendrions sur le sujet Des structures de covariance intra-sujet. Donc, nous allons regarder plusieurs des structures de covariance intra-sujet possibles. Cette structure de covariance considère les effets répétés comme étant totalement indépendants, tout comme si la conception était entre-sujets. Compound symmetryexchangeable Mesures répétées anova suppose que la structure de covariance intra-sujet a symétrie composée. Il existe une variance unique (sigma 2) pour tous les 3 points temporels et il existe une seule covariance (sigma 1) pour chacune des paires d'essais. Ceci est illustré ci-dessous. Stata appelle cette structure de covariance échangeable. Pour la covariance non structurée, chaque point temporel a sa propre variance (par exemple, sigma 1 2 est la variance du temps 1) et chaque paire de points temporels a sa propre covariance (par exemple, sigma 21 est la covariance du temps 1 et du temps 2). C'est le type de structure de covariance est trouvé analyse de variance multivariée (manova). L'inconvénient de l'utilisation de la covariance non structurée est le plus grand nombre de paramètres étant estimés. Autoregressive Une autre structure de covariance commune qui est fréquemment observée dans les données de mesures répétées est une structure autorégressive, qui reconnaît que les observations qui sont plus proches sont plus corrélées que les mesures qui sont plus éloignées. Ci-dessous un exemple de matrice de covariance autorégressive. Il est également possible d'avoir des structures autorégressives de type 2 ou 3. En plus des structures de covariance présentées ci-dessus, Stata propose également les structures de covariance suivantes: moyenne mobile, bande, toeplitz et exponentielle. Exemple avec covariance non structurée Après avoir vérifié notre matrice de covariance intra-sujet, nous avons décidé d'utiliser la covariance non-structurée dans le sujet. Voici le test conjoint (multi degré de liberté) pour l'interaction. Tests d'effets simples: trttime Puisque l'interaction est statistiquement significative, nous suivrons avec un test des effets simples du temps à chaque traitement. Modèles de croissance Modèle de croissance linéaire Il est également possible de traiter le temps comme une variable continue, Modèle serait considéré comme un modèle de croissance linéaire. Pour simplifier l'interprétation de l'interception, nous allons commencer l'heure à zéro au lieu d'un. Nous le faisons en créant une nouvelle variable ctime qui est time - 1. Nous devons laisser xtmixed savoir que nous traitons ctime comme continu en utilisant le c. Préfixe. Note, lorsqu'on utilise un modèle mixte, il n'est pas nécessaire de mesurer chaque sujet aux mêmes points de temps, bien que dans notre cas, ils soient tous mesurés aux mêmes quatre points de temps. Voici notre modèle de croissance linéaire. Comme vous pouvez le constater, le terme d'interaction reste statistiquement significatif. Vous devez faire attention à interpréter trt et ctime comme effets principaux dans le sens anova. Le coefficient ctime est la pente de y sur ctime dans le groupe de référence. Alors que le coefficient pour trt est la différence dans les deux groupes lorsque ctime est nul. Pentes simples Nous pouvons utiliser la commande margins avec l'option dydx pour obtenir les pentes de chacun des deux groupes de traitement. Notez que la pente pour trt 1 est identique au coefficient pour ctime ci-dessus. Nous pouvons également tester la différence dans les pentes en utilisant la commande marges avec le codage de groupe de référence en utilisant le r. Opérateur de contraste. Il n'est pas vraiment nécessaire de le faire parce que nous savons déjà que la différence de pentes est significative à partir du terme d'interaction ci-dessus. En fait, si vous prenez la valeur z pour l'interaction (3.57) et la carrée (12.7449), vous obtenez le chi-carré montré ci-dessous à l'intérieur de l'erreur d'arrondi. Représentation graphique de l'interaction Nous pouvons visualiser les pentes simples en dessinant l'interaction en utilisant une variation de marges avec l'option at () avec la commande marginsplot. Modèle de croissance quadratique Nous n'avons pas à nous limiter à une relation linéaire dans le temps. Nous pouvons facilement inclure un effet quadratique en répétant le terme c. ctime dans notre modèle. Graphique du modèle quadratique Nous pouvons représenter graphiquement le modèle quadratique en utilisant les mêmes marges et les mêmes instructions que celles utilisées pour le modèle linéaire Modèle de croissance cubique Si nous ajoutons un ctime supplémentaire à notre modèle de croissance quadratique, nous obtenons un modèle de croissance cubique. Graphique du modèle cubique Pentes pour chaque traitement et point de temps Avec une légère variation de la commande de marges, nous pouvons obtenir les pentes pour chaque groupe de traitement à chaque point temporel. Vous remarquerez que pour le traitement 2, les pentes ne cessent de devenir plus raides et plus raides, tandis que pour le traitement 1, les pentes remontent et redescendent. Avantages et inconvénients des modèles mixtes Il existe à la fois des avantages et des inconvénients à utiliser des modèles mixtes mais dans l'ensemble Les modèles mixtes sont plus souples et ont plus d'avantages que d'inconvénients. Avantages calcule automatiquement les erreurs standard correctes pour chaque effet permet le déséquilibre ou les observations manquantes dans le sujet permet des intervalles de temps inégaux permet diverses structures de covariance dans le sujet permet au temps d'être traité comme catégorique ou continue Inconvénients xtmixed rapports des résultats comme chi carré les valeurs p Approprié pour les grands échantillons et sont biaisés vers le bas dans de petits échantillons Le contenu de ce site Web ne doit pas être interprété comme un endossement de tout site Web, livre ou produit logiciel par l'Université de California. Slideshare utilise des cookies pour améliorer la fonctionnalité et les performances, Et pour vous fournir la publicité appropriée. Si vous continuez à naviguer sur le site, vous acceptez l'utilisation de cookies sur ce site. Consultez notre Accord utilisateur et notre Politique de confidentialité. Slideshare utilise des cookies pour améliorer la fonctionnalité et les performances, et pour vous fournir de la publicité pertinente. Si vous continuez à naviguer sur le site, vous acceptez l'utilisation de cookies sur ce site. Consultez notre politique de confidentialité et notre contrat d'utilisation pour plus de détails. Explorez tous vos sujets préférés dans l'application SlideShare Téléchargez l'application SlideShare pour Enregistrer pour plus tard, même en mode hors connexion Continuez vers le site mobile Télécharger Connexion Inscrivez-vous Appuyez deux fois pour faire un zoom arrière Séries temporelles Partagez SlideShare


No comments:

Post a Comment