So che questo potrebbe confondere l'inferenza statistica, ma sono davvero solo interessati a ottenere il più vicino a un modello accurato possibile. Ho una variabile dicotomica esito, con un ampio insieme di predittori dicotomiche. Sto pensando vorrei provare a utilizzare LASSO per selezionare le variabili che devo includere nel mio modello, quindi inserire le variabili selezionate in ad una regressione logit. C'è qualcosa che sto sottovalutando quando si tratta di la praticità di questo approccio ha chiesto 26 Gennaio 15 alla 21:35 In primo luogo, non c'è nessun garanzia che un modello lineare di probabilità sarà approssimare un modello logit molto bene conseguentemente il sottoinsieme delle variabili selezionate per uno può essere meno appropriato per l'altro. In secondo luogo, il ri-montaggio si applica nessun restringimento a tutti, nonostante il thats di selezione variabili avuto luogo nel primo passo rischiando gravi amp mis-calibrazione forse un po 'di perdita di discriminazione. Si può essere in grado di convalidare la procedura su un particolare set di dati, ma Non sembra al sicuro, in generale, o per offrire alcun vantaggio nel corso di un graduale regressione logistica. E, naturalmente, la sua inutile lacci pena L1-norma può essere utilizzato per la selezione restringimento amplificatore in regressione logistica. ha risposto 27 Gennaio 15 alla 13: 56I sto avendo confusione e difficoltà di utilizzo glmnet con lLASSOasso dove il mio risultato di interesse è dicotomica. Ho creato una piccola cornice dati falsi di seguito: Le colonne (variabili) dell'insieme di dati di cui sopra sono i seguenti: età (Età del bambino in anni) - continua genere - binario (1 maschio 0 femmina) BMIP (BMI percentile) - medu continua (livello più alto madre di istruzione) - ordinali (0 meno di liceo 1 diploma di 2 laurea 3 diploma post-diploma di maturità) Pedu (padre più alto livello di istruzione) - ordinali (uguale medu) fcolor (colore primario preferito) - nominale ( stato di blu, rosso o giallo) asma (bambino asma) - binario (1 asma 0 senza asma) l'obiettivo di questo esempio è di fare uso di LASSO per creare un modello di previsione dello stato del bambino asma dalla lista dei 6 potenziali variabili predittive ( l'età. genere. BMIP. medu. Pedu. e fcolor). Ovviamente la dimensione del campione è un problema qui, ma spero di avere un quadro più chiaro come gestire i diversi tipi di variabili (ad esempio continuo, ordinale, nominale, e binario) nel quadro glmnet quando il risultato è binaria (1 asma 0 senza asma). In quanto tale, sarebbe che nessuno sia disposto a fornire uno script di esempio R insieme a spiegazioni per questo stupido esempio, utilizzando LASSO con i dati di cui sopra per prevedere lo stato di asma Anche se molto semplice, lo so io, e probabilmente molti altri su CV, apprezzo molto questo ha chiesto 8 13 ottobre a 15:56 la linea xfactors model. matrix lt - (asma genere medu Pedu fcolor), - 1 codici del fcolor variabile categorica (come dichiarato dal as. factor nelle righe precedenti). Si dovrebbe utilizzare il valore predefinito R manichino codifica variabile, a meno che non viene fornito l'argomento contrasts. arg. Ciò significa che tutti i livelli di fcolor sono ugualmente ponderati e non direzionale, ad eccezione del primo che viene utilizzata come classe di riferimento e assorbito nel intercetta. ndash Alex 27 ottobre 15 a 05:16
No comments:
Post a Comment