gemeinsam zwiften | youtube | forum heute
Triathlon Trainingslager Südbaden
Keine Flugreise
Deutschlands wärmste Gegend
Kilometer sammeln vor den Wettkämpfen
Traumhafte Trainingsstrecken
Training auf dem eigenen Rad
25.05.-02.06.2024
EUR 390,-
Statistik / r-Studio Hilfe benötigt - triathlon-szene.de | Europas aktivstes Triathlon Forum
Zurück   triathlon-szene.de | Europas aktivstes Triathlon Forum > Offtopic > Sonstiges
Registrieren Benutzerliste Suchen Heutige Beiträge

Antwort
 
Themen-Optionen
Alt 23.04.2019, 09:36   #1
Acula
Szenekenner
 
Registriert seit: 10.12.2013
Beiträge: 2.461
Statistik / r-Studio Hilfe benötigt

Gibt es hier Leute die sich mit Statistik und r bzw. r-Studio auskennen?
Als erste "einfache" Frage für dein Einstieg hätte ich, was der Unterschied zwischen faktoriellen und numerischen Werten ist. Ich habe in meinem Datensatz folgende Zeilen:
sex age BMI smoke.lev bhd sys dias
1 F 61 21,181 taegl FALSE 101 70

bhd ist demnach ein logischer Wert, da er ja nur TRUE oder FALSE sein kann. sys, dias, age müssten numerische Werte sein. Bei sex, BMI und smoke.lev bin ich mir aber nicht sicher. smoke.lev kann taegl, gelegentl, nie und früher annehmen. sex kann F und M sein.
__________________
Forums-Trainings-Blog

Ich bin Ernährungswissenschaftler und haben einen kleinen Ernährungsblog, schau doch mal rein

Instagramprofil
Acula ist offline   Mit Zitat antworten
Alt 23.04.2019, 09:51   #2
BananeToWin
Szenekenner
 
Benutzerbild von BananeToWin
 
Registriert seit: 03.12.2015
Beiträge: 1.348
Ich bin selbst gerade am lernen (R/R-Studio) und deshalb sowohl Antwortender als auch Fragender.

Ich denke die Frage müsste lauten, welcher Vekrentyp die jeweilige Spalte/Variable ist.

bhd ist ein logischer Vektor (TRUE/FALSE). sys, dias, age sind numerische Vektoren, genauso müsste BMI ein numerischer Vektor sein.

sex und smoke.lev müssten sog. Factors sein. Soll heißen, es sind Vektoren, die nur vordefinierte Werte ("Values", müssen also keine Zahlen sein) enthalten und die benutzt werden, um kategoriale Daten abzuspeichern.

Mithilfe der Funktion typeof(Datensatz$Variable) kannst du dir den Vektortyp anzeigen lassen.
__________________
Motivation is crap, be driven!
BananeToWin ist offline   Mit Zitat antworten
Alt 23.04.2019, 10:04   #3
Acula
Szenekenner
 
Registriert seit: 10.12.2013
Beiträge: 2.461
Ah coole Funktion, die kannte ich nicht. Mit dieser bekomme ich für bhd "logical" für alle anderen sechs Variablen "integer" heraus. Das müsste dann ja numerischen Werten entsprechen.

Danke für deine Hilfe!
__________________
Forums-Trainings-Blog

Ich bin Ernährungswissenschaftler und haben einen kleinen Ernährungsblog, schau doch mal rein

Instagramprofil
Acula ist offline   Mit Zitat antworten
Alt 23.04.2019, 10:15   #4
BananeToWin
Szenekenner
 
Benutzerbild von BananeToWin
 
Registriert seit: 03.12.2015
Beiträge: 1.348
Integer ist numerisch ja. Aber das dürfte ja eigentlich für smoke.lev nicht zutreffen. Die Variable sex könnte man ja auch mit 1 und 2 codieren und hätte dann wieder Zahlen, insofern könnte die auch numerisch sein.

Für smoke.lev hätte ich jetzt "character" erwartet.


(Soweit mir bekannt gibt es 4 Hauptklassen von Vektoren: double und integer (beide numerisch), logical und character)
__________________
Motivation is crap, be driven!
BananeToWin ist offline   Mit Zitat antworten
Alt 23.04.2019, 10:39   #5
schnodo
Szenekenner
 
Benutzerbild von schnodo
 
Registriert seit: 28.10.2011
Ort: Karlsruhe
Beiträge: 8.970
Zitat:
Zitat von BananeToWin Beitrag anzeigen
Integer ist numerisch ja. Aber das dürfte ja eigentlich für smoke.lev nicht zutreffen. Die Variable sex könnte man ja auch mit 1 und 2 codieren und hätte dann wieder Zahlen, insofern könnte die auch numerisch sein.

Für smoke.lev hätte ich jetzt "character" erwartet.
Ich kenne mich mir R überhaupt nicht aus, bin aber neugierig.

Wenn Du "sex" als indizierten Aufzählungstypen interpretierst, warum sollte das bei "smoke.lev" anders sein? Wäre der Typ character, müsste der Wert dann nicht in Anführungszeichen eingeschlossen sein?
__________________
🏊 Mein Kraul-Armzug-Video: EnglishEspañolDeutsch 🏊
schnodo ist gerade online   Mit Zitat antworten
Alt 23.04.2019, 10:50   #6
BananeToWin
Szenekenner
 
Benutzerbild von BananeToWin
 
Registriert seit: 03.12.2015
Beiträge: 1.348
Zitat:
Zitat von schnodo Beitrag anzeigen
Wenn Du "sex" als indizierten Aufzählungstypen interpretierst, warum sollte das bei "smoke.lev" anders sein? Wäre der Typ character, müsste der Wert dann nicht in Anführungszeichen eingeschlossen sein?
Wäre natürlich auch bei smoke.lev möglich. Allerdings ist in der ersten Zeile bei smoke.lev das Wort taegl, bei sex steht eine 1 sowie F.

In Anführungszeichen musst du Worte setzten, wenn du sie in Funktionen benutzt. Angezeigt wird der Wert bzw. das Wort aber ohne "" bzw. ' '.
__________________
Motivation is crap, be driven!

Geändert von BananeToWin (23.04.2019 um 10:56 Uhr).
BananeToWin ist offline   Mit Zitat antworten
Alt 23.04.2019, 11:24   #7
macoio
Szenekenner
 
Registriert seit: 29.10.2006
Ort: Dresden (Gauernitz)
Beiträge: 1.172
der Überbegriff zur Unterscheidung heißt Skalenniveau. Mit dem Array Typ factor lassen sich die qualitativen/kategorialen Merkmale (Ordinalskala, Nominalskala) und mit dem metrischen Array die quantitativen/metrischen Merkmale (Intervallskala, Verhältnisskala) abbilden.
macoio ist offline   Mit Zitat antworten
Alt 23.04.2019, 11:35   #8
BananeToWin
Szenekenner
 
Benutzerbild von BananeToWin
 
Registriert seit: 03.12.2015
Beiträge: 1.348
Zitat:
Zitat von macoio Beitrag anzeigen
der Überbegriff zur Unterscheidung heißt Skalenniveau. Mit dem Array Typ factor lassen sich die qualitativen/kategorialen Merkmale (Ordinalskala, Nominalskala) und mit dem metrischen Array die quantitativen/metrischen Merkmale (Intervallskala, Verhältnisskala) abbilden.
Da der Raucherstatus ja nur ordinalskaliert ist, müsste der entsprechende Typ doch dann "factor" sein oder?
__________________
Motivation is crap, be driven!
BananeToWin ist offline   Mit Zitat antworten
Antwort


Themen-Optionen

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge anzufügen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

vB Code ist An.
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.
Gehe zu

Alle Zeitangaben in WEZ +2. Es ist jetzt 00:10 Uhr.

Durchbruch: Was wirklich schneller macht
Persönliche Tipps aus dem Training der Triathlon-Langstreckler Peter Weiss und Arne Dyck
Wettkampfpacing Rad
Nächste Termine
Anzeige:

triathlon-szene.de

Home | Impressum | Datenschutz | Kontakt | Forum

Social

Forum
Forum heute
Youtube
facebook
Instagram

Coaching

Individuelles Coaching
Trainingspläne
Gemeinsam zwiften

Trainingslager

Trainingslager Mallorca
Trainingslager Deutschland
Radtage Südbaden
Alle Camps

Events

Gemeinsamer Trainingstag
Gemeinsames Zeitfahrtraining
Trainingswochenende Freiburg
Trainingswochenende München
Zeitfahren Freiburg
Zwei-Seen-Tour München

TV-Sendung

Mediathek
Infos zur Sendung

Racewear

Trikot und Hose

Rechner

Trainingsbereiche und Wettkampftempo Rad
Trainingsbereiche und Wettkampftempo Laufen
Trainingsbereiche und Wettkampftempo Schwimmen
Profi-Pacing Langdistanz
Vorhersage erste Langdistanz
Altersrechner
Wettkampfpacing 100 km Lauf und Marathon
Wettkampfgetränk selbst mischen
Powered by vBulletin Version 3.6.1 (Deutsch)
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.