PDA

Vollständige Version anzeigen : Brauche eure Hilfe für mein Statistik-Projekt...


Lucy89
25.07.2011, 22:01
Hallo,
da ich Mathe studiere und letztes Semester eine Statistikvorlesung gehört habe und mir dabei ein paar Kenntnisse in der Programmiersprache R angeeignet habe (für alle, die nichts mit Statistik zu tun haben: spezielle Programmiersprache für statistische Untersuchungen) möchte ich die Semesterferien nutzen, um diese Kenntnisse noch weiter zu vertiefen. Dafür brauche ich nun erstmal Daten. Da mich Sport am meisten interessiert, bin ich neulich auf die Idee gekommen, meine Daten hier zu holen.
Ich würde mich freuen, wenn ein paar Leute hier in dieser Tabelle eben schnell ihre Werte eintragen (anonym, keine Namen oder sowas): https://spreadsheets.google.com/spreadsheet/ccc?key=0AvzofFFZ6-U6dFctUGlVRGFEN0I2Wl9zWkE5VzBwMWc&hl=en_US
Ich bitte euch, nichts zu manipulieren, da diese Tabelle öffentlich zugänglich ist und von jedem bearbeitet werden kann.

Ich würde mich über eure Mithilfe freuen, echte Daten zu analysieren macht mehr Spaß als sich welche auszudenken ;)

Achja, wem weitere wichtige Einflussfaktoren einfallen, können gern noch mit rein...

Und wer hinterher an der Auswertung interessiert ist, kann ich natürlich auch gern posten.

LG, Lucy

Lecker Nudelsalat
25.07.2011, 22:12
Training besteht nicht nur aus S/R/L. :Huhu:

Kraft, Yoga, Gymnastik, Pilates, FT = Fast Twitch, Massieren (FoamRoller) ....

Gruß strwd

Lucy89
25.07.2011, 22:15
Danke. Ich mache eine zusätzliche Spalte. Wird nur schwer bei der Auswertung...aber ich hab da schon eine Idee :)

be fast
25.07.2011, 22:20
Hallo,
da ich Mate studiere ......

Gut, dass du dich dafür entschieden hast....;)

Lucy89
25.07.2011, 22:21
Gut, dass du dich dafür entschieden hast....;)

Oooh, verdammt :D Ich hatte auch Deutsch-LK :Lachen2:

Ich danke euch schonmal für die vielen Einträge, ich freu mich total :) Dann kann ich bald richtig loslegen =))

wildcoyote
25.07.2011, 22:23
Mal ne frage - seit wann kann man Tee studieren :Blumen: argh, zu spät

be fast
25.07.2011, 22:24
Oooh, verdammt :D Ich hatte auch Deutsch-LK :Lachen2:


Wer an nem Triathlon teilnimmt fährt halt auch net automatisch nen 40er Schnitt....:Cheese: :Blumen:

Wassertraeger_HAM
25.07.2011, 22:33
Hallo,
da ich Mate studiere ...
Eingetragen.

Ich hoffe, du magst das Zeug. Sonst wird das Studium ziemlich hart. ;)

Lucy89
25.07.2011, 22:42
@Wasserträger: Wenn du mit Zeug Mathe magst, dann ja, ich liebe es =D, meinen Bachelor hab ich schon. Ich mach jetzt Master ;)
Das Getränk kenn ich noch nicht =D

JeromeGER
25.07.2011, 23:55
Mathe studieren verbinde ich mit Suizid ;)

mblanarik
26.07.2011, 04:49
Gute, nein, sehr sehr gute Studienwahl, Lucy! :Huhu:
Weiterhin viel Spass und Erfolg!

Flow
26.07.2011, 07:00
Hallo,
da ich Mathe studiere
Das ist gut ... :)
Vielleicht kannst du mir ein paar grundlegende Fragen zur nichteuklidischen Geometrie beantworten ... http://www.cosgan.de/images/smilie/frech/e030.gif


Ansonsten : Bei den "Trainingsstunden" ... willst du Trainingsstunden im Jahresschnitt oder Stunden in einer typischen/durchschnittlichen Belastungswoche ? Hab' da eine etwas höhere Abweichung vom Standard ... :cool:

Superpimpf
26.07.2011, 07:09
Eingetragen.

Ich hoffe, die Werte stimmen einigermaßen - sind alle aus dem Gedächtnis.

pXpress
26.07.2011, 07:25
Na hab mich auch mal mit den aktuellen Werten aus 2011 verewigt. Viel Spaß beim auswerten.

Bleierpel
26.07.2011, 08:03
Bin auch drin...

Sagst Du uns auch, was raus kommt..? :Blumen:

thunderbee
26.07.2011, 08:09
...habe leider gerade keinen Zugriff auf Dein Sheet.
Was willst Du denn "analysieren" und mit welchen Methoden?;)

carolinchen
26.07.2011, 08:11
Done

Roque
26.07.2011, 08:22
erledigt :Huhu:

Teuto Boy
26.07.2011, 09:01
auch dabei...

ben_11
26.07.2011, 09:14
Das unterstütze ich natürlich :) ! Ich hab mal Durchschnittswerte aus 2011 eingetragen!

Das ist gut ... :)
Vielleicht kannst du mir ein paar grundlegende Fragen zur nichteuklidischen Geometrie beantworten ... http://www.cosgan.de/images/smilie/frech/e030.gif


Was willste Wissen? Und welche Geometrie? :D

Lucy89
26.07.2011, 10:43
Das ist gut ... :)
Vielleicht kannst du mir ein paar grundlegende Fragen zur nichteuklidischen Geometrie beantworten ... http://www.cosgan.de/images/smilie/frech/e030.gif


Ansonsten : Bei den "Trainingsstunden" ... willst du Trainingsstunden im Jahresschnitt oder Stunden in einer typischen/durchschnittlichen Belastungswoche ? Hab' da eine etwas höhere Abweichung vom Standard ... :cool:

Meine Frage wäre auch erstmal, welche Geometrie ;) Neutrale, hyperbolische...? Gibt da ja schon kranke Sachen :D

Ich hab jetzt mal überlegt, so einen Durchschnittswert zu nehmen. Also ich fahr z.b. während der Saison viel mehr Rad als im Winter, das hab ich dann schon berücksichtigt.

...habe leider gerade keinen Zugriff auf Dein Sheet.
Was willst Du denn "analysieren" und mit welchen Methoden?;)

Ich analysiere erstmal mit einem multivariaten Modell den Einfluss aller Größen auf die Bestzeiten und schaue dann, welcher Faktor den größten Einfluss hat und welche so stark korrellieren, dass ich sie zu "einem" machen kann. Außerdem möchte ich natürlich vieles schön visualisieren.
Ich steh noch ziemlich am Anfang mit R (ich hab meinen Schwerpunkt im Studium eigentlich in der reinen Mathematik, Algebra). Aber ich denke, einige schöne Sachen werd ich schon hinkriegen.

Vielen Dank für eure Einträge! Bald wird das schon richtig repräsentativ. So ab 50 Einträgen kann man bestimmt was ordentliches da rauskriegen :)

Flow
26.07.2011, 10:55
Meine Frage wäre auch erstmal, welche Geometrie ;) Neutrale, hyperbolische...?
Egal, Hauptsache nichteuklidisch ... :cool:
Wie gesagt, weniger spezielle denn vielmehr grundlegende Aspekte der Befreiung der Idee des gekrümmten Raumes aus der Physik und Übertragung in die unbefleckte Reinheit der Mathematik ... ;)

thunderbee
26.07.2011, 12:21
....Ich analysiere erstmal mit einem multivariaten Modell den Einfluss aller Größen auf die Bestzeiten und schaue dann, welcher Faktor den größten Einfluss hat und welche so stark korrellieren, dass ich sie zu "einem" machen kann. Außerdem möchte ich natürlich vieles schön visualisieren.
Ich steh noch ziemlich am Anfang mit R (ich hab meinen Schwerpunkt im Studium eigentlich in der reinen Mathematik, Algebra). Aber ich denke, einige schöne Sachen werd ich schon hinkriegen...

Das wird interessant, vorallem welche Korrelationen je nach Distanz des Wks vorhanden sind.
Viel Spass!

Lucy89
26.07.2011, 12:50
Das wird interessant, vorallem welche Korrelationen je nach Distanz des Wks vorhanden sind.
Viel Spass!

Danke ;) Für die Korrelation je nach Distanz des WKs hätte ich wohl noch Bestzeiten hinzufügen müssen über längere Strecken, z.b. Langdistanz. Ich schreibs einfach noch dazu.

Meik
26.07.2011, 13:12
Eingetragen - zumindest fast. Zeiten von der KD hab ich keine, die letzte ist fast 10 Jahre her.

topre
26.07.2011, 16:30
erledigt - und die Auswertung ohne die ganzen mathematischen fachbegriffe würde mich auch interessieren. :Lachen2:

Lux
26.07.2011, 18:36
Danke ;) Für die Korrelation je nach Distanz des WKs hätte ich wohl noch Bestzeiten hinzufügen müssen über längere Strecken, z.b. Langdistanz. Ich schreibs einfach noch dazu.

Und Bestzeit Sprintdistanz und OD und MD fehlt dann auch noch.
Zumindest die OD Bestzeit drängt sich hier auf.

Ob da allerdings 50 Teilnehmende zusammenkommen mit allen Daten?
Schaun wir mal, es läuft ja gut an!

Lucy89
26.07.2011, 19:11
@Lux: die einzelnen Bestzeiten sind ja von der OD...halt nur ohne Wechsel. Naja ok, das sind jetzt Solo-bestzeiten,klar...ich fügs mal noch hinzu.

de..josi
26.07.2011, 20:02
ich wollt schon sagebn:: da hat aber jemand rumgepfuscht ;-), aber es wurde anscheinend nur sortiert :)

Lucy89
26.07.2011, 20:44
ich wollt schon sagebn:: da hat aber jemand rumgepfuscht ;-), aber es wurde anscheinend nur sortiert :)

Das gleiche hatte ich auch gedacht, als ich meinen Eintrag plötzlich nicht mehr gefunden habe ;) Ist aber echt nur Sortierung.

Lux
26.07.2011, 22:18
@Lux: die einzelnen Bestzeiten sind ja von der OD...halt nur ohne Wechsel. Naja ok, das sind jetzt Solo-bestzeiten,klar...ich fügs mal noch hinzu.

Die meisten Trias, an denen ich teilgenommen habe, weisen keine Wechselzeiten aus.
Meist waren in der Radzeit beide Wechsel enthalten.
Und die Wechselräume sind sehr unterschiedlich.
Mal mit langen Laufpassagen, mal mit sehr kurzen.

Wenn du also eine möglichst genaue Datenbasis haben möchtest,
müßtest du die Spalten genauer benennen
und m.E. bei der Radzeit z.B. inkl. 2er Wechsel dazu schreiben.

Oder noch eine zusätzliche Spalte: "Radzeit ohne Wechsel, falls bekannt". Dann wird wenigstens bei den Datensätzen, die die reine Radzeit angegeben haben, kein zusätzlicher Fehler (durch Rausrechnen von Wechseln) auftreten.

Mmh...
Fehler treten auch noch durch ungenau Streckenlängen auf.
Die wahre Länge korreliert nur mit den Angaben auf der Ausschreibung... :Nee:

Trotzdem bin ich auch an deiner Auswertung interessiert!

Lucy89
26.07.2011, 22:26
Ich meinte die Bestzeiten jetzt auch wirklich "solo", also ohne irgendeinen Wechsel drin. ich finde Triathlons sind so schwer zu vergleichen. Die Streckenlängen stimmen fast nie, und wie du schon sagtest, der Weg zur Wechselzone usw. Daher hab ich das so abgefragt. Ich warte jetzt noch 1-2 Tage und dann beginn ich mal. Je mehr Daten, desto besser. Mir ist bisher noch nichts eingefallen, wo ich sonst noch Daten herkriege, aber es sind ja auch schon über 50, das ist auf jeden Fall schonmal gut.

keko
26.07.2011, 22:31
Mathe studieren verbinde ich mit Suizid ;)

Wenn man das Studium überlebt, endet man meist in einem sinnlosen Job und schlägt die Zeit mit sinnlosen Forenpostings tot. :Lachen2:

Lucy89
27.07.2011, 12:33
Wenn man das Studium überlebt, endet man meist in einem sinnlosen Job und schlägt die Zeit mit sinnlosen Forenpostings tot. :Lachen2:

Klingt super :) Hoffentlich krieg ich auch so einen Job :Lachen2:

Lucy89
27.07.2011, 21:09
Vielen vielen Dank für die ganzen Einträge :). An alle, die sich am Anfang eingetragen haben, hätte ich noch die Bitte, eventuell die OD und MD Bestzeit nachzutragen. ich werde die Tabelle Freitag vormittag schließen und die Daten so übernehmen und auswerten.

*markus
27.07.2011, 21:21
Falls du noch mit anderen Datensätzen spielen möchtest schau doch einfach mal auf der Homepage des Statistischen Bundesamtes vorbei. Dort findest du massenhaft konkrete Daten!

keko
27.07.2011, 23:16
Klingt super :) Hoffentlich krieg ich auch so einen Job :Lachen2:

Das trau ich dir zu, dass du das schaffst. :Cheese:

Die Bestzeiten, sollen das aktuelle sein, oder?

Lucy89
29.07.2011, 12:05
Ja, bei den Bestzeiten meinte ich schon mehr oder weniger aktuelle. Also wenn jemand irgendwie von 20-25 richtig tolle zeiten gemacht hat, dann nach 20 jahren pause wieder neu beginnt, dann wäre es wenig aussagekräftig, die alten zeiten dahin zu schreiben...

Hab die Tabelle jetzt zum editieren geschlossen. Was mich etwas wunderte, war, dass bei einigen Einträgen die Gesamtzahl an Trainingsstunden schon wesentlich kleiner war als die Summe der einzelnen Angaben. Das werd ich dann ändern, denn das ist einfach unlogisch. Ich hätte in dieser Spalte auch einfach direkt automatisch die Summe berechnen lassen, aber ich dachte, bei dem ein oder anderen kommt noch Krafttraining oder Stabi hinzu...deswegen müsste eigentlich gelten: Gesamtzahl Stunden größer gleich Stunden Laufen+schwimmen+Rad.

Vielen Dank schonmal an alle! Wenn ich erste Ergebnisse hab, poste ich das hier.

Lucy89
04.08.2011, 21:49
Kurzes Update: Ich habe das Projekt NICHT vergessen, ich bin nur momentan im umzugsstress ;) Die erste Arbeit ist aber getan, ich habe etwa 3 Stunden gebraucht, um die Tabelle auf ein Format zu bringen, mit dem ich arbeiten kann. Sowas wie 00:32:37 muss man ja auch alles irgendwie umrechnen, das wusste ich vorher auch nicht. Schon was gelernt :)

Lucy89
15.08.2011, 22:24
So, ich habe jetzt schon einiges an Diagrammen gemacht und mein Ziel, besser mit diesem Programm/dieser Programmiersprache umzugehen, hab ich schon erreicht. Zumindest was die einfacheren Dinge betrifft.

Was mich persönlich grad als erstes interessiert, ist nun dieser Zusammenhang: Alter-Ruhepuls-Maximalpuls und daher hab ich mal 2 Diagramme angehängt.

ich dachte, dass Ruhepuls-Maximalpuls irgendwie voneinander abhängen. Sicher nicht richtig linear, denn der Ruhepuls ist ja trainierbar, aber ich hab zumindest eine leichte Abhängigkeit vermutet. Die Daten sagen was anderes, Korrelation ist nahezu 0.

Der Zusammenhang zwischen Alter und Maximalpuls ist hingegen bestätigt :) Es gibt ja diese Formel 220-Lebensalter, aus meinen Daten ergibt sich die Formel: 206.0948 - Jahre*0,4563.


Frage: Wieso bin ich so ein Ausreißer? Ich bin 22 und mein Maximalpuls beträgt 178, wobei ich den schon lang nicht mehr auf der uhr hatte. Nach harten 1000er Intervallen war ich auf 172, das war aber schon an der K***grenze. Hat das was zu bedeuten?

Lucy89
15.08.2011, 23:10
Hier übrigens noch meine Formel (rot) und die 220-Lebensalter.
Wenn ich weiter bin, dann werd ich männlich/weiblich getrennt untersuchen. Ich hab eben auch mal ne quadratische Funktion gefitted, die passte besser. Aber Graden sind immer beliebter =)

hier sieht man auch noch einen Fit mit einer Exponentialfunktion, das ist das genaueste:

http://i22.photobucket.com/albums/b339/Kathrin1989/AlterMaximalpulsregexp.gif?t=1313444020

Sorry fürs rumspammen =D hatte heute abend nur so viel Spaß mit dem zeug rumzuspielen :)

Zwerg87
16.08.2011, 00:58
Willst du auch Daten von einem Anfänger?.. Das wäre dann aber ein Ausreiser von dem , was du bisher für Daten gesammelt hast :)

Edit. Ok sehe gerade, dass es schon längst vorbei is ^^

Joerg aus Hattingen
16.08.2011, 08:50
...
Der Zusammenhang zwischen Alter und Maximalpuls ist hingegen bestätigt :) Es gibt ja diese Formel 220-Lebensalter, aus meinen Daten ergibt sich die Formel: 206.0948 - Jahre*0,4563.


Hf_max ist genetisch vorgegeben. Dabei variiert die maximal erreichbare Hf individuell.
Meine Theorie ist, dass die individuelle Hf_max aufgrund des Trainings nicht mehr so schnell erreicht werden kann. Als Anfänger ist das kardiopulmolare System schnell an seiner Lesitungsgrenze, nach längerem Training scheint eher die Muskulatur limitierend zu sein.

Lucy89
16.08.2011, 10:33
Hf_max ist genetisch vorgegeben. Dabei variiert die maximal erreichbare Hf individuell.
Meine Theorie ist, dass die individuelle Hf_max aufgrund des Trainings nicht mehr so schnell erreicht werden kann. Als Anfänger ist das kardiopulmolare System schnell an seiner Lesitungsgrenze, nach längerem Training scheint eher die Muskulatur limitierend zu sein.

Ja, das klingt schon logisch. Wobei, wenn man seine Hfmax irgendwie testet, indem man einfach losrennt so schnell man kann, ohne das man vorher was getan hat (außer aufwärmen natürlich), könnte es ja schon gehen.
Ich frag mich halt manchmal, ob man irgendeinen Nachteil davon hat, wenn die Hfmax so niedrig ist. bei mir ist die ja schon auffällig tief. Wenn der Trainer dann Pulsvorgaben macht: "So, jetzt Intervalle bei Puls 180" dann kann ich das schon gar nicht erfüllen ;)

snigel
16.08.2011, 10:38
sagt man deshalb nicht 90% von 100% sonst würde es bestimmt einige geben die die Vorgaben im Training nicht schaffen könnten ;)

Ob ein niedriger Maximalpuls schlecht ist glaube ich nicht wirklich, belegen müssten dies aber andere :Cheese:

Hafu
16.08.2011, 11:46
... Wenn der Trainer dann Pulsvorgaben macht: "So, jetzt Intervalle bei Puls 180" dann kann ich das schon gar nicht erfüllen ;)

Wenn du einen Trainer hast, der tatsächlich solche Vorgaben macht, dann wirst du ohnehin nur soboptimal betreut.:(

Intervalltraining (egal ob Laufen, Schwimmen oder Radfahren )sollte eigentlich nie über den Puls gesteuert werden, sondern über Tempovorgaben.
Der Puls ist viel zu träge und außerdem zu sehr von anderen Faktoren wie Wetter, Vorermüdung und Ernährung abhängig, als dass er ein taugliches Steuerungskriterium bei Intervallen abgeben könnte.

PippiLangstrumpf
16.08.2011, 17:51
Sorry fürs rumspammen =D hatte heute abend nur so viel Spaß mit dem zeug rumzuspielen :)

:confused: Ist doch Dein Thread. Da darfste auch reinschreiben :Cheese:
Ich finds spannend, was so aus den Zahlen wird :Huhu:

FinP
16.08.2011, 18:26
Der Puls ist viel zu träge und außerdem zu sehr von anderen Faktoren wie Wetter, Vorermüdung und Ernährung abhängig, als dass er ein taugliches Steuerungskriterium bei Intervallen abgeben könnte.

Bei den Intervallen ist es schon ein gutes Steuerunskriterium, bei den Belastungen zwischen den Intervallen nicht. :Cheese:

[/Klugscheißmodus]