Repräsentative Auswertung

Ansicht von 14 Beiträgen - 1 bis 14 (von insgesamt 14)

Autor

Beiträge
Floh
Mitglied

25. Oktober 2006 um 12:46 Uhr

Beitragsanzahl: 124

#22310

Hallo zusammen,
hallo Barbara :)

Gibt es eine Formel, die mir angiebt wann eine Auswertung repräsentativ ist?

Bsp.: Habe Daten von 1000 Personen die innerhalb 14 Tage erfasst worden sind. Kann ich die 1000 als ausreichend bezeichnen oder brauche ich (aufs Jahr gesehen) mehr. Es geht um Terminauswertungen in verschiedenen Kategorien. Nicht jede Person erfüllt jede Kategorie. (???) Alles klar, oder ist das zu wüst?

LG
Floh

Barbara
Senior Moderator

25. Oktober 2006 um 13:01 Uhr

Beitragsanzahl: 2766

#42703

Hallo Floh,

dazu gibt es zwei Punkte:

1. der benötigte Stichprobenumfang
Hängt (wie bei der Stichprobenprüfung) davon ab, wie genau Du mit Deinen Aussagen sein willst. Für eine Aussage von „hat sich im Vergleich zum Vorjahr um 0,01% verbessert“ brauchst Du deutlich mehr Informationen als für die Aussage „hat sich im Vergleich zum Vorjahr um 10% verbessert“.

Berechnet wird das Ganze so ziemlich ähnlich wie bei der Stichprobenprüfung. Meist wird die wichtigste Frage (bzw. die wichtigsten Fragen) genommen und dafür der erforderliche Umfang bestimmt. Der Umfang für die Durchführung ist dann der größte notwendige berechnete Stichprobenumfang.

2. Repräsentativität
Das hat zwar auch etwas mit der Größe zu tun, kann allerdings nicht direkt mit einer Formel abgesichert werden.

Repräsentativität ist gegeben, wenn die Stichprobe bezüglich der wichtigen Merkmale in der Gesamtheit repräsentativ ist, d. h. die Stichprobe sollte dieselbe Struktur wie die Gesamtheit haben (oder entsprechend gewichtet werden).

Häufig werden bei der Repräsentativität folgende Merkmale betrachtet: Alter, Umsatz / Einkommen, Geschlecht, höchster Abschluss, etc.

Wichtig ist natürlich auch, dass der Zeitraum repräsentativ für den abzubildenden Zeitraum ist, d. h. wenn Du mit Daten, die über 14 Tage gesammelt wurden, Aussagen für die nächsten 20 Jahre machen willst, dann ist das ziemlich wackelig. Ob die Aussagekraft ausreicht, um mit 14 Tagen einen Monat zu repräsentieren, hängt von den untersuchten Fragestellungen ab.

Ich hoffe, das hilft Dir erstmal weiter.

Viele Grüße

Barbara

_____________________________________

„Was war das für eine Stimme?“ schrie Arthur.
„Ich weiß nicht“, brüllte Ford zurück, „ich weiß es nicht. Es klang wie Wahrscheinlichkeitsrechnung.“
Douglas Adams – Per Anhalter durch die Galaxis

Floh
Mitglied

25. Oktober 2006 um 13:46 Uhr

Beitragsanzahl: 124

#42706

Hallo Barbara,

nicht wirklich:(
Stichprobenumfang… weißt ja das ich im Dienstleistungssektor bin und nicht wirklich bisher damit was zu tun hab.
o.k. hab 1050 Personen in (korrektur) 28 Tagen „verfolgt“. Merkmale: Termin, Ankunft, Voruntersuchung, Akte, Untersuchung, Demissio. Nicht jede Person hat alle Merkmale. Ich möchte somit die Durchlaufzeiten erfassen.

Besser?

LG
Floh

Systemmanager
Teilnehmer

25. Oktober 2006 um 13:59 Uhr

Beitragsanzahl: 291

#42707

Hallo Floh!

Mit Barbara habt ihr ja eine höchst kompetente Statistik- Person ;-)

Nur ergänzende Beispiele zu Stichproben der Binominal-Verteilung:

Beispiel 1:
n= 500 p=30%
Mit einer Sicherheit von 99% liegt die Wahrheit zwischen
p’= 25% und 35 %

Beispiel 2:
n= 30 p=30%
Mit einer Sicherheit von 99% liegt die Wahrheit zwischen
p’= 11% und 55%

Wenn du nun Veränderungen zwischen zwei Stichproben feststellen möchtest, muss geprüft werden, ob der Unterschied der beiden Stichproben auch signifikant ist.

Beispiel 3
n=500 p=20%
Mit einer Sicherheit von 99% liegt die Wahrheit zwischen
p’= 16% und 25% (Vetrauensbereich)

Im Vergleich zu Beispiel 1 tangieren sich die 25%-Grenzen. Die Aussagesicherheit, dass sich das Ergebnis von Beispiel 3 gegenüber dem Beispiel 1 signifikant verkleinert hat ist zulässig.
Wenn sich die Werte beginnen zu überschneiden sinkt die Signifikanz.

Beispiel 4
n= 30 p=20%
Mit einer Sicherheit von 99% liegt die Wahrheit zwischen
p’= 5,5% und 44%
Die Überschneidung der beiden Ergebnisse ist recht größ, die Aussage über die Signifikanz der Unterschiede der beiden Stichproben ist zu relativieren.

—————

Vergleiche und beurteile die Ergebnisse aus Beispiel 2 und 4 selbst!

—————

Wenn du aber einen Unterschied von 1% oder weniger signifikant ermitteln willst, dann reichen wohl auch die 500 oder 1000 nicht.

Die Zusammenhänge sind sehr komplex. Es gibt statistische Tests über den Vergleich zweier Stichproben, oder einer Stichprobe zur Grundgesamtheit, usw., nachzulesen in guten Statistikbüchern……

Systemmanager :-)

Barbara
Senior Moderator

25. Oktober 2006 um 14:03 Uhr

Beitragsanzahl: 2766

#42708

Hallo Floh,

wie definierst Du denn die Durchlaufzeit? Mir ist noch nicht so ganz klar, ob Du damit eine Art Aktenbearbeitungszeit meinst oder die Verweilsdauer Eurer Patienten in einem Bereich oder in Eurem Haus oder…

Viele Grüße

Barbara

_____________________________________

„Was war das für eine Stimme?“ schrie Arthur.
„Ich weiß nicht“, brüllte Ford zurück, „ich weiß es nicht. Es klang wie Wahrscheinlichkeitsrechnung.“
Douglas Adams – Per Anhalter durch die Galaxis

Floh
Mitglied

25. Oktober 2006 um 14:14 Uhr

Beitragsanzahl: 124

#42709

Hallo Barbara,

ja, so ähnlich.
Pat. kommt in Ambulanz, und muss wie lange warten bzw. wieviele Stunden verbringt er in dem Haus. Da hab ich Pat. mit Termin und Notfälle. die die Termin haben kommen oft >30 min. zu früh, und andere >15 min. zu spät (beläuft sich teilweise um 2 std.). Nach farblicher Markierung (für Dummies wie ich ein Hilfsmittel) ist der geringste Anteil Patienten, die „Termingenau“ kommen. Ich möchte somit zeigen, dass evtl. Terminplanung für die Katz ist oder ein anderes System eingeführt werden könnte. Als Synergieeffekt, natürlich die Wartezeiten ausmerzen.

LG
Floh

@ Systemmanager: was ist p und was ist n??
Wie gesagt hatte mit Statistik noch nicht viel am Hut. Unser Klinikinformationssystem spuckt meistens alles per Knopfdruck aus.

geändert von – Floh on 25/10/2006 14:16:22

Systemmanager
Teilnehmer

25. Oktober 2006 um 14:30 Uhr

Beitragsanzahl: 291

#42710

Hi Floh!
Die Wartezeit wird aber doch recht deutlich von der Behandlungsdauere (die restliuche Durchlaufzeit)der einzelnen Patienten beeiflusst.

Wenn du anstrebst die Leerlaufzeiten der KH-Mitarbeiter zu drücken, dann entstehen zwangsläufig Wartezeiten für die Patienten.
Umgekehrt entstehen Leerlaufzeiten wenn du die Abstände vergrößerst und die Pat. natürlich auch pünktlich kommen.

Also müsstest du am Takt schrauben und die Pat. bitten pünktlicher zu kommen.

p……Anteil des Merkmales in %. z. b: p=30 Patienten kommen zu früh.

n……ist die Stichprobengröße z.B: n=1000 Patienten befragt (aber nicht 1000 auf einander folgende, da wäre es nicht mehr eine Stichprobe. Also jeden dritten, oder 5 am Tag….

P'(es sollte nur ein Apostroph sein) ist der Anteil in der Gesamtheit, also wenn du alle Patienten befragt hättest.

Systemmanager :-)

Barbara
Senior Moderator

25. Oktober 2006 um 14:48 Uhr

Beitragsanzahl: 2766

#42711

Hallo Floh,

also:
Durchlaufzeit = Wartezeit + Behandlungsdauer?
oder geht es Dir in erster Linie „nur“ um die Wartezeit eines Patienten?

Mögliche Unterscheidungskriterien:
Notfall oder Termin

Gibt es auch Patienten, die sich selbst als Notfall einstufen oder werden die alle von Einweisenden als Notfall eingestuft? (Sprich: Gibt es Patienten, die alleine in Eure Ambulanz kommen?)

Du willst also für Euer Patientengut eine repräsentative Untersuchung dazu machen, wovon die Wartezeiten (oder Durchlaufzeiten) beeinflusst werden, oder? Ist denn der Zeitraum für Euch repräsentativ oder habt Ihr sehr große Schwankungen in der Anzahl behandelter Patienten?

Viele Grüße

Barbara

_____________________________________

„Was war das für eine Stimme?“ schrie Arthur.
„Ich weiß nicht“, brüllte Ford zurück, „ich weiß es nicht. Es klang wie Wahrscheinlichkeitsrechnung.“
Douglas Adams – Per Anhalter durch die Galaxis

baazi
Mitglied

25. Oktober 2006 um 16:51 Uhr

Beitragsanzahl: 42

#42716

wohw, na hier kochen mal wieder die Gehirne.
Hi Floh, ich glaube nicht, dass Du mit einer statistischen Auswertung euer System befürworten, oder widerlegen kannst.
Brechen wir das Ganze doch mal auf ein einfaches System herunter z.B. Kunden am Bahnschalter, oder Warteschlange an der Supermarktkasse.
(OK Beispiele sind Hanebüchen, erfüllen aber Ihren zweck.. :-)
Also Supermarkt.
Gehen wir davon aus, das die durchschnittliche Zeit für einen Artikel mit auf´s Band legen, scannen und bezahlen 15 sec ist
Mama Gundel hat Kind dabei und 16 Artikel auf dem Band = 4 min
Oma Traudel hat 8 Artikel = 2 min
Schorsch hat einen Kasten Bier = 1 Artikel = 15 sec

so und nun kommt Variante x in Spiel (allg bekannt als Murphys Law)
Kind von Gundel wirft sich an der Kasse bei der Quängelware auf den Boden und schreit nach Bonbons. Oma Traudel hat die PIN Ihrer EC-Karte vergessen, und Schorsch muß erst einmal seine ganzen Münzen zusammensammeln, und da er zuwenig hat, trink er eine Flasche gleich an der Kasse und setzt das Pfand ein… und somit fällt der rechnerische Wert vom 6 min 15 sec in sich zusammen….

OK unwahrscheinliches Szenario. Was ich aber damit sagen will ist, dass man nur ungefähr sagen kann wie effektiv solch eine Auswertung mit mehreren variablen Unbekannten ist. Der gute Herr Gauss (damals noch auf dem 10 Mark schein) verdeutlichte das in einer Glockenkurve…
Schaue du hier http://www.wikipedia.de immer sääähr hilfreich…

Ich würde mich bei dieser Umfrage eher auf „bei ca. so und soviel Prozent der Patienten“ trifft die Einhaltung der „Patientendurchlaufzeit“ zu, beschränken. Oder einfach eine Kundenbefragung durchführen, wenn es euch nur um schwarz oder weiß geht.

Für eine genaue Auswertung sind die Variablen meiner Meinung nach einfach zu breit gefächert. Glaube keiner Statistik, die Du nicht selber gefälscht hast…. :o)

Incognito ergo brumm…

Barbara
Senior Moderator

25. Oktober 2006 um 17:51 Uhr

Beitragsanzahl: 2766

#42718

Hallo Baazi, hallo Floh,

ich geh jetzt mal davon aus, dass die 1000 Patienten hinsichtlich der Kategorien „Termin“, „Notfall“ (von RTW eingeliefert), „Ambulanz“ (Patient kommt ohne Termin als Notfall) unterschieden werden sollen.

Da Du, Floh, ja wahrscheinlich die Basiszahlen hast (z. B. Verteilung der drei Gruppen in 2005), kannst Du dann vergleichen, ob die Anteile der 1000 Patienten den Anteilen der Patienten in 2005 gesamt entsprechen (erstmal pi mal Auge ohne irgendwelche Tests).

Wenn ja, hast Du Deinen repräsentativen Datensatz. Wenn nein, musst Du für die Berechnung der Durchschnittszeit die mittleren Werte der drei Gruppen entsprechend gewichten.

Als nächstes kannst Du Dich dann mit der Auswertung der Durchlaufzeiten beschäftigen. Interessant fänd ich z. B. die Fragestellung, ob sich die Dauer der Voruntersuchung / Akte / Untersuchung / etc. zwischen den drei Gruppen unterscheidet. Und wie sich der Soll-Termin zu der Ankunftszeit verhält.

Grundsätzlich kann man auch für Warteschlangen gute Modelle aufstellen. Übrigens wird das in jeder Anzeigetafel für Busse und U-Bahnen umgesetzt, weil auch hier zahlreiche Faktoren berücksichtigt werden müssen (Dauer Ein- und Ausstieg, Warten wegen vorherfahrendem Zug/Bus, etc.) und die Zeitangaben trotzdem stimmen sollen.

Eine Anmerkung zu dem Thema hab ich noch: Ist es bei Euch in der Klinik wirklich so, dass die Schwierigkeiten bzw. lange Wartezeiten durch die Ankunftszeiten der Patienten entstehen oder ist der Knackpunkt nicht vielmehr die Unterbesetzung beim Personal gepaart mit ausufernder Bürokratie?

Viele Grüße

Barbara

_____________________________________

„Was war das für eine Stimme?“ schrie Arthur.
„Ich weiß nicht“, brüllte Ford zurück, „ich weiß es nicht. Es klang wie Wahrscheinlichkeitsrechnung.“
Douglas Adams – Per Anhalter durch die Galaxis

medi12
Teilnehmer

25. Oktober 2006 um 17:57 Uhr

Beitragsanzahl: 683

#42719

Hallo Barbara,

wie sieht das denn mit Signifikanzwert und der Power aus? Kann man sowas für eine derartige Studie verwenden und damit dann auch sinnvolle Werte erhalten, oder schießt man mit Kanonen auf Spatzen?

Kenne beides aus klinischen Studien, auch wenn ich zugegebener Maßen kein Kenner der Materie Statistik bin.

Gruss,
medi12

Und machst du einen Plan, und bist ein schlauer Wicht, so machst du einen zweiten Plan doch gehn tun beide nicht.

Barbara
Senior Moderator

25. Oktober 2006 um 18:54 Uhr

Beitragsanzahl: 2766

#42720

Hallo medi12, hallo Floh,

klar kannst Du das auch noch nachträglich berechnen. In klinischen Studien wird vorher gerechnet, wie viele Patienten Du brauchst, um eine gewisse Sicherheit / Power zu bekommen.

Bei Floh ist schon klar, wie viele Patienten in der Studie sind. Du kannst dann nachher berechnen, wie genau die Ergebnisse bei einer vorgegebenen Power und Irrtumswahrscheinlichkeit sind. (Ich denk nur, dass sich Flohs Frage darauf nicht bezog, sondern eher auf die allgemeinen Überlegungen, wann eine Studie repräsentativ ist.)

@Floh: Ggf. helfen Dir die Zeiten dabei, eine Value Stream Map (VSM) aufzusetzen, um die „Bottlenecks“ zu identifizieren.

Viele Grüße

Barbara

_____________________________________

„Was war das für eine Stimme?“ schrie Arthur.
„Ich weiß nicht“, brüllte Ford zurück, „ich weiß es nicht. Es klang wie Wahrscheinlichkeitsrechnung.“
Douglas Adams – Per Anhalter durch die Galaxis

Floh
Mitglied

26. Oktober 2006 um 7:53 Uhr

Beitragsanzahl: 124

#42722

Hallo zusammen,

na, ist ja spannend die Kommentare zu lesen.

Ich denke da wird ja was bei rumkommen.

Also:
1: Notfall entspricht nicht vitaler Gefährdung sondern vielmehr unerwartete Kundschaft (Terminus Notfall ist in diesem Falle nicht herkömmlich zutreffend, jedoch kann u.U. eine nicht sofortige Behandlung den Pat. gravierende Folgen bescheren)
2: Kann die Zahl gerne noch auf 2000 aufstocken.
3. baazis Theorie ist gut. Wenn ältere Personen Hilfe benötigen.
4: Hab jetzt geclustert, Termingerecht (inkl. 30min vorher u. 15 min zu spät) sind o staune 50,78%, o. Termin = Notfall/Konsile = 26,95%, und verfrüht>30min verspätet>15min =22,28%
nun nehm ich alle Termingerechten und ermittel die durchschnittliche Durchlaufzeit, danach das gleiche mit den anderen

Scheiße… ich glaub da sind echt zu viele Variablen. Oberarzt muss noch verfügbar sein, wenn nicht, zieht sich alles in die Länge. Na, vielleicht stell ich das auch ein.

@ Barbara
im Gesundheitswesen wirst Du nicht mehr ohne ausufernde Bürokratie auskommen. Solange es die elektronische Patientenakte noch nicht Flächendeckend gibt.
Personalmangel sicher, im Gesundheitswesen findet ja überall Leistungsverdichtung statt, an der sich nichts ändern lassen wird (Dank Fallpauschalen).
Value Stream Map/Bottlenecks finde ich sicher gute Erklärungen und Beispiele bei Google?

Meine These, offene Sprechzeiten/Ambulanzzeiten. somit habe ich keine Personalbindung in der Terminvergabe. Mutig oder?

Also, summa sumarum, 1000 Personen ist eine gute Zahl oder?

Liebe Grüße
Floh

Barbara
Senior Moderator

26. Oktober 2006 um 8:43 Uhr

Beitragsanzahl: 2766

#42723

Hallo Floh,

ich würd das Ganze in zwei statistische Modelle packen und schauen, was dabei rauskommt (das geht deutlich schneller als die zu Fuß-Eingruppierung):

1. Modell
Zielgröße:
Durchlaufzeit (für alle)

Einflussgrößen:
+attributiv: Termin/Notfall
+variabel: Wartezeit (ggf. weitere wie Zeit Voruntersuchung, etc.)

2. Modell
Zielgröße:
Durchlaufzeit (nur Patienten mit Termin)

Einflussgrößen:
+variabel: Abstand Termin-Ankunft, Wartezeit (ggf. weitere wie Zeit Voruntersuchung, etc.)

Das erste Modell ist ein so genanntes Kovarianzmodell (wegen attributiven und variablen Einflussgrößen). Das zweite Modell ist ein Regressionsmodell (nur variable Einflussgrößen) und entspricht damit einer Ausgleichsebene, die optimal durch die Punktwolke
x: Abstand Termin-Ankunft
y: Wartezeit
z: Durchlaufzeit
gelegt wird.

Und dann siehst Du an den Ergebnissen der Modell-Analyse, ob es einen wichtigen Einfluss durch die Art des Patienten gibt (Termin/Notfall) und wie stark der Abstand Termin-Ankunft auf die Gesamt-Durchlaufzeit wirkt.

Und da für Modelle mehr Daten mehr Information bedeuten würd ich alles an Daten nehmen, was ich kriegen kann (wenn es sowieso leicht verfügbar ist).

Zur VSM findest Du hier einige Infos:
http://www.qualitydigest.com/mar06/articles/04_article.shtml
cee.uiuc.edu/railroad/CEE/pdf/DIRNBERGERJ%20-WCRR%202006.pdf

Sehr anschaulich und auch ansonsten ein wunderbares, witziges und interessantes Buch zur Theory of Constraints (TOC, Ursprung für die VSM) ist:
Goldratt & Cox [2002]: „Das Ziel. Ein Roman über Prozessoptimierung“, Campus Verlag, ISBN 3593367017, 25,50 Euro

Viele Grüße

Barbara

_____________________________________

„Was war das für eine Stimme?“ schrie Arthur.
„Ich weiß nicht“, brüllte Ford zurück, „ich weiß es nicht. Es klang wie Wahrscheinlichkeitsrechnung.“
Douglas Adams – Per Anhalter durch die Galaxis
Autor

Beiträge