Regression
Regression Regression
1 © PD Dr. C. Baumgarth (Lehrstuhl für Marketing) Carsten.Baumgarth@notes.uni-paderborn.de Marketingforschung WS 2003/2004
- Seite 2 und 3: 2 © PD Dr. C. Baumgarth (Lehrstuhl
- Seite 4 und 5: 4 © PD Dr. C. Baumgarth (Lehrstuhl
- Seite 6 und 7: Überblick Auswertungsverfahren Aus
- Seite 8 und 9: inführungsbeispiel zur multiplen R
- Seite 10 und 11: gebnisse des Regressionsmodells Erf
- Seite 12 und 13: Multiple Regressionsanalyse Vorgehe
- Seite 14 und 15: Modellspezifizierung +∑ 1. linear
- Seite 16 und 17: Multiple Regressionsanalyse - Metho
- Seite 18 und 19: nnahmen und Anwendungsmpfehlungen 1
- Seite 20 und 21: Heteroskedastizität und Autokorrel
- Seite 22 und 23: ultiple Regressionsanalyse Schätzu
- Seite 24 und 25: 24 © PD Dr. C. Baumgarth (Lehrstuh
1<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de<br />
Marketingforschung<br />
WS 2003/2004
2<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de<br />
VIII.<br />
Quantitative Marketingforschung<br />
- Überblick & <strong>Regression</strong>sanalyse -
3<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de<br />
Agenda<br />
• Überblick quant. Auswertungsverfahren,<br />
• (Multiple) <strong>Regression</strong>sanalyse<br />
Modell,<br />
Beispiel,<br />
Anwendungsempfehlungen.
4<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de<br />
berblick Auswertung<br />
Screening der Rohdaten<br />
Coding<br />
Plausibilitätstests<br />
Univariate Auswertungen, Häufigkeiten,<br />
Kreuztabellen<br />
Auswertung i.e.S.
Auswertungsverfahren<br />
5<br />
• Anzahl der Variablen univariat, multivariat<br />
• Art der Variablen metrisch, nicht metrisch<br />
• Zielsetzung deskriptiv, induktiv<br />
• Beziehung zwischen den Variablen <br />
Dependenz-, Interdependenzanalyse (gilt nur für<br />
bi- und multivariate Verfahren)<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
Überblick Auswertungsverfahren<br />
Auswertungsverfahren<br />
6<br />
univariat<br />
multivariat<br />
deskriptiv<br />
induktiv<br />
agearaeter<br />
Streuungsparameter<br />
nicht-parametrische<br />
Tests<br />
‣ Chi-Quadrat-<br />
Test<br />
‣ Kolmogorov-<br />
. Smirnov<br />
parametrische<br />
Tests<br />
‣ t-Test<br />
‣ ANOVA<br />
Dependenzanalysen<br />
‣ ANOVA<br />
‣ multiple<br />
. <strong>Regression</strong><br />
‣ Conjoint<br />
‣ Diskriminanz-.<br />
. analyse<br />
‣ Kausalanalyse<br />
Interdependenzanalysen<br />
‣ Faktoren-<br />
. analyse<br />
‣ Cluster- .<br />
analyse<br />
‣ MDS<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
nwendungsbereiche der multivariaten<br />
uswertungsverfahren<br />
Verfahren<br />
egressionsanalyse<br />
arianzanalyse<br />
ogistische <strong>Regression</strong><br />
iskriminanzanalyse<br />
aktorenanalyse<br />
lusteranalyse<br />
ausalanalyse<br />
DS<br />
onjoint Measurement<br />
Beispiel<br />
Abhängigkeit der Absatzmenge eines Produktes von Preis,<br />
Werbeausgaben und Einkommen.<br />
Wirkung alternativer Verpackungsgestaltungen auf die<br />
Absatzmenge eines Produktes<br />
Ermittlung des Herzinfarktrisikos von Patienten in<br />
Abhängigkeit ihres Alters und ihres Cholesterin-Spiegels.<br />
Unterscheidung der Wähler der verschiedenen Parteien<br />
hinsichtlich soziodemografischer und psychografischer<br />
Merkmale.<br />
Zusammenhang zwischen Rauchen und Lungenerkrankung.<br />
Verdichtung einer Vielzahl von Eigenschaftsbeurteilungen auf<br />
zugrunde liegende Beurteilungsdimensionen.<br />
Abhängigkeit der Käufertreue von der subjektiven<br />
Produktqualität und Servicequalität eines Anbieters.<br />
Positionierung von konkurrierenden Produktmarken im<br />
Wahrnehmungsraum der Konsumenten.<br />
Ableitung der Nutzenbeiträge alternativer Materialien, Formen<br />
7<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
inführungsbeispiel zur multiplen <strong>Regression</strong>snalyse:<br />
Erfolgsfaktorenmodell nach Zattloukal (1999)<br />
8<br />
MARKENTRANSFER-<br />
ERFOLG<br />
Unternehmen<br />
Charakteristika des<br />
Unternehmens der<br />
Muttermarke<br />
Größe<br />
0,04<br />
0,05<br />
Breite<br />
Produktpalette<br />
Positionierung<br />
Historie<br />
vorangegangener<br />
Markentransfers<br />
Anzahl<br />
Muttermarke<br />
0,05<br />
Varianz<br />
Qualitätseinschätzung<br />
0,35<br />
Qualitäteinschätzung<br />
Markenkonzeptkonsistenz<br />
Beziehung zwischen<br />
Muttermarke u.<br />
Transferprodukt<br />
Fit<br />
0,06 0,44<br />
Globale<br />
Ähnlichkeit<br />
Art der<br />
transferierten<br />
Informationen<br />
0,08<br />
Relevanz der<br />
Assoziationen<br />
für TP<br />
0,04<br />
Transferprodukt<br />
Charakteristika<br />
Produktkategorie des<br />
Transferprodukts<br />
Verbindung<br />
Nutzen mit<br />
Produkteigenschaften<br />
Involvement<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
Empirische Studie<br />
Operationalisierungen:<br />
9<br />
abhängige Variable: Erfolg (Qualitätseinschätzung*, Kaufwahrschein- .<br />
lichkeit, Zahlungsbereitschaft)<br />
* gewählte Erfolgsgröße<br />
unabhängige Variablen: Erfolgsfaktoren<br />
Marken: 44 FMCG-Marken; jeweils 2 Markentransfers<br />
Stichprobe: 917 Antworten (überwiegend Studierende)<br />
jeder beantwortete 5 Markentransfers 4585 Fälle<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
gebnisse des <strong>Regression</strong>smodells<br />
Erfolgsfaktor<br />
Qualität der Muttermarke<br />
unstandard.<br />
<strong>Regression</strong>skoeffizient<br />
+0,38<br />
standard.<br />
<strong>Regression</strong>skoeffizient<br />
+0,35<br />
Signifikanz<br />
p
agestellungen für <strong>Regression</strong>sanalysen<br />
Fragestellung abhängige Variable Unabhängige Variable<br />
1. Hängt die Höhe des<br />
Verkäuferumsatzes von der Zahl der<br />
Kundenbesuche ab?<br />
€-Umsatz pro<br />
Verkäufer pro Periode<br />
Zahl der Kundenbesuche pro<br />
Verkäufer pro Periode<br />
2. Wie wird sich der Absatz ändern,<br />
wenn die Werbung verdoppelt wird?<br />
3. Reicht es aus, die Beziehung<br />
zwischen Absatz und Werbung zu<br />
untersuchen oder haben auch Preis und<br />
Zahl der Vertreterbesuche eine<br />
Bedeutung für den Absatz?<br />
4. Wie lässt sich die Entwicklung des<br />
Absatzes in den nächsten Monaten<br />
schätzen?<br />
5. Wie erfasst man die<br />
Wirkungsverzögerung der Werbung?<br />
6. Sind das wahrgenommene Risiko,<br />
die Einstellung zu einer Marke und die<br />
Abneigung gegen kognitive<br />
Dissonanzen Faktoren, die die<br />
Markentreue von Konsumenten<br />
beeinflussen?<br />
Absatzmenge pro<br />
Periode<br />
Absatzmenge pro<br />
Periode<br />
Absatzmenge pro<br />
Monat t<br />
Absatzmenge in<br />
Periode t<br />
Anteile der<br />
Wiederholungskäufe<br />
einer Marke an allen<br />
Käufen eines<br />
bestimmten Produktes<br />
durch einen Käufer<br />
€-Ausgaben für Werbung<br />
pro Periode oder Sekunden<br />
Werbefunk oder Zahl der<br />
Inserate etc.<br />
Zahl der Vertreterbesuche,<br />
Preis pro Packung, €<br />
Ausgaben für Werbung pro<br />
Periode<br />
Menge pro Monat t-k<br />
(k=1,2,...,K)<br />
Werbung in Periode t,<br />
Werbung in Periode t-1,<br />
Werbung in Periode t-2 usw.<br />
Rating-Werte für<br />
empfundenes Risiko,<br />
Einstellung und kognitive<br />
Dissonanz<br />
11<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
Multiple <strong>Regression</strong>sanalyse<br />
Vorgehensweise:<br />
12<br />
1. Modellspezifizierung,<br />
2. Annahmeüberprüfung,<br />
3. Schätzung der <strong>Regression</strong>skoeffizienten,<br />
4. Prüfung der <strong>Regression</strong>skoeffizienten,<br />
5. Modifikation durch schrittweise <strong>Regression</strong>sanalyse.<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de<br />
13<br />
Bsp. Multiple <strong>Regression</strong>sanalyse<br />
-<br />
2.509<br />
6.124<br />
5.830<br />
3.965<br />
6.801<br />
6.196<br />
5.142<br />
6.905<br />
6.859<br />
3.115<br />
6.640<br />
5.734<br />
6.152<br />
3.734<br />
4.733<br />
7.106<br />
Mailings*<br />
240.000<br />
45<br />
3<br />
119.000<br />
17*<br />
361.974<br />
46<br />
3<br />
71.431<br />
16<br />
363.501<br />
52<br />
6<br />
81.410<br />
15<br />
289.470<br />
54<br />
6<br />
59.207<br />
14<br />
288.303<br />
50<br />
4<br />
67.817<br />
13<br />
324.837<br />
50<br />
7<br />
83.310<br />
12<br />
359.511<br />
45<br />
6<br />
107.836<br />
11<br />
372.498<br />
46<br />
5<br />
89.511<br />
10<br />
296.100<br />
49<br />
7<br />
88.834<br />
9<br />
244.575<br />
46<br />
7<br />
95.523<br />
8<br />
241.362<br />
47<br />
3<br />
68.564<br />
7<br />
367.644<br />
47<br />
7<br />
105.369<br />
6<br />
299.919<br />
51<br />
6<br />
78.319<br />
5<br />
271.884<br />
45<br />
6<br />
101.192<br />
4<br />
297.909<br />
50<br />
4<br />
70.830<br />
3<br />
370.062<br />
46<br />
5<br />
91.735<br />
2<br />
228.753<br />
49<br />
7<br />
81.996<br />
1<br />
Werbebudget<br />
Preis<br />
Anzahl ADM<br />
Absatzmenge<br />
Bezirk
Modellspezifizierung<br />
+∑ 1. linearer Fall: a b * x +<br />
Zielfunktion:<br />
y<br />
i<br />
=<br />
k i,<br />
k<br />
ei<br />
14<br />
bk<br />
y<br />
i<br />
= a*<br />
x i , k<br />
(2. nichtlinearer Fall: )<br />
Beschränkung auf linearen Fall<br />
∏<br />
Schätzfunktion:<br />
(Methode der<br />
kleinsten Quadrate)<br />
Beispiel: Absatz = b1 * Anzahl ADM + b2 * Preis + b3 * Werbebudget<br />
a: Konstante der <strong>Regression</strong>sfunktion<br />
+∑<br />
y<br />
i<br />
= a bk<br />
* xi,<br />
k<br />
b: <strong>Regression</strong>skoeffiziente: Residualgröße<br />
x: unabhängige Variable y: abhängige Variable<br />
ˆ<br />
∑<br />
( yi − yˆ<br />
i<br />
)²<br />
→<br />
Minimum<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
15<br />
Minimierung<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de<br />
Idee der <strong>Regression</strong>sanalyse<br />
y<br />
e<br />
x<br />
ŷ
Multiple <strong>Regression</strong>sanalyse<br />
- Methode der kleinsten Quadrate am Bsp. einer einfachen <strong>Regression</strong>sanalyse -<br />
120000<br />
16<br />
110000<br />
2. Schätzung<br />
100000<br />
90000<br />
80000<br />
70000<br />
60000<br />
50000<br />
1 3 5 7 9<br />
1. Schätzung<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
Multiple <strong>Regression</strong>sanalyse<br />
- Methode der kleinsten Quadrate am Bsp. einer einfachen <strong>Regression</strong>sanalyse -<br />
17<br />
xADM<br />
Y<br />
(Beobachtungswerte)<br />
1. Schätzung<br />
y ˆ = y<br />
e²<br />
2. Schätzung<br />
yˆ = 53.000+<br />
5. 400x ADM<br />
e²<br />
7<br />
5<br />
4<br />
...<br />
81.996<br />
91.735<br />
70.830<br />
...<br />
83.930<br />
83.930<br />
83.930<br />
3.740.356<br />
...<br />
91.500<br />
...<br />
90.326.016<br />
Gesamtabweichungen 3,1x10 9 2,2x10 9<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
nnahmen und Anwendungsmpfehlungen<br />
1. Art der Variablen: unabhängige und abhängige Variablen, metrisches<br />
Niveau<br />
18<br />
2. Vermeidung von Ausreißern<br />
- Identifikation durch visuelle Inspektion und i.d.R. Eliminierung<br />
3. Zusammenhang zwischen abhängigen und unabhängigen Variablen<br />
- Erfassung aller relevanten unabhängigen Variablen<br />
- Linearität des Zusammenhangs<br />
Theorieproblem<br />
4. Zusammenhang zwischen den unabhängigen Variablen<br />
- keine lineare Abhängigkeit (Multikollinearität)<br />
Korrelationsmatrix: geringe Korrelation<br />
„Tolerance“ und „Variance Inflation Factor“: nahe Eins<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
Annahmen und Anwendungsempfehlungen<br />
19<br />
5. Anzahl der Beobachtungen<br />
Daumenregel: 3 (besser 5) * Anzahl der zu schätzenden Parameter<br />
6. Annahmen über die Residualgrößen<br />
- keine Heteroskedastizität<br />
- keine Autokorrelation<br />
- Identifizierungsmöglichkeiten: visuelle Inspektion des Plot zwischen<br />
Residuen und geschätzten Y(a+b) und Verteilung der Residuen<br />
7. Nominalskalierte unabhängige Variablen Bildung von Dummy-<br />
Variablen<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
Heteroskedastizität und Autokorrelation<br />
e<br />
e<br />
0<br />
··<br />
· ·<br />
·<br />
· ·<br />
·· · · ·<br />
·<br />
·<br />
· ·<br />
·<br />
· · · ·<br />
·<br />
·<br />
·<br />
·<br />
·<br />
·<br />
· ·<br />
0<br />
·<br />
· · ·<br />
·<br />
·<br />
·<br />
·<br />
· ·<br />
· · · · ·<br />
· ·<br />
·<br />
·<br />
· · ·<br />
20<br />
a) Heteroskedastizität І<br />
Ŷ<br />
b) Heteroskedastizität ІІ<br />
e<br />
e<br />
···<br />
·<br />
··<br />
·<br />
·<br />
··<br />
···· ·<br />
·<br />
·<br />
·<br />
··<br />
···<br />
·<br />
0 0<br />
c) positive Autokorrelation Ŷ d) positive Autokorrelation<br />
Ŷ<br />
Ŷ<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
ultiple <strong>Regression</strong>sanalyse<br />
Prüfung der Annahmen im Beispiel -<br />
21<br />
1. Absatz, Anzahl der ADM, Preis, Werbebudget: metrisches Niveau<br />
2. Identifikation von Ausreißern: Eliminierung von Fall 17<br />
3. Zusammenhang zwischen abhängiger und unabhängiger Variablen<br />
- eher nicht alle relevanten Parameter berücksichtigt<br />
- Linearität: eher nicht zu erwarten<br />
4. Test auf Multikollinearität<br />
Korrelationsmatrix + VIF<br />
keine lineare Abhängigkeit feststellbar<br />
5. Anzahl der Beobachtungen:<br />
16 > 3 * 4 ausreichende Beobachtungswerte<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
ultiple <strong>Regression</strong>sanalyse<br />
Schätzung/Prüfung der <strong>Regression</strong>skoeffizienten -<br />
1.<br />
∑<br />
Allgemein<br />
( − yˆ)²<br />
→ Min!<br />
y i<br />
∑<br />
1. b<br />
ADM<br />
Beispiel<br />
≈ 6723 bPr ≈ −3833<br />
b ≈ 0,069<br />
eis<br />
Werbung<br />
22<br />
2. Bestimmheitsmaß<br />
R²<br />
=<br />
∑<br />
( yˆ<br />
( y<br />
−<br />
−<br />
J: Zahl der Regressoren; k: Zahl d. Beobachtungswerte<br />
3. Signifikanzprüfung<br />
a) Gesamtmodell:<br />
i<br />
i<br />
y)²<br />
y)²<br />
R<br />
2 J *(1 − R²)<br />
korr<br />
= R²<br />
−<br />
.<br />
k − J −1<br />
R²<br />
F emp<br />
= J<br />
1−<br />
R²<br />
k − J −1<br />
b) einzelne <strong>Regression</strong>skoeff.:<br />
bk<br />
t<br />
emp<br />
=<br />
s<br />
k<br />
2. Bestimmheitsmaß<br />
3. Signifikanzprüfung<br />
a) = 45 ,29 > F( 3,12)<br />
= 3,49 signifikant<br />
b)<br />
R² = 0,919<br />
2<br />
R<br />
korr.<br />
=<br />
0,899<br />
F emp<br />
t ADM<br />
= 7 ,995 > t = 2, 18<br />
= − 8,632 > t 2, 18<br />
tPr eis<br />
=<br />
signifikant<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
. Anordnungen<br />
ultiple <strong>Regression</strong>sanalyse<br />
Schätzung/Prüfung der <strong>Regression</strong>skoeffizienten -<br />
Allgemein<br />
Beispiel<br />
23<br />
4. Standardisierung der Parameter<br />
beta =<br />
b k<br />
σ<br />
*<br />
σ<br />
xk<br />
y<br />
notwendig bei ungleichen Größender<br />
unabhängigen<br />
. Variablen<br />
4.<br />
beta ADM<br />
= 0,665<br />
betaPr eis<br />
= −0,725<br />
beta Werbung<br />
= 0,242<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
24<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de
25<br />
© PD Dr. C. Baumgarth (Lehrstuhl für Marketing)<br />
Carsten.Baumgarth@notes.uni-paderborn.de<br />
chrittweise <strong>Regression</strong>sanalyse<br />
Anwendungsbereiche:<br />
Vergleich mehrerer theoretisch plausibler Modelle<br />
explorative Vorgehensweise