Præsentation er lastning. Vent venligst

Præsentation er lastning. Vent venligst

Basic Data Analysis: Descriptive Statistics. Disposition for afrapportering •Om undersøgelsens tilblivelse •Undersøgelsens hovedresultater •Materialets.

Lignende præsentationer


Præsentationer af emnet: "Basic Data Analysis: Descriptive Statistics. Disposition for afrapportering •Om undersøgelsens tilblivelse •Undersøgelsens hovedresultater •Materialets."— Præsentationens transcript:

1 Basic Data Analysis: Descriptive Statistics

2 Disposition for afrapportering •Om undersøgelsens tilblivelse •Undersøgelsens hovedresultater •Materialets sammensætning •Elevernes faglige profiler –Mhp. en bestemt videreuddannelse? –Supplering inden studiestart? •Hvad skal der ske efter sommerferien? •Faglige interesset –Opdelt på hum, samf og tek-nat hovedområder •Kriterier for valg af studium –Faglige dimensioner –Sociale dimensioner –Praktiske forhold Ch 152

3 Disposition for afrapportering (fortsat) •Valg af studieby –Plan for valg –Opfattelsen af forskellige studiebyer –Alt-i-alt-vurdering af studiebyer •Om matematik-økonomi-uddannelsen –Hørt om denne –Kendskab til, hvor man kan få uddannelsen –Overvejet at påbegynde mat-øk? –Specielt om studiet ved AAU •Kendskab •Kílde til kendskab •Påbegyndelse af studium? •Sandsynligheden for at begynde efter sommerferien. Ch 153

4 4 Types of Statistical Analyses Used in Marketing Research •Data summarization: the process of describing a data matrix by computing a small number of measures that characterize the data set •Four functions of data summarization: –Summarizes the data –Applies understandable conceptualizations –Communicates underlying patterns –Generalizes sample findings to the population

5 Ch 155 Types of Statistical Analyses Used in Marketing Research

6 Ch 156 Types of Statistical Analyses Used in Marketing Research Five Types of Statistical Analysis: 1.Descriptive analysis: used to describe the data set 2.Inferential analysis: used to generate conclusions about the population’s characteristics based on the sample data 3.Differences analysis: used to compare the mean of the responses of one group to that of another group 4.Associative analysis: determines the strength and direction of relationships between two or more variables 5.Predictive analysis: allows one to make forecasts for future events

7 Materialets sammensætning • kriterier som køn og alder • undersøgelsesspørgsmål Test af sammenhænge mellem • undersøgelsesspørgsmål og kriterier • undersøgelsesspørgsmål indbyrdes Vurdering af repræsentativitet fx ved test mod en kendt populationsfordeling på køn og alder Hvilken betydning har opfattelsen af studiebyer for valget heraf? Types of Statistical Analyses Used in Marketing Research Hvis vi ændrer en bys image på en række dimensioner, hvor meget stiger vurderingen af byen så med? Hvis vi ændrer en bys image på én dimension, hvor meget stiger – alt andet lige - vurderingen af byen så med?

8 Ch 158 Understanding Data Via Descriptive Analysis •Two sets of descriptive measures: –Measures of central tendency: used to report a single piece of information that describes the most typical response to a question –Measures of variability: used to reveal the typical difference between the values in a set of values

9 Ch 159 Understanding Data Via Descriptive Analysis •Measures of Central Tendency: –Mode: the value in a string of numbers that occurs most often –Median: the value whose occurrence lies in the middle of a set of ordered values –Mean: sometimes referred to as the “arithmetic mean”; the average value characterizing a set of numbers

10 Ch 1510 Understanding Data Via Descriptive Analysis •Measures of Variability: –Frequency distribution reveals the number (percent) of occurrences of each number or set of numbers –Range identifies the maximum and minimum values in a set of numbers –Standard deviation indicates the degree of variation in a way that can be translated into a bell-shaped curve distribution

11 Ch 1511 Understanding Data Via Descriptive Analysis •Measures of Variability:

12 Ch 1512 When to Use a Particular Statistic

13 Hvornår bruges hvad? Eksempler fra casen SpørgsmålMåleniveauCentral tendensVariabilitet Opfattelsen af forskellige studiebyer Køn NominalskaleretModalværdienFrekvensfordeling Har du i valg af fag og niveau haft en bestemt videreuddannelse i tankerne? Hvor vigtige er følgende forhold for dit studievalg? OrdinalskaleretMedianenKumuleret fordeling Hvor vigtige er følgende forhold for dit studievalg? Hvordan vurderer du alt-i- alt København, Odense, Aalborg og Århus samt "Din by" som studiebyer? Intervalskaleret (antager vi) MiddeltalVarians/spredning Variationsbredden (range) Hvor sandsynligt er det, at du påbegynder matematik- økonomistudiet efter sommerferien 2009? Alder RatioskaleretMiddeltalVarians/spredning Variationsbredden (range) Ch 1513

14 Datamatricen i Studievalgsundersøgelsen Ch 1514

15 Hvornår bruges hvad? Eksempler fra casen SpørgsmålMåleniveauCentral tendensVariabilitet Opfattelsen af forskellige studiebyer Køn NominalskaleretModalværdienFrekvensfordeling Ch 1515

16 Hvornår bruges hvad? Eksempler fra casen SpørgsmålMåleniveauCentral tendensVariabilitet Opfattelsen af forskellige studiebyer Køn NominalskaleretModalværdienFrekvensfordeling Ch 1516

17 Hvornår bruges hvad? Eksempler fra casen SpørgsmålMåleniveauCentral tendensVariabilitet Har du i valg af fag og niveau haft en bestemt videreuddannelse i tankerne? Hvor vigtige er følgende forhold for dit studievalg? OrdinalskaleretMedianenKumuleret fordeling Ch 1517

18 Hvornår bruges hvad? Eksempler fra casen SpørgsmålMåleniveauCentral tendensVariabilitet Hvor vigtige er følgende forhold for dit studievalg? Hvordan vurderer du alt-i- alt København, Odense, Aalborg og Århus samt "Din by" som studiebyer? Intervalskaleret (antager vi) MiddeltalVarians/spredning Variationsbredden (range) Ch 1518

19 Hvornår bruges hvad? Eksempler fra casen SpørgsmålMåleniveauCentral tendensVariabilitet Hvor sandsynligt er det, at du påbegynder matematik- økonomistudiet efter sommerferien 2009? Alder RatioskaleretMiddeltalVarians/spredning Variationsbredden (range) Ch 1519

20 Generalizing a Sample’s Findings to Its Population and Testing Hypotheses About Percents and Means

21 Statistics Versus Parameters •Statistics: values that are computed from information provided by a sample •Parameters: values that are computed from a complete census which are considered to be precise and valid measures of the population •Parameters represent “what we wish to know” about a population. Statistics are used to estimate population parameters. Ch 1621

22 Ch 1622

23 The Concepts of Inference and Statistical Inference •Inference: drawing a conclusion based on some evidence •Statistical inference: a set of procedures in which the sample size and sample statistics are used to make estimates of population parameters Ch 1623

24 Ch 1624

25 Parameter Estimation •Parameter estimation: the process of using sample information to compute an interval that describes the range of values of a parameter such as the population mean or population percentage is likely to take on Ch 1625

26 Parameter Estimation •Parameter estimation involves three values: 1.Sample statistic (mean or percentage generated from sample data) 2.Standard error (variance divided by sample size; formula for standard error of the mean and another formula for standard error of the percentage) 3.Confidence interval (gives us a range within which a sample statistic will fall if we were to repeat the study many times over Ch 1626

27 Parameter Estimation •Standard error: while there are two formulas, one for a percentage and the other for a mean, both formulas have a measure of variability divided by sample size. Given the sample size, the more variability, the greater the standard error. Ch 1627

28 Standard Error of the Mean Ch 1628

29 Standard Error of the Percentage Ch 1629

30 Parameter Estimation •Confidence intervals: the degree of accuracy desired by the researcher and stipulated as a level of confidence in the form of a percentage •Most commonly used level of confidence: 95%; corresponding to 1.96 standard errors Ch 1630

31 Parameter Estimation •What does this mean? It means that we can say that if we did our study over 100 times, we can determine a range within which the sample statistic will fall 95 times out of 100 (95% level of confidence). This gives us confidence that the real population value falls within this range. Ch 1631

32 Hypothesis Testing •Hypothesis: an expectation of what the population parameter value is •Hypothesis testing: a statistical procedure used to “accept” or “reject” the hypothesis based on sample information •Intuitive hypothesis testing: when someone uses something he or she has observed to see if it agrees with or refutes his or her belief about that topic Ch 1632

33 Hypothesis Testing •Statistical hypothesis testing: –Begin with a statement about what you believe exists in the population –Draw a random sample and determine the sample statistic –Compare the statistic to the hypothesized parameter Ch 1633

34 Hypothesis Testing •Statistical hypothesis testing: –Decide whether the sample supports the original hypothesis –If the sample does not support the hypothesis, revise the hypothesis to be consistent with the sample’s statistic Ch 1634

35 What is a Statistical Hypothesis? •A hypothesis is what someone expects (or hypothesizes) the population percent or the average to be. •If your hypothesis is correct, it will fall in the confidence interval (known as supported). •If your hypothesis is incorrect, it will fall outside the confidence interval (known as not supported) Ch 1635

36 How to Test Statistical Hypothesis Ch % 95%

37 Test af sammenhænge mellem • undersøgelsesspørgsmål og kriterier • undersøgelsesspørgsmål indbyrdes Types of Statistical Analyses Used in Marketing Research

38 •Sammenligninger ved hjælp af tabelanalyse Sammenligning af to populationer i Studievalgsundersøgelsen Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem drenges og pigers planer for fremtiden efter sommerferien s_5_1 s_16 KrydstabelPct.-vis fordeling af drenge og pigers svar på sp.

39 Ch 1639 Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem drenges og pigers planer for fremtiden efter sommerferien s_5_1 s_16 KrydstabelPct.-vis fordeling af drenge og pigers svar på sp.

40 Sammenligning af to populationer i Studievalgsundersøgelsen Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem drenges og pigers planer om at læse videre på universitet el. ln. s_5_1, svar 1 s_16 Gennemsnit af dummyvariabel Konfidensinterval for hyppigheden, som kan afgøre signifikans

41 Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem drenges og pigers planer om at læse videre på universitet el. ln. s_5_1, svar 1 s_16 Sammenligning af gennemsnit af dummyvariabel Konfidensinterval for hyppigheden, som kan afgøre signifikans

42 Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem drenges og pigers planer om at læse videre på universitet el. ln. s_5_1, svar 1 s_16 Sammenligning af gennemsnit af dummyvariabel Konfidensinterval for hyppigheden, som kan afgøre signifikans

43 Sammenligning af to populationer i Studievalgsundersøgelsen Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem drenges og pigers gennemsnitlige vurdering af København og Aalborg som studiebyer s_22_1 s_22_4 s_16 Gennemsnit af intervalskaleret variabel Independent samples T-test Konfidensinterval for gennemsnit, som kan afgøre signifikans

44 Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem drenges og pigers gennemsnitlige vurdering af København og Aalborg som studiebyer s_22_1 s_22_4 s_16 Gennemsnit af intervalskaleret variabel Independent samples T-test Konfidensinterval for gennemsnit, som kan afgøre signifikans

45 Sammenligning af gennemsnittet for to spørgsmål i Studievalgsundersøgelsen Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem den gennemsnitlige vurdering af København og Aalborg som studiebyer s_22_1 s_22_4 Gennemsnit af intervalskaleret variabel Dependent samples T-test Konfidensinterval for gennemsnit, som kan afgøre signifikans

46 Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem den gennemsnitlige vurdering af København og Aalborg som studiebyer s_22_1 s_22_4 Gennemsnit af intervalskaleret variabel Dependent samples T-test Konfidensinterval for gennemsnit, som kan afgøre signifikans

47 Ch 1647 Sammenligning af gennemsnittet for flere end to populationer i Studievalgsundersøgelsen Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem forskellige skolers elever i deres planer for at læse videre på universitet el. ln. s_1 (evt. grupperet) s_5_1 Gennemsnit af dummykodet variabel Variansanalyse (ANOVA) Estimerede andele Test for signifikans af forskelle

48 Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem forskellige skolers elever i deres planer for at læse videre på universitet el. ln. s_1 (evt. grupperet) s_5_1 Gennemsnit af dummykodet variabel Variansanalyse (ANOVA) Estimerede andele Test for signifikans af forskelle

49 Ch 1649 Undersøgelses- spørgsmål Relevante variablerAnalyseteknikForventet output Er der forskel mellem forskellige skolers elever i deres planer for at læse videre på universitet el. ln. s_1 (evt. grupperet) s_5_1 Gennemsnit af dummykodet variabel Variansanalyse (ANOVA) Estimerede andele Test for signifikans af forskelle


Download ppt "Basic Data Analysis: Descriptive Statistics. Disposition for afrapportering •Om undersøgelsens tilblivelse •Undersøgelsens hovedresultater •Materialets."

Lignende præsentationer


Annoncer fra Google