5 Manieren om uw grafische reeks uit te breiden

5 Manieren om uw grafische reeks uit te breiden - dummies

1 5

Boxplot (ook wel box en whiskers )

Histogrammen beschrijven distributies van continue variabelen, maar hebben beperkte waarde voor weergave details. Een boxplot is een alternatief. Het hart van de afbeelding is een kader; dit vertegenwoordigt de helft van de gegevens, genomen in het midden van zijn bereik.

Het midden van de rechthoek is de mediaanwaarde van de variabele en de onderste en bovenste uiteinden van de rechthoek vertegenwoordigen respectievelijk het 25e en 75e percentielniveaus. Whiskers strekken zich uit onder en boven de doos, wat het bereik van het grootste deel van de gegevens weergeeft. Punten buiten de snorharen zijn uitschieters, hoogst atypische waarden (sommige plots geven ook uitersten, aan, die uitbijters tussen uitbijters zijn).

2 5

Voorwaardelijke boxplot

Boxplots voor meerdere groepen (zoals geografische regio's) kunnen naast elkaar op een enkele grafiek worden geplaatst voor eenvoudige vergelijking.

3 5

Parallelle coördinaten

De grafieken tonen waarden voor verschillende variabelen allemaal samen op één plot, waarbij de waarden voor elk geval zijn verbonden door lijnsegmenten. Gemeenschappelijke combinaties onderscheiden zich van de rest. De figuur toont bijvoorbeeld verschillende variabelen met betrekking tot auto's en brandstofverbruik.

Veel cases delen bepaalde waarden, precies of bij benadering, en vormen donkere patronen van de vele lijnen die dezelfde paden volgen in de grafiek. Gevallen voor auto's met vier cilinders, lage cilinderinhoud, hoge kilometerstand en late modeljaren vormen bijvoorbeeld een zeer donker en opvallend patroon.

4 5

Winstengrafieken (ook wel cumulatieve winsten genoemd)

Een winstengrafiek laat zien hoeveel een voorspellend model de resultaten verbetert ten opzichte van willekeurige steekproeven. Sommige mensen zijn eerder geneigd om actie te ondernemen (een product kopen, op een kandidaat stemmen, de wet overtreden ...) dan anderen. Als u niets over een groep mensen weet, is het beste dat u kunt zeggen dat contact opnemen met de helft van de mensen de helft van degenen zal zijn die actie zullen ondernemen.

Maar een voorspellend model kan u vertellen welke mensen de beste prospecten zijn, dus u kunt het model gebruiken om de helft (of 10 procent of 60 procent, enzovoort) te kiezen en meer actie te ondernemen. Hoeveel meer?

In het diagram ziet u een diagonale lijn waarbij de waarden x en y altijd hetzelfde zijn; dit vertegenwoordigt wat u zou krijgen door prospects willekeurig te selecteren. De andere regel vertegenwoordigt het model. Het verschil in y -waarden tussen het model en de willekeurige selectie toont hoeveel het model uw uitkomst verbetert. Lees de modellijn geplot op de grafiek en vergelijk deze met de lijn voor willekeurige steekproeven.

5 5

Liftdiagrammen

Liftdiagrammen zijn vergelijkbaar met winstkaarten. Het belangrijkste verschil is dat de gegevens genormaliseerd zijn, zodat willekeurige bemonstering altijd wordt weergegeven als een waarde van 1 en modelresultaten worden weergegeven in verhouding tot willekeurige steekproeven.

Mogelijk ziet u verschillende soorten diagrammen met de naam liftdiagrammen. Sommige zijn cumulatief en andere niet. Sommige kunnen zelfs winstkaarten zijn

vorige Volgende