Definitie en definitie van gegevensafronding |
Inhoudsopgave:
Wat het is:
Afvlakking van gegevens is een statistische techniek waarbij uitbijters uit een gegevensverzameling worden verwijderd om een patroon meer zichtbaar.
Hoe het werkt (Voorbeeld):
Laten we bijvoorbeeld stellen dat een universiteit de gegevens van misdaad in de afgelopen 10 jaar analyseert. Het aantal geweldsmisdrijven ziet er ongeveer zo uit:
Zoals u ziet, ondervindt de universiteit meestal minder dan 15 misdrijven per jaar. In 2006 en 2007 deed het er echter 44 mee vanwege een experimentele rapportagevereiste van het openbare veiligheidsteam van de universiteit. Het rapportage-experiment veranderde de definitie van gewelddadige misdaad in alle vormen van diefstallen, waardoor het aantal 'gewelddadige' misdaden op de campus flink toenam. Als we deze jaren in het gemiddelde opnemen - dat wil zeggen, als we bepaalde gegevens gladstrijken - ondervond de universiteit gemiddeld ongeveer 19 geweldsmisdrijven per jaar. Maar als we die jaren achter ons laten, kunnen we zien dat een realistischer gemiddelde 13 geweldsmisdrijven per jaar is - een verschil van 32 procent.
Waarom het belangrijk is:
Er zijn veel manieren om gegevens soepel te laten lopen, inclusief het gebruik van bewegende beelden gemiddelden en algoritmen. Het idee is dat het afvlakken van gegevens patronen zichtbaarder maakt en zo helpt bij het voorspellen van veranderingen in aandelenprijzen, klantentrends of andere zakelijke informatie. Het gladmaken van gegevens kan echter belangrijke informatie over het hoofd zien te zien of belangrijke feiten minder zichtbaar maken; met andere woorden: "het afronden van de randen" van gegevens kan te veel nadruk leggen op bepaalde gegevens en andere gegevens negeren.