Wie (und Warum), um den “Ausreißer” – Funktion in Excel

0
3165

Ein Ausreißer ist ein Wert, der deutlich höher oder niedriger als die meisten der Werte in Ihren Daten. Bei der Verwendung von Excel, um Daten zu analysieren, Ausreißer können die Ergebnisse verzerren. Zum Beispiel der Mittelwert einer Datengruppe könnte wirklich reflektieren Ihre Werte. Excel bietet ein paar nützliche Funktionen, die helfen können, Ihr Ausreißer, also lassen Sie uns nehmen einen Blick.

Ein Schnelles Beispiel

Im Bild unten, die Ausreißer sind Recht einfach zu erkennen—den Wert von zwei zugewiesen Eric und den Wert von 173 zugeordnet Ryan. In einem Daten-set wie dieses, es ist leicht genug, zu erkennen und befassen sich mit diese Ausreisser manuell.

In einer größeren Anzahl von Daten, das wird nicht der Fall sein. Lage zu identifizieren, die Ausreißer und entfernen Sie Sie aus statistischen Berechnungen ist wichtig—und das ist es, was wir zu suchen an, wie Sie in diesem Artikel.

So Finden Sie Ausreißer in Ihren Daten

Finden Sie den Ausreißer in einer Datenmenge, verwenden wir die folgenden Schritte:

  1. Berechnen Sie die 1. und 3. Quartile (wir sprechen über das, was diejenigen, die sind nur ein bisschen).
  2. Bewertung der interquartilbereich (wir werden auch erklären, diese ein wenig weiter unten).
  3. Rückkehr die oberen und unteren Grenzen unserer Daten-Bereich.
  4. Verwenden Sie diese Grenzen zu identifizieren, die außenliegende Datenpunkte.

Der Zellbereich auf der rechten Seite der Daten im Bild unten zu sehen, wird verwendet, um zu speichern diese Werte.

Lassen Sie uns begonnen erhalten.

Schritt Eins: Berechnung der Quartile

Wenn Sie teilen Ihre Daten in Viertel, jedes dieser sets heißt ein Viertel. Die niedrigsten 25% der zahlen im Bereich make-up das 1. Quartil, die die nächsten 25% dem 2. Quartil, und so weiter. Nehmen wir zunächst diesen Schritt, weil das am meisten verbreitete definition der Ausreißer ist ein Datenpunkt, der mehr als 1,5 interquartile Bereiche (IQRs) unter dem 1. Quartil, und 1,5 interquartile ranges über dem 3. Quartil. Um festzustellen, diese Werte müssen wir zuerst herausfinden, was die Quartile sind.

Excel bietet eine QUARTIL-Funktion Quartile zu berechnen. Es erfordert zwei Informationen: das array und die quart.

=QUARTILE(array, quart)

Das array ist der Bereich der Werte, die Sie bewerten. Und die quart ist eine Nummer, die für die quartile, die Sie zurückgeben möchten (z.B., 1 für das 1. Quartil, 2 für das 2. Quartil, und so weiter).

Hinweis: In Excel 2010, Microsoft veröffentlicht das VIERTEL.INC und QUARTIL.EXC Funktionen wie Verbesserungen der QUARTIL-Funktion. QUARTIL mehr rückwärts kompatibel, beim arbeiten quer über mehrere Versionen von Excel.

Lassen Sie uns zurück zu unserem Beispiel-Tabelle.

Berechnen Sie die 1. Quartil wir können verwenden Sie die folgende Formel in Zelle F2.

=QUARTILE(C2:C14,1)

Als Sie die Formel eingeben, zeigt Excel eine Liste der Optionen für das quart-argument.

Zur Berechnung des 3. quartils, wir können geben Sie eine Formel wie die vorhergehende in Zelle F3, aber mit drei statt.

=QUARTILE(C2:C14,3)

Jetzt haben wir die quartile der Daten Punkte in den Zellen angezeigt.

Schritt Zwei: Bewertung der interquartilbereich

Der interquartilbereich (oder IQR) ist die mittleren 50% der Werte in Ihren Daten. Es wird berechnet als die Differenz zwischen 1. Quartil-Wert und der 3. Quartil-Wert.

Verwenden wir eine einfache Formel in die Zelle F4, subtrahiert das 1. Quartil aus dem 3. Quartil:

=F3-F2

Nun, wir sehen, dass unsere interquartilbereich dargestellt.

Schritt Drei: Rückkehr der Untere und Obere Schranken

Die unteren und oberen Schranken sind die kleinsten und größten Werte der Daten-Bereich, die wir nutzen wollen. Alle Werte, die kleiner oder größer als diese gebundenen Werte sind die Ausreißer.

Wir berechnen die untere Grenze Grenze in Zelle F5 durch Multiplikation der IQR-Wert von 1,5 und dann subtrahieren Sie von den Q1-Daten zeigen:

=F2-(1.5*F4)

Hinweis: Die eckigen Klammern in dieser Formel nicht notwendig, da die Multiplikation Teil berechnet, bevor der Abzug Teil, aber Sie machen die Formel einfacher zu Lesen.

Zur Berechnung der oberen Schranke in Zelle F6, wir werden multiplizieren Sie die IQR von 1.5 wieder, aber dieses mal fügen Sie es zu den Q3-Daten zeigen:

=F3+(1.5*F4)

Schritt Vier: Erkennen der Ausreißer

Nun, wir haben alle unsere zugrunde liegenden Daten, ist es Zeit, um unsere abgelegenen Daten-Punkte—diejenigen, die niedriger sind als die untere Grenze Wert oder höher als die Obere Grenze Wert.

Wir verwenden die ODER-Funktion zum ausführen dieser logischen test und zeigen die Werte, die diese Kriterien erfüllen, durch Eingabe der folgenden Formel in Zelle C2:

=ODER(B2<$F$5; B2>$F$6)

Wir werden dann kopieren Sie diesen Wert in unsere C3-C14-Zellen. Der Wert TRUE gibt an, ein Ausreißer, und wie Sie sehen können, haben wir zwei in unseren Daten.

Das ignorieren der Ausreißer bei der Berechnung der Durchschnitt

Mit der QUARTIL-Funktion lassen Sie uns die Berechnung der IQR und arbeiten mit der am weitesten verbreitete definition der Ausreißer. Allerdings, wenn die Berechnung der Mittelwert für einen Bereich von Werten ignorieren und Ausreißer, es ist ein schneller und einfacher Funktion zu verwenden. Diese Technik wird nicht identifizieren Ausreißer-wie vorher, aber es wird uns erlauben, flexibel zu sein mit dem, was wir vielleicht beachten Sie unsere Ausreißer-Teil.

Die Funktion die wir benötigen, heißt TRIMMEAN, und Sie können die syntax für es unter:

=TRIMMEAN(array, Prozent)

Das array ist der Bereich der Werte, die Sie möchten Durchschnitt. Die Prozent ist der Prozentsatz der Datenpunkte, die zum ausschließen von der Ober-und Unterseite der Datensatz (können Sie es als ein Prozentsatz oder Dezimalwert).

Wir in der Formel in Zelle D3 in unserem Beispiel um den Mittelwert zu berechnen und auszuschließen, 20% von Ausreißern.

=TRIMMEAN(B2:B14, 20%)

Dort haben Sie zwei verschiedene Funktionen für den Umgang mit Ausreißern. Ob Sie wollen, Sie zu identifizieren, die für einige reporting-Anforderungen oder schließen Sie diese von Berechnungen wie Mittelwerte, Excel verfügt über eine Funktion, um Ihre Bedürfnisse anzupassen.