Zuhause Persönliche Finanzen Grundlagen der R-Programmierung für Predictive Analytics - Dummies

Grundlagen der R-Programmierung für Predictive Analytics - Dummies

Inhaltsverzeichnis:

Video: Predictive Analysis – Programmieren in R am Beispiel von Vorhersageanalysen (Level 3) 2024

Video: Predictive Analysis – Programmieren in R am Beispiel von Vorhersageanalysen (Level 3) 2024
Anonim

R ist eine Programmiersprache, die ursprünglich für Statistiker geschrieben wurde, um statistische Analysen einschließlich prädiktiver Analysen durchzuführen. Es handelt sich um eine Open-Source-Software, die in der akademischen Welt verbreitet wird, um solche Disziplinen wie Statistik, Bioinformatik und Wirtschaftswissenschaften zu unterrichten. Seit seinen bescheidenen Anfängen wurde es inzwischen auf Datenmodellierung, Data Mining und prädiktive Analyse erweitert.

R hat eine sehr aktive Gemeinschaft; Freie Codebeiträge werden ständig und konsistent gemacht. Einer der Vorteile der Verwendung eines Open-Source-Tools wie R ist, dass der Großteil der Datenanalyse, die Sie durchführen möchten, bereits von jemandem durchgeführt wurde. Codebeispiele werden in vielen Message Boards und Universitäten veröffentlicht.

Wenn Sie mit einem problematischen Code zu kämpfen haben, posten Sie einfach eine Frage auf einem Message Board (wie Stack-Exchange oder Stack-Overflow) und Sie haben in kürzester Zeit eine Antwort.

Da R kostenlos zu verwenden ist, ist es das perfekte Werkzeug, um einen schnellen Prototyp zu erstellen, der dem Management die Vorteile von Vorhersageanalysen zeigt. Sie müssen das Management nicht bitten, etwas zu kaufen, um gleich loszulegen. Jeder Ihrer Data Scientists, Business Analysten, Statistiker oder Software-Ingenieure kann den Prototyp ohne weitere Investitionen in Software erstellen.

Daher kann R eine kostengünstige Möglichkeit sein, mit Vorhersageanalysen zu experimentieren, ohne Unternehmenssoftware erwerben zu müssen. Nachdem Sie bewiesen haben, dass prädiktive Analysen Mehrwert hinzufügen (oder hinzufügen können), sollten Sie das Management davon überzeugen können, ein kommerzielles Tool für Ihr frischgeprägtes Data-Science-Team zu erwerben.

Installation von R

Die Installation von R ist ein einfacher Vorgang, der weniger als 30 Minuten dauert. Die meisten Standardeinstellungen können während des Installationsvorgangs akzeptiert werden. Sie können R installieren, indem Sie das Installationsprogramm für Windows und andere Betriebssysteme von der R-Website herunterladen.

Nachdem Sie die R-Website aufgerufen haben, können Sie nach dem Download-Link suchen, um die Datei zu erhalten. Nachdem Sie die Datei heruntergeladen haben, doppelklicken Sie darauf, um den Installationsvorgang zu starten.

So installieren Sie RStudio

Nachdem Sie den R-Installationsprozess abgeschlossen haben, können Sie RStudio installieren. Die Installation der RStudio IDE ist genauso einfach wie die Installation von R. Sie können RStudio Desktop von ihrer Website herunterladen. Sie sollten die für Ihr Betriebssystem geeignete Desktop-Version installieren (z. B. RStudio Version 0. 97. 551 für Windows). Nachdem Sie die Datei heruntergeladen haben, doppelklicken Sie darauf, um den Installationsvorgang zu starten.

Hier ist ein direkter Link für Ihre Bequemlichkeit.

Grundlagen der R-Umgebung

RStudio ist eine grafische Benutzeroberfläche zur Entwicklung von R-Programmen. Die Standardschnittstelle (wie sie beim ersten Start des Programms aussieht) hat vier Fensterbereiche. Sie werden alle vier häufig verwenden.

  • Das obere linke Fenster ist Ihr Skriptfenster.

    Hier können Sie R-Code kopieren und einfügen. Sie können den Code Zeile für Zeile oder in Abschnitten ausführen, indem Sie die Zeilen hervorheben, die Sie ausführen möchten. Im Skriptfenster können Sie auch die Werte von Datenrahmen anzeigen. Wenn Sie im Arbeitsbereich auf einen Datenrahmen klicken, wird eine neue Registerkarte im Skriptbereich mit den Datenrahmenwerten geöffnet.

  • Das untere linke Fenster ist Ihr Konsolenfenster.

    Hier geben Sie Ihren R-Code zeilenweise ein. Die Ausgabe (falls vorhanden) wird in der nächsten Zeile unmittelbar nach Abschluss der Ausführung des Befehls gedruckt.

  • Das obere rechte Fenster ist Ihr Arbeitsbereich und Ihr Verlaufsfenster.

    Es hat zwei Registerkarten:

    • Auf der Registerkarte Verlauf wird der Verlauf des gesamten Codes gespeichert, den Sie in der aktuellen Sitzung ausgeführt haben.

    • Die Registerkarte Workspace listet alle Variablen im Speicher auf. Hier können Sie auf die Variablen klicken, um deren Werte anzuzeigen und (falls Sie dies wünschen) Datensätze interaktiv laden.

  • Im Fenster unten rechts finden Sie vier Registerkarten von Interesse:

    • Eine Registerkarte Hilfe bietet eine Dokumentation wie Beschreibungen von Funktionen.

    • Auf der Registerkarte Pakete werden alle installierten und verfügbaren Pakete angezeigt, die von Ihrem Programm geladen werden können. Die geprüften Pakete sind diejenigen, die für Ihr Programm geladen wurden. Hier können Sie neue Pakete suchen und installieren.

    • Auf der Registerkarte "Diagramme" wird die Ausgabe beliebiger Diagramme angezeigt.

    • Die Registerkarte "Dateien" ist Ihr Datei-Explorer in RStudio.

Grundlagen der R-Programmierung für Predictive Analytics - Dummies

Die Wahl des Herausgebers

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Netzwerkgrundlagen: IPv6-Adresse Vereinfachte Notation - Dummies

Bei der Arbeit mit IPv6-Adressen kann es viel Zeit in Anspruch nehmen. schreibe deine Adressen - immerhin sind sie 128 Bit lang. Um das Leben einfacher zu machen, gibt es einige Regeln, die Sie verwenden können, um diese Schreibweise zu verdichten: Führende Nullen in der Adresse sind optional. Für einen Adressblock wäre also 0A45 gleich A45, ...

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkgrundlagen: IP-Netzwerkklassen - Dummies

Netzwerkadressierungsarchitektur unterteilt den Adressraum für Internet Protocol Version 4 (IPv4 ) in fünf Adressklassen. Jede Klasse, die in den ersten vier Bits der Adresse codiert ist, definiert entweder eine andere Netzwerkgröße, d.h. e. Anzahl der Hosts für Unicast-Adressen (Klassen A, B, C) oder Multicast-Netzwerk (Klasse D). Die fünfte Klasse (E) address ...

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

Netzwerkgrundlagen: Netzwerkport Übersicht - Dummys

In TCP / IP- und UDP-Netzwerken ist ein Port ein Endpunkt eine logische Verbindung. Die Portnummer gibt an, um welchen Port es sich handelt. Port 80 wird beispielsweise für HTTP-Datenverkehr verwendet. Wenn Sie einen Befehl wie netstat -n unter Microsoft Windows oder Linux verwenden, sehen Sie eine Auflistung der lokalen Adressen ...

Die Wahl des Herausgebers

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Excel-Dashboards: Wie Sie Ihr erstes Makro aufzeichnen - Dummies

Wenn Sie ein Anfänger auf dem Dashboard sind Automatisierung in Excel ist es unwahrscheinlich, dass Sie den VBA-Code (Visual Basic für Applikationen) von Hand schreiben können, um Makros zu erstellen. Ohne vollständige Kenntnis des Objektmodells und der Syntax von Excel wäre das Schreiben des benötigten Codes für die meisten Anfänger unmöglich. Hier können Sie ein Makro aufzeichnen ...

Excel-Formelberechnungsmodi - Dummys

Excel-Formelberechnungsmodi - Dummys

Standardmäßig ist Excel so eingestellt, dass es automatisch neu berechnet wird. Wenn Sie eine der Zellen ändern, auf die in einer bestimmten Formel verwiesen wird, berechnet Excel diese Formel automatisch neu, sodass ein korrektes Ergebnis basierend auf den Änderungen in den Zellbezügen zurückgegeben wird. Wenn die Formel, die neu berechnet wird, auch als Zellenreferenz in anderen verwendet wird ...

Excel Formelfehler - Dummies

Excel Formelfehler - Dummies

Es ist nicht immer glatt, wenn Sie mit Excel-Formeln arbeiten. Manchmal gibt eine Formel einen Fehlerwert anstelle des erwarteten Werts zurück. Excel hilft Ihnen, das Problem zu identifizieren, indem Sie einen von sieben Fehlerwerten zurückgeben: # DIV / 0! , # N / A, #NAME? , #NULL! , #NUM! , #REF! und #WERT! , erklärt in der folgenden Liste: # DIV / 0! : ...

Die Wahl des Herausgebers

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

Teilen, Weiterverbreiten und Kommentieren von Google+ Posts - Dummies

, Wenn Sie mit der Verwendung und Veröffentlichung beginnen Bei Google+ möchten Sie gelegentlich Links und Bilder teilen, die Beiträge anderer freigeben, ihre Beiträge kommentieren und andere in Ihren eigenen Google+ Beiträgen erwähnen. Vielleicht fragen Sie sich auch, wie Sie andere dazu bringen, Ihre eigenen Beiträge öfter zu kommentieren. Teilen von Links und Bildern in Google+ So geben Sie ein ...

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Teilen Ihrer Google+ Posts mit bestimmten Personen - Dummies

Beiträge auf Google+ sind ganz einfach und können posten Text, Links, Fotos, Videos und sogar Ihren aktuellen Standort. Der schwierigste Teil des Beitrags auf Google+ besteht darin, auszuwählen, wen Sie Ihren Beitrag sehen möchten. Google+ verwendet Ihre Kreise, um festzulegen, wer Ihre Beiträge sehen kann. Kreise sind etwas einfacher als Listen, weil ...

Taggen von Personen in Google+ Fotos - Dummies

Taggen von Personen in Google+ Fotos - Dummies

Sie können Personen in Ihren Kreisen auf jedem Foto auf Google+ markieren. Wenn Sie eine Person in einem Foto taggen, wird diese Person über ihre Google+ Benachrichtigungen benachrichtigt. Sie können dann das Tag entfernen oder genehmigen, und das Foto wird mit dem Tag des Namens dieser Person darin angezeigt. Um jemanden zu markieren, ...