Inhaltsverzeichnis:
Video: Predictive Analysis – Programmieren in R am Beispiel von Vorhersageanalysen (Level 3) 2024
R ist eine Programmiersprache, die ursprünglich für Statistiker geschrieben wurde, um statistische Analysen einschließlich prädiktiver Analysen durchzuführen. Es handelt sich um eine Open-Source-Software, die in der akademischen Welt verbreitet wird, um solche Disziplinen wie Statistik, Bioinformatik und Wirtschaftswissenschaften zu unterrichten. Seit seinen bescheidenen Anfängen wurde es inzwischen auf Datenmodellierung, Data Mining und prädiktive Analyse erweitert.
R hat eine sehr aktive Gemeinschaft; Freie Codebeiträge werden ständig und konsistent gemacht. Einer der Vorteile der Verwendung eines Open-Source-Tools wie R ist, dass der Großteil der Datenanalyse, die Sie durchführen möchten, bereits von jemandem durchgeführt wurde. Codebeispiele werden in vielen Message Boards und Universitäten veröffentlicht.
Wenn Sie mit einem problematischen Code zu kämpfen haben, posten Sie einfach eine Frage auf einem Message Board (wie Stack-Exchange oder Stack-Overflow) und Sie haben in kürzester Zeit eine Antwort.
Da R kostenlos zu verwenden ist, ist es das perfekte Werkzeug, um einen schnellen Prototyp zu erstellen, der dem Management die Vorteile von Vorhersageanalysen zeigt. Sie müssen das Management nicht bitten, etwas zu kaufen, um gleich loszulegen. Jeder Ihrer Data Scientists, Business Analysten, Statistiker oder Software-Ingenieure kann den Prototyp ohne weitere Investitionen in Software erstellen.
Daher kann R eine kostengünstige Möglichkeit sein, mit Vorhersageanalysen zu experimentieren, ohne Unternehmenssoftware erwerben zu müssen. Nachdem Sie bewiesen haben, dass prädiktive Analysen Mehrwert hinzufügen (oder hinzufügen können), sollten Sie das Management davon überzeugen können, ein kommerzielles Tool für Ihr frischgeprägtes Data-Science-Team zu erwerben.
Installation von R
Die Installation von R ist ein einfacher Vorgang, der weniger als 30 Minuten dauert. Die meisten Standardeinstellungen können während des Installationsvorgangs akzeptiert werden. Sie können R installieren, indem Sie das Installationsprogramm für Windows und andere Betriebssysteme von der R-Website herunterladen.
Nachdem Sie die R-Website aufgerufen haben, können Sie nach dem Download-Link suchen, um die Datei zu erhalten. Nachdem Sie die Datei heruntergeladen haben, doppelklicken Sie darauf, um den Installationsvorgang zu starten.
So installieren Sie RStudio
Nachdem Sie den R-Installationsprozess abgeschlossen haben, können Sie RStudio installieren. Die Installation der RStudio IDE ist genauso einfach wie die Installation von R. Sie können RStudio Desktop von ihrer Website herunterladen. Sie sollten die für Ihr Betriebssystem geeignete Desktop-Version installieren (z. B. RStudio Version 0. 97. 551 für Windows). Nachdem Sie die Datei heruntergeladen haben, doppelklicken Sie darauf, um den Installationsvorgang zu starten.
Hier ist ein direkter Link für Ihre Bequemlichkeit.
Grundlagen der R-Umgebung
RStudio ist eine grafische Benutzeroberfläche zur Entwicklung von R-Programmen. Die Standardschnittstelle (wie sie beim ersten Start des Programms aussieht) hat vier Fensterbereiche. Sie werden alle vier häufig verwenden.
-
Das obere linke Fenster ist Ihr Skriptfenster.
Hier können Sie R-Code kopieren und einfügen. Sie können den Code Zeile für Zeile oder in Abschnitten ausführen, indem Sie die Zeilen hervorheben, die Sie ausführen möchten. Im Skriptfenster können Sie auch die Werte von Datenrahmen anzeigen. Wenn Sie im Arbeitsbereich auf einen Datenrahmen klicken, wird eine neue Registerkarte im Skriptbereich mit den Datenrahmenwerten geöffnet.
-
Das untere linke Fenster ist Ihr Konsolenfenster.
Hier geben Sie Ihren R-Code zeilenweise ein. Die Ausgabe (falls vorhanden) wird in der nächsten Zeile unmittelbar nach Abschluss der Ausführung des Befehls gedruckt.
-
Das obere rechte Fenster ist Ihr Arbeitsbereich und Ihr Verlaufsfenster.
Es hat zwei Registerkarten:
-
Auf der Registerkarte Verlauf wird der Verlauf des gesamten Codes gespeichert, den Sie in der aktuellen Sitzung ausgeführt haben.
-
Die Registerkarte Workspace listet alle Variablen im Speicher auf. Hier können Sie auf die Variablen klicken, um deren Werte anzuzeigen und (falls Sie dies wünschen) Datensätze interaktiv laden.
-
-
Im Fenster unten rechts finden Sie vier Registerkarten von Interesse:
-
Eine Registerkarte Hilfe bietet eine Dokumentation wie Beschreibungen von Funktionen.
-
Auf der Registerkarte Pakete werden alle installierten und verfügbaren Pakete angezeigt, die von Ihrem Programm geladen werden können. Die geprüften Pakete sind diejenigen, die für Ihr Programm geladen wurden. Hier können Sie neue Pakete suchen und installieren.
-
Auf der Registerkarte "Diagramme" wird die Ausgabe beliebiger Diagramme angezeigt.
-
Die Registerkarte "Dateien" ist Ihr Datei-Explorer in RStudio.
-