(Acest articol a fost publicat pentru prima dată pe R – Bensstatsși a contribuit cu drag la R-Bloggers). (Puteți raporta problema despre conținutul de pe această pagină aici)
Doriți să vă împărtășiți conținutul pe R-Bloggers? Faceți clic aici dacă aveți un blog sau aici dacă nu.

Am găsit recent câteva cod R în depozitul Tidytuesday care a scos date de la Kaggle direct în consola R și am crezut că ideea este incredibilă! După ce m -am uitat în jur și am văzut că nu există pachete care să facă deja acest lucru, am fost inspirat să creez pachetul {rkaggle} care să permită utilizatorilor să descarce seturi de date de la Kaggle direct în consola R.
Instalare
# Install devtools and/or remotes if you haven't already
# install.packages(c("devtools", "remotes"))
# Use devtools
devtools::install_github("benyamindsmith/RKaggle")
# Or use remotes
# remotes::install_github("benyamindsmith/RKaggle")
Utilizare de bază
În prezent, {rkaggle} funcționează doar cu obținerea de date de date (nu cu competiții). Iată câteva exemple de cod pentru descărcarea unui set de date:
>library(RKaggle)
># Download and read the "canadian-prime-ministers" dataset from Kaggle
>canadian_prime_ministers <- RKaggle::get_dataset("benjaminsmith/canadian-prime-ministers")
>canadian_prime_ministers
# A tibble: 29 × 5
No. Name `Political Party` `Term Start` `Term End`
1 1 (1 of 2) John A. Macdonald Liberal-Conservative 1 July 1867 5 November 1873
2 2 Alexander Mackenzie Liberal 7 November 1873 8 October 1878
3 1 (2 of 2) John A. Macdonald Liberal-Conservative 17 October 1878 6 June 1891
4 3 John Abbott Liberal-Conservative 16 June 1891 24 November 1891
5 4 John Thompson Liberal-Conservative 5 December 1892 12 December 1894
6 5 Mackenzie Bowell Conservative 21 December 1894 27 April 1896
7 6 Charles Tupper Conservative 1 May 1896 8 July 1896
8 7 Wilfrid Laurier Liberal 11 July 1896 10/6/1911
9 8 Robert Borden Government (Unionist) 10/10/1911 7/10/1920
10 9 (1 of 2) Arthur Meighen Conservative 7/10/1920 12/29/1921
# 19 more rows
# Use `print(n = ...)` to see more rows
Actualul de aplicare
{Rkaggle} acceptă în prezent doar descărcarea și încărcarea următoarelor formate de fișier:
.csv.tsv.xlsx.json.rds.parquet.ods
Există deja câteva probleme deschise pentru acomodarea altor formate de fișiere. Dacă doriți să vă implicați, trimiteți -vă liber să trimiteți o cerere de tragere!


Vrei să vezi mai mult din conținutul meu?
Asigurați -vă că vă abonați și nu pierdeți niciodată o actualizare!
