Instalați LM Studio și descărcați modele
Înainte de a începe, asigurați-vă că aveți următoarele instalate:
După ce ați descărcat și instalat LM Studio, deschideți aplicația. Du-te la Descoperi fila (bara laterală), unde puteți căuta și căuta modele. În acest exemplu, vom folosi modelul Phi-3-mini-4k-instruct, dar, desigur, puteți experimenta cu orice alt model pe care îl preferați – atâta timp cât aveți hardware-ul necesar pentru a-l rula!
Acum, selectați modelul din bara de sus pentru a-l încărca:
Pentru a verifica dacă totul funcționează bine, accesați
Chat din bara laterală și începeți un nou chat pentru a interacționa direct cu modelul Phi-3. Acum ați pus în funcțiune modelul dvs. de limbă!
Pachete R necesare
Pentru a lucra eficient cu LM Studio, vom avea nevoie de mai multe pachete R:
- tidyverse – pentru manipularea datelor
- httr – pentru interacțiunea API
- jsonlite – pentru analiza JSON
Le puteți instala/actualiza pe toate cu o singură linie de cod:
# Install necessary packages install.packages(c("tidyverse", "httr", "jsonlite"))
Să setăm scriptul R încărcând pachetele și datele cu care vom lucra:
# Load the packages library(tidyverse) library(httr) library(jsonlite) top_100_climbs_df <- read_csv("https://raw.githubusercontent.com/martinctc/blog/refs/heads/master/datasets/top_100_climbs.csv")
The top_100_climbs_df
Setul de date conține informații despre primele 100 de urcări de ciclism din Marea Britanie, pe care le-am extras de pe site-ul web Cycling Uphill, creat inițial de Simon Warren. Acestea sunt 100 de rânduri și următoarele coloane din setul de date:
climb_id
: identificatorul unic al rândului pentru urcareclimb
: numele urcușuluiheight_gain_m
: crestere in inaltime in metriaverage_gradient
: gradient mediu al urcușuluilength_km
: lungimea totală a urcușului în kilometrimax_gradient
: gradient maxim al urcușuluiurl
: URL la pagina de urcare pe Ciclism Uphill
Iată cum arată setul de date când rulăm
dplyr::glimpse()
:
glimpse(top_100_climbs_df) ## Rows: 100 ## Columns: 7 ## $ climb_id1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16… ## $ climb "Cheddar Gorge", "Weston Hill", "Crowcombe Combe", "P… ## $ height_gain_m 150, 165, 188, 372, 326, 406, 166, 125, 335, 163, 346… ## $ average_gradient 0.05, 0.09, 0.15, 0.12, 0.10, 0.04, 0.11, 0.11, 0.06,… ## $ length_km 3.5, 1.8, 1.2, 4.9, 3.2, 11.0, 1.5, 1.1, 5.4, 1.4, 9.… ## $ max_gradient 0.16, 0.18, 0.25, 0.25, 0.17, 0.12, 0.25, 0.18, 0.12,… ## $ url "https://cyclinguphill.com/cheddar-gorge/", "https://…
Scopul nostru aici este să folosim acest set de date pentru a genera descrieri text pentru fiecare urcare folosind modelul de limbă. Deoarece aceasta este pentru generarea de text, vom face puțină curățare a setului de date, transformând valorile gradientului în procente:
top_100_climbs_df_clean <- top_100_climbs_df %>% mutate( average_gradient = scales::percent(average_gradient), max_gradient = scales::percent(max_gradient) )