import pandas as pd
df = pd.read_csv('../datasets/bikes.csv')
df.head(3)
Odrediti u kojim redovima putovanje traje duže od 1000 sekundi. Da bismo napravili poređenje, biramo kolonu tripduration kao niz i upoređujemo je sa celim brojem 1000.
uslov = df['tripduration'] > 1000
uslov.head(3)
Kada napišemo df['tripduration'] > 1000, pandas upoređuje svaku vrednost u koloni tripduration sa 1000. Vraća novu seriju iste dužine kao tripduartion sa logičkim vrednostima koje odgovaraju ishodu poređenja.
len(uslov)
len(df)
df[uslov].head(3)
Koliko imamo redova čije je trajanje putovanja veće od 1000? Da bismo odgovorili na ovo pitanje, dodelimo rezultat logičke selekcije promenljivoj, a zatim uporedimo broj redova između nje i originalnog DataFrame-a.
bikes_duration_1000 = df[uslov]
bikes_duration_1000
len(df)
len(bikes_duration_1000)
Izračunali smo da je 20% vožnji duže od 1000 sekundi.
len(bikes_duration_1000) / len(df)
df[df['tripduration'] > 1000].head(3)
Primer: pronaći sve vožnje koje su se desile kada je vreme bilo oblačno. Koristimo == operator da testiramo jednakost i ponovo prosleđujemo ovu promenljivu u zagrade čime se završava naš izbor.
uslov = df['events'] == 'cloudy'
df[uslov].head(3)
df[df['events'] == 'cloudy'].head(3)
Za sledeće vežbe koristite skup podataka movie.csv sa skupom naslova kao indeksom (title).
Izaberite sve filmove u kojima je Johnny Depp glumac1. U koliko od ovih filmova je glumio?
Izaberite filmove sa IMDB score ocenom većom od 9.
Napišite funkciju koja prihvata jedan parametar da biste pronašli broj filmova za datu ocenu sadržaja. Koristite ovu funkciju da biste pronašli broj filmova ocenjene sa „R“, „PG-13“ i „PG“.
Pronaći sve vožnje duže od 1000 sekundi kada je bilo oblačno.
Ovaj upit ima dva uslova - trajanje putovanja veće od 1000 i oblačno vreme.
import pandas as pd
df = pd.read_csv('../datasets/bikes.csv')
df.head(3)
uslov1 = df['tripduration'] > 1000
uslov2 = df['events'] == 'cloudy'
uslov = uslov1 & uslov2
df[uslov].head(3)
df[(df['tripduration'] > 1000) & (df['events'] == 'cloudy')].head(3)
U skupu podataka movie.csv izaberite sve filmove iz 1970-ih.
Izaberite sve filmove iz 1970-ih koji su imali IMDB ocene veće od 8.
Izaberite filmove koji su ocenjeni sa R, PG-13 ili PG.