Vrednostima u tabeli možemo pristupati preko indeksa, naziva kolona i određenih uslova. Takođe možemo vršiti selekciju podataka na osnovu postavljenih uslova.
import pandas as pd
df1 = pd.read_csv('../datasets/sample_data.csv', index_col=0)
df1
loc, iloc¶Da biste izabrali jednu kolonu iz DataFrame-a, prosledite ime jedne od kolona operatoru zagrada, []. Vraćeni objekat će biti Series (niz podataka).
df1['height']
Možete da izaberete više kolona tako što ćete ih postaviti u listu unutar zagrada. Primetite da se vraća DataFrame, a Series.
df1[['age', 'height']]
df1[['height','age']] #može se menjati redosled kolona
lista = ['height', 'age','score']
df1[lista]
Izaberite kolonu Director i Rating.
Izaberite jednu kolonu kao DataFrame, a ne Series.
loc¶loc možemo da pristupamo redovima tabele, kao i pojedinačnim ćelijama tabele.
loc prvenstveno bira podatke prema oznaci redova i kolona. # Učitavanje podataka
import pandas as pd
df = pd.read_csv('../datasets/sample_data.csv', index_col=0)
df
# Selektovanje tri reda i dve kolone sa lok
rows = ['Penelope','Dean','Christina' ]
cols = ['age', 'height']
df.loc[rows, cols]
# Selektovanje dva reda i jedne kolone
rows = ['Dean','Christina' ]
cols = 'height'
df.loc[rows, cols]
# Selektovanje više redova
cols = ['age', 'height']
df.loc['Jane':'Dean', cols]
# Selektovanje više redova
cols = ['age', 'height']
df.loc[:'Dean', cols]
# Selektovanje svih redova
cols = ['age', 'height']
df.loc[:, cols]
rows = ['Penelope','Cornelia']
df.loc[rows, :]
# Izaberite jedan red kao seriju sa lok
df.loc['Dean']
df.loc['Dean', 'height']
Pročitajte skup podataka filma IMDB-Movie-Data.csv i postavite kolonu naslova (Title) kao indeks. Izaberite sve kolone za film 'The Intouchables'.
Izaberite sve kolone za filmove 'The Intouchables' i 'Steve Jobs'
Koje godine su snimljeni 'The Intouchables' i 'Steve Jobs' i koji je njihov rejting?
iloc¶Upotreba metode iloc je sličana loc, ali koristi samo celobrojnu lokaciju da bi se izvršila selekcija.
df.iloc[redovi, kolone]
# Učitavanje podataka
import pandas as pd
df = pd.read_csv('../datasets/sample_data.csv')
df
df.iloc[5]
rows = [2, 4]
cols = [0, -1]
df.iloc[rows, cols]
cols = [4, 2]
df.iloc[2:4, cols]
rows = [5, 2, 4]
df.iloc[rows, 4:]
rows = [3, 2]
df.iloc[rows]
# df.iloc[rows, :]
df.iloc[rows, :]
cols = [1, 5]
df.iloc[:, cols]
rows = [2, 3, 5]
cols = 4
df.iloc[rows, cols]
rows = [2, 3, 5]
cols = [4]
df.iloc[rows, cols]
Iz Data Frame-a dfM izaberite kolone sa celobrojnom lokacijom 7, 3 i 1
Izaberite redove sa celobrojnom lokacijom od 100 do 104 zajedno sa celobrojnom lokacijom kolone 5.