mean() metod¶Metod mean()vraća Series sa prosečnom vrednošću svake kolone
# Odredi prosečnu (srednju) vrednost za svaku kolonu
import pandas as pd
data = [[1, 1, 2], [6, 4, 2], [4, 2, 1], [4, 2, 3]]
df = pd.DataFrame(data)
df
print(df.mean())
dataframe.mean(axis, skipna, level, numeric_only, kwargs)
Parametri:
Opciono, osa na koju treba primeniti funkciju. Podrazumevana vrednost je 0.
skipna: bool, podrazumevano True
Isključuje NA/null vrednosti prilikom izračunavanja rezultata.
level: int ili ime nivoa
Opciono, podrazumevano None. Određuje koji nivo (u hijerarhijskom više indeksu) da proverite
numeric_only: bool
Opciono. Odredite da li želite da proverite samo numeričke vrednosti. Podrazumevano None
**kwargs
Opcioni, argumenti ključne reči. Ovi argumenti nemaju efekta, ali ih može prihvatiti funkcija NumPi
Metoda vraća: Series ili DataFrame ako je naveden nivo
import pandas as pd
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
"B":[7, 2, 54, 3, None],
"C":[20, 16, 11, 3, 8],
"D":[14, 3, None, 2, 6]})
df.mean(axis = 0)
import pandas as pd
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
"B":[7, 2, 54, 3, None],
"C":[20, 16, 11, 3, 8],
"D":[14, 3, None, 2, 6]})
df.mean(axis = 1, skipna = True)
import pandas as pd
dfFilm = pd.read_csv('../datasets/IMDB-Movie-Data.csv',index_col='Title')
dfFilm.head()
dfFilm['Rating'].mean()
median() metod¶Metod median()vraća Series sa srednjom vrednošću svake kolone
import pandas as pd
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
spead = speed.sort()
speed
77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111
df = pd.DataFrame(speed)
df.median()
Ako su u sredini dva broja median će biti aritmetička sredina tih brojeva
77, 78, 85, 86, 86, 86, 87 88, 94, 99, 103, 111
import pandas as pd
speed1 = [99,86,87,88,111,86,103,94,78,77,85,86]
df = pd.DataFrame(speed1)
df.median()
# Odredi srednju vrednost za svaku kolonu
import pandas as pd
data = [[1, 1, 2], [6, 4, 2], [4, 2, 1], [4, 2, 3]]
df = pd.DataFrame(data)
df
print(df.median())
import pandas as pd
# Kreiranje dataframe-a
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
"B":[7, 2, 54, 3, None],
"C":[20, 16, 11, 3, 8],
"D":[14, 3, None, 2, 6]})
df.median(axis = 1)
# Obrazložiti izlaz
Izračunati srednju vrednost za kolonu Rating.
dfFilm['Rating'].median()
mode() metod¶Metod mode()vraća DataFrame sa vrednostima koje se najviše puta pojavljuju u određenoj koloni
speed1 = [99,86,87,88,111,86,103,94,78,77,85,86]
df = pd.DataFrame(speed)
df.mode()
import pandas as pd
data = [[1, 1, 2], [6, 4, 2], [4, 2, 1], [4, 2, 3]]
df = pd.DataFrame(data)
print (df)
df.mode()
Odrediti najčešću vrednost za kolone Rating i Year.
dfFilm[['Rating']].mode()
dfFilm['Year'].mode()
import pandas as pd
df = pd.read_csv('../datasets/weather.csv')
#df.loc[:,'temperature'].mean()
df['temperature'].mean()
df['temperature'].median()
df['temperature'].mode()
# prosečna temperatura za period od 2018-11-09 do 2018-11-16
import pandas as pd
df = pd.read_csv('../datasets/weather.csv', index_col=0)
df.loc ['2018-11-09':'2018-11-16', 'temperature']. mean()
import matplotlib.pyplot as plt
y = df.loc ['2018-11-09':'2018-11-16', 'temperature']
y
plt.plot(y.index,y)
plt.show()