Professional Documents
Culture Documents
SUP - Projekt
SUP - Projekt
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
premenne = df.columns[df.notna().all()].tolist()
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv', sep=',')
percent_missing = percent_missing.round(0)
print(percent_missing)
3. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, aký je priemerný vek
pasažierov na lodi. Výsledok zaokrúhlite na dve desatinné miesta.
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv', sep=',')
4. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, koľko rôznych skupín
pasažierov je evidovaných na lodi.
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv', sep=',')
pocet_skupin = df['PassengerId'].str[-2:].nunique()
print(pocet_skupin)
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
pocet_passazieri = len(df)
percento_mars_passazieri = round(percento_mars_passazieri)
print(percento_mars_passazieri)
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
# explore the dataset
pocet_passazieri = len(df)
percento_cryo_passazieri = round(percento_cryo_passazieri)
print(percento_cryo_passazieri)
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv', sep=',')
8. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, ktorý graf zodpovedá
správnej vizualizácií rozdelenia veku pasažierov na lodi.
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv', sep=',')
plt.hist(df['Age'], bins=10)
plt.ylabel('Frequency')
plt.show()
# import library
import pandas as pd
# read csv from https://priscilla.fitped.eu/data/pandas/space_titanic.csv
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv', sep=',')
pocet = df['Cabin'].str[0].value_counts()
paluba = pocet.idxmax()
maxi = pocet.max()
print(f"{paluba}: {maxi}")
10. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, koľko percent
pasažierov bolo po stretnutí s anomáliou presunutých do inej dimenzie? Výsledok zaokrúhlite na
celé čísla.
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv', sep=',')
11. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, aké bolo percentuálne
rozloženie planéty pôvodu presunutých pasažierov. Inými slovami chceme vedieť, koľko percent
pasažierov bolo presunutých do inej dimenzie na základe ich domovskej planéty (pozor, súčet
týchto percent nemusí byť 100). Výsledok zaokrúhlite na celé čísla a vypíšte v nasledovnom
tvare: Earth: 40, Mars: 70, Europa: 20
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
pocetpres = df[df['Transported']]['HomePlanet'].value_counts()
pocetpas = df['HomePlanet'].value_counts()
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
df['CryoSleep'].fillna(False, inplace=True)
df['Transported'].fillna(False, inplace=True)
pocetcryo = df[df['CryoSleep']]['PassengerId'].count()
pocetpres = df[df['Transported']]['PassengerId'].count()
pocetall = len(df)
print('cryo:',pocetcryo)
print('transport:',pocetpres)
print('cryo-transport:',pocetct)
print('all:',pocetall)
13. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, z ktorej paluby bolo
po havárií presunutých najviac pasažierov do inej dimenzie. Vypíšte spolu s názvom paluby, aj
počet presunutých pasažierov.
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
pocetpalub = transported['Cabin'].str[0].value_counts()
maxpalub = pocetpalub.idxmax()
pocetpasazierov = pocetpalub.max()
print(f"{maxpalub}: {pocetpasazierov}")
14. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, z ktorej strany paluby
bolo po havárií presunutých najviac pasažierov do inej dimenzie. Vypíšte spolu s názvom strany
(Portside alebo Starboard), aj počet presunutých pasažierov.
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
trans = df[df['Transported']]
strana = trans['Cabin'].str[6]
maxtrans = strana.value_counts().idxmax()
pocet = strana.value_counts().max()
print(f"{maxtrans}: {pocet}")
15. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, aký bol rozdiel v
utrácaní pasažierov v luxusných službách lode. Porovnajte priemernú spotrebu pasažierov, ktorí
boli presunutý do inej dimenzie a tými, ktorí neboli. Výslednú spotrebu zaokrúhlite na dve
desatinné miesta a vypíšte v nasledovnom formáte: Transported: 153.52 Saved: 133.41
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
df['RoomService'].fillna(0, inplace=True)
df['FoodCourt'].fillna(0, inplace=True)
df['ShoppingMall'].fillna(0, inplace=True)
df['Spa'].fillna(0, inplace=True)
df['VRDeck'].fillna(0, inplace=True)
priemertrans = round(priemertrans, 2)
priemersaved = round(priemersaved, 2)
16. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite, vekovú skupinu
pasažierov, ktorých bolo najviac presunutých do inej dimenzie. Vekové skupiny vytvorte na
intervale 10 rokov. Výsledok vypíšte v nasledovnom formáte, pričom uveďte aj počet
presunutých pasažierov: 60-69: 785
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
agegroup = pocet.idxmax()
maxpocet = pocet[agegroup]
print(f"{agegroup}: {maxpocet}")
17. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite vekovú skupinu
pasažierov, ktorá mala najväčšiu pravdepodobnosť presunu do inej dimenzie. Vekové skupiny
vytvorte na intervale 10 rokov. Výsledok vypíšte v nasledovnom formáte, pričom uveďte aj
percento presunutých pasažierov zaokrúhlené na dve desatinné miesta: 60-69: 55.55
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
agegroup = percent.idxmax()
maxpercent= round(percent[agegroup], 2)
print(f"{agegroup}: {maxpercent}")
18. Načítajte údaje z space_titanic.csv. Preskúmajte údaje v datasete a zistite koľko pasažierov, ktorí
cestovali v skupinách, bolo presunutých do inej dimenzie (v skupine boli aspoň dvaja).
Informácia o skupine sa nachádza v premennej PassengerID
# import library
import pandas as pd
df=pd.read_csv('https://priscilla.fitped.eu/data/pandas/space_titanic.csv')
df['Group'] = df['PassengerId'].astype(str).str[-2:]