From a366886b6de0f5147faa9f9bf4fc27b6f57ee0ca Mon Sep 17 00:00:00 2001 From: dev weycloud Date: Mon, 24 Jan 2022 18:21:48 +0100 Subject: [PATCH] Code fuer Hausarbeit d --- Hausarbeit/mobile_device_data.py | 43 +++++++++++++++++++++++++++----- 1 file changed, 37 insertions(+), 6 deletions(-) diff --git a/Hausarbeit/mobile_device_data.py b/Hausarbeit/mobile_device_data.py index b847d51..27b0fd9 100644 --- a/Hausarbeit/mobile_device_data.py +++ b/Hausarbeit/mobile_device_data.py @@ -69,11 +69,42 @@ dfUnivariateAnalyse.to_csv('UnivariateAnalyse.csv') ### d) Balkendiagramme -dfNominaleMerkmale = df[["bluetooth", "dual_sim", "4G"]].astype(int) -#dfNominaleSummen = dfNominaleMerkmale["bluetooth", "dual_sim", "4G"].sum() -#print(dfNominaleMerkmale) -#dfNominaleMerkmale.plot(kind="hist") -#plt.show() + +# Arbeitstabelle erzeugen, die nur die Spalten der nominalen Merkmale enthält: +dfNominaleMerkmale = df[["bluetooth", "dual_sim", "4G"]].astype(int) # inkl. Typenumwandlung zur Ganzzahl (int) + +# Jetzt Abwechselnd: +# ___Yes = Extrahieren der Datensätze mit Merkmalsausprägung 1 (yes) +# anzahl___Yes = Anzahl der Datensätze ermitteln +# ___No = Extrahieren der Datensätze mit Merkmalsausprägung 0 (no) +# anzahl___No = Anzahl der Datensätze ermitteln +bluetoothYes = dfNominaleMerkmale.loc[dfNominaleMerkmale['bluetooth'] == 1] +anzahlBluetoothYes = bluetoothYes.shape[0] # Anzahl ermitteln +bluetoothNo = dfNominaleMerkmale.loc[dfNominaleMerkmale['bluetooth'] == 0,] +anzahlBluetoothNo = bluetoothNo.shape[0] # Anzahl ermitteln +dualSimYes = dfNominaleMerkmale.loc[dfNominaleMerkmale['dual_sim'] == 1] +anzahlDualSimYes = dualSimYes.shape[0] # Anzahl ermitteln +dualSimNo = dfNominaleMerkmale.loc[dfNominaleMerkmale['dual_sim'] == 0] +anzahlDualSimNo = dualSimNo.shape[0] # Anzahl ermitteln +g4Yes = dfNominaleMerkmale.loc[dfNominaleMerkmale['4G'] == 1] +anzahl4GYes = g4Yes.shape[0] # Anzahl ermitteln +g4No = dfNominaleMerkmale.loc[dfNominaleMerkmale['4G'] == 0] +anzahl4GNo = g4No.shape[0] # Anzahl ermitteln + +# Neues Dataframe erzeugen, das je Merkmal die Anzahl der Yes/No Ausprägungen abbildet +anzahlYes = [anzahlBluetoothYes, anzahlDualSimYes, anzahl4GYes] +anzahlNo = [anzahlBluetoothNo, anzahlDualSimNo, anzahl4GNo] +index = ["bluetooth", "dual_sim", "4G"] # Beschriftung der indeX-Achse +dfAnzahlYesNo = pd.DataFrame({'yes': anzahlYes, 'no': anzahlNo}, index=index) +# print(dfAnzahlYesNo) +# yes no +# bluetooth 104 96 +# dual_sim 109 91 +# 4G 90 110 + +# Für dieses Dataframe ein Balkendiagramm erzeugen, mit Rotation=0 +dfAnzahlYesNo.plot.bar() +plt.show() @@ -102,6 +133,6 @@ plt.xlabel('ram', color='black') plt.ylabel('battery_power', color='black') #plt.xlim([0,50]) # set x-Axis View Range,[from,to] plt.scatter(werteListeX, werteListeY) -plt.show() +#plt.show()