An warware: samun adadin da suka ɓace a cikin pandas

Pandas babban ɗakin karatu ne na sarrafa bayanai na buɗe tushen don Python. Yana ba da tsarin bayanai da ayyukan da ake buƙata don sarrafa da kuma nazarin manyan bayanan bayanai yadda ya kamata. Matsala ɗaya gama gari masana kimiyya da manazarta suna ci karo da juna yayin amfani da pandas shine sarrafa ƙimar da bacewar a cikin bayanan. A cikin wannan labarin, za mu bincika yadda ake ƙididdige adadin ƙimar da suka ɓace a cikin pandas DataFrame ta amfani da dabaru daban-daban, bayanin mataki-mataki na lambar, da zurfafa zurfafa cikin wasu ɗakunan karatu da ayyukan da ke cikin warware wannan matsala.

Ƙididdigar Ƙimar Ƙirarriya a Pandas

Don farawa, muna buƙatar fara shigo da ɗakin karatu na pandas. Idan baku shigar dashi ba tukuna, kawai kuyi umarni 'pip install pandas' a cikin tashar ku ko da sauri.

import pandas as pd

Da zarar mun shigo da ɗakin karatu na pandas, bari mu ƙirƙiri samfurin DataFrame tare da ɓatattun dabi'u, waɗanda za mu yi amfani da su a cikin wannan labarin don nuna dabaru daban-daban na ƙidayar ƙimar da suka ɓace.

data = {
    'Name': ['Anna', 'Ben', 'Carla', None, 'Eva'],
    'Age': [25, None, 30, 35, None],
    'City': ['NY', 'LA', None, 'SF', 'LA']
}

df = pd.DataFrame(data)

A cikin wannan misali, muna da DataFrame tare da ginshiƙai uku: Suna, Shekaru, da Birni. Akwai wasu dabi'u da suka ɓace, waɗanda za mu samo kuma mu ƙidaya a sashe na gaba.

Nemo da Ƙididdiga Ƙimar Rasa ta amfani da isnull() da jimla ()

Hanya ta farko don ƙidaya ƙimar batacce a cikin pandas DataFrame ita ce ta amfani da isnull() aiki. Wannan aikin yana dawo da DataFrame mai siffa iri ɗaya da na asali, amma tare da ƙimar Gaskiya ko Ƙarya da ke nuna ko shigarwar da ta dace ta ɓace (watau ya ƙunshi Babu ko NaN) ko a'a.

missing_values = df.isnull()

Yanzu muna da DataFrame na siffa iri ɗaya, tare da ƙimar gaskiya da ke nuna abubuwan da suka ɓace. Don ƙidaya waɗannan ƙimar da suka ɓace, za mu iya amfani da kawai sum() aiki. Ta amfani da shi akan DataFrame, za mu iya samun adadin ƙimar da aka ɓace don kowane shafi.

count_missing_values = df.isnull().sum()

Wannan zai ba mu jerin pandas tare da adadin ƙimar da suka ɓace ga kowane shafi a cikin DataFrame ɗin mu.

Madadin Hanyar: Amfani da isna() da jimla()

Wata hanya don ƙididdige ƙimar da aka ɓace a cikin pandas DataFrame shine ta amfani da isna() aiki. Lakabi ne na isnull() kuma yana aiki iri ɗaya.

count_missing_values = df.isna().sum()

Wannan zai ba da sakamako iri ɗaya da tsarin da ya gabata, yana ƙidayar adadin ƙimar da suka ɓace ga kowane shafi a cikin DataFrame ɗin mu.

Ƙididdigar Ƙimar Rasa a cikin Gaba ɗaya DataFrame

Idan muna son nemo jimlar adadin ƙimar da suka ɓace a cikin dukkan DataFrame, za mu iya sarkar wani kawai sum() aiki bayan aikin jimlar farko().

total_missing_values = df.isnull().sum().sum()

Wannan zai dawo da adadin adadin da suka ɓace a cikin duka DataFrame.

A taƙaice, sarrafa abubuwan da suka ɓace a cikin pandas mataki ne mai mahimmanci a cikin tsabtace bayanai da lokacin aiwatarwa. Ta amfani da ayyukan isnull () ko isna() , a haɗe tare da aikin jimla () , za mu iya ƙidaya adadin ƙimar da suka ɓace a cikin DataFrame ɗin mu da kyau, yana sauƙaƙa magancewa da sarrafa abubuwan da suka ɓace a cikin bincikenmu.

Shafi posts:

Leave a Comment