Yoshimaru's Blog

京都に住む院生が書いています

書き出す時に欠損値がないのに,読み込んだら欠損値が出てしまう場合

主にPandasを利用時

エラー状況 - 保存する時にはnanがない 例えば以下で集計

df.isnull().sum()

このときは全て0になる

ただ読み込んで同じコードを書くと数が増える.

おそらくの原因

文字列 nan が含まれている!

そのときは以下のようにread_csvの引数を指定して読み込む.

pd.read_csv("パス名", keep_default_na=False)

備考

(ちなみに自分はレシピデータを扱うことが多いのですが,カレーに付けるいわゆる「ナン」の英語表記が原因でした,,,食メディア研究あるあると言いたい)