pandasでnull値を判定する方法のメモです。
isnull()やnotnull()を使用します。
ちなみに、データフレームにnull値を設定するときはNoneを入れます。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | import pandas as pd df = pd.DataFrame({ 'A' : [ 1 , 2 , 2 , 3 , 3 , None , 5 ], 'B' : [ 1 , 1 , 2 , 2 , None , 4 , 5 ] }) print df print '------------------------' print df.loc[df.A.isnull(), :] #Aがnullの行を表示 print '------------------------' print df.loc[df.B.isnull(), :] #Bがnullの行を表示 print '------------------------' print df.loc[df.A.notnull(), :] #Aがnull以外の行を表示 print '------------------------' print df.loc[df.B.notnull(), :] #Bがnull以外の行を表示 |
実行結果は以下のようになります。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 | A B 0 1.0 1.0 1 2.0 1.0 2 2.0 2.0 3 3.0 2.0 4 3.0 NaN 5 NaN 4.0 6 5.0 5.0 ------------------------ A B 5 NaN 4.0 ------------------------ A B 4 3.0 NaN ------------------------ A B 0 1.0 1.0 1 2.0 1.0 2 2.0 2.0 3 3.0 2.0 4 3.0 NaN 6 5.0 5.0 ------------------------ A B 0 1.0 1.0 1 2.0 1.0 2 2.0 2.0 3 3.0 2.0 5 NaN 4.0 6 5.0 5.0 |
pandasについての詳しく知りたい方は書籍もおすすめです。