データハンドリング 前処理

python/pandas/DataFrame/データ型指定列抽出

投稿日:

データフレームカラムのdtypeを判定し任意のdtype列に絞り込む

メソッド

パラメータ

  • include:指定するdtypeの文字列のリスト
  • exclude:除外するdtypeの文字列のリスト

注意

  • 全数値タイプの指定:np.numberまたは’number’
  • 日時の指定:np.datetime64、’datetime’または’datetime64′
  • timedeltaの指定:np.timedelta64、’timedelta’、’timedelta64′

データの準備

PassengerIdSurvivedPclassSexAgeEmbarked
0NaN03.0male22.0S
12.011.0female38.0NaN
23.01NaNNaNNaNNaN
34.011.0female35.0S
45.003.0male35.0S

pandas.DataFrame.select_dtype

infoを使ってカラムのdtypeを確認する

PassengerId 4 non-null float64
Survived 5 non-null int64
Pclass 4 non-null float64
Sex 4 non-null object
Age 4 non-null float64
Embarked 3 non-null object
dtypes: float64(3), int64(1), object(2)


dype = objectのカラムを指定して抽出する

SexEmbarked
0maleS
1femaleNaN
2NaNNaN
3femaleS
4maleS

dype = float64のカラムを除外して抽出する

SurvivedSexEmbarked
00maleS
11femaleNaN
21NaNNaN
31femaleS
40maleS

-データハンドリング, 前処理

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

データフレームの操作一覧

データフレームでよく使う機能をチートシートとしてまとめました。 Contents1 インデックス操作2 型変換3 欠損値4 ソート5 一括処理6 可視化7 結合8 集約9 重複10 条件抽出11 出力 …

no image

python/基礎/メソッド,関数,インスタンス

pythonでは値に対する処理方法として、メソッド、関数、インスタンスの3つがある。 メソッドと関数はと関数は機能としては同じだが、記述法が異なる。 関数:関数(処理対象)例)max([1,2,3]) …

no image

pythonのpandasを使ったデータ処理2

pythonのpandasを使ったデータ処理1からの続き。 データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデータをダウンロー …

no image

教師なし学習 クラスタリング

  辛さ 重厚 スパイシー 果実味 コク 酸味 落ち着き 香り 華や …

no image

毒キノコの判定 〜SVM〜

Contents1 SVMとは2 標準化3 カーネルとは4 コストペナルティCとは5 ハイパーパラメータの調整6 学習およびテスト SVMとは クラス間のマージンを最大化するように境界線を引く手法。ク …