データハンドリング 前処理

python/pandas/DataFrame/データ型指定列抽出

投稿日:

データフレームカラムのdtypeを判定し任意のdtype列に絞り込む

メソッド

パラメータ

  • include:指定するdtypeの文字列のリスト
  • exclude:除外するdtypeの文字列のリスト

注意

  • 全数値タイプの指定:np.numberまたは’number’
  • 日時の指定:np.datetime64、’datetime’または’datetime64′
  • timedeltaの指定:np.timedelta64、’timedelta’、’timedelta64′

データの準備

PassengerIdSurvivedPclassSexAgeEmbarked
0NaN03.0male22.0S
12.011.0female38.0NaN
23.01NaNNaNNaNNaN
34.011.0female35.0S
45.003.0male35.0S

pandas.DataFrame.select_dtype

infoを使ってカラムのdtypeを確認する

PassengerId 4 non-null float64
Survived 5 non-null int64
Pclass 4 non-null float64
Sex 4 non-null object
Age 4 non-null float64
Embarked 3 non-null object
dtypes: float64(3), int64(1), object(2)


dype = objectのカラムを指定して抽出する

SexEmbarked
0maleS
1femaleNaN
2NaNNaN
3femaleS
4maleS

dype = float64のカラムを除外して抽出する

SurvivedSexEmbarked
00maleS
11femaleNaN
21NaNNaN
31femaleS
40maleS

-データハンドリング, 前処理

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

毒キノコの判定 〜SVM〜

Contents1 SVMとは2 標準化3 カーネルとは4 コストペナルティCとは5 ハイパーパラメータの調整6 学習およびテスト SVMとは クラス間のマージンを最大化するように境界線を引く手法。ク …

no image

探索的データ分析 | PortoSeguro コンペ

Contents1 概要説明2 コンペの説明3 パッケージの読み込み4 データについて5 メタデータ6 記述統計6.1 間隔変数6.1.1 reg変数6.1.2 car変数6.2 calc変数6.3 …

no image

pythonのpandasを使ったデータ処理2

pythonのpandasを使ったデータ処理1からの続き。 データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデータをダウンロー …

no image

python/pandas/DataFrame/欠損値確認

データフレーム内の値がNoneまたはNAかどうかを確認する。 ※isnullとisnaの機能は同じ。isnullはisnaの別名なのでisnaが推奨 Contents1 メソッド2 データの準備3 p …

no image

KFold + XGBoost + EDAチュートリアル | PortoSeguro コンペ

Contents1 概要説明2 コンペの説明3 目次4 コンペの説明5 イントロ6 データ準備6.1 データロード6.2 欠損値の確認6.3 中央値で欠損値補完7 特徴量とターゲットの分割8 データの …