データハンドリング 前処理

python/pandas/DataFrame/データ型指定列抽出

投稿日:

データフレームカラムのdtypeを判定し任意のdtype列に絞り込む

メソッド

パラメータ

  • include:指定するdtypeの文字列のリスト
  • exclude:除外するdtypeの文字列のリスト

注意

  • 全数値タイプの指定:np.numberまたは’number’
  • 日時の指定:np.datetime64、’datetime’または’datetime64′
  • timedeltaの指定:np.timedelta64、’timedelta’、’timedelta64′

データの準備

PassengerIdSurvivedPclassSexAgeEmbarked
0NaN03.0male22.0S
12.011.0female38.0NaN
23.01NaNNaNNaNNaN
34.011.0female35.0S
45.003.0male35.0S

pandas.DataFrame.select_dtype

infoを使ってカラムのdtypeを確認する

PassengerId 4 non-null float64
Survived 5 non-null int64
Pclass 4 non-null float64
Sex 4 non-null object
Age 4 non-null float64
Embarked 3 non-null object
dtypes: float64(3), int64(1), object(2)


dype = objectのカラムを指定して抽出する

SexEmbarked
0maleS
1femaleNaN
2NaNNaN
3femaleS
4maleS

dype = float64のカラムを除外して抽出する

SurvivedSexEmbarked
00maleS
11femaleNaN
21NaNNaN
31femaleS
40maleS

-データハンドリング, 前処理

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

毒キノコの判定 〜SVM〜

Contents1 SVMとは2 標準化3 カーネルとは4 コストペナルティCとは5 ハイパーパラメータの調整6 学習およびテスト SVMとは クラス間のマージンを最大化するように境界線を引く手法。ク …

no image

Pandas/DataFrame/ビニング

ビニングとは数値データを任意の幅で区切ったカテゴリ変数に変換すること。 具体的には、年齢データを年代データ( 10代、20代…)に変換するイメージ。 Contents1 データの読み込み2 …

no image

クラスタリングの実践(好きなアイスクリームアンケート)

Contents1 概要2 データの読み込み3 データの確認4 主成分分析5 クラスタリング 概要 ・目的:このデータを使ってアイスクリームの好みの違いをクラスタリングで分類し、好みのパターンを理解す …

no image

python/pandas/DataFrame/欠損値確認

データフレーム内の値がNoneまたはNAかどうかを確認する。 ※isnullとisnaの機能は同じ。isnullはisnaの別名なのでisnaが推奨 Contents1 メソッド2 データの準備3 p …

no image

kaggle:House Price チュートリアル(EDA探索的データ解析)

Contents1 概要説明1.1 データ探索の流れ2 ライブラリインポート3 データの読み込み4 データ項目からの考察5 SalePriceの分析5.1 ヒストグラムで分布の可視化5.2 数値変数と …