データハンドリング 前処理

Pandas/DataFrame/データ抽出

投稿日:5月 26, 2019 更新日:

分析をするにあたって、最初に必要になるpandas/DataFrameのデータ抽出について記載しています。

メソッド

  • loc:行、列をラベルで指定
  • iloc:行、列を番号で指定(先頭 0)
PassengerIdSurvivedPclassSexAgeEmbarked
0103male22.0S
1211female38.0C
2313female26.0S
3411female35.0S
4503male35.0S

任意の行、列を指定して、データを抽出します。
抽出の方法としては、名前で指定する「loc」、番号で指定する「iloc」を使います。

SurvivedSex
11female
31female
SurvivedPclassSex
111female
213female
311female

-データハンドリング, 前処理

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

データフレームの操作一覧

データフレームでよく使う機能をチートシートとしてまとめました。 Contents1 インデックス操作2 型変換3 欠損値4 ソート5 一括処理6 可視化7 結合8 集約9 重複10 条件抽出11 出力 …

no image

kaggle:House Price チュートリアル(住宅価格の予測)

Contents1 概要説明1.1 作業の流れ2 ライブラリインポート3 データの読み込み4 前処理4.1 外れ値4.2 目的変数4.3 特徴量エンジニアリング4.3.1 欠損値4.3.2 データ相関 …

no image

python/相関行列(correlation_matrix)

多変量に対して各変数の関係性を可視化するのに役立ちます。 Contents1 データ取得2 メソッド3 相関行列の算出4 可視化 データ取得 必要なモジュールのインポート [crayon-5f08c6 …

no image

python/pandas/DataFrame/データ型指定列抽出

データフレームカラムのdtypeを判定し任意のdtype列に絞り込む Contents1 メソッド1.1 パラメータ1.2 注意2 データの準備3 pandas.DataFrame.select_dt …

no image

pythonのpandasを使ったデータ処理2

pythonのpandasを使ったデータ処理1からの続き。 データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデータをダウンロー …