「 前処理 」 一覧

no image

データフレームの操作一覧

データフレームでよく使う機能をチートシートとしてまとめました。 インデックス操作 用途概要サンプルリセットインデックスまたはそのレベルのリセットdf.reset_index(drop=True, in …

no image

クラスタリングの実践(好きなアイスクリームアンケート)

概要 ・目的:このデータを使ってアイスクリームの好みの違いをクラスタリングで分類し、好みのパターンを理解する データの読み込み 中学生104人の運動能力テスト6種と体力測定5種の計測のデータ。このデー …

no image

クラスタリングの実践(中学生スポーツテストデータ)

クラスタリングの実践 概要 ・目的:中学生のスポーツテストデータをクラスタリングにより身体能力の組み合わせのパターンを理解する データの読み込み 中学生104人の運動能力テスト6種と体力測定5種の計測 …

no image

python/基礎/メソッド,関数,インスタンス

pythonでは値に対する処理方法として、メソッド、関数、インスタンスの3つがある。 メソッドと関数はと関数は機能としては同じだが、記述法が異なる。 関数:関数(処理対象)例)max([1,2,3]) …

no image

python/pandas/DataFrame/欠損値の補完

データフレームの欠損値を補填する メソッド pandas.DataFrame.fillna指定した方法で欠損値を補完するpandas.DataFrame.ffillfillnaと同じpandas.Da …

no image

python/pandas/DataFrame/データ型指定列抽出

データフレームカラムのdtypeを判定し任意のdtype列に絞り込む メソッド pandas.DataFrame.select_dtypesデータフレームの列のdtypeを指定して列を絞り込む パラメ …

no image

python/pandas/DataFrame/欠損値確認

データフレーム内の値がNoneまたはNAかどうかを確認する。 ※isnullとisnaの機能は同じ。isnullはisnaの別名なのでisnaが推奨 メソッド pandas.DataFrame.isn …

no image

Pandas/DataFrame/ダミー変数(get_gummies)

ダミー変数とは、カテゴリカルデータのように数値でないデータに対して、0と1の 2値型に変換し数量化すること。 具体的には、血液型、職業など pythonのpandasではget_dummiesを主に利 …

no image

python/相関行列(correlation_matrix)

多変量に対して各変数の関係性を可視化するのに役立ちます。 データ取得 必要なモジュールのインポート

データのロード [crayon-5 …

no image

python/pandas/dataframe/重複関連

pandasのDataFrameの取り扱いで、特に重複関連についてのまとめ データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデ …