no image

python/pandas/DataFrame/データ型指定列抽出

データフレームカラムのdtypeを判定し任意のdtype列に絞り込む メソッド pandas.DataFrame.select_dtypesデータフレームの列のdtypeを指定して列を絞り込む パラメ …

no image

python/pandas/DataFrame/欠損値確認

データフレーム内の値がNoneまたはNAかどうかを確認する。 ※isnullとisnaの機能は同じ。isnullはisnaの別名なのでisnaが推奨 メソッド pandas.DataFrame.isn …

no image

Pandas/DataFrame/ダミー変数(get_gummies)

ダミー変数とは、カテゴリカルデータのように数値でないデータに対して、0と1の 2値型に変換し数量化すること。 具体的には、血液型、職業など pythonのpandasではget_dummiesを主に利 …

no image

python/相関行列(correlation_matrix)

多変量に対して各変数の関係性を可視化するのに役立ちます。 データ取得 必要なモジュールのインポート

データのロード [crayon-5 …

no image

python/sklearn/単回帰(LinearRegression)

2次元のデータに対して単回帰分析を行う。 データ取得 必要なモジュールのインポート

データのロード [crayon-5edbc8976 …

no image

python/matplotlib/散布図(scatterplot)

2019/06/18   -可視化

2つの数値データの関係を可視化する データ取得 必要なモジュールのインポート

データのロード [crayon-5edbc8976dcd …

no image

python/pandas/dataframe/重複関連

pandasのDataFrameの取り扱いで、特に重複関連についてのまとめ データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデ …

no image

Pandas/DataFrame/ビニング

ビニングとは数値データを任意の幅で区切ったカテゴリ変数に変換すること。 具体的には、年齢データを年代データ( 10代、20代…)に変換するイメージ。 データの読み込み [crayon-5e …

no image

pythonのpandasを使ったデータ処理2

pythonのpandasを使ったデータ処理1からの続き。 データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデータをダウンロー …

no image

毒キノコの判定 〜SVM〜

SVMとは クラス間のマージンを最大化するように境界線を引く手法。クラス分類や場合によっては回帰にも使うことができる。 利点:高次元でも識別性能が良い 利点:最適化すべきパラメータが少ない 欠点:特徴 …