no image

python/pandas/DataFrame/欠損値確認

データフレーム内の値がNoneまたはNAかどうかを確認する。 ※isnullとisnaの機能は同じ。isnullはisnaの別名なのでisnaが推奨 メソッド pandas.DataFrame.isn …

no image

Pandas/DataFrame/ダミー変数(get_gummies)

ダミー変数とは、カテゴリカルデータのように数値でないデータに対して、0と1の 2値型に変換し数量化すること。 具体的には、血液型、職業など pythonのpandasではget_dummiesを主に利 …

no image

python/相関行列(correlation_matrix)

多変量に対して各変数の関係性を可視化するのに役立ちます。 データ取得 必要なモジュールのインポート

データのロード [crayon-5 …

no image

python/sklearn/単回帰(LinearRegression)

2次元のデータに対して単回帰分析を行う。 データ取得 必要なモジュールのインポート

データのロード [crayon-5da9b7956 …

no image

python/matplotlib/散布図(scatterplot)

2019/06/18   -可視化

2つの数値データの関係を可視化する データ取得 必要なモジュールのインポート

データのロード [crayon-5da9b7956e8c …

no image

python/pandas/dataframe/重複関連

pandasのDataFrameの取り扱いで、特に重複関連についてのまとめ データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデ …

no image

Pandas/DataFrame/ビニング

ビニングとは数値データを任意の幅で区切ったカテゴリ変数に変換すること。 具体的には、年齢データを年代データ( 10代、20代…)に変換するイメージ。 データの読み込み [crayon-5d …

no image

pythonのpandasを使ったデータ処理2

pythonのpandasを使ったデータ処理1からの続き。 データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデータをダウンロー …

no image

毒キノコの判定 〜SVM〜

SVMとは クラス間のマージンを最大化するように境界線を引く手法。クラス分類や場合によっては回帰にも使うことができる。 利点:高次元でも識別性能が良い 利点:最適化すべきパラメータが少ない 欠点:特徴 …

no image

ボストン住宅価格 〜決定木〜

線形回帰とは 線形回帰複数の変数における相関関係を直線モデルによって説明する分析手法。 具体的に言うと?ボストンの住宅価格を、住宅の立地や間取り、築年数などから予測するモデルを作ること 分類と何か違う …