「 前処理 」 一覧

no image

Pandas/DataFrame/ビニング

ビニングとは数値データを任意の幅で区切ったカテゴリ変数に変換すること。 具体的には、年齢データを年代データ( 10代、20代…)に変換するイメージ。 データの読み込み [crayon-5f …

no image

pythonのpandasを使ったデータ処理2

pythonのpandasを使ったデータ処理1からの続き。 データは有名なタイタニックデータを使います。 データはこちらkaggleコンペページのリンクです。 左上の「data」からデータをダウンロー …

no image

毒キノコの判定 〜SVM〜

SVMとは クラス間のマージンを最大化するように境界線を引く手法。クラス分類や場合によっては回帰にも使うことができる。 利点:高次元でも識別性能が良い 利点:最適化すべきパラメータが少ない 欠点:特徴 …

no image

ボストン住宅価格 〜決定木〜

線形回帰とは 線形回帰複数の変数における相関関係を直線モデルによって説明する分析手法。 具体的に言うと?ボストンの住宅価格を、住宅の立地や間取り、築年数などから予測するモデルを作ること 分類と何か違う …

no image

教師なし学習〜主成分分析〜

教師なし学習 教師あり学習との比較正解ががあらかじめ決まっていないという点で、教師あり学習と異なる。 教師なし学習は、データの背後に存在する本質的な構造を抽出するために用いられる。 どんなときに使うの …

no image

教師なし学習 クラスタリング

  辛さ 重厚 スパイシー 果実味 コク 酸味 落ち着き 香り 華や …

no image

タイタニック生存者予測~ランダムフォレスト~

有名なタイタニックのデータを使って、RandamForestを使って生存者を予測します。 前処理について 前処理とはデータ分析に適したデータセットの作成を目的とした生データの加工処理のこと前処理の必要 …

no image

Pandas/DataFrame/データ抽出

分析をするにあたって、最初に必要になるpandas/DataFrameのデータ抽出について記載しています。 メソッド pandas.DataFrame.locpandas.DataFrame.iloc …