-
-
2019/05/26 -コンペチュートリアル, データハンドリング, 前処理, 可視化, 機械学習
線形回帰とは 線形回帰複数の変数における相関関係を直線モデルによって説明する分析手法。 具体的に言うと?ボストンの住宅価格を、住宅の立地や間取り、築年数などから予測するモデルを作ること 分類と何か違う …
-
-
教師なし学習 教師あり学習との比較正解ががあらかじめ決まっていないという点で、教師あり学習と異なる。 教師なし学習は、データの背後に存在する本質的な構造を抽出するために用いられる。 どんなときに使うの …
-
-
1234567891011import pandas as pd from sklearn.datasetsimport make_blobsX, y = make_blobs(n_samples=100, n_features=20, centers=15,cluster_std=2.0, shuffle=True, random_state=0)variables = ['辛さ','重厚','スパイシー','果実味','コク','酸味','落ち着き','香り','華やか','ジューシー','熟成','透明感','シャープ','力強い','フレッシュ','渋み','苦味','樽','エキゾチック','粘性']name = list(map(str,[i for i in range(100)])) df = pd.DataFrame(X, columns=variables, index=name)1234#データの概要を表示df.describe()
辛さ 重厚 スパイシー 果実味 コク 酸味 落ち着き 香り 華や …
-
-
有名なタイタニックのデータを使って、RandamForestを使って生存者を予測します。 前処理について 前処理とはデータ分析に適したデータセットの作成を目的とした生データの加工処理のこと前処理の必要 …