-
-
2019/08/02 -Uncategorized, データセット一覧, 統計解析
Pythonで乱数を扱うnumpyモジュールでよく利用する乱数生成方法を整理しました。 乱数の生成 用途サンプル概要seedの設定np.random.seed(0)乱数を固定標準正規分布np.rand …
-
-
データフレームでよく使う機能をチートシートとしてまとめました。 インデックス操作 用途概要サンプルリセットインデックスまたはそのレベルのリセットdf.reset_index(drop=True, in …
-
-
2019/07/30 -機械学習
回帰問題用に重回帰、ラッソ回帰、リッジ回帰、SVM、ランダムフォレストの5つの手法及び各手法のハイパーパラメータを最適化するランダムサーチ、グリッドサーチのサンプルスクリプトです。 データセット作成 …
-
-
CNNとは CNNは、畳み込み層、プーリング層、全結合層から構成され、この構造により、画像をピクセルではなくピースごとに比較することが特徴。 2つの画像を比較して、だいたい同じ位置にある、特徴がほぼ一 …
-
-
概要 ・目的:このデータを使ってアイスクリームの好みの違いをクラスタリングで分類し、好みのパターンを理解する データの読み込み 中学生104人の運動能力テスト6種と体力測定5種の計測のデータ。このデー …
-
-
クラスタリングの実践 概要 ・目的:中学生のスポーツテストデータをクラスタリングにより身体能力の組み合わせのパターンを理解する データの読み込み 中学生104人の運動能力テスト6種と体力測定5種の計測 …
-
-
2019/07/15 -データセット一覧
概要 データ分析やプログラミングの勉強ようにデータ一覧とpythonへ取り込むスクリプトも合わせてまとめました。スクリプトをコピーして、そのまま実行すればDataFrame化ができます。参考URL:h …
-
-
python/matplotlib/subplot(グラフの複数表示)
2019/07/01 -可視化
サブプロットを使うことで複数のグラフを並べて表示する事ができる。 データ取得 必要なモジュールのインポート
1234567import matplotlib.pyplot as pltfrom sklearn.datasets import load_bostonimport pandas as pd%matplotlib inlineデータのロード [cray …
-
-
pythonでは値に対する処理方法として、メソッド、関数、インスタンスの3つがある。 メソッドと関数はと関数は機能としては同じだが、記述法が異なる。 関数:関数(処理対象)例)max([1,2,3]) …
-
-
python/pandas/DataFrame/欠損値の補完
データフレームの欠損値を補填する メソッド pandas.DataFrame.fillna指定した方法で欠損値を補完するpandas.DataFrame.ffillfillnaと同じpandas.Da …