機械学習

ハイパーパラメータの調整(分類器)

投稿日:

分類問題用にk-NN、SVM、ランダムフォレストの3つの手法及び各手法のハイパーパラメータを最適化するランダムサーチ、グリッドサーチのサンプルスクリプトです。

データセット作成

labelcap-shapecap-surfacecap-colorbruisesodorgill-attachmentgill-spacinggill-sizegill-colorstalk-shapestalk-rootstalk-surface-above-ringstalk-surface-below-ringstalk-color-above-ringatalk-color-below-ringveil-typeveil-colorring-numberring-typespore-print-colorpopulationhabitat
0pxsntpfcnkeesswwpwopksu
1exsytafcbkecsswwpwopnng
2ebswtlfcbnecsswwpwopnnm
3pxywtpfcnneesswwpwopksu
4exsgfnfwbktesswwpwoenag
cap-shape_bcap-shape_ccap-shape_fcap-shape_kcap-shape_scap-shape_xcap-surface_fcap-surface_gcap-surface_scap-surface_ycap-color_bcap-color_ccap-color_ecap-color_gcap-color_ncap-color_pcap-color_rcap-color_ucap-color_wcap-color_ybruises_fbruises_todor_aodor_codor_fodor_lodor_modor_nodor_podor_sodor_ygill-attachment_agill-attachment_fgill-spacing_cgill-spacing_wgill-size_bgill-size_ngill-color_bgill-color_egill-color_gatalk-color-below-ring_oatalk-color-below-ring_patalk-color-below-ring_watalk-color-below-ring_yveil-type_pveil-color_nveil-color_oveil-color_wveil-color_yring-number_nring-number_oring-number_tring-type_ering-type_fring-type_lring-type_nring-type_pspore-print-color_bspore-print-color_hspore-print-color_kspore-print-color_nspore-print-color_ospore-print-color_rspore-print-color_uspore-print-color_wspore-print-color_ypopulation_apopulation_cpopulation_npopulation_spopulation_vpopulation_yhabitat_dhabitat_ghabitat_lhabitat_mhabitat_phabitat_uhabitat_wlabel
000000000000000000000000000000000000000000000000000000000000000000000000000000000
111111111111111111111111111111111111111111111111111111111111111111111111111111111
211111111111111111111111111111111111111111111111111111111111111111111111111111111
300000000000000000000000000000000000000000000000000000000000000000000000000000000
411111111111111111111111111111111111111111111111111111111111111111111111111111111

学習データとテストデータに分割

(8124, 117) (6093, 117) (2031, 117) (6093,) (2031,)

ランダムサーチ

ランダムサーチ用のパラメータセットの辞書を用意

ランダムサーチの実施

グリッドサーチ

グリッドサーチ用のハイパーパラメータの組み合わせデータをの作成

グリッドサーチの実施

-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

kaggle:House Price チュートリアル(LASSO回帰とRIDGE回帰)

Contents1 概要説明1.1 作業の流れ2 ライブラリインポート3 データの読み込み4 前処理4.1 対数変換4.2 ダミー変数化4.3 欠損値処理4.4 データの分割5 モデリング5.1 RI …

no image

教師なし学習〜主成分分析〜

Contents1 教師なし学習1.1 不要な特徴量を消す1.2 Feature Scalingの実行1.3 疑問1.4 【課題】なぜFeature Scalingが必要なのか記述せよ1.5 PCAの …

no image

python/相関行列(correlation_matrix)

多変量に対して各変数の関係性を可視化するのに役立ちます。 Contents1 データ取得2 メソッド3 相関行列の算出4 可視化 データ取得 必要なモジュールのインポート [crayon-5da9b7 …

no image

タイタニック生存者予測~ランダムフォレスト~

有名なタイタニックのデータを使って、RandamForestを使って生存者を予測します。 Contents0.1 前処理について0.2 モデル選定について 0.2.1 ロジスティック回帰0.2.2 S …

no image

kaggle:House Price チュートリアル(EDA探索的データ解析)

Contents1 概要説明1.1 データ探索の流れ2 ライブラリインポート3 データの読み込み4 データ項目からの考察5 SalePriceの分析5.1 ヒストグラムで分布の可視化5.2 数値変数と …