機械学習

ハイパーパラメータの調整(分類器)

投稿日:

分類問題用にk-NN、SVM、ランダムフォレストの3つの手法及び各手法のハイパーパラメータを最適化するランダムサーチ、グリッドサーチのサンプルスクリプトです。

データセット作成

labelcap-shapecap-surfacecap-colorbruisesodorgill-attachmentgill-spacinggill-sizegill-colorstalk-shapestalk-rootstalk-surface-above-ringstalk-surface-below-ringstalk-color-above-ringatalk-color-below-ringveil-typeveil-colorring-numberring-typespore-print-colorpopulationhabitat
0pxsntpfcnkeesswwpwopksu
1exsytafcbkecsswwpwopnng
2ebswtlfcbnecsswwpwopnnm
3pxywtpfcnneesswwpwopksu
4exsgfnfwbktesswwpwoenag
cap-shape_bcap-shape_ccap-shape_fcap-shape_kcap-shape_scap-shape_xcap-surface_fcap-surface_gcap-surface_scap-surface_ycap-color_bcap-color_ccap-color_ecap-color_gcap-color_ncap-color_pcap-color_rcap-color_ucap-color_wcap-color_ybruises_fbruises_todor_aodor_codor_fodor_lodor_modor_nodor_podor_sodor_ygill-attachment_agill-attachment_fgill-spacing_cgill-spacing_wgill-size_bgill-size_ngill-color_bgill-color_egill-color_gatalk-color-below-ring_oatalk-color-below-ring_patalk-color-below-ring_watalk-color-below-ring_yveil-type_pveil-color_nveil-color_oveil-color_wveil-color_yring-number_nring-number_oring-number_tring-type_ering-type_fring-type_lring-type_nring-type_pspore-print-color_bspore-print-color_hspore-print-color_kspore-print-color_nspore-print-color_ospore-print-color_rspore-print-color_uspore-print-color_wspore-print-color_ypopulation_apopulation_cpopulation_npopulation_spopulation_vpopulation_yhabitat_dhabitat_ghabitat_lhabitat_mhabitat_phabitat_uhabitat_wlabel
000000000000000000000000000000000000000000000000000000000000000000000000000000000
111111111111111111111111111111111111111111111111111111111111111111111111111111111
211111111111111111111111111111111111111111111111111111111111111111111111111111111
300000000000000000000000000000000000000000000000000000000000000000000000000000000
411111111111111111111111111111111111111111111111111111111111111111111111111111111

学習データとテストデータに分割

(8124, 117) (6093, 117) (2031, 117) (6093,) (2031,)

ランダムサーチ

ランダムサーチ用のパラメータセットの辞書を用意

ランダムサーチの実施

グリッドサーチ

グリッドサーチ用のハイパーパラメータの組み合わせデータをの作成

グリッドサーチの実施

-機械学習

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

機械学習スタッキング例

汎化性能を上げるためkaggleでよく利用されている、スタッキングの実行例をメモしておきます。 スタッキングとは、単一の学習器をそのまま使うのではなく、複数の学習きを組み合わせることで、過学習を防ぎ予 …

no image

探索的データ分析 | PortoSeguro コンペ

Contents1 概要説明2 コンペの説明3 パッケージの読み込み4 データについて5 メタデータ6 記述統計6.1 間隔変数6.1.1 reg変数6.1.2 car変数6.2 calc変数6.3 …

no image

python/相関行列(correlation_matrix)

多変量に対して各変数の関係性を可視化するのに役立ちます。 Contents1 データ取得2 メソッド3 相関行列の算出4 可視化 データ取得 必要なモジュールのインポート [crayon-5edbc8 …

no image

python/sklearn/単回帰(LinearRegression)

2次元のデータに対して単回帰分析を行う。 Contents0.1 データ取得0.2 メソッド0.3 可視化0.4 学習データとテストデータに分割0.5 単回帰分析0.6 結果のプロット1 決定係数の算 …

no image

ハイパーパラメータの調整(回帰)

回帰問題用に重回帰、ラッソ回帰、リッジ回帰、SVM、ランダムフォレストの5つの手法及び各手法のハイパーパラメータを最適化するランダムサーチ、グリッドサーチのサンプルスクリプトです。 Contents1 …