Update 10_spot_hpt_sklearn.ipynb

bartzbeielstein · bartzbeielstein · commit fdc302b3f883 · 2023-05-09T00:12:39.000+02:00
diff --git a/notebooks/10_spot_hpt_sklearn.ipynb b/notebooks/10_spot_hpt_sklearn.ipynb
@@ -16,8 +16,8 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "MAX_TIME = 5\n",
-    "INIT_SIZE = 10\n",
+    "MAX_TIME = 10\n",
+    "INIT_SIZE = 50\n",
     "CLASSIFICATION = True\n",
     "REGRESSION = False\n",
     "MOONS = True\n",
@@ -32,7 +32,7 @@
     {
      "data": {
       "text/plain": [
-       "'10-sklearn_p040025_5min_10init_2023-05-08_23-24-38'"
+       "'10-sklearn_p040025_10min_50init_2023-05-09_00-04-46'"
       ]
      },
      "execution_count": 2,
@@ -58,7 +58,7 @@
    "metadata": {},
    "source": [
     "# Chapter 10: Sequential Parameter Optimization\n",
-    "## Hyperparameter Tuning: sklearn decision tree"
+    "## Hyperparameter Tuning: sklearn"
    ]
   },
   {
@@ -130,7 +130,7 @@
     "from sklearn.ensemble import HistGradientBoostingRegressor\n",
     "from sklearn.model_selection import cross_validate\n",
     "from sklearn.datasets import fetch_openml\n",
-    "from sklearn.metrics import mean_absolute_error, accuracy_score, roc_curve, roc_auc_score\n",
+    "from sklearn.metrics import mean_absolute_error, accuracy_score, roc_curve, roc_auc_score, log_loss, mean_squared_error\n",
     "from sklearn.tree import DecisionTreeRegressor\n",
     "from sklearn.datasets import make_regression\n",
     "from sklearn.preprocessing import OneHotEncoder\n",
@@ -144,6 +144,8 @@
     "from sklearn.linear_model import LogisticRegression\n",
     "from sklearn.neighbors import KNeighborsClassifier\n",
     "from sklearn.ensemble import GradientBoostingClassifier\n",
+    "from sklearn.ensemble import GradientBoostingRegressor\n",
+    "from sklearn.linear_model import ElasticNet\n",
     "\n",
     "warnings.filterwarnings(\"ignore\")\n",
     "\n",
@@ -354,11 +356,13 @@
    "outputs": [],
    "source": [
     "# core_model  = RidgeCV\n",
-    "# core_model = RandomForestClassifier\n",
+    "# core_model = GradientBoostingRegressor\n",
+    "# core_model = ElasticNet\n",
+    "core_model = RandomForestClassifier\n",
     "# core_model = SVC\n",
     "# core_model = LogisticRegression\n",
     "# core_model = KNeighborsClassifier\n",
-    "core_model = GradientBoostingClassifier\n",
+    "# core_model = GradientBoostingClassifier\n",
     "fun_control = add_core_model_to_fun_control(core_model=core_model,\n",
     "                              fun_control=fun_control,\n",
     "                              hyper_dict=SklearnHyperDict,\n",
@@ -436,8 +440,10 @@
    "outputs": [],
    "source": [
     "fun = HyperSklearn(seed=123, log_level=50).fun_sklearn\n",
-    "weights = -1.0\n",
-    "\n",
+    "# metric_sklearn = roc_auc_score\n",
+    "# weights = -1.0\n",
+    "metric_sklearn = log_loss\n",
+    "weights = 1.0\n",
     "\n",
     "fun_control.update({\n",
     "               \"horizon\": None,\n",
@@ -447,7 +453,7 @@
     "               \"log_level\": 50,\n",
     "               \"weight_coeff\": None,\n",
     "               \"metric\": None,\n",
-    "               \"metric_sklearn\": roc_auc_score\n",
+    "               \"metric_sklearn\": metric_sklearn\n",
     "               })"
    ]
   },
@@ -499,21 +505,18 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "| name                     | type   | default      |   lower |   upper | transform              |\n",
-      "|--------------------------|--------|--------------|---------|---------|------------------------|\n",
-      "| loss                     | factor | log_loss     |   0     |   1     | None                   |\n",
-      "| learning_rate            | float  | 0.1          |   0.001 |   0.2   | None                   |\n",
-      "| n_estimators             | int    | 7            |   3     |  10     | transform_power_2_int  |\n",
-      "| subsample                | float  | 0.0          | -10     |   0     | transform_power_2      |\n",
-      "| criterion                | factor | friedman_mse |   0     |   1     | None                   |\n",
-      "| min_samples_split        | int    | 1            |   1     |  10     | transform_power_2_int  |\n",
-      "| min_samples_leaf         | int    | 0            |   0     |  10     | transform_power_2_int  |\n",
-      "| min_weight_fraction_leaf | float  | 0.0          |   0     |   0.5   | None                   |\n",
-      "| max_depth                | int    | 2            |   1     |  20     | transform_power_2_int  |\n",
-      "| min_impurity_decrease    | float  | 0.0          |   0     |   1e+06 | None                   |\n",
-      "| max_features             | factor | none         |   0     |   3     | transform_none_to_None |\n",
-      "| max_leaf_nodes           | int    | 10           |   1     |  12     | transform_power_2_int  |\n",
-      "| tol                      | float  | 0.0001       |   1e-05 |   0.001 | None                   |\n"
+      "| name                     | type   | default   |   lower |   upper | transform              |\n",
+      "|--------------------------|--------|-----------|---------|---------|------------------------|\n",
+      "| n_estimators             | int    | 7         |       5 |    9    | transform_power_2_int  |\n",
+      "| criterion                | factor | gini      |       0 |    2    | None                   |\n",
+      "| max_depth                | int    | 10        |       1 |   20    | transform_power_2_int  |\n",
+      "| min_samples_split        | int    | 2         |       2 |  100    | None                   |\n",
+      "| min_samples_leaf         | int    | 1         |       1 |   10    | None                   |\n",
+      "| min_weight_fraction_leaf | float  | 0.0       |       0 |    0.01 | None                   |\n",
+      "| max_features             | factor | sqrt      |       0 |    1    | transform_none_to_None |\n",
+      "| max_leaf_nodes           | int    | 10        |       7 |   12    | transform_power_2_int  |\n",
+      "| min_impurity_decrease    | float  | 0.0       |       0 |    0.01 | None                   |\n",
+      "| bootstrap                | factor | 1         |       0 |    1    | None                   |\n"
      ]
     }
    ],
@@ -540,8 +543,7 @@
     {
      "data": {
       "text/plain": [
-       "array([[0.e+00, 1.e-01, 7.e+00, 0.e+00, 0.e+00, 1.e+00, 0.e+00, 0.e+00,\n",
-       "        2.e+00, 0.e+00, 3.e+00, 1.e+01, 1.e-04]])"
+       "array([[ 7.,  0., 10.,  2.,  1.,  0.,  0., 10.,  0.,  1.]])"
       ]
      },
      "execution_count": 18,
@@ -565,7 +567,7 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "spotPython tuning: [##########] 97.10% \r"
+      "spotPython tuning: [##--------] 23.07% \r"
      ]
     }
    ],