tests optimizers

bartzbeielstein · bartzbeielstein · commit 30432327965b · 2023-11-15T11:56:08.000+01:00
diff --git a/notebooks/00_spotPython_tests.ipynb b/notebooks/00_spotPython_tests.ipynb
@@ -790,7 +790,46 @@
     },
     {
       "cell_type": "code",
-      "execution_count": 20,
+      "execution_count": null,
+      "metadata": {},
+      "outputs": [],
+      "source": [
+        "from torch.utils.data import DataLoader\n",
+        "from spotPython.data.diabetes import Diabetes\n",
+        "from spotPython.light.netlightregression import NetLightRegression\n",
+        "from torch import nn\n",
+        "import lightning as L\n",
+        "PATH_DATASETS = './data'\n",
+        "BATCH_SIZE = 8\n",
+        "\n",
+        "dataset = Diabetes()\n",
+        "train_loader = DataLoader(dataset, batch_size=BATCH_SIZE)\n",
+        "test_loader = DataLoader(dataset, batch_size=BATCH_SIZE)\n",
+        "val_loader = DataLoader(dataset, batch_size=BATCH_SIZE)\n",
+        "batch_x, batch_y = next(iter(train_loader)) \n",
+        "print(batch_x.shape)\n",
+        "print(batch_y.shape)\n",
+        "\n",
+        "net_light_base = NetLightRegression(l1=128, epochs=10, batch_size=BATCH_SIZE,\n",
+        "                                initialization='xavier', act_fn=nn.ReLU(),\n",
+        "                                optimizer='Adam', dropout_prob=0.1, lr_mult=0.1,\n",
+        "                                patience=5, _L_in=10, _L_out=1)\n",
+        "trainer = L.Trainer(max_epochs=2,  enable_progress_bar=False)\n",
+        "trainer.fit(net_light_base, train_loader)\n",
+        "trainer.validate(net_light_base, val_loader)\n",
+        "trainer.test(net_light_base, test_loader)\n"
+      ]
+    },
+    {
+      "cell_type": "markdown",
+      "metadata": {},
+      "source": [
+        "# tests optimizer_handler"
+      ]
+    },
+    {
+      "cell_type": "code",
+      "execution_count": 10,
       "metadata": {},
       "outputs": [
         {
@@ -811,52 +850,32 @@
             "15.9 K    Trainable params\n",
             "0         Non-trainable params\n",
             "15.9 K    Total params\n",
-            "0.064     Total estimated model params size (MB)\n"
-          ]
-        },
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "torch.Size([8, 10])\n",
-            "torch.Size([8])\n"
-          ]
-        },
-        {
-          "name": "stderr",
-          "output_type": "stream",
-          "text": [
+            "0.064     Total estimated model params size (MB)\n",
             "/Users/bartz/miniforge3/envs/spotCondaEnv/lib/python3.11/site-packages/lightning/pytorch/trainer/connectors/data_connector.py:441: The 'train_dataloader' does not have many workers which may be a bottleneck. Consider increasing the value of the `num_workers` argument` to `num_workers=11` in the `DataLoader` to improve performance.\n",
             "`Trainer.fit` stopped: `max_epochs=2` reached.\n",
-            "/Users/bartz/miniforge3/envs/spotCondaEnv/lib/python3.11/site-packages/lightning/pytorch/trainer/connectors/data_connector.py:441: The 'val_dataloader' does not have many workers which may be a bottleneck. Consider increasing the value of the `num_workers` argument` to `num_workers=11` in the `DataLoader` to improve performance.\n",
-            "/Users/bartz/miniforge3/envs/spotCondaEnv/lib/python3.11/site-packages/lightning/pytorch/trainer/connectors/data_connector.py:441: The 'test_dataloader' does not have many workers which may be a bottleneck. Consider increasing the value of the `num_workers` argument` to `num_workers=11` in the `DataLoader` to improve performance.\n"
-          ]
-        },
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────\n",
-            "     Validate metric           DataLoader 0\n",
-            "────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────\n",
-            "        hp_metric             28981.529296875\n",
-            "        val_loss              28981.529296875\n",
-            "────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────\n",
-            "────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────\n",
-            "       Test metric             DataLoader 0\n",
-            "────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────\n",
-            "        hp_metric             28981.529296875\n",
-            "        val_loss              28981.529296875\n",
-            "────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────\n"
+            "GPU available: True (mps), used: True\n",
+            "TPU available: False, using: 0 TPU cores\n",
+            "IPU available: False, using: 0 IPUs\n",
+            "HPU available: False, using: 0 HPUs\n",
+            "\n",
+            "  | Name   | Type       | Params | In sizes | Out sizes\n",
+            "-------------------------------------------------------------\n",
+            "0 | layers | Sequential | 15.9 K | [8, 10]  | [8, 1]   \n",
+            "-------------------------------------------------------------\n",
+            "15.9 K    Trainable params\n",
+            "0         Non-trainable params\n",
+            "15.9 K    Total params\n",
+            "0.064     Total estimated model params size (MB)\n",
+            "`Trainer.fit` stopped: `max_epochs=2` reached.\n"
           ]
         },
         {
           "data": {
             "text/plain": [
-              "[{'val_loss': 28981.529296875, 'hp_metric': 28981.529296875}]"
+              "True"
             ]
           },
-          "execution_count": 20,
+          "execution_count": 10,
           "metadata": {},
           "output_type": "execute_result"
         }
@@ -867,25 +886,35 @@
         "from spotPython.light.netlightregression import NetLightRegression\n",
         "from torch import nn\n",
         "import lightning as L\n",
-        "PATH_DATASETS = './data'\n",
+        "\n",
         "BATCH_SIZE = 8\n",
+        "lr_mult=0.1\n",
         "\n",
         "dataset = Diabetes()\n",
         "train_loader = DataLoader(dataset, batch_size=BATCH_SIZE)\n",
         "test_loader = DataLoader(dataset, batch_size=BATCH_SIZE)\n",
         "val_loader = DataLoader(dataset, batch_size=BATCH_SIZE)\n",
-        "batch_x, batch_y = next(iter(train_loader)) \n",
-        "print(batch_x.shape)\n",
-        "print(batch_y.shape)\n",
         "\n",
         "net_light_base = NetLightRegression(l1=128, epochs=10, batch_size=BATCH_SIZE,\n",
         "                                initialization='xavier', act_fn=nn.ReLU(),\n",
-        "                                optimizer='Adam', dropout_prob=0.1, lr_mult=0.1,\n",
+        "                                optimizer='Adam', dropout_prob=0.1, lr_mult=lr_mult,\n",
         "                                patience=5, _L_in=10, _L_out=1)\n",
         "trainer = L.Trainer(max_epochs=2,  enable_progress_bar=False)\n",
         "trainer.fit(net_light_base, train_loader)\n",
-        "trainer.validate(net_light_base, val_loader)\n",
-        "trainer.test(net_light_base, test_loader)\n"
+        "# Adam uses a lr which is calculated as lr=lr_mult * 0.001, so this value\n",
+        "# should be 0.1 * 0.001 = 0.0001 \n",
+        "trainer.optimizers[0].param_groups[0][\"lr\"] == lr_mult*0.001\n",
+        "\n",
+        "\n",
+        "net_light_base = NetLightRegression(l1=128, epochs=10, batch_size=BATCH_SIZE,\n",
+        "                                initialization='xavier', act_fn=nn.ReLU(),\n",
+        "                                optimizer='Adadelta', dropout_prob=0.1, lr_mult=lr_mult,\n",
+        "                                patience=5, _L_in=10, _L_out=1)\n",
+        "trainer = L.Trainer(max_epochs=2,  enable_progress_bar=False)\n",
+        "trainer.fit(net_light_base, train_loader)\n",
+        "# Adadelta uses a lr which is calculated as lr=lr_mult * 1.0, so this value\n",
+        "# should be 1.0 * 0.1 = 0.1 \n",
+        "trainer.optimizers[0].param_groups[0][\"lr\"] == lr_mult*1.0\n"
       ]
     },
     {
diff --git a/pyproject.toml b/pyproject.toml
@@ -7,7 +7,7 @@ build-backend = "setuptools.build_meta"
 
 [project]
 name = "spotPython"
-version = "0.6.55"
+version = "0.6.56"
 authors = [
   { name="T. Bartz-Beielstein", email="tbb@bartzundbartz.de" }
 ]
diff --git a/src/spotPython/hyperparameters/optimizer.py b/src/spotPython/hyperparameters/optimizer.py
@@ -39,17 +39,37 @@ def optimizer_handler(
             An instance of the specified optimizer.
 
     Examples:
-        >>>
-        >>> model = torch.nn.Linear(10, 1)
-        >>> optimizer = optimizer_handler("Adadelta", model.parameters(), lr_mult=0.5)
-        >>> print(optimizer)
-        Adadelta (
-            Parameter Group 0
-                eps: 1e-06
-                lr: 0.5
-                rho: 0.9
-                weight_decay: 0
-        )
+        from torch.utils.data import DataLoader
+        from spotPython.data.diabetes import Diabetes
+        from spotPython.light.netlightregression import NetLightRegression
+        from torch import nn
+        import lightning as L
+        BATCH_SIZE = 8
+        lr_mult=0.1
+        dataset = Diabetes()
+        train_loader = DataLoader(dataset, batch_size=BATCH_SIZE)
+        test_loader = DataLoader(dataset, batch_size=BATCH_SIZE)
+        val_loader = DataLoader(dataset, batch_size=BATCH_SIZE)
+        # First example: Adam
+        net_light_base = NetLightRegression(l1=128, epochs=10, batch_size=BATCH_SIZE,
+                                        initialization='xavier', act_fn=nn.ReLU(),
+                                        optimizer='Adam', dropout_prob=0.1, lr_mult=lr_mult,
+                                        patience=5, _L_in=10, _L_out=1)
+        trainer = L.Trainer(max_epochs=2,  enable_progress_bar=False)
+        trainer.fit(net_light_base, train_loader)
+        # Adam uses a lr which is calculated as lr=lr_mult * 0.001, so this value
+        # should be 0.1 * 0.001 = 0.0001
+        trainer.optimizers[0].param_groups[0]["lr"] == lr_mult*0.001
+        # Second example: Adadelta
+        net_light_base = NetLightRegression(l1=128, epochs=10, batch_size=BATCH_SIZE,
+                                        initialization='xavier', act_fn=nn.ReLU(),
+                                        optimizer='Adadelta', dropout_prob=0.1, lr_mult=lr_mult,
+                                        patience=5, _L_in=10, _L_out=1)
+        trainer = L.Trainer(max_epochs=2,  enable_progress_bar=False)
+        trainer.fit(net_light_base, train_loader)
+        # Adadelta uses a lr which is calculated as lr=lr_mult * 1.0, so this value
+        # should be 1.0 * 0.1 = 0.1
+        trainer.optimizers[0].param_groups[0]["lr"] == lr_mult*1.0
     """
     if optimizer_name == "Adadelta":
         return torch.optim.Adadelta(
diff --git a/src/spotPython/light/traintest.py b/src/spotPython/light/traintest.py
@@ -1,6 +1,5 @@
 import lightning as L
 
-# from spotPython.light.csvdatamodule import CSVDataModule
 from spotPython.data.lightdatamodule import LightDataModule
 from spotPython.data.lightcrossvalidationdatamodule import LightCrossValidationDataModule
 from spotPython.utils.eda import generate_config_id
diff --git a/test/test_optimizer_handler.py b/test/test_optimizer_handler.py
@@ -0,0 +1,39 @@
+import pytest
+from torch.utils.data import DataLoader
+from spotPython.data.diabetes import Diabetes
+from spotPython.light.netlightregression import NetLightRegression
+from torch import nn
+import lightning as L
+
+
+def test_optimizer_handler():
+    BATCH_SIZE = 8
+    lr_mult=0.1
+
+    dataset = Diabetes()
+    train_loader = DataLoader(dataset, batch_size=BATCH_SIZE)
+
+    net_light_base = NetLightRegression(l1=128, epochs=10, batch_size=BATCH_SIZE,
+                                    initialization='xavier', act_fn=nn.ReLU(),
+                                    optimizer='Adam', dropout_prob=0.1, lr_mult=lr_mult,
+                                    patience=5, _L_in=10, _L_out=1)
+    trainer = L.Trainer(max_epochs=2,  enable_progress_bar=False)
+    trainer.fit(net_light_base, train_loader)
+    # Adam uses a lr which is calculated as lr=lr_mult * 0.001, so this value
+    # should be 0.1 * 0.001 = 0.0001 
+    assert(trainer.optimizers[0].param_groups[0]["lr"] == lr_mult*0.001)
+
+
+    net_light_base = NetLightRegression(l1=128, epochs=10, batch_size=BATCH_SIZE,
+                                    initialization='xavier', act_fn=nn.ReLU(),
+                                    optimizer='Adadelta', dropout_prob=0.1, lr_mult=lr_mult,
+                                    patience=5, _L_in=10, _L_out=1)
+    trainer = L.Trainer(max_epochs=2,  enable_progress_bar=False)
+    trainer.fit(net_light_base, train_loader)
+    # Adadelta uses a lr which is calculated as lr=lr_mult * 1.0, so this value
+    # should be 1.0 * 0.1 = 0.1 
+    assert(trainer.optimizers[0].param_groups[0]["lr"] == lr_mult*1.0)
+
+
+if __name__ == "__main__":
+    pytest.main(["-v", __file__])

Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,7 @@ build-backend = "setuptools.build_meta"`
`7`	`7`
`8`	`8`	`[project]`
`9`	`9`	`name = "spotPython"`
`10`		`-version = "0.6.55"`
	`10`	`+version = "0.6.56"`
`11`	`11`	`authors = [`
`12`	`12`	`{ name="T. Bartz-Beielstein", email="tbb@bartzundbartz.de" }`
`13`	`13`	`]`