llm-conf

Running

App Files Files Community

muellerzr commited on Dec 13, 2022

Commit

8c1d0f7

1 Parent(s): c43c604

All nits

Browse files

Files changed (3) hide show

Accelerate.ipynb +11 -12
CLI.gif +0 -0
index.html +6 -3

Accelerate.ipynb CHANGED Viewed

@@ -15,15 +15,6 @@
     "---"
    ]
   },
-  {
-   "attachments": {},
-   "cell_type": "markdown",
-   "id": "f2333422",
-   "metadata": {},
-   "source": [
-    "## Test Gradio {background-iframe=\"https://muellerzr-accelerate-presentation.hf.space\"}"
-   ]
-  },
   {
    "cell_type": "markdown",
    "id": "45e61402-f734-4500-8eb6-fcdd6f17a0d4",
@@ -366,7 +357,7 @@
     "accelerator = Accelerator(gradient_accumulation_steps=4)\n",
     "...\n",
     "for batch in dataloader:\n",
-    "    with accelerator.accumulate(model)\n",
     "        optimizer.zero_grad()\n",
     "        inputs, targets = batch\n",
     "        outputs = model(inputs)\n",
@@ -522,7 +513,7 @@
     "    my_model = ModelClass(...)\n",
     "\n",
     "my_model = load_checkpoint_and_dispatch(\n",
-    "    y_model, \"sharted-weights\", device_map=\"auto\"\n",
     ")\n",
     "```\n",
     "`device_map=\"auto\"` will tell 🤗 Accelerate that it should determine where to put each layer of the model:\n",
@@ -546,7 +537,7 @@
     "    my_model = ModelClass(...)\n",
     "\n",
     "my_model = load_checkpoint_and_dispatch(\n",
-    "    y_model, \"sharted-weights\", device_map=\"auto\"\n",
     ")\n",
     "my_model.eval()\n",
     "\n",
@@ -555,6 +546,14 @@
     "```"
    ]
   },
   {
    "cell_type": "markdown",
    "id": "6f5122b2-f4fe-4237-aff2-d2a69f85b692",

     "---"
    ]
   },
   {
    "cell_type": "markdown",
    "id": "45e61402-f734-4500-8eb6-fcdd6f17a0d4",
     "accelerator = Accelerator(gradient_accumulation_steps=4)\n",
     "...\n",
     "for batch in dataloader:\n",
+    "    with accelerator.accumulate(model):\n",
     "        optimizer.zero_grad()\n",
     "        inputs, targets = batch\n",
     "        outputs = model(inputs)\n",
     "    my_model = ModelClass(...)\n",
     "\n",
     "my_model = load_checkpoint_and_dispatch(\n",
+    "    my_model, \"sharded-weights\", device_map=\"auto\"\n",
     ")\n",
     "```\n",
     "`device_map=\"auto\"` will tell 🤗 Accelerate that it should determine where to put each layer of the model:\n",
     "    my_model = ModelClass(...)\n",
     "\n",
     "my_model = load_checkpoint_and_dispatch(\n",
+    "    my_model, \"sharded-weights\", device_map=\"auto\"\n",
     ")\n",
     "my_model.eval()\n",
     "\n",
     "```"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "id": "23911045-44a7-4e1d-aebc-db46be856234",
+   "metadata": {},
+   "source": [
+    "## Demo!"
+   ]
+  },
   {
    "cell_type": "markdown",
    "id": "6f5122b2-f4fe-4237-aff2-d2a69f85b692",

CLI.gif ADDED Viewed

index.html CHANGED Viewed

@@ -581,7 +581,7 @@ Zachary Mueller
 <span id="cb13-2"><a href="#cb13-2"></a>accelerator <span class="op">=</span> Accelerator(gradient_accumulation_steps<span class="op">=</span><span class="dv">4</span>)</span>
 <span id="cb13-3"><a href="#cb13-3"></a>...</span>
 <span id="cb13-4"><a href="#cb13-4"></a><span class="cf">for</span> batch <span class="kw">in</span> dataloader:</span>
-<span id="cb13-5"><a href="#cb13-5"></a>    <span class="cf">with</span> accelerator.accumulate(model)</span>
 <span id="cb13-6"><a href="#cb13-6"></a>        optimizer.zero_grad()</span>
 <span id="cb13-7"><a href="#cb13-7"></a>        inputs, targets <span class="op">=</span> batch</span>
 <span id="cb13-8"><a href="#cb13-8"></a>        outputs <span class="op">=</span> model(inputs)</span>
@@ -682,7 +682,7 @@ Zachary Mueller
 <span id="cb17-4"><a href="#cb17-4"></a>    my_model <span class="op">=</span> ModelClass(...)</span>
 <span id="cb17-5"><a href="#cb17-5"></a></span>
 <span id="cb17-6"><a href="#cb17-6"></a>my_model <span class="op">=</span> load_checkpoint_and_dispatch(</span>
-<span id="cb17-7"><a href="#cb17-7"></a>    y_model, <span class="st">"sharted-weights"</span>, device_map<span class="op">=</span><span class="st">"auto"</span></span>
 <span id="cb17-8"><a href="#cb17-8"></a>)</span></code><button title="Copy to Clipboard" class="code-copy-button"><i class="bi"></i></button></pre></div>
 <p><code>device_map="auto"</code> will tell 🤗 Accelerate that it should determine where to put each layer of the model:</p>
 <ol type="1">
@@ -699,12 +699,15 @@ Zachary Mueller
 <span id="cb18-4"><a href="#cb18-4"></a>    my_model <span class="op">=</span> ModelClass(...)</span>
 <span id="cb18-5"><a href="#cb18-5"></a></span>
 <span id="cb18-6"><a href="#cb18-6"></a>my_model <span class="op">=</span> load_checkpoint_and_dispatch(</span>
-<span id="cb18-7"><a href="#cb18-7"></a>    y_model, <span class="st">"sharted-weights"</span>, device_map<span class="op">=</span><span class="st">"auto"</span></span>
 <span id="cb18-8"><a href="#cb18-8"></a>)</span>
 <span id="cb18-9"><a href="#cb18-9"></a>my_model.<span class="bu">eval</span>()</span>
 <span id="cb18-10"><a href="#cb18-10"></a></span>
 <span id="cb18-11"><a href="#cb18-11"></a><span class="cf">for</span> batch <span class="kw">in</span> dataloader:</span>
 <span id="cb18-12"><a href="#cb18-12"></a>    output <span class="op">=</span> my_model(batch)</span></code><button title="Copy to Clipboard" class="code-copy-button"><i class="bi"></i></button></pre></div>
 </section></section>
 <section>
 <section id="thanks-for-listening" class="title-slide slide level1 center">

 <span id="cb13-2"><a href="#cb13-2"></a>accelerator <span class="op">=</span> Accelerator(gradient_accumulation_steps<span class="op">=</span><span class="dv">4</span>)</span>
 <span id="cb13-3"><a href="#cb13-3"></a>...</span>
 <span id="cb13-4"><a href="#cb13-4"></a><span class="cf">for</span> batch <span class="kw">in</span> dataloader:</span>
+<span id="cb13-5"><a href="#cb13-5"></a>    <span class="cf">with</span> accelerator.accumulate(model):</span>
 <span id="cb13-6"><a href="#cb13-6"></a>        optimizer.zero_grad()</span>
 <span id="cb13-7"><a href="#cb13-7"></a>        inputs, targets <span class="op">=</span> batch</span>
 <span id="cb13-8"><a href="#cb13-8"></a>        outputs <span class="op">=</span> model(inputs)</span>
 <span id="cb17-4"><a href="#cb17-4"></a>    my_model <span class="op">=</span> ModelClass(...)</span>
 <span id="cb17-5"><a href="#cb17-5"></a></span>
 <span id="cb17-6"><a href="#cb17-6"></a>my_model <span class="op">=</span> load_checkpoint_and_dispatch(</span>
+<span id="cb17-7"><a href="#cb17-7"></a>    my_model, <span class="st">"sharded-weights"</span>, device_map<span class="op">=</span><span class="st">"auto"</span></span>
 <span id="cb17-8"><a href="#cb17-8"></a>)</span></code><button title="Copy to Clipboard" class="code-copy-button"><i class="bi"></i></button></pre></div>
 <p><code>device_map="auto"</code> will tell 🤗 Accelerate that it should determine where to put each layer of the model:</p>
 <ol type="1">
 <span id="cb18-4"><a href="#cb18-4"></a>    my_model <span class="op">=</span> ModelClass(...)</span>
 <span id="cb18-5"><a href="#cb18-5"></a></span>
 <span id="cb18-6"><a href="#cb18-6"></a>my_model <span class="op">=</span> load_checkpoint_and_dispatch(</span>
+<span id="cb18-7"><a href="#cb18-7"></a>    my_model, <span class="st">"sharded-weights"</span>, device_map<span class="op">=</span><span class="st">"auto"</span></span>
 <span id="cb18-8"><a href="#cb18-8"></a>)</span>
 <span id="cb18-9"><a href="#cb18-9"></a>my_model.<span class="bu">eval</span>()</span>
 <span id="cb18-10"><a href="#cb18-10"></a></span>
 <span id="cb18-11"><a href="#cb18-11"></a><span class="cf">for</span> batch <span class="kw">in</span> dataloader:</span>
 <span id="cb18-12"><a href="#cb18-12"></a>    output <span class="op">=</span> my_model(batch)</span></code><button title="Copy to Clipboard" class="code-copy-button"><i class="bi"></i></button></pre></div>
+</section>
+<section id="demo" class="slide level2">
+<h2>Demo!</h2>
 </section></section>
 <section>
 <section id="thanks-for-listening" class="title-slide slide level1 center">