refactor lagoon setup:

- create lagoon specific docker-compose - de-amazeeioify - add chatbot-ui
amazeeio · Aug 17, 2023 · 7f1b002 · 7f1b002
1 parent 4753dfd
commit 7f1b002
Show file tree

Hide file tree

Showing 9 changed files with 48 additions and 34 deletions.
diff --git a/.gitignore b/.gitignore
@@ -1 +1,2 @@
 ENV
+data
diff --git a/.lagoon.yml b/.lagoon.yml
@@ -1,4 +1,4 @@
-docker-compose-yaml: docker-compose.yml
+docker-compose-yaml: docker-compose.lagoon.yml
 environments:
   main:
     routes:

diff --git a/Dockerfile b/Dockerfile
@@ -2,7 +2,7 @@
 FROM python:3-slim-bullseye
 ENV MODEL=WizardLM-13B-V1.2
 
-# Update and upgrade the existing packages 
+# Update and upgrade the existing packages
 RUN apt-get update && apt-get upgrade -y && apt-get install -y \
     python3 \
     python3-pip \
@@ -22,17 +22,13 @@ RUN rm -rf /var/lib/apt/lists/*
 # Set a working directory for better clarity
 WORKDIR /app
 
-COPY ./amazee_server.sh /app/amazee_server.sh
+COPY ./start-llama2.sh /app/start-llama2.sh
 COPY ./hug_model.py /app/hug_model.py
 COPY ./fix-permissions.sh /app/fix-permissions.sh
 RUN chmod +x /app/fix-permissions.sh
 
 RUN mkdir -p /data \
-    && /app/fix-permissions.sh /data  \
-    && /app/fix-permissions.sh /app
-
-# Make the server start script executable
-RUN chmod +x /app/amazee_server.sh
+    && /app/fix-permissions.sh /data
 
 # Set environment variable for the host
 ENV HOST=0.0.0.0
@@ -41,4 +37,4 @@ ENV HOST=0.0.0.0
 EXPOSE 8000
 
 # Run the server start script
-CMD ["/bin/sh", "/app/amazee_server.sh"]
+CMD ["/app/start-llama2.sh"]
diff --git a/README.md b/README.md
@@ -3,12 +3,7 @@ lagoon going llama2
 
 # local run on mac M1
 ```sh
-docker build --platform linux/amd64 .
-docker run -it --platform linux/amd64
-```
-
-```sh
-docker run --rm -it --platform linux/amd64 -v '/Users/marco/Downloads:/data' -p '8000:8000' $(docker build --platform linux/amd64 -q .)
+docker-compose up -d
 ```
 
 # curl test openai api

diff --git a/docker-compose.lagoon.yml b/docker-compose.lagoon.yml
@@ -0,0 +1,22 @@
+version: '2'
+services:
+  llama2-api:
+    build: gpu.Dockerfile
+    labels:
+      lagoon.type: basic-persistent
+      lagoon.persistent: /data
+      lagoon.service.port: 8000
+      lagoon.autogeneratedroute: true
+      lagoon.gpu: true
+    volumes:
+      - ./data:/data:delegated
+    ports:
+      - "8000:8000"
+  ui:
+    build:
+      context: .
+      dockerfile: ui.Dockerfile
+    labels:
+      lagoon.type: node
+    ports:
+      - "3000:3000"
diff --git a/docker-compose.yml b/docker-compose.yml
@@ -3,14 +3,15 @@ services:
   llama2-api:
     build:
       context: .
-      dockerfile: gpu.Dockerfile
-    labels:
-      lagoon.type: basic-persistent
-      lagoon.persistent: /data
-      lagoon.service.port: 8000
-      lagoon.autogeneratedroute: true
-      lagoon.gpu: true
+      dockerfile: Dockerfile
     volumes:
-      - ./app:/app:delegated
+      - ./data:/data:delegated
     ports:
       - "8000:8000"
+    platform: linux/amd64
+  ui:
+    build:
+      context: .
+      dockerfile: ui.Dockerfile
+    ports:
+      - "3000:3000"
diff --git a/gpu.Dockerfile b/gpu.Dockerfile
@@ -7,7 +7,8 @@ RUN apt-get update && apt-get upgrade -y \
     python3 python3-pip gcc wget \
     ocl-icd-opencl-dev opencl-headers clinfo \
     libclblast-dev libopenblas-dev \
-    && mkdir -p /etc/OpenCL/vendors && echo "libnvidia-opencl.so.1" > /etc/OpenCL/vendors/nvidia.icd
+    && mkdir -p /etc/OpenCL/vendors && echo "libnvidia-opencl.so.1" > /etc/OpenCL/vendors/nvidia.icd \
+    && rm -rf /var/lib/apt/lists/*
 
 ENV CUDA_DOCKER_ARCH=all
 ENV LLAMA_CUBLAS=1
@@ -19,23 +20,17 @@ RUN CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 pip install llama-cpp-python
 # Run the server
 ENV MODEL=vicuna-13B-v1.5-16K-GGML
 
-# Clean up apt cache
-RUN rm -rf /var/lib/apt/lists/*
-
 # Set a working directory for better clarity
 WORKDIR /app
 
-COPY ./amazee_server.sh /app/amazee_server.sh
+COPY ./start-llama2.sh /app/start-llama2.sh
 COPY ./hug_model.py /app/hug_model.py
 COPY ./fix-permissions.sh /app/fix-permissions.sh
 RUN chmod +x /app/fix-permissions.sh
 
 RUN mkdir -p /data \
-    && /app/fix-permissions.sh /data  \
-    && /app/fix-permissions.sh /app
+    && /app/fix-permissions.sh /data
 
-# Make the server start script executable
-RUN chmod +x /app/amazee_server.sh
 
 # Set environment variable for the host
 ENV HOST=0.0.0.0
@@ -44,4 +39,4 @@ ENV HOST=0.0.0.0
 EXPOSE 8000
 
 # Run the server start script
-CMD ["/bin/sh", "/app/amazee_server.sh"]
+CMD ["/app/start-llama2.sh"]
diff --git a/amazee_server.sh → start-llama2.sh b/amazee_server.sh → start-llama2.sh
@@ -5,4 +5,4 @@ ulimit -l unlimited
 echo "Model: ${MODEL}"
 
 python3 hug_model.py -s ${MODEL} -f "q5_1"
-python3 -B -m llama_cpp.server --model /app/model.bin --n_gpu_layers=43
+python3 -B -m llama_cpp.server --model /data/model.bin --n_gpu_layers=43
diff --git a/ui.Dockerfile b/ui.Dockerfile
@@ -0,0 +1,4 @@
+FROM ghcr.io/mckaywrigley/chatbot-ui:main
+
+ENV OPENAI_API_KEY=not-needed \
+    OPENAI_API_HOST=http://llama2-api:8000