From 2d7d824b20522596266a1cd32590c90b64357424 Mon Sep 17 00:00:00 2001
From: Swati Tiwari <swatitiwari@Swatis-MacBook-Pro.local>
Date: Thu, 16 Jan 2025 04:49:05 +0530
Subject: [PATCH 1/2] Add changes to run darwin locally

---
 .../vespa/app_config/hosts-dev.xml            | 37 ++-----------------
 .../vespa/app_config/services-dev.xml         | 36 ++++++++++++++++++
 backend/danswer/document_index/vespa/index.py |  3 +-
 .../docker_compose/docker-compose.dev.yml     | 15 +++++++-
 4 files changed, 55 insertions(+), 36 deletions(-)
 create mode 100644 backend/danswer/document_index/vespa/app_config/services-dev.xml
diff --git a/backend/danswer/document_index/vespa/app_config/hosts-dev.xml b/backend/danswer/document_index/vespa/app_config/hosts-dev.xml
index 671994fb854..10fa846c58d 100644
--- a/backend/danswer/document_index/vespa/app_config/hosts-dev.xml
+++ b/backend/danswer/document_index/vespa/app_config/hosts-dev.xml
@@ -1,36 +1,7 @@
 <?xml version="1.0" encoding="utf-8" ?>
+<!-- Copyright Vespa.ai. Licensed under the terms of the Apache 2.0 license. See LICENSE in the project root. -->
 <hosts>
-  <host name='vespa-configserver-0.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>config0</alias>
+  <host name="index">
+    <alias>danswer-node</alias>
   </host>
-  <host name='vespa-configserver-1.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>config1</alias>
-  </host>
-  <host name='vespa-configserver-2.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>config2</alias>
-  </host>
-  <host name='vespa-admin-0.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>admin0</alias>
-  </host>
-  <host name='vespa-feed-container-0.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>feed0</alias>
-  </host>
-  <host name='vespa-feed-container-1.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>feed1</alias>
-  </host>
-  <host name='vespa-query-container-0.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>query0</alias>
-  </host>
-  <host name='vespa-query-container-1.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>query1</alias>
-  </host>
-  <host name='vespa-content-0.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>content0</alias>
-  </host>
-  <host name='vespa-content-1.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>content1</alias>
-  </host>
-  <host name='vespa-content-2.vespa-internal.darwin-dev.svc.cluster.local'>
-    <alias>content2</alias>
-  </host>
-</hosts>
+</hosts>
\ No newline at end of file
diff --git a/backend/danswer/document_index/vespa/app_config/services-dev.xml b/backend/danswer/document_index/vespa/app_config/services-dev.xml
new file mode 100644
index 00000000000..a5087563e26
--- /dev/null
+++ b/backend/danswer/document_index/vespa/app_config/services-dev.xml
@@ -0,0 +1,36 @@
+<?xml version="1.0" encoding="utf-8" ?>
+<services version="1.0">
+    <container id="default" version="1.0">
+        <document-api/>
+        <search/>
+        <http>
+            <server id="default" port="8081"/>
+        </http>
+        <nodes>
+            <node hostalias="danswer-node" />
+        </nodes>
+    </container>
+    <content id="danswer_index" version="1.0">
+        <redundancy>1</redundancy>
+        <documents>
+            <!-- <document type="danswer_chunk" mode="index" /> -->
+            DOCUMENT_REPLACEMENT
+        </documents>
+        <nodes>
+            <node hostalias="danswer-node" distribution-key="0" />
+        </nodes>
+        <tuning>
+            <resource-limits>
+                <!-- Default is 75% but this can be increased for Dockerized deployments -->
+                <!-- https://docs.vespa.ai/en/operations/feed-block.html -->
+                <disk>0.75</disk>
+            </resource-limits>
+        </tuning>
+        <config name="vespa.config.search.summary.juniperrc">
+            <max_matches>3</max_matches>
+            <length>750</length>
+            <surround_max>350</surround_max>
+            <min_length>300</min_length>
+        </config>
+    </content>
+</services>
\ No newline at end of file
diff --git a/backend/danswer/document_index/vespa/index.py b/backend/danswer/document_index/vespa/index.py
index 5ff60f2305a..99c401e2557 100644
--- a/backend/danswer/document_index/vespa/index.py
+++ b/backend/danswer/document_index/vespa/index.py
@@ -815,12 +815,13 @@ def ensure_indices_exist(
             os.getcwd(), "danswer", "document_index", "vespa", "app_config"
         )
         schema_file = os.path.join(vespa_schema_path, "schemas", "danswer_chunk.sd")
-        services_file = os.path.join(vespa_schema_path, "services.xml")
         overrides_file = os.path.join(vespa_schema_path, "validation-overrides.xml")
         if ENVIRONMENT in "DEV":
             hosts_file = os.path.join(vespa_schema_path, "hosts-dev.xml")
+            services_file = os.path.join(vespa_schema_path, "services-dev.xml")
         else:
             hosts_file = os.path.join(vespa_schema_path, "hosts.xml")
+            services_file = os.path.join(vespa_schema_path, "services.xml")
 
         with open(services_file, "r") as services_f:
             services_template = services_f.read()
diff --git a/deployment/docker_compose/docker-compose.dev.yml b/deployment/docker_compose/docker-compose.dev.yml
index b0883d4ff74..d7b5d72832b 100644
--- a/deployment/docker_compose/docker-compose.dev.yml
+++ b/deployment/docker_compose/docker-compose.dev.yml
@@ -17,9 +17,10 @@ services:
     ports:
       - "8080:8080"
     environment:
+      - ENVIRONMENT=${ENVIRONMENT:-DEV} 
       # Auth Settings
       - AUTH_TYPE=${AUTH_TYPE:-disabled}
-      - SESSION_EXPIRE_TIME_SECONDS=${SESSION_EXPIRE_TIME_SECONDS:-86400}
+      - SESSION_EXPIRE_TIME_SECONDS=${SESSION_EXPIRE_TIME_SECONDS:-86400}   
       - ENCRYPTION_KEY_SECRET=${ENCRYPTION_KEY_SECRET:-}
       - VALID_EMAIL_DOMAINS=${VALID_EMAIL_DOMAINS:-}
       - GOOGLE_OAUTH_CLIENT_ID=${GOOGLE_OAUTH_CLIENT_ID:-}
@@ -72,6 +73,7 @@ services:
       # Other services
       - POSTGRES_HOST=relational_db
       - VESPA_HOST=index
+      - VESPA_FEED_PORT=${VESPA_FEED_PORT:-}
       - WEB_DOMAIN=${WEB_DOMAIN:-}  # For frontend redirect auth purpose
       # Don't change the NLP model configs unless you know what you're doing
       - DOCUMENT_ENCODER_MODEL=${DOCUMENT_ENCODER_MODEL:-}
@@ -119,6 +121,7 @@ services:
       - indexing_model_server
     restart: always
     environment:
+      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - ENCRYPTION_KEY_SECRET=${ENCRYPTION_KEY_SECRET:-}
       # Gen AI Settings (Needed by DanswerBot)
       - GEN_AI_MODEL_PROVIDER=${GEN_AI_MODEL_PROVIDER:-}
@@ -157,6 +160,9 @@ services:
       - POSTGRES_PASSWORD=${POSTGRES_PASSWORD:-}
       - POSTGRES_DB=${POSTGRES_DB:-}
       - VESPA_HOST=index
+      - VESPA_PORT=${VESPA_PORT:-}
+      - VESPA_FEED_PORT=${VESPA_FEED_PORT:-}
+      - VESPA_FEED_HOST=${VESPA_FEED_HOST:-}
       - WEB_DOMAIN=${WEB_DOMAIN:-}  # For frontend redirect auth purpose for OAuth2 connectors
       # Don't change the NLP model configs unless you know what you're doing
       - DOCUMENT_ENCODER_MODEL=${DOCUMENT_ENCODER_MODEL:-}
@@ -231,6 +237,7 @@ services:
       - api_server
     restart: always
     environment:
+      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - INTERNAL_URL=http://api_server:8080
       - WEB_DOMAIN=${WEB_DOMAIN:-}
       - THEME_IS_DARK=${THEME_IS_DARK:-}
@@ -240,7 +247,7 @@ services:
 
 
   inference_model_server:
-    image: danswer/danswer-model-server:latest
+    image: danswer/danswer-model-server:v0.4.28
     build:
       context: ../../backend
       dockerfile: Dockerfile.model_server
@@ -253,6 +260,7 @@ services:
       fi"
     restart: on-failure
     environment:
+      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - MIN_THREADS_ML_MODELS=${MIN_THREADS_ML_MODELS:-}
       # Set to debug to get more fine-grained logs
       - LOG_LEVEL=${LOG_LEVEL:-info}
@@ -280,6 +288,7 @@ services:
       fi"
     restart: on-failure
     environment:
+      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - MIN_THREADS_ML_MODELS=${MIN_THREADS_ML_MODELS:-}
       - INDEXING_ONLY=True
       # Set to debug to get more fine-grained logs
@@ -297,6 +306,7 @@ services:
     image: postgres:15.2-alpine
     restart: always
     environment:
+      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - POSTGRES_USER=${POSTGRES_USER:-postgres}
       - POSTGRES_PASSWORD=${POSTGRES_PASSWORD:-password}
     ports:
@@ -330,6 +340,7 @@ services:
       - api_server
       - web_server
     environment:
+      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - DOMAIN=localhost
     ports:
       - "80:80"

From 09bc26764e7bf66bb32533a10f0ad4cbf5e9b8c6 Mon Sep 17 00:00:00 2001
From: swati354 <swatitiwari354@gmail.com>
Date: Fri, 17 Jan 2025 10:44:31 +0530
Subject: [PATCH 2/2] modified hosts and service files

---
 .../vespa/app_config/hosts-dev.xml            |  35 +-
 .../vespa/app_config/hosts-local.xml          |   7 +
 .../{services-dev.xml => services-local.xml}  |   0
 backend/danswer/document_index/vespa/index.py |  10 +-
 .../docker_compose/docker-compose.dev.yml     |  17 +-
 .../docker_compose/docker-compose.local.yml   | 369 ++++++++++++++++++
 6 files changed, 419 insertions(+), 19 deletions(-)
 create mode 100644 backend/danswer/document_index/vespa/app_config/hosts-local.xml
 rename backend/danswer/document_index/vespa/app_config/{services-dev.xml => services-local.xml} (100%)
 create mode 100644 deployment/docker_compose/docker-compose.local.yml

diff --git a/backend/danswer/document_index/vespa/app_config/hosts-dev.xml b/backend/danswer/document_index/vespa/app_config/hosts-dev.xml
index 10fa846c58d..515938b93bb 100644
--- a/backend/danswer/document_index/vespa/app_config/hosts-dev.xml
+++ b/backend/danswer/document_index/vespa/app_config/hosts-dev.xml
@@ -1,7 +1,36 @@
 <?xml version="1.0" encoding="utf-8" ?>
-<!-- Copyright Vespa.ai. Licensed under the terms of the Apache 2.0 license. See LICENSE in the project root. -->
 <hosts>
-  <host name="index">
-    <alias>danswer-node</alias>
+  <host name='vespa-configserver-0.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>config0</alias>
+  </host>
+  <host name='vespa-configserver-1.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>config1</alias>
+  </host>
+  <host name='vespa-configserver-2.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>config2</alias>
+  </host>
+  <host name='vespa-admin-0.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>admin0</alias>
+  </host>
+  <host name='vespa-feed-container-0.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>feed0</alias>
+  </host>
+  <host name='vespa-feed-container-1.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>feed1</alias>
+  </host>
+  <host name='vespa-query-container-0.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>query0</alias>
+  </host>
+  <host name='vespa-query-container-1.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>query1</alias>
+  </host>
+  <host name='vespa-content-0.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>content0</alias>
+  </host>
+  <host name='vespa-content-1.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>content1</alias>
+  </host>
+  <host name='vespa-content-2.vespa-internal.darwin-dev.svc.cluster.local'>
+    <alias>content2</alias>
   </host>
 </hosts>
\ No newline at end of file
diff --git a/backend/danswer/document_index/vespa/app_config/hosts-local.xml b/backend/danswer/document_index/vespa/app_config/hosts-local.xml
new file mode 100644
index 00000000000..10fa846c58d
--- /dev/null
+++ b/backend/danswer/document_index/vespa/app_config/hosts-local.xml
@@ -0,0 +1,7 @@
+<?xml version="1.0" encoding="utf-8" ?>
+<!-- Copyright Vespa.ai. Licensed under the terms of the Apache 2.0 license. See LICENSE in the project root. -->
+<hosts>
+  <host name="index">
+    <alias>danswer-node</alias>
+  </host>
+</hosts>
\ No newline at end of file
diff --git a/backend/danswer/document_index/vespa/app_config/services-dev.xml b/backend/danswer/document_index/vespa/app_config/services-local.xml
similarity index 100%
rename from backend/danswer/document_index/vespa/app_config/services-dev.xml
rename to backend/danswer/document_index/vespa/app_config/services-local.xml
diff --git a/backend/danswer/document_index/vespa/index.py b/backend/danswer/document_index/vespa/index.py
index 99c401e2557..a7892e40f45 100644
--- a/backend/danswer/document_index/vespa/index.py
+++ b/backend/danswer/document_index/vespa/index.py
@@ -816,12 +816,18 @@ def ensure_indices_exist(
         )
         schema_file = os.path.join(vespa_schema_path, "schemas", "danswer_chunk.sd")
         overrides_file = os.path.join(vespa_schema_path, "validation-overrides.xml")
+
+        if ENVIRONMENT in "LOCAL":
+            services_file = os.path.join(vespa_schema_path, "services-local.xml")
+        else:
+            services_file = os.path.join(vespa_schema_path, "services.xml")
+
         if ENVIRONMENT in "DEV":
             hosts_file = os.path.join(vespa_schema_path, "hosts-dev.xml")
-            services_file = os.path.join(vespa_schema_path, "services-dev.xml")
+        elif ENVIRONMENT in "LOCAL":
+            hosts_file = os.path.join(vespa_schema_path, "hosts-local.xml")
         else:
             hosts_file = os.path.join(vespa_schema_path, "hosts.xml")
-            services_file = os.path.join(vespa_schema_path, "services.xml")
 
         with open(services_file, "r") as services_f:
             services_template = services_f.read()
diff --git a/deployment/docker_compose/docker-compose.dev.yml b/deployment/docker_compose/docker-compose.dev.yml
index d7b5d72832b..581b8eb247e 100644
--- a/deployment/docker_compose/docker-compose.dev.yml
+++ b/deployment/docker_compose/docker-compose.dev.yml
@@ -17,10 +17,9 @@ services:
     ports:
       - "8080:8080"
     environment:
-      - ENVIRONMENT=${ENVIRONMENT:-DEV} 
       # Auth Settings
       - AUTH_TYPE=${AUTH_TYPE:-disabled}
-      - SESSION_EXPIRE_TIME_SECONDS=${SESSION_EXPIRE_TIME_SECONDS:-86400}   
+      - SESSION_EXPIRE_TIME_SECONDS=${SESSION_EXPIRE_TIME_SECONDS:-86400}
       - ENCRYPTION_KEY_SECRET=${ENCRYPTION_KEY_SECRET:-}
       - VALID_EMAIL_DOMAINS=${VALID_EMAIL_DOMAINS:-}
       - GOOGLE_OAUTH_CLIENT_ID=${GOOGLE_OAUTH_CLIENT_ID:-}
@@ -73,7 +72,6 @@ services:
       # Other services
       - POSTGRES_HOST=relational_db
       - VESPA_HOST=index
-      - VESPA_FEED_PORT=${VESPA_FEED_PORT:-}
       - WEB_DOMAIN=${WEB_DOMAIN:-}  # For frontend redirect auth purpose
       # Don't change the NLP model configs unless you know what you're doing
       - DOCUMENT_ENCODER_MODEL=${DOCUMENT_ENCODER_MODEL:-}
@@ -121,7 +119,6 @@ services:
       - indexing_model_server
     restart: always
     environment:
-      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - ENCRYPTION_KEY_SECRET=${ENCRYPTION_KEY_SECRET:-}
       # Gen AI Settings (Needed by DanswerBot)
       - GEN_AI_MODEL_PROVIDER=${GEN_AI_MODEL_PROVIDER:-}
@@ -160,9 +157,6 @@ services:
       - POSTGRES_PASSWORD=${POSTGRES_PASSWORD:-}
       - POSTGRES_DB=${POSTGRES_DB:-}
       - VESPA_HOST=index
-      - VESPA_PORT=${VESPA_PORT:-}
-      - VESPA_FEED_PORT=${VESPA_FEED_PORT:-}
-      - VESPA_FEED_HOST=${VESPA_FEED_HOST:-}
       - WEB_DOMAIN=${WEB_DOMAIN:-}  # For frontend redirect auth purpose for OAuth2 connectors
       # Don't change the NLP model configs unless you know what you're doing
       - DOCUMENT_ENCODER_MODEL=${DOCUMENT_ENCODER_MODEL:-}
@@ -237,7 +231,6 @@ services:
       - api_server
     restart: always
     environment:
-      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - INTERNAL_URL=http://api_server:8080
       - WEB_DOMAIN=${WEB_DOMAIN:-}
       - THEME_IS_DARK=${THEME_IS_DARK:-}
@@ -247,7 +240,7 @@ services:
 
 
   inference_model_server:
-    image: danswer/danswer-model-server:v0.4.28
+    image: danswer/danswer-model-server:latest
     build:
       context: ../../backend
       dockerfile: Dockerfile.model_server
@@ -260,7 +253,6 @@ services:
       fi"
     restart: on-failure
     environment:
-      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - MIN_THREADS_ML_MODELS=${MIN_THREADS_ML_MODELS:-}
       # Set to debug to get more fine-grained logs
       - LOG_LEVEL=${LOG_LEVEL:-info}
@@ -288,7 +280,6 @@ services:
       fi"
     restart: on-failure
     environment:
-      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - MIN_THREADS_ML_MODELS=${MIN_THREADS_ML_MODELS:-}
       - INDEXING_ONLY=True
       # Set to debug to get more fine-grained logs
@@ -306,7 +297,6 @@ services:
     image: postgres:15.2-alpine
     restart: always
     environment:
-      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - POSTGRES_USER=${POSTGRES_USER:-postgres}
       - POSTGRES_PASSWORD=${POSTGRES_PASSWORD:-password}
     ports:
@@ -340,7 +330,6 @@ services:
       - api_server
       - web_server
     environment:
-      - ENVIRONMENT=${ENVIRONMENT:-DEV}
       - DOMAIN=localhost
     ports:
       - "80:80"
@@ -366,4 +355,4 @@ volumes:
   db_volume:
   vespa_volume:
   # Created by the container itself
-  model_cache_huggingface:
+  model_cache_huggingface:
\ No newline at end of file
diff --git a/deployment/docker_compose/docker-compose.local.yml b/deployment/docker_compose/docker-compose.local.yml
new file mode 100644
index 00000000000..7583b09b836
--- /dev/null
+++ b/deployment/docker_compose/docker-compose.local.yml
@@ -0,0 +1,369 @@
+version: '3'
+services:
+  api_server:
+    image: danswer/danswer-backend:latest
+    build:
+      context: ../../backend
+      dockerfile: Dockerfile
+    command: >
+      /bin/sh -c "alembic upgrade head &&
+      echo \"Starting Danswer Api Server\" &&
+      uvicorn danswer.main:app --host 0.0.0.0 --port 8080"
+    depends_on:
+      - relational_db
+      # - index
+      - inference_model_server
+    restart: always
+    ports:
+      - "8080:8080"
+    environment:
+      - ENVIRONMENT=${ENVIRONMENT:-LOCAL} 
+      # Auth Settings
+      - AUTH_TYPE=${AUTH_TYPE:-disabled}
+      - SESSION_EXPIRE_TIME_SECONDS=${SESSION_EXPIRE_TIME_SECONDS:-86400}   
+      - ENCRYPTION_KEY_SECRET=${ENCRYPTION_KEY_SECRET:-}
+      - VALID_EMAIL_DOMAINS=${VALID_EMAIL_DOMAINS:-}
+      - GOOGLE_OAUTH_CLIENT_ID=${GOOGLE_OAUTH_CLIENT_ID:-}
+      - GOOGLE_OAUTH_CLIENT_SECRET=${GOOGLE_OAUTH_CLIENT_SECRET:-}
+      - REQUIRE_EMAIL_VERIFICATION=${REQUIRE_EMAIL_VERIFICATION:-}
+      - SMTP_SERVER=${SMTP_SERVER:-}  # For sending verification emails, if unspecified then defaults to 'smtp.gmail.com'
+      - SMTP_PORT=${SMTP_PORT:-587}  # For sending verification emails, if unspecified then defaults to '587'
+      - SMTP_USER=${SMTP_USER:-}
+      - SMTP_PASS=${SMTP_PASS:-}
+      - EMAIL_FROM=${EMAIL_FROM:-}
+      - OAUTH_CLIENT_ID=${OAUTH_CLIENT_ID:-}
+      - OAUTH_CLIENT_SECRET=${OAUTH_CLIENT_SECRET:-}
+      - OPENID_CONFIG_URL=${OPENID_CONFIG_URL:-}
+      # Gen AI Settings
+      - GEN_AI_MODEL_PROVIDER=${GEN_AI_MODEL_PROVIDER:-}
+      - GEN_AI_MODEL_VERSION=${GEN_AI_MODEL_VERSION:-}
+      - FAST_GEN_AI_MODEL_VERSION=${FAST_GEN_AI_MODEL_VERSION:-}
+      - GEN_AI_API_KEY=${GEN_AI_API_KEY:-}
+      - GEN_AI_API_ENDPOINT=https://alpha.uipath.com/llmgateway_/openai/deployments/gpt-35-turbo/chat/completions?api-version=2023-03-15-preview
+      - GEN_AI_IDENTITY_ENDPOINT=https://alpha.uipath.com/identity_/connect/token
+      - GEN_AI_CLIENT_ID=${GEN_AI_CLIENT_ID:-}
+      - GEN_AI_CLIENT_SECRET=${GEN_AI_CLIENT_SECRET:-}
+      - GEN_AI_API_VERSION=${GEN_AI_API_VERSION:-}
+      - GEN_AI_LLM_PROVIDER_TYPE=${GEN_AI_LLM_PROVIDER_TYPE:-}
+      - GEN_AI_MAX_TOKENS=${GEN_AI_MAX_TOKENS:-}
+      - QA_TIMEOUT=${QA_TIMEOUT:-}
+      - MAX_CHUNKS_FED_TO_CHAT=${MAX_CHUNKS_FED_TO_CHAT:-}
+      - DISABLE_LLM_FILTER_EXTRACTION=${DISABLE_LLM_FILTER_EXTRACTION:-true}
+      - DISABLE_LLM_CHUNK_FILTER=${DISABLE_LLM_CHUNK_FILTER:-true}
+      - DISABLE_LLM_CHOOSE_SEARCH=${DISABLE_LLM_CHOOSE_SEARCH:-true}
+      - DISABLE_LLM_QUERY_REPHRASE=${DISABLE_LLM_QUERY_REPHRASE:-false}
+      - DISABLE_GENERATIVE_AI=${DISABLE_GENERATIVE_AI:-}
+      - DISABLE_LITELLM_STREAMING=${DISABLE_LITELLM_STREAMING:-true}
+      - LITELLM_EXTRA_HEADERS=${LITELLM_EXTRA_HEADERS:-}
+      - BING_API_KEY=${BING_API_KEY:-}
+      # if set, allows for the use of the token budget system
+      - TOKEN_BUDGET_GLOBALLY_ENABLED=${TOKEN_BUDGET_GLOBALLY_ENABLED:-}
+      # Enables the use of bedrock models
+      - AWS_ACCESS_KEY_ID=${AWS_ACCESS_KEY_ID:-}
+      - AWS_SECRET_ACCESS_KEY=${AWS_SECRET_ACCESS_KEY:-}
+      - AWS_REGION_NAME=${AWS_REGION_NAME:-}
+      # Query Options
+      - DOC_TIME_DECAY=${DOC_TIME_DECAY:-}  # Recency Bias for search results, decay at 1 / (1 + DOC_TIME_DECAY * x years)
+      - HYBRID_ALPHA=${HYBRID_ALPHA:-}  # Hybrid Search Alpha (0 for entirely keyword, 1 for entirely vector)
+      - EDIT_KEYWORD_QUERY=${EDIT_KEYWORD_QUERY:-}
+      - MULTILINGUAL_QUERY_EXPANSION=${MULTILINGUAL_QUERY_EXPANSION:-}
+      - LANGUAGE_HINT=${LANGUAGE_HINT:-}
+      - LANGUAGE_CHAT_NAMING_HINT=${LANGUAGE_CHAT_NAMING_HINT:-}
+      - QA_PROMPT_OVERRIDE=${QA_PROMPT_OVERRIDE:-}
+      # Other services
+      - POSTGRES_HOST=relational_db
+      - VESPA_HOST=index
+      - VESPA_FEED_PORT=${VESPA_FEED_PORT:-}
+      - WEB_DOMAIN=${WEB_DOMAIN:-}  # For frontend redirect auth purpose
+      # Don't change the NLP model configs unless you know what you're doing
+      - DOCUMENT_ENCODER_MODEL=${DOCUMENT_ENCODER_MODEL:-}
+      - DOC_EMBEDDING_DIM=${DOC_EMBEDDING_DIM:-}
+      - NORMALIZE_EMBEDDINGS=${NORMALIZE_EMBEDDINGS:-}
+      - ASYM_QUERY_PREFIX=${ASYM_QUERY_PREFIX:-}
+      - ENABLE_RERANKING_REAL_TIME_FLOW=${ENABLE_RERANKING_REAL_TIME_FLOW:-}
+      - ENABLE_RERANKING_ASYNC_FLOW=${ENABLE_RERANKING_ASYNC_FLOW:-}
+      - MODEL_SERVER_HOST=${MODEL_SERVER_HOST:-inference_model_server}
+      - MODEL_SERVER_PORT=${MODEL_SERVER_PORT:-}
+      # Leave this on pretty please? Nothing sensitive is collected!
+      # https://docs.danswer.dev/more/telemetry
+      - DISABLE_TELEMETRY=${DISABLE_TELEMETRY:-true}
+      - LOG_LEVEL=${LOG_LEVEL:-info}  # Set to debug to get more fine-grained logs
+      - LOG_ALL_MODEL_INTERACTIONS=${LOG_ALL_MODEL_INTERACTIONS:-true}  # Log all of the prompts to the LLM
+      # If set to `true` will enable additional logs about Vespa query performance
+      # (time spent on finding the right docs + time spent fetching summaries from disk)
+      - LOG_VESPA_TIMING_INFORMATION=${LOG_VESPA_TIMING_INFORMATION:-}
+      - LOG_ENDPOINT_LATENCY=${LOG_ENDPOINT_LATENCY:-}
+
+      # Enterprise Edition only
+      - ENABLE_PAID_ENTERPRISE_EDITION_FEATURES=${ENABLE_PAID_ENTERPRISE_EDITION_FEATURES:-false}
+      - API_KEY_HASH_ROUNDS=${API_KEY_HASH_ROUNDS:-}
+      # Seeding configuration
+      - ENV_SEED_CONFIGURATION=${ENV_SEED_CONFIGURATION:-}
+    extra_hosts:
+      - "host.docker.internal:host-gateway"
+    logging:
+      driver: json-file
+      options:
+        max-size: "50m"
+        max-file: "6"
+
+
+  background:
+    image: danswer/danswer-backend:latest
+    build:
+      context: ../../backend
+      dockerfile: Dockerfile
+    command: /usr/bin/supervisord -c /etc/supervisor/conf.d/supervisord.conf
+    depends_on:
+      - relational_db
+      # - index
+      - inference_model_server
+      - indexing_model_server
+    restart: always
+    environment:
+      - ENVIRONMENT=${ENVIRONMENT:-LOCAL}
+      - ENCRYPTION_KEY_SECRET=${ENCRYPTION_KEY_SECRET:-}
+      # Gen AI Settings (Needed by DanswerBot)
+      - GEN_AI_MODEL_PROVIDER=${GEN_AI_MODEL_PROVIDER:-}
+      - GEN_AI_MODEL_VERSION=${GEN_AI_MODEL_VERSION:-}
+      - FAST_GEN_AI_MODEL_VERSION=${FAST_GEN_AI_MODEL_VERSION:-custom}
+      - GEN_AI_API_KEY=${GEN_AI_API_KEY:-}
+      - GEN_AI_API_ENDPOINT=https://alpha.uipath.com/llmgateway_/openai/deployments/gpt-35-turbo/chat/completions?api-version=2023-03-15-preview
+      - GEN_AI_IDENTITY_ENDPOINT=https://alpha.uipath.com/identity_/connect/token
+      - GEN_AI_CLIENT_ID=${GEN_AI_CLIENT_ID:-}
+      - GEN_AI_CLIENT_SECRET=${GEN_AI_CLIENT_SECRET:-}
+      - GEN_AI_API_VERSION=${GEN_AI_API_VERSION:-}
+      - GEN_AI_LLM_PROVIDER_TYPE=${GEN_AI_LLM_PROVIDER_TYPE:-}
+      - GEN_AI_MAX_TOKENS=${GEN_AI_MAX_TOKENS:-}
+      - QA_TIMEOUT=${QA_TIMEOUT:-}
+      - MAX_CHUNKS_FED_TO_CHAT=${MAX_CHUNKS_FED_TO_CHAT:-}
+      - DISABLE_LLM_FILTER_EXTRACTION=${DISABLE_LLM_FILTER_EXTRACTION:-true}
+      - DISABLE_LLM_CHUNK_FILTER=${DISABLE_LLM_CHUNK_FILTER:-true}
+      - DISABLE_LLM_CHOOSE_SEARCH=${DISABLE_LLM_CHOOSE_SEARCH:-true}
+      - DISABLE_LLM_QUERY_REPHRASE=${DISABLE_LLM_QUERY_REPHRASE:-true}
+      - DISABLE_GENERATIVE_AI=${DISABLE_GENERATIVE_AI:-}
+      - GENERATIVE_MODEL_ACCESS_CHECK_FREQ=${GENERATIVE_MODEL_ACCESS_CHECK_FREQ:-}
+      - DISABLE_LITELLM_STREAMING=${DISABLE_LITELLM_STREAMING:-true}
+      - LITELLM_EXTRA_HEADERS=${LITELLM_EXTRA_HEADERS:-}
+      - BING_API_KEY=${BING_API_KEY:-}
+      # Query Options
+      - DOC_TIME_DECAY=${DOC_TIME_DECAY:-}  # Recency Bias for search results, decay at 1 / (1 + DOC_TIME_DECAY * x years)
+      - HYBRID_ALPHA=${HYBRID_ALPHA:-}  # Hybrid Search Alpha (0 for entirely keyword, 1 for entirely vector)
+      - EDIT_KEYWORD_QUERY=${EDIT_KEYWORD_QUERY:-}
+      - MULTILINGUAL_QUERY_EXPANSION=${MULTILINGUAL_QUERY_EXPANSION:-}
+      - LANGUAGE_HINT=${LANGUAGE_HINT:-}
+      - LANGUAGE_CHAT_NAMING_HINT=${LANGUAGE_CHAT_NAMING_HINT:-}
+      - QA_PROMPT_OVERRIDE=${QA_PROMPT_OVERRIDE:-}
+      # Other Services
+      - POSTGRES_HOST=relational_db
+      - POSTGRES_USER=${POSTGRES_USER:-}
+      - POSTGRES_PASSWORD=${POSTGRES_PASSWORD:-}
+      - POSTGRES_DB=${POSTGRES_DB:-}
+      - VESPA_HOST=index
+      - VESPA_PORT=${VESPA_PORT:-}
+      - VESPA_FEED_PORT=${VESPA_FEED_PORT:-}
+      - VESPA_FEED_HOST=${VESPA_FEED_HOST:-}
+      - WEB_DOMAIN=${WEB_DOMAIN:-}  # For frontend redirect auth purpose for OAuth2 connectors
+      # Don't change the NLP model configs unless you know what you're doing
+      - DOCUMENT_ENCODER_MODEL=${DOCUMENT_ENCODER_MODEL:-}
+      - DOC_EMBEDDING_DIM=${DOC_EMBEDDING_DIM:-}
+      - NORMALIZE_EMBEDDINGS=${NORMALIZE_EMBEDDINGS:-}
+      - ASYM_QUERY_PREFIX=${ASYM_QUERY_PREFIX:-}  # Needed by DanswerBot
+      - ASYM_PASSAGE_PREFIX=${ASYM_PASSAGE_PREFIX:-}
+      - MODEL_SERVER_HOST=${MODEL_SERVER_HOST:-inference_model_server}
+      - MODEL_SERVER_PORT=${MODEL_SERVER_PORT:-}
+      - INDEXING_MODEL_SERVER_HOST=${INDEXING_MODEL_SERVER_HOST:-indexing_model_server}
+      # Indexing Configs
+      - NUM_INDEXING_WORKERS=${NUM_INDEXING_WORKERS:-}
+      - ENABLED_CONNECTOR_TYPES=${ENABLED_CONNECTOR_TYPES:-}
+      - DISABLE_INDEX_UPDATE_ON_SWAP=${DISABLE_INDEX_UPDATE_ON_SWAP:-}
+      - DASK_JOB_CLIENT_ENABLED=${DASK_JOB_CLIENT_ENABLED:-}
+      - CONTINUE_ON_CONNECTOR_FAILURE=${CONTINUE_ON_CONNECTOR_FAILURE:-}
+      - EXPERIMENTAL_CHECKPOINTING_ENABLED=${EXPERIMENTAL_CHECKPOINTING_ENABLED:-}
+      - CONFLUENCE_CONNECTOR_LABELS_TO_SKIP=${CONFLUENCE_CONNECTOR_LABELS_TO_SKIP:-}
+      - JIRA_CONNECTOR_LABELS_TO_SKIP=${JIRA_CONNECTOR_LABELS_TO_SKIP:-}
+      - WEB_CONNECTOR_VALIDATE_URLS=${WEB_CONNECTOR_VALIDATE_URLS:-}
+      - JIRA_API_VERSION=${JIRA_API_VERSION:-}
+      - GONG_CONNECTOR_START_TIME=${GONG_CONNECTOR_START_TIME:-}
+      - NOTION_CONNECTOR_ENABLE_RECURSIVE_PAGE_LOOKUP=${NOTION_CONNECTOR_ENABLE_RECURSIVE_PAGE_LOOKUP:-}
+      - GITHUB_CONNECTOR_BASE_URL=${GITHUB_CONNECTOR_BASE_URL:-}
+      # Danswer SlackBot Configs
+      - DANSWER_BOT_SLACK_APP_TOKEN=${DANSWER_BOT_SLACK_APP_TOKEN:-}
+      - DANSWER_BOT_SLACK_BOT_TOKEN=${DANSWER_BOT_SLACK_BOT_TOKEN:-}
+      - DANSWER_BOT_DISABLE_DOCS_ONLY_ANSWER=${DANSWER_BOT_DISABLE_DOCS_ONLY_ANSWER:-}
+      - DANSWER_BOT_FEEDBACK_VISIBILITY=${DANSWER_BOT_FEEDBACK_VISIBILITY:-}
+      - DANSWER_BOT_DISPLAY_ERROR_MSGS=${DANSWER_BOT_DISPLAY_ERROR_MSGS:-}
+      - DANSWER_BOT_RESPOND_EVERY_CHANNEL=${DANSWER_BOT_RESPOND_EVERY_CHANNEL:-}
+      - DANSWER_BOT_DISABLE_COT=${DANSWER_BOT_DISABLE_COT:-}  # Currently unused
+      - NOTIFY_SLACKBOT_NO_ANSWER=${NOTIFY_SLACKBOT_NO_ANSWER:-}
+      - DANSWER_BOT_MAX_QPM=${DANSWER_BOT_MAX_QPM:-}
+      - DANSWER_BOT_MAX_WAIT_TIME=${DANSWER_BOT_MAX_WAIT_TIME:-}
+      # Logging
+      # Leave this on pretty please? Nothing sensitive is collected!
+      # https://docs.danswer.dev/more/telemetry
+      - DISABLE_TELEMETRY=${DISABLE_TELEMETRY:-true}
+      - LOG_LEVEL=${LOG_LEVEL:-debug}  # Set to debug to get more fine-grained logs
+      - LOG_ALL_MODEL_INTERACTIONS=${LOG_ALL_MODEL_INTERACTIONS:-true}  # Log all of the prompts to the LLM
+      - LOG_VESPA_TIMING_INFORMATION=${LOG_VESPA_TIMING_INFORMATION:-}
+
+      # Enterprise Edition stuff
+      - ENABLE_PAID_ENTERPRISE_EDITION_FEATURES=${ENABLE_PAID_ENTERPRISE_EDITION_FEATURES:-false}
+    extra_hosts:
+      - "host.docker.internal:host-gateway"
+    logging:
+      driver: json-file
+      options:
+        max-size: "50m"
+        max-file: "6"
+
+
+  web_server:
+    image: danswer/danswer-web-server:latest
+    build:
+      context: ../../web
+      dockerfile: Dockerfile
+      args:
+        - NEXT_PUBLIC_DISABLE_STREAMING=${NEXT_PUBLIC_DISABLE_STREAMING:-true}
+        - NEXT_PUBLIC_NEW_CHAT_DIRECTS_TO_SAME_PERSONA=${NEXT_PUBLIC_NEW_CHAT_DIRECTS_TO_SAME_PERSONA:-false}
+        - NEXT_PUBLIC_POSITIVE_PREDEFINED_FEEDBACK_OPTIONS=${NEXT_PUBLIC_POSITIVE_PREDEFINED_FEEDBACK_OPTIONS:-}
+        - NEXT_PUBLIC_NEGATIVE_PREDEFINED_FEEDBACK_OPTIONS=${NEXT_PUBLIC_NEGATIVE_PREDEFINED_FEEDBACK_OPTIONS:-}
+        - NEXT_PUBLIC_DISABLE_LOGOUT=${NEXT_PUBLIC_DISABLE_LOGOUT:-}
+
+        # Enterprise Edition only
+        - NEXT_PUBLIC_THEME=${NEXT_PUBLIC_THEME:-}
+        # DO NOT TURN ON unless you have EXPLICIT PERMISSION from Danswer.
+        - NEXT_PUBLIC_DO_NOT_USE_TOGGLE_OFF_DANSWER_POWERED=${NEXT_PUBLIC_DO_NOT_USE_TOGGLE_OFF_DANSWER_POWERED:-false}
+    depends_on:
+      - api_server
+    restart: always
+    environment:
+      - ENVIRONMENT=${ENVIRONMENT:-LOCAL}
+      - INTERNAL_URL=http://api_server:8080
+      - WEB_DOMAIN=${WEB_DOMAIN:-}
+      - THEME_IS_DARK=${THEME_IS_DARK:-}
+
+      # Enterprise Edition only
+      - ENABLE_PAID_ENTERPRISE_EDITION_FEATURES=${ENABLE_PAID_ENTERPRISE_EDITION_FEATURES:-false}
+
+
+  inference_model_server:
+    image: danswer/danswer-model-server:v0.4.28
+    build:
+      context: ../../backend
+      dockerfile: Dockerfile.model_server
+    command: >
+      /bin/sh -c "if [ \"${DISABLE_MODEL_SERVER:-false}\" = \"True\" ]; then
+        echo 'Skipping service...';
+        exit 0;
+      else
+        exec uvicorn model_server.main:app --host 0.0.0.0 --port 9000;
+      fi"
+    restart: on-failure
+    environment:
+      - ENVIRONMENT=${ENVIRONMENT:-LOCAL}
+      - MIN_THREADS_ML_MODELS=${MIN_THREADS_ML_MODELS:-}
+      # Set to debug to get more fine-grained logs
+      - LOG_LEVEL=${LOG_LEVEL:-info}
+    volumes:
+      # Not necessary, this is just to reduce download time during startup
+      - model_cache_huggingface:/root/.cache/huggingface/
+    logging:
+      driver: json-file
+      options:
+        max-size: "50m"
+        max-file: "6"
+
+
+  indexing_model_server:
+    image: danswer/danswer-model-server:latest
+    build:
+      context: ../../backend
+      dockerfile: Dockerfile.model_server
+    command: >
+      /bin/sh -c "if [ \"${DISABLE_MODEL_SERVER:-false}\" = \"True\" ]; then
+        echo 'Skipping service...';
+        exit 0;
+      else
+        exec uvicorn model_server.main:app --host 0.0.0.0 --port 9000;
+      fi"
+    restart: on-failure
+    environment:
+      - ENVIRONMENT=${ENVIRONMENT:-LOCAL}
+      - MIN_THREADS_ML_MODELS=${MIN_THREADS_ML_MODELS:-}
+      - INDEXING_ONLY=True
+      # Set to debug to get more fine-grained logs
+      - LOG_LEVEL=${LOG_LEVEL:-info}
+    volumes:
+      # Not necessary, this is just to reduce download time during startup
+      - model_cache_huggingface:/root/.cache/huggingface/
+    logging:
+      driver: json-file
+      options:
+        max-size: "50m"
+        max-file: "6"
+
+  relational_db:
+    image: postgres:15.2-alpine
+    restart: always
+    environment:
+      - ENVIRONMENT=${ENVIRONMENT:-LOCAL}
+      - POSTGRES_USER=${POSTGRES_USER:-postgres}
+      - POSTGRES_PASSWORD=${POSTGRES_PASSWORD:-password}
+    ports:
+      - "5432:5432"
+    volumes:
+      - db_volume:/var/lib/postgresql/data
+
+
+  # This container name cannot have an underscore in it due to Vespa expectations of the URL
+  # index:
+  #   image: vespaengine/vespa:8.277.17
+  #   restart: always
+  #   ports:
+  #     - "19071:19071"
+  #     - "8081:8081"
+  #   volumes:
+  #     - vespa_volume:/opt/vespa/var
+  #   logging:
+  #     driver: json-file
+  #     options:
+  #       max-size: "50m"
+  #       max-file: "6"
+
+
+  nginx:
+    image: nginx:1.23.4-alpine
+    restart: always
+    # nginx will immediately crash with `nginx: [emerg] host not found in upstream`
+    # if api_server / web_server are not up 
+    depends_on:
+      - api_server
+      - web_server
+    environment:
+      - ENVIRONMENT=${ENVIRONMENT:-LOCAL}
+      - DOMAIN=localhost
+    ports:
+      - "80:80"
+      - "3000:80"  # allow for localhost:3000 usage, since that is the norm
+    volumes:
+      - ../data/nginx:/etc/nginx/conf.d
+    logging:
+      driver: json-file
+      options:
+        max-size: "50m"
+        max-file: "6"
+    # the specified script waits for the api_server to start up. 
+    # Without this we've seen issues where nginx shows no error logs but 
+    # does not recieve any traffic
+    # NOTE: we have to use dos2unix to remove Carriage Return chars from the file
+    # in order to make this work on both Unix-like systems and windows
+    command: > 
+      /bin/sh -c "dos2unix /etc/nginx/conf.d/run-nginx.sh 
+      && /etc/nginx/conf.d/run-nginx.sh app.conf.template.dev"
+        
+
+volumes:
+  db_volume:
+  # vespa_volume:
+  # Created by the container itself
+  model_cache_huggingface: