Spaces:

jbilcke-hf
/

VideoChain-API

Paused

App Files Files Community

Julian Bilcke commited on Dec 8, 2023

Commit

5b3357c

1 Parent(s): 95bbb7f

working on adding turbo

Browse files

Files changed (4) hide show

.env +3 -0
src/production/renderImage.mts +11 -1
src/production/renderVideo.mts +3 -1
src/providers/image-generation/generateImageSDXLTurbo.mts +103 -0

.env CHANGED Viewed

@@ -31,6 +31,9 @@ VC_SDXL_SPACE_API_URL="https://jbilcke-hf-image-server.hf.space"
 #--------------------- LCM INFERENCE SERVERS ---------------------
 VC_LCM_SPACE_API_URL="https://jbilcke-hf-fast-image-server.hf.space"
 #----------------- ZEROSCOPE INFERENCE SERVERS -------------------
 VC_ZEROSCOPE_SPACE_API_URL_1="https://jbilcke-hf-zeroscope-server-1.hf.space"
 VC_ZEROSCOPE_SPACE_API_URL_2="https://jbilcke-hf-zeroscope-server-2.hf.space"

 #--------------------- LCM INFERENCE SERVERS ---------------------
 VC_LCM_SPACE_API_URL="https://jbilcke-hf-fast-image-server.hf.space"
+#--------------------- SDXL TURBO INFERENCE SERVERS ---------------------
+VC_SDXL_TURBO_SPACE_API_URL="https://jbilcke-hf-faster-image-server.hf.space"
 #----------------- ZEROSCOPE INFERENCE SERVERS -------------------
 VC_ZEROSCOPE_SPACE_API_URL_1="https://jbilcke-hf-zeroscope-server-1.hf.space"
 VC_ZEROSCOPE_SPACE_API_URL_2="https://jbilcke-hf-zeroscope-server-2.hf.space"

src/production/renderImage.mts CHANGED Viewed

@@ -1,4 +1,5 @@
 import { generateImageLCMAsBase64 } from "../providers/image-generation/generateImageLCMGradio.mts"
 import { generateImageSDXLAsBase64 } from "../providers/image-generation/generateImageSDXLGradio.mts"
 import { generateImageSDXL360AsBase64 } from "../providers/image-generation/generateImageSDXL360.mts"
 import { RenderedScene, RenderRequest } from "../types.mts"
@@ -10,10 +11,19 @@ export async function renderImage(
   const isSpherical = request.projection === 'spherical'
   const generateImageAsBase64 = isSpherical
     ? generateImageSDXL360AsBase64
     : request.turbo
-    ? generateImageLCMAsBase64
     : generateImageSDXLAsBase64
   // console.log(`going to generate an image using ${request.projection || "default (cartesian)"} projection`)

 import { generateImageLCMAsBase64 } from "../providers/image-generation/generateImageLCMGradio.mts"
+import { generateImageSDXLTurboAsBase64 } from "../providers/image-generation/generateImageSDXLTurbo.mts"
 import { generateImageSDXLAsBase64 } from "../providers/image-generation/generateImageSDXLGradio.mts"
 import { generateImageSDXL360AsBase64 } from "../providers/image-generation/generateImageSDXL360.mts"
 import { RenderedScene, RenderRequest } from "../types.mts"
   const isSpherical = request.projection === 'spherical'
+  // we don't want to switch too much between model types in VideoChain,
+  // because for speed we need to pre-load the servers,
+  // but there is no point in pre-loading many servers for many models
   const generateImageAsBase64 = isSpherical
     ? generateImageSDXL360AsBase64
     : request.turbo
+    // turbo models are models that are slightly less beautiful
+    // but much, much faster to run
+    // for the moment we use SDXL + LCM, as it offers better scene coherence,
+    // but we might switch to SDXL Turbo in the future if its quality improves
+    ? generateImageLCMAsBase64 // generateImageSDXLTurboAsBase64
     : generateImageSDXLAsBase64
   // console.log(`going to generate an image using ${request.projection || "default (cartesian)"} projection`)

src/production/renderVideo.mts CHANGED Viewed

@@ -1,5 +1,7 @@
 import { RenderedScene, RenderRequest } from "../types.mts"
-import { generateVideo } from "../providers/video-generation/generateVideoWithZeroscope.mts"
 export async function renderVideo(
   request: RenderRequest,

 import { RenderedScene, RenderRequest } from "../types.mts"
+// import { generateVideo } from "../providers/video-generation/generateVideoWithZeroscope.mts"
+import { generateVideo } from "../providers/video-generation/generateVideoWithHotshotGradioAPI.mts"
 export async function renderVideo(
   request: RenderRequest,

src/providers/image-generation/generateImageSDXLTurbo.mts ADDED Viewed

	@@ -0,0 +1,103 @@

+import { client } from "@gradio/client"
+import { generateSeed } from "../../utils/misc/generateSeed.mts"
+import { getValidNumber } from "../../utils/validators/getValidNumber.mts"
+import { convertToWebp } from "../../utils/image/convertToWebp.mts"
+const instance = `${process.env.VC_SDXL_TURBO_SPACE_API_URL || ""}`
+const secretToken = `${process.env.VC_MICROSERVICE_SECRET_TOKEN || ""}`
+// console.log("DEBUG:", JSON.stringify({ instances, secretToken }, null, 2))
+export async function generateImageSDXLTurboAsBase64(options: {
+  positivePrompt: string;
+  negativePrompt?: string;
+  seed?: number;
+  width?: number;
+  height?: number;
+  nbSteps?: number;
+}): Promise<string> {
+  // console.log("querying " + instance)
+  const positivePrompt = options?.positivePrompt || ""
+  if (!positivePrompt) {
+    throw new Error("missing prompt")
+  }
+  // the negative prompt CAN be missing, since we use a trick
+  // where we make the interface mandatory in the TS doc,
+  // but browsers might send something partial
+  const negativePrompt = options?.negativePrompt || ""
+  // we treat 0 as meaning "random seed"
+  const seed = (options?.seed ? options.seed : 0) || generateSeed()
+  const maxRequestedResolution = 1024
+  const maxModelResolution = 512
+  const requestedWidth = getValidNumber(options?.width, 256, maxRequestedResolution, maxModelResolution)
+  const requestedHeight = getValidNumber(options?.height, 256, maxRequestedResolution, maxModelResolution)
+  // we try to preserve the original image ratio
+  const ratioH = requestedHeight / requestedWidth
+  const ratioW = requestedWidth / requestedHeight
+  // we always try to ccrank the resolution to the max
+  let width = ratioW < 1 ? Math.round(ratioW * maxModelResolution) : maxModelResolution
+  let height = ratioH < 1 ? Math.round(ratioH * maxModelResolution) : maxModelResolution
+  const positive = [
+    // oh well.. is it too late to move this to the bottom?
+    "beautiful",
+    // too opinionated, so let's remove it
+    // "intricate details",
+    positivePrompt,
+    "award winning",
+    "high resolution"
+  ].filter(word => word)
+  .join(", ")
+  const negative =  [
+    negativePrompt,
+    "watermark",
+    "copyright",
+    "blurry",
+    // "artificial",
+    // "cropped",
+    "low quality",
+    "ugly"
+  ].filter(word => word)
+  .join(", ")
+  const api = await client(instance, {
+    hf_token: `${process.env.VC_HF_API_TOKEN}` as any
+  })
+  const rawResponse = (await api.predict("/run", [
+    positive, // string  in 'Prompt' Textbox component
+    negative, // string  in 'Negative prompt' Textbox component
+    seed, // number (numeric value between 0 and 2147483647) in 'Seed' Slider component
+    width, // number (numeric value between 256 and 1024) in 'Width' Slider component
+    height, // number (numeric value between 256 and 1024) in 'Height' Slider component
+    secretToken
+  ])) as any
+  const result = rawResponse?.data?.[0] as string
+  if (!result?.length) {
+    throw new Error(`the returned image was empty`)
+  }
+  try {
+    const finalImage = await convertToWebp(result)
+    return finalImage
+  } catch (err) {
+    // console.log("err:", err)
+    throw new Error(err)
+  }
+}