gpu-mode · msaroufim · Feb 26, 2026 · Feb 26, 2026
diff --git a/pyproject.toml b/pyproject.toml
@@ -23,6 +23,7 @@ dependencies = [
     "fastapi[all]",
     "uvicorn",
     "jinja2",
+    "openai",
 ]
 
 [project.optional-dependencies]

diff --git a/src/kernelbot/api/main.py b/src/kernelbot/api/main.py
@@ -11,6 +11,7 @@
 from fastapi.responses import JSONResponse, StreamingResponse
 
 from kernelbot.env import env
+from libkernelbot.ai_generate import generate_kernel
 from libkernelbot.backend import KernelBackend
 from libkernelbot.background_submission_manager import BackgroundSubmissionManager
 from libkernelbot.consts import SubmissionMode
@@ -444,6 +445,99 @@ async def enqueue_background_job(
     return sub_id, job_id
 
 
+@app.post("/ai/{leaderboard_name}/{gpu_type}/{submission_mode}")
+async def run_ai_submission(
+    leaderboard_name: str,
+    gpu_type: str,
+    submission_mode: str,
+    payload: dict,
+    user_info: Annotated[dict, Depends(validate_user_header)],
+    db_context=Depends(get_db),
+) -> Any:
+    """Generate kernel code from a prompt using AI, then submit it for evaluation.
+
+    Requires a valid X-Popcorn-Cli-Id or X-Web-Auth-Id header.
+
+    Args:
+        leaderboard_name: The leaderboard to submit to.
+        gpu_type: The GPU type to run on.
+        submission_mode: The submission mode (test, benchmark, etc.).
+        payload: JSON body with a "prompt" field.
+    """
+    try:
+        await simple_rate_limit()
+
+        prompt = payload.get("prompt")
+        if not prompt or not isinstance(prompt, str):
+            raise HTTPException(status_code=400, detail="Missing or invalid 'prompt' in request body")
+        if len(prompt) > 10000:
+            raise HTTPException(status_code=400, detail="Prompt too long (max 10000 characters)")
+
+        try:
+            submission_mode_enum = SubmissionMode(submission_mode.lower())
+        except ValueError:
+            raise HTTPException(
+                status_code=400, detail=f"Invalid submission mode: '{submission_mode}'"
+            ) from None
+
+        # Fetch leaderboard info, templates, and validate GPU
+        with db_context as db:
+            leaderboard_item = db.get_leaderboard(leaderboard_name)
+            gpus = leaderboard_item.get("gpu_types", [])
+            if gpu_type not in gpus:
+                supported = ", ".join(gpus) if gpus else "None"
+                raise HTTPException(
+                    status_code=400,
+                    detail=f"GPU '{gpu_type}' not supported. Supported: {supported}",
+                )
+            templates = db.get_leaderboard_templates(leaderboard_name)
+
+        task = leaderboard_item["task"]
+        description = leaderboard_item.get("description", "")
+
+        # Generate code via AI
+        try:
+            code, file_name = await generate_kernel(prompt, task, description, templates)
+        except Exception as e:
+            logger.error(f"AI generation failed: {e}")
+            raise HTTPException(status_code=502, detail=f"AI code generation failed: {e}") from e
+
+        # Build submission request and enqueue
+        submission_request = SubmissionRequest(
+            code=code,
+            file_name=file_name,
+            user_id=user_info["user_id"],
+            user_name=user_info["user_name"],
+            gpus=[gpu_type],
+            leaderboard=leaderboard_name,
+        )
+
+        req = prepare_submission(submission_request, backend_instance)
+        if not req.gpus or len(req.gpus) != 1:
+            raise HTTPException(status_code=400, detail="Invalid GPU type")
+
+        sub_id, job_status_id = await enqueue_background_job(
+            req, submission_mode_enum, backend_instance, background_submission_manager
+        )
+
+        return JSONResponse(
+            status_code=202,
+            content={
+                "status": "accepted",
+                "details": {"id": sub_id, "job_status_id": job_status_id},
+                "generated_code": code,
+            },
+        )
+
+    except HTTPException:
+        raise
+    except KernelBotError as e:
+        raise HTTPException(status_code=getattr(e, "http_code", 400), detail=str(e)) from e
+    except Exception as e:
+        logger.error(f"Unexpected error in AI submission: {e}")
+        raise HTTPException(status_code=500, detail="Internal server error") from e
+
+
 @app.post("/submission/{leaderboard_name}/{gpu_type}/{submission_mode}")
 async def run_submission_async(
     leaderboard_name: str,

diff --git a/src/kernelbot/env.py b/src/kernelbot/env.py
@@ -40,6 +40,9 @@
 env.DATABASE_URL = os.getenv("DATABASE_URL")
 env.DISABLE_SSL = os.getenv("DISABLE_SSL")
 
+# OpenAI API key for AI kernel generation
+env.OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
+
 
 def init_environment(skip_discord: bool = False):
     """Validate required environment variables."""

diff --git a/src/libkernelbot/ai_generate.py b/src/libkernelbot/ai_generate.py
@@ -0,0 +1,71 @@
+import re
+
+from openai import AsyncOpenAI
+
+from libkernelbot.consts import Language
+from libkernelbot.task import LeaderboardTask
+from libkernelbot.utils import setup_logging
+
+logger = setup_logging(__name__)
+
+
+async def generate_kernel(
+    prompt: str,
+    task: LeaderboardTask,
+    description: str,
+    templates: dict[str, str],
+) -> tuple[str, str]:
+    """Generate kernel code from a natural language prompt using OpenAI.
+
+    Args:
+        prompt: The user's natural language description of the kernel to generate.
+        task: The LeaderboardTask containing file signatures, tests, and config.
+        description: The leaderboard's problem description.
+        templates: Template/starter code files keyed by language name.
+
+    Returns:
+        A tuple of (generated_code, file_name).
+    """
+    # Build context from the task
+    system_parts = [
+        "You are an expert GPU kernel programmer. Generate code that solves the given problem.",
+        "Return ONLY the code inside a single code block. No explanation outside the code block.",
+    ]
+
+    if description:
+        system_parts.append(f"## Problem Description\n{description}")
+
+    # Include template code so the AI knows the expected function signatures
+    if templates:
+        for lang, code in templates.items():
+            system_parts.append(f"## Template ({lang})\n```\n{code}\n```")
+
+    # Include reference/test files for additional context (skip submission placeholder)
+    for name, content in task.files.items():
+        if content != "@SUBMISSION@":
+            system_parts.append(f"## Reference file: {name}\n```\n{content}\n```")
+
+    # Include test specs so the AI knows input sizes / shapes
+    if task.tests:
+        system_parts.append(f"## Test cases\n{task.tests}")
+
+    system_prompt = "\n\n".join(system_parts)
+
+    client = AsyncOpenAI()
+    response = await client.chat.completions.create(
+        model="o3",
+        max_completion_tokens=4096,
+        messages=[
+            {"role": "system", "content": system_prompt},
+            {"role": "user", "content": prompt},
+        ],
+    )
+
+    raw = response.choices[0].message.content
+
+    # Extract code from a fenced code block if present
+    match = re.search(r"```(?:\w+)?\n(.*?)```", raw, re.DOTALL)
+    code = match.group(1).strip() if match else raw.strip()
+
+    file_name = "submission.py" if task.lang == Language.Python else "submission.cu"
+    return code, file_name