server: /v1/responses (text generation only) #18227

openingnow · 2025-12-20T14:47:52Z

This PR introduces minimally working openAI-compatible /v1/responses API by converting /v1/responses request into /v1/chat/completions request.

Only text generation is supported and several fields such as IDs (of response and messages) are omitted.

If this appears too unfinished for a merge at this stage, please let me know and I'll convert it to a draft.

ngxson

please also add a test with openai python library to prove that this is openai-compat.

see tools/server/tests/unit/test_chat_completion.py

tools/server/server-context.cpp

tools/server/server.cpp

wqerrewetw · 2025-12-20T23:27:26Z

#14702

pwilkin · 2025-12-20T23:38:55Z

@openingnow

If this appears too unfinished for a merge at this stage, please let me know and I'll convert it to a draft.

Actually, I think this is a very good approach - let's start with a minimal implementation that will permit Codex to work properly with Llama.cpp and we can add more complexities later.

openingnow requested review from ggerganov and ngxson as code owners December 20, 2025 14:47

github-actions bot added examples server labels Dec 20, 2025

server: Implement /v1/responses (text generation only)

10c38c1

openingnow force-pushed the master branch from b1291eb to 10c38c1 Compare December 20, 2025 14:52

ngxson reviewed Dec 20, 2025

View reviewed changes

tools/server/server-context.cpp Outdated Show resolved Hide resolved

ngxson reviewed Dec 20, 2025

View reviewed changes

tools/server/server.cpp Show resolved Hide resolved

loci-dev mentioned this pull request Dec 20, 2025

UPSTREAM PR #18227: server: /v1/responses (text generation only) auroralabs-loci/llama.cpp#639

Open

openingnow and others added 5 commits December 21, 2025 09:25

Merge branch 'ggml-org:master' into master

41515b7

Use format_oai_resp_sse(array)

91e39c2

Register handlers

a49cbc8

Also convert max_output_tokens field

3b16dac

Add tests to check /v1/responses

4244093

openingnow requested a review from CISC as a code owner December 21, 2025 04:22

github-actions bot added the python python script changes label Dec 21, 2025

openingnow and others added 2 commits December 21, 2025 14:04

Merge branch 'ggml-org:master' into master

cddf872

catch up origin/master

07a43f8

openingnow marked this pull request as draft December 21, 2025 06:35

openingnow force-pushed the master branch from e1f7007 to 07a43f8 Compare December 21, 2025 06:40

openingnow added 2 commits December 21, 2025 12:08

Try to satisfy pyright

18cad94

Temporarily remove openai dependency from requirements-tool_bench

feb8253

openingnow force-pushed the master branch from 4fd4698 to feb8253 Compare December 21, 2025 12:10

openingnow and others added 3 commits December 21, 2025 12:20

remove openai import

5e97d1d

Merge branch 'ggml-org:master' into master

24f0761

introduce bumped openai requirements

0680e80

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

server: /v1/responses (text generation only) #18227

server: /v1/responses (text generation only) #18227

openingnow commented Dec 20, 2025

Uh oh!

ngxson left a comment

Uh oh!

Uh oh!

Uh oh!

wqerrewetw commented Dec 20, 2025

Uh oh!

pwilkin commented Dec 20, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

server: /v1/responses (text generation only) #18227

Are you sure you want to change the base?

server: /v1/responses (text generation only) #18227

Conversation

openingnow commented Dec 20, 2025

Uh oh!

ngxson left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

wqerrewetw commented Dec 20, 2025

Uh oh!

pwilkin commented Dec 20, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants