jaworldwideorg
diff --git a/‎packages/model-runtime/src/core/RouterRuntime/createRuntime.ts‎
Lines changed: 0 additions & 1 deletion b/‎packages/model-runtime/src/core/RouterRuntime/createRuntime.ts‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎packages/model-runtime/src/core/streams/protocol.ts‎
Lines changed: 12 additions & 12 deletions b/‎packages/model-runtime/src/core/streams/protocol.ts‎
Lines changed: 12 additions & 12 deletions
diff --git a/‎packages/model-runtime/src/utils/usageConverter.test.ts‎
Lines changed: 0 additions & 351 deletions b/‎packages/model-runtime/src/utils/usageConverter.test.ts‎
Lines changed: 0 additions & 351 deletions
@@ -181,7 +181,6 @@ export const createRouterRuntime = ({
       for (const runtimeItem of runtimes) {
         const models = runtimeItem.models || [];
         if (models.includes(model)) {
-          console.log(`get runtime ${runtimeItem.id} ${model}`);
           return runtimeItem.runtime;
         }
       }
 
@@ -408,22 +408,22 @@ export const createTokenSpeedCalculator = (
     }
     // if the chunk is the stop chunk, set as output finish
     if (inputStartAt && outputStartAt && chunk.type === 'usage') {
-      const totalOutputTokens =
-        chunk.data?.totalOutputTokens ??
-        (chunk.data?.outputTextTokens ?? 0) + (chunk.data?.outputImageTokens ?? 0);
-      const reasoningTokens = chunk.data?.outputReasoningTokens ?? 0;
-      const outputTokens =
-        (outputThinking ?? false)
-          ? totalOutputTokens
-          : Math.max(0, totalOutputTokens - reasoningTokens);
+      // TPS should always include all generated tokens (including reasoning tokens)
+      // because it measures generation speed, not just visible content
+      const outputTokens = chunk.data?.totalOutputTokens ?? 0;
       const now = Date.now();
       const elapsed = now - (enableStreaming ? outputStartAt : inputStartAt);
+      const duration = now - outputStartAt;
+      const latency = now - inputStartAt;
+      const ttft = outputStartAt - inputStartAt;
+      const tps = elapsed === 0 ? undefined : (outputTokens / elapsed) * 1000;
+
       result.push({
         data: {
-          duration: now - outputStartAt,
-          latency: now - inputStartAt,
-          tps: elapsed === 0 ? undefined : (outputTokens / elapsed) * 1000,
-          ttft: outputStartAt - inputStartAt,
+          duration,
+          latency,
+          tps,
+          ttft,
         } as ModelSpeed,
         id: TOKEN_SPEED_CHUNK_ID,
         type: 'speed',
Original file line number	Diff line number	Diff line change
`@@ -181,7 +181,6 @@ export const createRouterRuntime = ({`
`181`	`181`	`for (const runtimeItem of runtimes) {`
`182`	`182`	`const models = runtimeItem.models \|\| [];`
`183`	`183`	`if (models.includes(model)) {`
`184`		- console.log(`get runtime ${runtimeItem.id} ${model}`);
`185`	`184`	`return runtimeItem.runtime;`
`186`	`185`	`}`
`187`	`186`	`}`