Add firefunction-v2 to the leaderboard (#470)

pgarbacki · web-flow · commit 2f39693df986 · 2024-06-19T01:13:31.000-07:00
This PR adds firefunction-v2 to the leaderboard. It also updates the
fireworks handler making sure that the parameters and prompt are set
correctly.
diff --git a/berkeley-function-call-leaderboard/README.md b/berkeley-function-call-leaderboard/README.md
@@ -196,7 +196,7 @@ Below is *a table of models we support* to run our leaderboard evaluation agains
 |command-r-plus | Prompt|
 |databrick-dbrx-instruct | Prompt|
 |deepseek-ai/deepseek-coder-6.7b-instruct 💻| Prompt|
-|fire-function-v1-FC | Function Calling|
+|firefunction-{v1,v2}-FC | Function Calling|
 |gemini-1.0-pro | Function Calling|
 |gemini-1.5-pro-preview-{0409,0514} | Function Calling|
 |gemini-1.5-flash-preview-0514 | Function Calling|
diff --git a/berkeley-function-call-leaderboard/eval_checker/eval_runner_helper.py b/berkeley-function-call-leaderboard/eval_checker/eval_runner_helper.py
@@ -236,12 +236,18 @@
         "Nexusflow",
         "Apache 2.0",
     ],
-    "fire-function-v1-FC": [
+    "firefunction-v1-FC": [
         "FireFunction-v1 (FC)",
         "https://huggingface.co/fireworks-ai/firefunction-v1",
         "Fireworks",
         "Apache 2.0",
     ],
+    "firefunction-v2-FC": [
+        "FireFunction-v2 (FC)",
+        "https://huggingface.co/fireworks-ai/firefunction-v2",
+        "Fireworks",
+        "Apache 2.0",
+    ],
     "gemini-1.5-pro-preview-0514": [
         "Gemini-1.5-Pro-Preview-0514 (FC)",
         "https://deepmind.google/technologies/gemini/pro/",
@@ -349,7 +355,7 @@
         "https://huggingface.co/Snowflake/snowflake-arctic-instruct",
         "Snowflake",
         "apache-2.0",
-    ]
+    ],
 }
 
 INPUT_PRICE_PER_MILLION_TOKEN = {
@@ -445,7 +451,8 @@
 
 NO_COST_MODELS = [
     "Nexusflow-Raven-v2",
-    "fire-function-v1-FC",
+    "firefunction-v1-FC",
+    "firefunction-v2-FC",
     "meetkai/functionary-medium-v2.4-FC",
     "meetkai/functionary-small-v2.2-FC",
     "meetkai/functionary-small-v2.4-FC",
diff --git a/berkeley-function-call-leaderboard/model_handler/firework_ai_handler.py b/berkeley-function-call-leaderboard/model_handler/firework_ai_handler.py
@@ -1,14 +1,19 @@
+import json
+import os
+import time
+
+from model_handler.constant import GORILLA_TO_OPENAPI
 from model_handler.gpt_handler import OpenAIHandler
 from model_handler.model_style import ModelStyle
-import os, json
+from model_handler.utils import convert_to_tool, language_specific_pre_processing
 from openai import OpenAI
 
 
 class FireworkAIHandler(OpenAIHandler):
-    def __init__(self, model_name, temperature=0.7, top_p=1, max_tokens=1000) -> None:
+    def __init__(self, model_name, temperature=0.0, top_p=1, max_tokens=1000) -> None:
         super().__init__(model_name, temperature, top_p, max_tokens)
-        self.model_name = "accounts/fireworks/models/firefunction-v1-FC"
         self.model_style = ModelStyle.FIREWORK_AI
+        self.temperature = 0.0
 
         self.client = OpenAI(
             base_url="https://api.fireworks.ai/inference/v1",
@@ -19,11 +24,54 @@ def write(self, result, file_to_open):
         # This method is used to write the result to the file.
         if not os.path.exists("./result"):
             os.mkdir("./result")
-        if not os.path.exists("./result/fire-function-v1-FC"):
-            os.mkdir("./result/fire-function-v1-FC")
+        if not os.path.exists(f"./result/{self.model_name}"):
+            os.mkdir(f"./result/{self.model_name}")
         with open(
-            "./result/fire-function-v1-FC/"
+            f"./result/{self.model_name}/"
             + file_to_open.replace(".json", "_result.json"),
             "a+",
         ) as f:
             f.write(json.dumps(result) + "\n")
+
+    def inference(self, prompt, functions, test_category):
+        functions = language_specific_pre_processing(functions, test_category, True)
+        if type(functions) is not list:
+            functions = [functions]
+        message = [{"role": "user", "content": prompt}]
+        oai_tool = convert_to_tool(
+            functions, GORILLA_TO_OPENAPI, self.model_style, test_category, True
+        )
+        start_time = time.time()
+        model_name = self.model_name.replace("-FC", "")
+        model_name = f"accounts/fireworks/models/{model_name}"
+        if len(oai_tool) > 0:
+            response = self.client.chat.completions.create(
+                messages=message,
+                model=model_name,
+                temperature=self.temperature,
+                max_tokens=self.max_tokens,
+                top_p=self.top_p,
+                tools=oai_tool,
+                frequency_penalty=0.4,
+            )
+        else:
+            response = self.client.chat.completions.create(
+                messages=message,
+                model=model_name,
+                temperature=self.temperature,
+                max_tokens=self.max_tokens,
+                top_p=self.top_p,
+            )
+        latency = time.time() - start_time
+        try:
+            result = [
+                {func_call.function.name: func_call.function.arguments}
+                for func_call in response.choices[0].message.tool_calls
+            ]
+        except:
+            result = response.choices[0].message.content
+        metadata = {}
+        metadata["input_tokens"] = response.usage.prompt_tokens
+        metadata["output_tokens"] = response.usage.completion_tokens
+        metadata["latency"] = latency
+        return result, metadata
diff --git a/berkeley-function-call-leaderboard/model_handler/handler_map.py b/berkeley-function-call-leaderboard/model_handler/handler_map.py
@@ -1,5 +1,7 @@
+from model_handler.arctic_handler import ArcticHandler
 from model_handler.claude_fc_handler import ClaudeFCHandler
 from model_handler.claude_prompt_handler import ClaudePromptingHandler
+from model_handler.cohere_handler import CohereHandler
 from model_handler.databricks_handler import DatabricksHandler
 from model_handler.deepseek_handler import DeepseekHandler
 from model_handler.firework_ai_handler import FireworkAIHandler
@@ -14,8 +16,6 @@
 from model_handler.mistral_handler import MistralHandler
 from model_handler.nexus_handler import NexusHandler
 from model_handler.oss_handler import OSSHandler
-from model_handler.cohere_handler import CohereHandler
-from model_handler.arctic_handler import ArcticHandler
 
 handler_map = {
     "gorilla-openfunctions-v0": GorillaHandler,
@@ -48,7 +48,8 @@
     "mistral-small-2402-FC-Any": MistralHandler,
     "mistral-small-2402-FC-Auto": MistralHandler,
     "mistral-tiny-2312": MistralHandler,
-    "fire-function-v1-FC": FireworkAIHandler,
+    "firefunction-v1-FC": FireworkAIHandler,
+    "firefunction-v2-FC": FireworkAIHandler,
     "Nexusflow-Raven-v2": NexusHandler,
     "gemini-1.0-pro": GeminiHandler,
     "gemini-1.5-pro-preview-0409": GeminiHandler,