From f729c0742a0403bbd7da6c05fca8dac78632b540 Mon Sep 17 00:00:00 2001
From: "Myan V." <myanvoos@gmail.com>
Date: Fri, 25 Jul 2025 00:36:55 +1200
Subject: [PATCH 1/7] Add agent subsection parsing

---
 report/parse_logs.py                | 116 +++++++++++++++++------
 report/templates/sample/sample.html | 139 ++++++++++++++++++++++++++--
 2 files changed, 221 insertions(+), 34 deletions(-)

diff --git a/report/parse_logs.py b/report/parse_logs.py
index 60104bca1..df9537900 100644
--- a/report/parse_logs.py
+++ b/report/parse_logs.py
@@ -35,6 +35,64 @@ class LogsParser:
   def __init__(self, logs: list[LogPart]):
     self._logs = logs
 
+  def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
+    """Parse steps from agent logs, grouping by step number."""
+    step_pattern = re.compile(r"Step #(\d+) - \"(.+?)\":")
+    simple_step_pattern = re.compile(r"Step #(\d+)")
+
+    steps_dict = {}
+    current_step_number = None
+    current_step_name = None
+
+    for log_part in agent_logs:
+      content = log_part.content.strip()
+      if not content:
+        continue
+
+      lines = content.split('\n')
+
+      step_header_found = False
+      for line in lines:
+        step_match = step_pattern.search(line)
+        if not step_match:
+          simple_match = simple_step_pattern.search(line)
+          if simple_match:
+            step_match = simple_match
+
+        if step_match:
+          step_header_found = True
+          current_step_number = step_match.group(1)
+          if len(step_match.groups()) > 1:
+            current_step_name = step_match.group(2).strip()
+          else:
+            current_step_name = "agent-step"
+
+          if current_step_number not in steps_dict:
+            steps_dict[current_step_number] = {
+                'number': current_step_number,
+                'name': current_step_name,
+                'type': 'Step',
+                'log_parts': []
+            }
+          break
+
+      if not step_header_found and current_step_number:
+        steps_dict[current_step_number]['log_parts'].append(log_part)
+      elif not step_header_found and not current_step_number and not steps_dict:
+        steps_dict['0'] = {
+            'number': None,
+            'name': None,
+            'type': 'Content',
+            'log_parts': [log_part]
+        }
+
+    steps = []
+    for step_num in sorted(steps_dict.keys(),
+                           key=lambda x: int(x) if x.isdigit() else 999):
+      steps.append(steps_dict[step_num])
+
+    return steps
+
   def get_agent_sections(self) -> dict[str, list[LogPart]]:
     """Get the agent sections from the logs."""
 
@@ -91,16 +149,22 @@ def get_agent_cycles(self) -> list[dict]:
     cycles_dict = {}
 
     for agent_name, agent_logs in agent_sections.items():
+      # Parse steps for this agent
+      steps = self._parse_steps_from_logs(agent_logs)
+
       cycle_match = re.search(r'\(Cycle (\d+)\)', agent_name)
       if cycle_match:
         cycle_number = int(cycle_match.group(1))
         if cycle_number not in cycles_dict:
           cycles_dict[cycle_number] = {}
-        cycles_dict[cycle_number][agent_name] = agent_logs
+        cycles_dict[cycle_number][agent_name] = {
+            'logs': agent_logs,
+            'steps': steps
+        }
       else:
         if 0 not in cycles_dict:
           cycles_dict[0] = {}
-        cycles_dict[0][agent_name] = agent_logs
+        cycles_dict[0][agent_name] = {'logs': agent_logs, 'steps': steps}
 
     return [cycles_dict[cycle] for cycle in sorted(cycles_dict.keys())]
 
@@ -178,30 +242,30 @@ def get_formatted_stack_traces(self,
 
         function_name = in_match.group(1)
         path = in_match.group(2)
-        if '/src/' in path and 'llvm-project' not in path and self._benchmark_id and self._sample_id:
-          path_parts = path.split(':')
-          file_path = path_parts[0]  # Just the file path without line numbers
-          line_number = path_parts[1] if len(path_parts) > 1 else None
-
-          relative_path = file_path.lstrip('/')
-
-          # If coverage_report_path is set, it's a local run
-          # Otherwise it's cloud
-          if self._coverage_report_path:
-            url = f'{self._coverage_report_path}{relative_path}.html'
-            url_with_line_number = f'{url}#L{line_number}' if line_number else url
-          else:
-            url = (
-                f'{base_url}/results/{self._benchmark_id}/code-coverage-reports/'
-                f'{self._sample_id}.fuzz_target/report/linux/'
-                f'{relative_path}.html')
-            url_with_line_number = f'{url}#L{line_number}' if line_number else url
-          stack_traces[frame_num] = {
-              "url": url_with_line_number,
-              "path": path,
-              "function": function_name,
-              "memory_address": memory_addr
-          }
+        if '/src/' in path and 'llvm-project' not in path:
+          if self._benchmark_id and self._sample_id:
+            path_parts = path.split(':')
+            file_path = path_parts[0]
+            line_number = path_parts[1] if len(path_parts) > 1 else None
+
+            relative_path = file_path.lstrip('/')
+
+            # If coverage_report_path is set, it's a local run
+            # Otherwise it's cloud
+            if self._coverage_report_path:
+              url = f'{self._coverage_report_path}{relative_path}.html'
+              url_line_number = f'{url}#L{line_number}' if line_number else url
+            else:
+              url = (f'{base_url}/results/{self._benchmark_id}/'
+                     f'code-coverage-reports/{self._sample_id}.fuzz_target/'
+                     f'report/linux/{relative_path}.html')
+              url_line_number = f'{url}#L{line_number}' if line_number else url
+            stack_traces[frame_num] = {
+                "url": url_line_number,
+                "path": path,
+                "function": function_name,
+                "memory_address": memory_addr
+            }
 
     return stack_traces
 
diff --git a/report/templates/sample/sample.html b/report/templates/sample/sample.html
index 67f10c909..ce9c62c59 100644
--- a/report/templates/sample/sample.html
+++ b/report/templates/sample/sample.html
@@ -283,7 +283,7 @@ <h3>Build Script</h3>
                 {% for cycle_data in agent_cycles %}
                   {% if 'standalone' in cycle_data %}
                     <!-- Standalone agents -->
-                    {% for agent_name, agent_logs in cycle_data.standalone.items() %}
+                    {% for agent_name, agent_data in cycle_data.standalone.items() %}
                       <div x-data="{ open: false }" class="border rounded-lg mb-4 agent-section">
                         <button @click="open = !open" class="w-full p-4 flex justify-between items-center text-left rounded-t-lg">
                           <span class="font-medium">{{ agent_name }}</span>
@@ -292,9 +292,28 @@ <h3>Build Script</h3>
                           </svg>
                         </button>
                         <div x-show="open" class="border-t">
-                          {% for log_part in agent_logs %}
-                            <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
-                          {% endfor %}
+                          {% if agent_data.steps %}
+                            {% for step in agent_data.steps %}
+                              <div x-data="{ stepOpen: false }" class="border-b last:border-b-0">
+                                <button @click="stepOpen = !stepOpen" class="w-full p-3 flex justify-between items-center text-left">
+                                  <span class="font-medium">
+                                    {% if step.number %}Step {{ step.number }}{% else %}Content{% endif %}
+                                    <span class="text-gray-500 ml-2">({{ step.type }})</span>
+                                  </span>
+                                  <svg class="w-3 h-3" :class="{'rotate-180': stepOpen}" fill="none" stroke="currentColor" viewBox="0 0 24 24">
+                                    <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M19 9l-7 7-7-7"></path>
+                                  </svg>
+                                </button>
+                                <div x-show="stepOpen" class="px-3 pb-3">
+                                  <pre class="{% if step.chat_prompt %}chat_prompt {% elif step.chat_response %}chat_response {% endif %} p-3 rounded-md  whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                </div>
+                              </div>
+                            {% endfor %}
+                          {% else %}
+                            {% for log_part in agent_data.logs %}
+                              <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                            {% endfor %}
+                          {% endif %}
                         </div>
                       </div>
                     {% endfor %}
@@ -314,7 +333,7 @@ <h3>Build Script</h3>
                       <div class="mb-2 font-medium">
                         Cycle {{ loop.index }}
                       </div>
-                      {% for agent_name, agent_logs in cycle_data.items() %}
+                      {% for agent_name, agent_data in cycle_data.items() %}
                         <div x-data="{ open: false }" class="border rounded-lg mb-4 agent-section">
                           <button @click="open = !open" class="w-full p-4 flex justify-between items-center text-left rounded-t-lg">
                             <span class="font-medium">{{ agent_name }}</span>
@@ -323,9 +342,113 @@ <h3>Build Script</h3>
                             </svg>
                           </button>
                           <div x-show="open" class="border-t">
-                            {% for log_part in agent_logs %}
-                              <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
-                            {% endfor %}
+                            {% if agent_data.steps %}
+                              {% if agent_data.steps|length == 1 %}
+                                <!-- Single step - show raw content -->
+                                {% set step = agent_data.steps[0] %}
+                                {% if step.number and step.name %}
+                                  <div class="p-3 border-b mt-3">
+                                    <div class="font-medium mb-2">Step {{ step.number }} - {{ step.name }}</div>
+                                    {% if step.log_parts %}
+                                      {% for log_part in step.log_parts %}
+                                        <div x-data="{ chatOpen: false }" class="border rounded-lg mb-2">
+                                          <button @click="chatOpen = !chatOpen" class="w-full p-2 flex justify-between items-center text-left outline-none focus:outline-none ring-0">
+                                            <div class="flex-1">
+                                              <span class=" font-medium">
+                                                {% if log_part.chat_prompt %}Chat Prompt{% elif log_part.chat_response %}Chat Response{% else %}Log{% endif %}
+                                              </span>
+                                              <div x-show="!chatOpen" class="text-sm text-gray-500 mt-1 line-clamp-2">
+                                                {% set words = log_part.content.split() %}
+                                                {% if words|length > 50 %}
+                                                  {{ words[:50]|join(' ') }}...
+                                                {% else %}
+                                                  {{ log_part.content }}
+                                                {% endif %}
+                                              </div>
+                                            </div>
+                                            <svg class="w-3 h-3 flex-shrink-0 ml-2" :class="{'rotate-180': chatOpen}" fill="none" stroke="currentColor" viewBox="0 0 24 24">
+                                              <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M19 9l-7 7-7-7"></path>
+                                            </svg>
+                                          </button>
+                                          <div x-show="chatOpen" class="px-2 pb-2 border-t">
+                                            <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-2 rounded-md  whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                                          </div>
+                                        </div>
+                                      {% endfor %}
+                                    {% else %}
+                                      <pre class="p-3 rounded-md  whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                    {% endif %}
+                                  </div>
+                                {% else %}
+                                  {% if step.log_parts %}
+                                    {% for log_part in step.log_parts %}
+                                      <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                                    {% endfor %}
+                                  {% else %}
+                                    <pre class="p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                  {% endif %}
+                                {% endif %}
+                              {% else %}
+                                <!-- Multiple steps - show collapsible -->
+                                {% for step in agent_data.steps %}
+                                  <div x-data="{ stepOpen: false }" class="ml-5 border-b last:border-b-0">
+                                    <button @click="stepOpen = !stepOpen" class="w-full p-3 flex justify-between items-center text-left">
+                                      <span class="font-medium">
+                                        {% if step.number %}
+                                          {% if step.name %}
+                                            Step {{ step.number }} - {{ step.name }}
+                                          {% else %}
+                                            Step {{ step.number }}
+                                          {% endif %}
+                                        {% elif step.name %}
+                                          {{ step.name }}
+                                        {% else %}
+                                          Content
+                                        {% endif %}
+                                      </span>
+                                      <svg class="w-3 h-3" :class="{'rotate-180': stepOpen}" fill="none" stroke="currentColor" viewBox="0 0 24 24">
+                                        <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M19 9l-7 7-7-7"></path>
+                                      </svg>
+                                    </button>
+                                    <div x-show="stepOpen" class="ml-5 px-3 pb-3 mt-3">
+                                      {% if step.log_parts %}
+                                        {% for log_part in step.log_parts %}
+                                          <div x-data="{ chatOpen: false }" class="border rounded-lg mb-2 last:mb-0">
+                                            <button @click="chatOpen = !chatOpen" class="w-full p-2 flex justify-between items-center text-left outline-none focus:outline-none ring-0">
+                                              <div class="flex-1 space-y-2">
+                                                <span class=" font-medium">
+                                                  {% if log_part.chat_prompt %}Chat Prompt{% elif log_part.chat_response %}Chat Response{% else %}Log{% endif %}
+                                                </span>
+                                                <div x-show="!chatOpen" class="text-gray-500 mt-1 line-clamp-2">
+                                                  {% set words = log_part.content.split() %}
+                                                  {% if words|length > 50 %}
+                                                    {{ words[:50]|join(' ') }}...
+                                                  {% else %}
+                                                    {{ log_part.content }}
+                                                  {% endif %}
+                                                </div>
+                                              </div>
+                                              <svg class="w-3 h-3 flex-shrink-0 ml-2" :class="{'rotate-180': chatOpen}" fill="none" stroke="currentColor" viewBox="0 0 24 24">
+                                                <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M19 9l-7 7-7-7"></path>
+                                              </svg>
+                                            </button>
+                                            <div x-show="chatOpen" class="px-2 pb-2 border-t">
+                                              <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-2 rounded-md  whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                                            </div>
+                                          </div>
+                                        {% endfor %}
+                                      {% else %}
+                                        <pre class="p-3 rounded-md  whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                      {% endif %}
+                                    </div>
+                                  </div>
+                                {% endfor %}
+                              {% endif %}
+                            {% else %}
+                              {% for log_part in agent_data.logs %}
+                                <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                              {% endfor %}
+                            {% endif %}
                           </div>
                         </div>
                       {% endfor %}

From 761ad74c6664e11b2443e39d9aa57af7018c2eb7 Mon Sep 17 00:00:00 2001
From: "Myan V." <myanvoos@gmail.com>
Date: Tue, 29 Jul 2025 11:56:03 +1200
Subject: [PATCH 2/7] Remove the added layer of collapse for chat
 prompt/response, add tools in the title

---
 report/parse_logs.py                | 37 ++++++++++++++++----
 report/templates/sample/sample.html | 52 +++--------------------------
 2 files changed, 35 insertions(+), 54 deletions(-)

diff --git a/report/parse_logs.py b/report/parse_logs.py
index df9537900..10b302155 100644
--- a/report/parse_logs.py
+++ b/report/parse_logs.py
@@ -35,6 +35,30 @@ class LogsParser:
   def __init__(self, logs: list[LogPart]):
     self._logs = logs
 
+  def _extract_tool_names(self, content: str) -> list[str]:
+    """Extract tool names from content."""
+    tool_counts = {}
+    lines = content.split('\n')
+    
+    for i, line in enumerate(lines):
+      line = line.strip()
+      if (line in ['<bash>', '<reason>', '<conclusion>', '<build script>', '<fuzz target>'] and 
+          not line.startswith('</')):
+        tool_name = line[1:-1].title()
+        tool_counts[tool_name] = tool_counts.get(tool_name, 0) + 1
+      elif line == '<stderr>':
+        if i + 1 < len(lines) and lines[i + 1].strip():
+          tool_counts['Stderr'] = tool_counts.get('Stderr', 0) + 1
+    
+    tool_names = []
+    for tool_name, count in tool_counts.items():
+      if count == 1:
+        tool_names.append(tool_name)
+      else:
+        tool_names.append(f"{tool_name} (x{count})")
+    
+    return tool_names
+
   def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
     """Parse steps from agent logs, grouping by step number."""
     step_pattern = re.compile(r"Step #(\d+) - \"(.+?)\":")
@@ -62,15 +86,10 @@ def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
         if step_match:
           step_header_found = True
           current_step_number = step_match.group(1)
-          if len(step_match.groups()) > 1:
-            current_step_name = step_match.group(2).strip()
-          else:
-            current_step_name = "agent-step"
 
           if current_step_number not in steps_dict:
             steps_dict[current_step_number] = {
                 'number': current_step_number,
-                'name': current_step_name,
                 'type': 'Step',
                 'log_parts': []
             }
@@ -81,11 +100,17 @@ def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
       elif not step_header_found and not current_step_number and not steps_dict:
         steps_dict['0'] = {
             'number': None,
-            'name': None,
             'type': 'Content',
             'log_parts': [log_part]
         }
 
+    for step_num, step_data in steps_dict.items():
+      if step_data['log_parts']:
+        all_content = '\n'.join([part.content for part in step_data['log_parts']])
+        tool_names = self._extract_tool_names(all_content)
+        if tool_names:
+          step_data['name'] = f"{', '.join(tool_names)}"
+
     steps = []
     for step_num in sorted(steps_dict.keys(),
                            key=lambda x: int(x) if x.isdigit() else 999):
diff --git a/report/templates/sample/sample.html b/report/templates/sample/sample.html
index ce9c62c59..f93f77b0d 100644
--- a/report/templates/sample/sample.html
+++ b/report/templates/sample/sample.html
@@ -351,32 +351,10 @@ <h3>Build Script</h3>
                                     <div class="font-medium mb-2">Step {{ step.number }} - {{ step.name }}</div>
                                     {% if step.log_parts %}
                                       {% for log_part in step.log_parts %}
-                                        <div x-data="{ chatOpen: false }" class="border rounded-lg mb-2">
-                                          <button @click="chatOpen = !chatOpen" class="w-full p-2 flex justify-between items-center text-left outline-none focus:outline-none ring-0">
-                                            <div class="flex-1">
-                                              <span class=" font-medium">
-                                                {% if log_part.chat_prompt %}Chat Prompt{% elif log_part.chat_response %}Chat Response{% else %}Log{% endif %}
-                                              </span>
-                                              <div x-show="!chatOpen" class="text-sm text-gray-500 mt-1 line-clamp-2">
-                                                {% set words = log_part.content.split() %}
-                                                {% if words|length > 50 %}
-                                                  {{ words[:50]|join(' ') }}...
-                                                {% else %}
-                                                  {{ log_part.content }}
-                                                {% endif %}
-                                              </div>
-                                            </div>
-                                            <svg class="w-3 h-3 flex-shrink-0 ml-2" :class="{'rotate-180': chatOpen}" fill="none" stroke="currentColor" viewBox="0 0 24 24">
-                                              <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M19 9l-7 7-7-7"></path>
-                                            </svg>
-                                          </button>
-                                          <div x-show="chatOpen" class="px-2 pb-2 border-t">
-                                            <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-2 rounded-md  whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
-                                          </div>
-                                        </div>
+                                        <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
                                       {% endfor %}
                                     {% else %}
-                                      <pre class="p-3 rounded-md  whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                      <pre class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content }}</pre>
                                     {% endif %}
                                   </div>
                                 {% else %}
@@ -413,32 +391,10 @@ <h3>Build Script</h3>
                                     <div x-show="stepOpen" class="ml-5 px-3 pb-3 mt-3">
                                       {% if step.log_parts %}
                                         {% for log_part in step.log_parts %}
-                                          <div x-data="{ chatOpen: false }" class="border rounded-lg mb-2 last:mb-0">
-                                            <button @click="chatOpen = !chatOpen" class="w-full p-2 flex justify-between items-center text-left outline-none focus:outline-none ring-0">
-                                              <div class="flex-1 space-y-2">
-                                                <span class=" font-medium">
-                                                  {% if log_part.chat_prompt %}Chat Prompt{% elif log_part.chat_response %}Chat Response{% else %}Log{% endif %}
-                                                </span>
-                                                <div x-show="!chatOpen" class="text-gray-500 mt-1 line-clamp-2">
-                                                  {% set words = log_part.content.split() %}
-                                                  {% if words|length > 50 %}
-                                                    {{ words[:50]|join(' ') }}...
-                                                  {% else %}
-                                                    {{ log_part.content }}
-                                                  {% endif %}
-                                                </div>
-                                              </div>
-                                              <svg class="w-3 h-3 flex-shrink-0 ml-2" :class="{'rotate-180': chatOpen}" fill="none" stroke="currentColor" viewBox="0 0 24 24">
-                                                <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M19 9l-7 7-7-7"></path>
-                                              </svg>
-                                            </button>
-                                            <div x-show="chatOpen" class="px-2 pb-2 border-t">
-                                              <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-2 rounded-md  whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
-                                            </div>
-                                          </div>
+                                          <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
                                         {% endfor %}
                                       {% else %}
-                                        <pre class="p-3 rounded-md  whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                        <pre class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content }}</pre>
                                       {% endif %}
                                     </div>
                                   </div>

From a1292bc2a19d9916c7a7030705725a6794ba37ef Mon Sep 17 00:00:00 2001
From: "Myan V." <myanvoos@gmail.com>
Date: Tue, 29 Jul 2025 12:17:50 +1200
Subject: [PATCH 3/7] Add bash tool preview as subtitle heading

---
 report/parse_logs.py                | 93 +++++++++++++++++++++++++++--
 report/templates/sample/sample.html | 54 +++++++++++++----
 2 files changed, 131 insertions(+), 16 deletions(-)

diff --git a/report/parse_logs.py b/report/parse_logs.py
index 10b302155..713b26e77 100644
--- a/report/parse_logs.py
+++ b/report/parse_logs.py
@@ -35,6 +35,78 @@ class LogsParser:
   def __init__(self, logs: list[LogPart]):
     self._logs = logs
 
+  def _extract_bash_commands(self, content: str) -> list[str]:
+    """Extract and parse bash commands from content."""
+    commands = []
+    lines = content.split('\n')
+    
+    for i, line in enumerate(lines):
+      line = line.strip()
+      if line == '<bash>':
+        # Look for the next closing tag
+        for j in range(i + 1, len(lines)):
+          if lines[j].strip() == '</bash>':
+            # Extract bash content between tags
+            bash_content = '\n'.join(lines[i+1:j]).strip()
+            if bash_content:
+              # Parse the first line as the main command
+              first_line = bash_content.split('\n')[0].strip()
+              if first_line:
+                # Skip comments and placeholder text
+                if (first_line.startswith('#') or 
+                    first_line.startswith('[The command') or
+                    first_line.startswith('No bash') or
+                    'No bash' in first_line or
+                    len(first_line) < 3):
+                  continue
+                
+                # Extract command and key arguments
+                parts = first_line.split()
+                if parts:
+                  cmd = parts[0]
+                  
+                  # Special handling for grep commands
+                  if cmd == 'grep':
+                    # Extract the search term (usually the first quoted argument)
+                    import re
+                    quoted_match = re.search(r"'([^']+)'", first_line)
+                    if quoted_match:
+                      search_term = quoted_match.group(1)
+                      command_summary = f"grep '{search_term}'"
+                    else:
+                      # Fallback to regular parsing
+                      key_args = []
+                      for part in parts[1:]:
+                        if not part.startswith('-') and len(part) > 1:
+                          if len(part) > 20:
+                            part = part[:17] + '...'
+                          key_args.append(part)
+                          if len(key_args) >= 1:  # Limit to 1 arg for grep
+                            break
+                      command_summary = f"{cmd} {' '.join(key_args)}".strip()
+                  else:
+                    # Regular command parsing
+                    key_args = []
+                    for part in parts[1:]:
+                      if not part.startswith('-') and len(part) > 1:
+                        if len(part) > 20:
+                          part = part[:17] + '...'
+                        key_args.append(part)
+                        if len(key_args) >= 2:  # Limit to 2 key args
+                          break
+                    
+                    command_summary = f"{cmd} {' '.join(key_args)}".strip()
+                  
+                  if len(command_summary) > 40:
+                    command_summary = command_summary[:37] + '...'
+                  
+                  # Only add if it's not already in the list
+                  if command_summary not in commands:
+                    commands.append(command_summary)
+            break
+    
+    return commands
+
   def _extract_tool_names(self, content: str) -> list[str]:
     """Extract tool names from content."""
     tool_counts = {}
@@ -52,10 +124,7 @@ def _extract_tool_names(self, content: str) -> list[str]:
     
     tool_names = []
     for tool_name, count in tool_counts.items():
-      if count == 1:
-        tool_names.append(tool_name)
-      else:
-        tool_names.append(f"{tool_name} (x{count})")
+      tool_names.append(tool_name)
     
     return tool_names
 
@@ -106,10 +175,24 @@ def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
 
     for step_num, step_data in steps_dict.items():
       if step_data['log_parts']:
-        all_content = '\n'.join([part.content for part in step_data['log_parts']])
+        # For the first step, exclude the first chat prompt (instruction prompt)
+        if step_num == '1' and len(step_data['log_parts']) > 1:
+          # Skip the first log part if it's a chat prompt
+          first_part = step_data['log_parts'][0]
+          if first_part.chat_prompt:
+            content_parts = step_data['log_parts'][1:]
+          else:
+            content_parts = step_data['log_parts']
+        else:
+          content_parts = step_data['log_parts']
+        
+        all_content = '\n'.join([part.content for part in content_parts])
         tool_names = self._extract_tool_names(all_content)
+        bash_commands = self._extract_bash_commands(all_content)
         if tool_names:
           step_data['name'] = f"{', '.join(tool_names)}"
+        if bash_commands:
+          step_data['bash_commands'] = bash_commands
 
     steps = []
     for step_num in sorted(steps_dict.keys(),
diff --git a/report/templates/sample/sample.html b/report/templates/sample/sample.html
index f93f77b0d..e52b374d5 100644
--- a/report/templates/sample/sample.html
+++ b/report/templates/sample/sample.html
@@ -348,7 +348,21 @@ <h3>Build Script</h3>
                                 {% set step = agent_data.steps[0] %}
                                 {% if step.number and step.name %}
                                   <div class="p-3 border-b mt-3">
-                                    <div class="font-medium mb-2">Step {{ step.number }} - {{ step.name }}</div>
+                                    <div class="font-medium mb-2">Step {{ step.number }} - 
+                                      {% if 'Stderr' in step.name %}
+                                        {{ step.name.replace('Stderr', '<span class="text-red-600">Stderr</span>') | safe }}
+                                      {% else %}
+                                        {{ step.name }}
+                                      {% endif %}
+                                    </div>
+                                    {% if step.bash_commands %}
+                                    <div class="text-sm text-gray-600 mb-3">
+                                      <span class="font-medium">Commands:</span>
+                                      {% for cmd in step.bash_commands %}
+                                        <span class="inline-block px-2 py-1 rounded text-xs mr-2 mb-1">{{ cmd }}</span>
+                                      {% endfor %}
+                                    </div>
+                                    {% endif %}
                                     {% if step.log_parts %}
                                       {% for log_part in step.log_parts %}
                                         <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
@@ -371,19 +385,37 @@ <h3>Build Script</h3>
                                 {% for step in agent_data.steps %}
                                   <div x-data="{ stepOpen: false }" class="ml-5 border-b last:border-b-0">
                                     <button @click="stepOpen = !stepOpen" class="w-full p-3 flex justify-between items-center text-left">
-                                      <span class="font-medium">
-                                        {% if step.number %}
-                                          {% if step.name %}
-                                            Step {{ step.number }} - {{ step.name }}
+                                      <div class="flex-1">
+                                        <span class="font-medium">
+                                          {% if step.number %}
+                                            {% if step.name %}
+                                              Step {{ step.number }} - 
+                                              {% if 'Stderr' in step.name %}
+                                                {{ step.name.replace('Stderr', '<span class="text-red-600">Stderr</span>') | safe }}
+                                              {% else %}
+                                                {{ step.name }}
+                                              {% endif %}
+                                            {% else %}
+                                              Step {{ step.number }}
+                                            {% endif %}
+                                          {% elif step.name %}
+                                            {% if 'Stderr' in step.name %}
+                                              {{ step.name.replace('Stderr', '<span class="text-red-600">Stderr</span>') | safe }}
+                                            {% else %}
+                                              {{ step.name }}
+                                            {% endif %}
                                           {% else %}
-                                            Step {{ step.number }}
+                                            Content
                                           {% endif %}
-                                        {% elif step.name %}
-                                          {{ step.name }}
-                                        {% else %}
-                                          Content
+                                        </span>
+                                        {% if step.bash_commands %}
+                                        <div class="text-sm text-gray-600 mt-2>
+                                          {% for cmd in step.bash_commands %}
+                                            <span class="inline-block px-1 py-0.5 rounded mr-1">{{ cmd }}</span>
+                                          {% endfor %}
+                                        </div>
                                         {% endif %}
-                                      </span>
+                                      </div>
                                       <svg class="w-3 h-3" :class="{'rotate-180': stepOpen}" fill="none" stroke="currentColor" viewBox="0 0 24 24">
                                         <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M19 9l-7 7-7-7"></path>
                                       </svg>

From 080a4ed633bad2de3a5fbddc11a075a1d640785b Mon Sep 17 00:00:00 2001
From: "Myan V." <myanvoos@gmail.com>
Date: Fri, 8 Aug 2025 00:42:34 +1200
Subject: [PATCH 4/7] Add proper grouping of steps by prompt-tool execution
 pairs

---
 report/parse_logs.py                | 188 ++++++++++++++++++++--------
 report/templates/base.html          |   8 +-
 report/templates/sample/sample.html |  29 +++--
 report/web.py                       |   6 +
 4 files changed, 163 insertions(+), 68 deletions(-)

diff --git a/report/parse_logs.py b/report/parse_logs.py
index 713b26e77..de0fbea7d 100644
--- a/report/parse_logs.py
+++ b/report/parse_logs.py
@@ -15,6 +15,7 @@
 information such as the crash details, crash symptoms,
 stack traces, etc. to be rendered in the report."""
 
+import html
 import re
 
 from report.common import LogPart
@@ -39,33 +40,27 @@ def _extract_bash_commands(self, content: str) -> list[str]:
     """Extract and parse bash commands from content."""
     commands = []
     lines = content.split('\n')
-    
+
     for i, line in enumerate(lines):
       line = line.strip()
       if line == '<bash>':
-        # Look for the next closing tag
         for j in range(i + 1, len(lines)):
           if lines[j].strip() == '</bash>':
-            # Extract bash content between tags
-            bash_content = '\n'.join(lines[i+1:j]).strip()
+            bash_content = '\n'.join(lines[i + 1:j]).strip()
             if bash_content:
-              # Parse the first line as the main command
               first_line = bash_content.split('\n')[0].strip()
               if first_line:
-                # Skip comments and placeholder text
-                if (first_line.startswith('#') or 
+                # skip comments and placeholder text
+                if (first_line.startswith('#') or
                     first_line.startswith('[The command') or
                     first_line.startswith('No bash') or
-                    'No bash' in first_line or
-                    len(first_line) < 3):
+                    'No bash' in first_line or len(first_line) < 3):
                   continue
-                
-                # Extract command and key arguments
+
                 parts = first_line.split()
                 if parts:
                   cmd = parts[0]
-                  
-                  # Special handling for grep commands
+
                   if cmd == 'grep':
                     # Extract the search term (usually the first quoted argument)
                     import re
@@ -74,7 +69,6 @@ def _extract_bash_commands(self, content: str) -> list[str]:
                       search_term = quoted_match.group(1)
                       command_summary = f"grep '{search_term}'"
                     else:
-                      # Fallback to regular parsing
                       key_args = []
                       for part in parts[1:]:
                         if not part.startswith('-') and len(part) > 1:
@@ -85,7 +79,6 @@ def _extract_bash_commands(self, content: str) -> list[str]:
                             break
                       command_summary = f"{cmd} {' '.join(key_args)}".strip()
                   else:
-                    # Regular command parsing
                     key_args = []
                     for part in parts[1:]:
                       if not part.startswith('-') and len(part) > 1:
@@ -94,42 +87,40 @@ def _extract_bash_commands(self, content: str) -> list[str]:
                         key_args.append(part)
                         if len(key_args) >= 2:  # Limit to 2 key args
                           break
-                    
+
                     command_summary = f"{cmd} {' '.join(key_args)}".strip()
-                  
+
                   if len(command_summary) > 40:
                     command_summary = command_summary[:37] + '...'
-                  
-                  # Only add if it's not already in the list
+
                   if command_summary not in commands:
                     commands.append(command_summary)
             break
-    
+
     return commands
 
   def _extract_tool_names(self, content: str) -> list[str]:
     """Extract tool names from content."""
     tool_counts = {}
     lines = content.split('\n')
-    
+
     for i, line in enumerate(lines):
       line = line.strip()
-      if (line in ['<bash>', '<reason>', '<conclusion>', '<build script>', '<fuzz target>'] and 
-          not line.startswith('</')):
+      if (line in ['<bash>', '<conclusion>'] and not line.startswith('</')):
         tool_name = line[1:-1].title()
         tool_counts[tool_name] = tool_counts.get(tool_name, 0) + 1
       elif line == '<stderr>':
         if i + 1 < len(lines) and lines[i + 1].strip():
           tool_counts['Stderr'] = tool_counts.get('Stderr', 0) + 1
-    
+
     tool_names = []
     for tool_name, count in tool_counts.items():
       tool_names.append(tool_name)
-    
+
     return tool_names
 
   def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
-    """Parse steps from agent logs, grouping by step number."""
+    """Parse steps from agent logs, grouping by chat prompt/response pairs."""
     step_pattern = re.compile(r"Step #(\d+) - \"(.+?)\":")
     simple_step_pattern = re.compile(r"Step #(\d+)")
 
@@ -173,34 +164,119 @@ def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
             'log_parts': [log_part]
         }
 
-    for step_num, step_data in steps_dict.items():
-      if step_data['log_parts']:
-        # For the first step, exclude the first chat prompt (instruction prompt)
-        if step_num == '1' and len(step_data['log_parts']) > 1:
-          # Skip the first log part if it's a chat prompt
-          first_part = step_data['log_parts'][0]
-          if first_part.chat_prompt:
-            content_parts = step_data['log_parts'][1:]
-          else:
-            content_parts = step_data['log_parts']
-        else:
-          content_parts = step_data['log_parts']
-        
-        all_content = '\n'.join([part.content for part in content_parts])
-        tool_names = self._extract_tool_names(all_content)
-        bash_commands = self._extract_bash_commands(all_content)
-        if tool_names:
-          step_data['name'] = f"{', '.join(tool_names)}"
-        if bash_commands:
-          step_data['bash_commands'] = bash_commands
+    return self._parse_steps_by_chat_pairs(agent_logs)
 
+  def _parse_steps_by_chat_pairs(self, agent_logs: list[LogPart]) -> list[dict]:
     steps = []
-    for step_num in sorted(steps_dict.keys(),
-                           key=lambda x: int(x) if x.isdigit() else 999):
-      steps.append(steps_dict[step_num])
+
+    first_prompt_idx = -1
+    for i, log_part in enumerate(agent_logs):
+      if log_part.chat_prompt:
+        first_prompt_idx = i
+        break
+
+    if first_prompt_idx == -1:
+      return []
+
+    steps.append({
+        'number': '0 - System Instructions',
+        'type': 'System Instructions',
+        'log_parts': [agent_logs[first_prompt_idx]]
+    })
+
+    # Process logs after the system prompt to group into steps.
+    logs_to_process = agent_logs[first_prompt_idx + 1:]
+    step_counter = 1
+    current_step_parts = []
+
+    for log_part in logs_to_process:
+      if "agent-step" in log_part.content:
+        continue
+
+      # A chat_response marks the beginning of a new step.
+      if log_part.chat_response:
+        if current_step_parts:
+          step_data = self._create_step_data(step_counter, current_step_parts)
+          steps.append(step_data)
+          step_counter += 1
+        current_step_parts = [log_part]
+      else:
+        current_step_parts.append(log_part)
+
+    # Append the last step.
+    if current_step_parts:
+      step_data = self._create_step_data(step_counter, current_step_parts)
+      steps.append(step_data)
 
     return steps
 
+  def _syntax_highlight_content(self, content: str) -> str:
+    """Syntax highlights the content."""
+
+    content = html.escape(content)
+
+    # Simple pre-formatted blocks
+    content = re.sub(r'<conclusion>(.*?)</conclusion>',
+                     r'<pre class="conclusion-block">\1</pre>',
+                     content,
+                     flags=re.DOTALL)
+    content = re.sub(r'<reason>(.*?)</reason>',
+                     r'<pre class="reason-block">\1</pre>',
+                     content,
+                     flags=re.DOTALL)
+
+    # Code blocks with language specification
+    content = re.sub(r'<bash>(.*?)</bash>',
+                     r'<pre><code class="language-bash">\1</code></pre>',
+                     content,
+                     flags=re.DOTALL)
+    content = re.sub(r'<build_script>(.*?)</build_script>',
+                     r'<pre><code class="language-c++">\1</code></pre>',
+                     content,
+                     flags=re.DOTALL)
+    content = re.sub(r'<fuzz_target>(.*?)</fuzz_target>',
+                     r'<pre><code class="language-c++">\1</code></pre>',
+                     content,
+                     flags=re.DOTALL)
+
+    # Standard output/error with return code
+    content = re.sub(
+        r'<stdout>(.*?)</stdout>',
+        r'<h4>Standard Output</h4><pre><code class="language-bash">\1</code></pre>',
+        content,
+        flags=re.DOTALL)
+    content = re.sub(
+        r'<stderr>(.*?)</stderr>',
+        r'<h4>Standard Error</h4><pre><code class="language-bash">\1</code></pre>',
+        content,
+        flags=re.DOTALL)
+    content = re.sub(r'<return_code>(.*?)</return_code>',
+                     r'<h4>Return Code</h4><pre><code>\1</code></pre>',
+                     content,
+                     flags=re.DOTALL)
+
+    return content
+
+  def _create_step_data(self, step_number: int,
+                        log_parts: list[LogPart]) -> dict:
+    """Create step data from log parts."""
+    step_data = {
+        'number': str(step_number),
+        'type': 'Step',
+        'log_parts': log_parts
+    }
+
+    all_content = '\n'.join([part.content for part in log_parts])
+    tool_names = self._extract_tool_names(all_content)
+    bash_commands = self._extract_bash_commands(all_content)
+
+    if tool_names:
+      step_data['name'] = f"{', '.join(tool_names)}"
+    if bash_commands:
+      step_data['bash_commands'] = bash_commands
+
+    return step_data
+
   def get_agent_sections(self) -> dict[str, list[LogPart]]:
     """Get the agent sections from the logs."""
 
@@ -209,6 +285,20 @@ def get_agent_sections(self) -> dict[str, list[LogPart]]:
     current_agent = None
     agent_counters = {}
 
+    # NUMBER OF BASH TOOLS REQUESTED BY LLMS
+    # system prompt is itself
+    # subsequent ones will be LLM request tool -> tool execution
+
+    # NO REASON IF THERE'S BASH
+    # JUST NEED CONCLUSION
+    # SO INSTEAD STEP 4 - BASH REASON CONCLUSION FUZZ TARGET BUILDSCRIPT -> STEP 4 - BASH, CONCLUSION
+
+    # bash syntax highlight - shell
+    # build script - c or c++
+    # stdout/stderror - console/shell/bash - BASH
+
+    # moving to html
+
     for log_part in self._logs:
       lines = log_part.content.split('\n')
       agent_headers = []
diff --git a/report/templates/base.html b/report/templates/base.html
index 9a4bcd0be..d8f6fb55e 100644
--- a/report/templates/base.html
+++ b/report/templates/base.html
@@ -746,8 +746,8 @@ <h2 class="signature">
 }
 
 document.addEventListener('DOMContentLoaded', (event) => {
-    document.querySelectorAll('pre code.syntax-highlight').forEach((block) => {
-        hljs.highlightElement(block);
+    document.querySelectorAll('.prettify-benchmark-name').forEach(el => {
+        el.textContent = prettifyBenchmarkName(el.textContent);
     });
 
     const searchInput = document.getElementById('searchInput');
@@ -800,10 +800,6 @@ <h2 class="signature">
         }, 300);
     });
 
-    document.querySelectorAll('.prettify-benchmark-name').forEach(el => {
-        el.textContent = prettifyBenchmarkName(el.textContent);
-    });
-
     const tocTree = document.getElementById('toc-tree');
     const sections = document.querySelectorAll('.toc-section');
     sections.forEach((section, index) => {
diff --git a/report/templates/sample/sample.html b/report/templates/sample/sample.html
index e52b374d5..41a536c0d 100644
--- a/report/templates/sample/sample.html
+++ b/report/templates/sample/sample.html
@@ -17,7 +17,7 @@
 
 {% block content %}
 
-{% if sample_css_content %}
+{% if sample_css_content and sample_css_content.strip() and '{' in sample_css_content %}
 <style type="text/css">
 {{ sample_css_content | safe }}
 </style>
@@ -305,13 +305,15 @@ <h3>Build Script</h3>
                                   </svg>
                                 </button>
                                 <div x-show="stepOpen" class="px-3 pb-3">
-                                  <pre class="{% if step.chat_prompt %}chat_prompt {% elif step.chat_response %}chat_response {% endif %} p-3 rounded-md  whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                  {% for log_part in step.log_parts %}
+                                    <pre class="log-part-content {% if log_part.chat_prompt %}chat_prompt{% elif log_part.chat_response %}chat_response{% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
+                                  {% endfor %}
                                 </div>
                               </div>
                             {% endfor %}
                           {% else %}
                             {% for log_part in agent_data.logs %}
-                              <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                              <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
                             {% endfor %}
                           {% endif %}
                         </div>
@@ -348,7 +350,7 @@ <h3>Build Script</h3>
                                 {% set step = agent_data.steps[0] %}
                                 {% if step.number and step.name %}
                                   <div class="p-3 border-b mt-3">
-                                    <div class="font-medium mb-2">Step {{ step.number }} - 
+                                    <div class="font-medium mb-2">Step {{ step.number }} -
                                       {% if 'Stderr' in step.name %}
                                         {{ step.name.replace('Stderr', '<span class="text-red-600">Stderr</span>') | safe }}
                                       {% else %}
@@ -365,19 +367,19 @@ <h3>Build Script</h3>
                                     {% endif %}
                                     {% if step.log_parts %}
                                       {% for log_part in step.log_parts %}
-                                        <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                                        <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
                                       {% endfor %}
                                     {% else %}
-                                      <pre class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                      <pre class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</pre>
                                     {% endif %}
                                   </div>
                                 {% else %}
                                   {% if step.log_parts %}
                                     {% for log_part in step.log_parts %}
-                                      <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                                      <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
                                     {% endfor %}
                                   {% else %}
-                                    <pre class="p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                    <pre class="p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</pre>
                                   {% endif %}
                                 {% endif %}
                               {% else %}
@@ -389,7 +391,7 @@ <h3>Build Script</h3>
                                         <span class="font-medium">
                                           {% if step.number %}
                                             {% if step.name %}
-                                              Step {{ step.number }} - 
+                                              Step {{ step.number }} -
                                               {% if 'Stderr' in step.name %}
                                                 {{ step.name.replace('Stderr', '<span class="text-red-600">Stderr</span>') | safe }}
                                               {% else %}
@@ -423,10 +425,10 @@ <h3>Build Script</h3>
                                     <div x-show="stepOpen" class="ml-5 px-3 pb-3 mt-3">
                                       {% if step.log_parts %}
                                         {% for log_part in step.log_parts %}
-                                          <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                                          <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
                                         {% endfor %}
                                       {% else %}
-                                        <pre class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content }}</pre>
+                                        <pre class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</pre>
                                       {% endif %}
                                     </div>
                                   </div>
@@ -434,7 +436,7 @@ <h3>Build Script</h3>
                               {% endif %}
                             {% else %}
                               {% for log_part in agent_data.logs %}
-                                <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content }}</pre>
+                                <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
                               {% endfor %}
                             {% endif %}
                           </div>
@@ -460,7 +462,7 @@ <h3>Build Script</h3>
         <div x-show="logsOpen"
              class="p-4 border-t">
               {% for part in logs %}
-                <pre id="logs" class="{% if part.chat_prompt %}chat_prompt bg-gray-50{% elif part.chat_response %}chat_response bg-gray-100{% endif %} p-4 rounded-md mb-4 overflow-x-auto">{{ part.content }}</pre>
+                <pre id="logs" class="{% if part.chat_prompt %}chat_prompt bg-gray-50{% elif part.chat_response %}chat_response bg-gray-100{% endif %} p-4 rounded-md mb-4 overflow-x-auto">{{ part.content|syntax_highlight|safe }}</pre>
               {% endfor %}
         </div>
       </div>
@@ -514,6 +516,7 @@ <h3>Build Script</h3>
 
 <script>
 document.addEventListener('DOMContentLoaded', function() {
+    hljs.highlightAll();
     // Agent sections expand/collapse buttons
     const agentSectionsExpandAllButton = document.getElementById('agent-sections-expand-all');
     if (agentSectionsExpandAllButton) {
diff --git a/report/web.py b/report/web.py
index c391bde45..aa052882a 100644
--- a/report/web.py
+++ b/report/web.py
@@ -107,6 +107,11 @@ def __init__(self, template_globals: Optional[Dict[str, Any]] = None):
         'remove_trailing_empty_lines'] = self._remove_trailing_empty_lines
     self._env.filters['splitlines'] = self._splitlines
 
+    # Add a new filter for syntax highlighting
+    logs_parser = LogsParser([])
+    self._env.filters[
+        'syntax_highlight'] = logs_parser._syntax_highlight_content
+
     if template_globals:
       for key, val in template_globals.items():
         self._env.globals[key] = val
@@ -371,6 +376,7 @@ def _write_benchmark_sample(self, benchmark: Benchmark, sample: Sample,
                                     agent_sections=agent_sections,
                                     agent_cycles=agent_cycles,
                                     logs=logs,
+                                    logs_parser=logs_parser,
                                     triage=triage,
                                     targets=sample_targets,
                                     sample_css_content=sample_css_content,

From daf419abfc5b98dda01b00fb7d4c361f23b59e11 Mon Sep 17 00:00:00 2001
From: "Myan V." <myanvoos@gmail.com>
Date: Thu, 14 Aug 2025 22:41:01 +1200
Subject: [PATCH 5/7] Add plot.js and d3

---
 report/parse_logs.py                | 133 +++++++++++++++-------------
 report/templates/base.html          |  69 +++++++++++----
 report/templates/index/index.html   |  22 +++++
 report/templates/index/index.js     |  93 +++++++++++++++++++
 report/templates/sample/sample.html |  20 ++---
 report/web.py                       |  22 +++++
 6 files changed, 273 insertions(+), 86 deletions(-)

diff --git a/report/parse_logs.py b/report/parse_logs.py
index de0fbea7d..d45725095 100644
--- a/report/parse_logs.py
+++ b/report/parse_logs.py
@@ -190,7 +190,7 @@ def _parse_steps_by_chat_pairs(self, agent_logs: list[LogPart]) -> list[dict]:
     current_step_parts = []
 
     for log_part in logs_to_process:
-      if "agent-step" in log_part.content:
+      if "agent-step" in log_part.content or "Trial ID:" in log_part.content:
         continue
 
       # A chat_response marks the beginning of a new step.
@@ -210,52 +210,77 @@ def _parse_steps_by_chat_pairs(self, agent_logs: list[LogPart]) -> list[dict]:
 
     return steps
 
-  def _syntax_highlight_content(self, content: str) -> str:
-    """Syntax highlights the content."""
-
-    content = html.escape(content)
-
-    # Simple pre-formatted blocks
-    content = re.sub(r'<conclusion>(.*?)</conclusion>',
-                     r'<pre class="conclusion-block">\1</pre>',
-                     content,
-                     flags=re.DOTALL)
-    content = re.sub(r'<reason>(.*?)</reason>',
-                     r'<pre class="reason-block">\1</pre>',
-                     content,
-                     flags=re.DOTALL)
-
-    # Code blocks with language specification
-    content = re.sub(r'<bash>(.*?)</bash>',
-                     r'<pre><code class="language-bash">\1</code></pre>',
-                     content,
-                     flags=re.DOTALL)
-    content = re.sub(r'<build_script>(.*?)</build_script>',
-                     r'<pre><code class="language-c++">\1</code></pre>',
-                     content,
-                     flags=re.DOTALL)
-    content = re.sub(r'<fuzz_target>(.*?)</fuzz_target>',
-                     r'<pre><code class="language-c++">\1</code></pre>',
-                     content,
-                     flags=re.DOTALL)
-
-    # Standard output/error with return code
-    content = re.sub(
-        r'<stdout>(.*?)</stdout>',
-        r'<h4>Standard Output</h4><pre><code class="language-bash">\1</code></pre>',
-        content,
-        flags=re.DOTALL)
-    content = re.sub(
-        r'<stderr>(.*?)</stderr>',
-        r'<h4>Standard Error</h4><pre><code class="language-bash">\1</code></pre>',
-        content,
-        flags=re.DOTALL)
-    content = re.sub(r'<return_code>(.*?)</return_code>',
-                     r'<h4>Return Code</h4><pre><code>\1</code></pre>',
-                     content,
-                     flags=re.DOTALL)
-
-    return content
+  def _syntax_highlight_content(self, content: str, default_language: str = "") -> str:
+    """Syntax highlights content while preserving visible tags."""
+
+    # Escape everything first so raw logs are safe to render in HTML
+    escaped = html.escape(content)
+
+    # Helper to simplify substitutions
+    def _sub(pattern: str, repl: str, text: str) -> str:
+      return re.sub(pattern, repl, text, flags=re.DOTALL)
+
+    def _normalize_lang(lang: str) -> str:
+      if not lang:
+        return 'cpp'
+      lang = lang.strip().lower()
+      if lang in ['c++', 'cpp', 'cxx']:
+        return 'cpp'
+      if lang in ['c']:
+        return 'c'
+      if lang in ['python', 'py']:
+        return 'python'
+      if lang in ['java']:
+        return 'java'
+      if lang in ['rust', 'rs']:
+        return 'rust'
+      if lang in ['go', 'golang']:
+        return 'go'
+      return 'cpp'
+
+    lang_key = _normalize_lang(default_language)
+
+    escaped = _sub(r'&lt;conclusion&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/conclusion&gt;',
+                   r'<span class="log-tag">&lt;conclusion&gt;</span>'
+                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto reason-block">\1</pre>'
+                   r'<span class="log-tag">&lt;/conclusion&gt;</span>', escaped)
+    escaped = _sub(r'&lt;reason&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/reason&gt;',
+                   r'<span class="log-tag">&lt;reason&gt;</span>'
+                   r'<div class="markdown-block whitespace-pre-wrap break-words overflow-x-auto">\1</div>'
+                   r'<span class="log-tag">&lt;/reason&gt;</span>', escaped)
+
+    escaped = _sub(r'&lt;bash&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/bash&gt;',
+                   r'<span class="log-tag">&lt;bash&gt;</span>'
+                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+                   r'<span class="log-tag">&lt;/bash&gt;</span>',
+                   escaped)
+    escaped = _sub(r'&lt;build_script&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/build_script&gt;',
+                   r'<span class="log-tag">&lt;build_script&gt;</span>'
+                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-cpp">\1</code></pre>'
+                   r'<span class="log-tag">&lt;/build_script&gt;</span>',
+                   escaped)
+    escaped = _sub(r'&lt;fuzz target&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/fuzz target&gt;',
+                   rf'<span class="log-tag">&lt;fuzz target&gt;</span>'
+                   rf'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-{lang_key}">\1</code></pre>'
+                   rf'<span class="log-tag">&lt;/fuzz target&gt;</span>',
+                   escaped)
+
+    escaped = _sub(r'&lt;stdout&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/stdout&gt;',
+                   r'<span class="log-tag">&lt;stdout&gt;</span>'
+                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+                   r'<span class="log-tag">&lt;/stdout&gt;</span>',
+                   escaped)
+    escaped = _sub(r'&lt;stderr&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/stderr&gt;',
+                   r'<span class="log-tag">&lt;stderr&gt;</span>'
+                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+                   r'<span class="log-tag">&lt;/stderr&gt;</span>',
+                   escaped)
+    escaped = _sub(r'&lt;return_code&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/return_code&gt;',
+                   r'<span class="log-tag">&lt;return_code&gt;</span>'
+                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code>\1</code></pre>'
+                   r'<span class="log-tag">&lt;/return_code&gt;</span>', escaped)
+
+    return escaped
 
   def _create_step_data(self, step_number: int,
                         log_parts: list[LogPart]) -> dict:
@@ -285,20 +310,6 @@ def get_agent_sections(self) -> dict[str, list[LogPart]]:
     current_agent = None
     agent_counters = {}
 
-    # NUMBER OF BASH TOOLS REQUESTED BY LLMS
-    # system prompt is itself
-    # subsequent ones will be LLM request tool -> tool execution
-
-    # NO REASON IF THERE'S BASH
-    # JUST NEED CONCLUSION
-    # SO INSTEAD STEP 4 - BASH REASON CONCLUSION FUZZ TARGET BUILDSCRIPT -> STEP 4 - BASH, CONCLUSION
-
-    # bash syntax highlight - shell
-    # build script - c or c++
-    # stdout/stderror - console/shell/bash - BASH
-
-    # moving to html
-
     for log_part in self._logs:
       lines = log_part.content.split('\n')
       agent_headers = []
diff --git a/report/templates/base.html b/report/templates/base.html
index d8f6fb55e..d0d43b0b8 100644
--- a/report/templates/base.html
+++ b/report/templates/base.html
@@ -87,12 +87,14 @@
     background-color: #333333;
 }
 .chat_prompt {
-    background-color: #fff7f2;
+    background-color: #e2e8f0;
+    border: 1px solid #a0aec0;
     max-width: 50%;
     overflow: scroll;
 }
 .chat_response {
-    background-color: #fcfff2;
+    background-color: #ececec;
+    border: 1px solid #718096;
     max-width: 50%;
     overflow: scroll;
     margin-left: auto;
@@ -507,6 +509,8 @@ <h2 class="text-lg font-bold">Search Results</h2>
 
 <script src="https://cdnjs.cloudflare.com/ajax/libs/alpinejs/3.10.3/cdn.min.js" defer></script>
 <script src="https://cdn.jsdelivr.net/npm/chart.js" defer></script>
+<script src="d3.min.js" defer></script>
+<script src="plot.min.js" defer></script>
 
 {% if unified_data %}
 <script type="application/json" id="unified-data">{{ unified_data|tojson|safe }}</script>
@@ -909,16 +913,51 @@ <h2 class="signature">
 });
 
 </script>
-
-</body>
-<!-- added highlight.js for syntax highlighting -->
-<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/styles/default.min.css">
-<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/highlight.min.js"></script>
-<!-- some additional language -->
-<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/bash.min.js"></script>
-<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/c.min.js"></script>
-<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/cpp.min.js"></script>
-<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/java.min.js"></script>
-<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/python.min.js"></script>
-<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/rust.min.js"></script>
-<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/go.min.js"></script>
\ No newline at end of file
+  <!-- added highlight.js for syntax highlighting -->
+  <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/styles/default.min.css">
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/highlight.min.js"></script>
+  <!-- additional languages -->
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/bash.min.js"></script>
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/c.min.js"></script>
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/cpp.min.js"></script>
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/java.min.js"></script>
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/python.min.js"></script>
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/rust.min.js"></script>
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/go.min.js"></script>
+  <script src="https://cdnjs.cloudflare.com/ajax/libs/marked/12.0.2/marked.min.js"></script>
+  <script>
+    window.addEventListener('DOMContentLoaded', function() {
+      if (window.hljs && typeof window.hljs.highlightAll === 'function') {
+        window.hljs.highlightAll();
+      }
+
+      function renderMarkdownBlocks(root) {
+        if (!window.marked) return;
+        const blocks = (root || document).querySelectorAll('.markdown-block');
+        blocks.forEach((el) => {
+          try {
+            el.innerHTML = window.marked.parse(el.textContent || '');
+          } catch (_) {}
+        });
+      }
+
+      renderMarkdownBlocks(document);
+      if (window.hljs) {
+        const observer = new MutationObserver((mutations) => {
+          for (const mutation of mutations) {
+            for (const node of mutation.addedNodes) {
+              if (!(node instanceof HTMLElement)) continue;
+              renderMarkdownBlocks(node);
+              node.querySelectorAll('pre code:not(.hljs)').forEach((el) => {
+                try { window.hljs.highlightElement(el); } catch (_) {}
+              });
+            }
+          }
+        });
+        try {
+          observer.observe(document.body, { childList: true, subtree: true });
+        } catch (_) {}
+      }
+    });
+  </script>
+</body>
\ No newline at end of file
diff --git a/report/templates/index/index.html b/report/templates/index/index.html
index 8c222333a..55b36f1ed 100644
--- a/report/templates/index/index.html
+++ b/report/templates/index/index.html
@@ -35,6 +35,7 @@
     languageOpen: true,
     crashesFoundOpen: true,
     ofgMetricsOpen: true,
+    chartsOpen: true,
 }" class="space-y-2">
 
     <div class="border rounded-lg toc-section">
@@ -489,6 +490,27 @@
         </div>
     </div>
 
+    <div class="container mx-auto mt-8">
+        <div class="border rounded-lg toc-section">
+            <button @click="chartsOpen = !chartsOpen"
+                    class="w-full p-4 flex justify-between items-center">
+                <span class="text-lg font-bold">
+                    Charts
+                </span>
+                <svg class="w-5 h-5 transform transition-transform duration-200"
+                     :class="{'rotate-180': chartsOpen}"
+                     fill="none" stroke="currentColor" viewBox="0 0 24 24">
+                    <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M19 9l-7 7-7-7"/>
+                </svg>
+            </button>
+            <div x-show="chartsOpen" class="p-4 border-t">
+                <div class="chart-row">
+                    <div id="coverage-chart" class="chart-box"></div>
+                    <div id="bugs-chart" class="chart-box"></div>
+                </div>
+            </div>
+        </div>
+    </div>
 </div>
 
 <button class="toc-toggle" id="tocToggle">
diff --git a/report/templates/index/index.js b/report/templates/index/index.js
index 44646d457..99cacef5b 100644
--- a/report/templates/index/index.js
+++ b/report/templates/index/index.js
@@ -1,4 +1,97 @@
 document.addEventListener('DOMContentLoaded', function() {
+    function waitForPlot() {
+        if (typeof Plot !== 'undefined') {
+            setTimeout(initializeCharts, 100);
+        } else {
+            setTimeout(waitForPlot, 100);
+        }
+    }
+
+    function getBarY() {
+        if (Plot.barY) return Plot.barY;
+        if (Plot.BarY) return Plot.BarY;
+        if (Plot.rectY) {
+            return (data, opts) => {
+                const { x, y, fill, title } = opts || {};
+                return Plot.rectY(data, { x, y2: y, y1: 0, fill, title });
+            };
+        }
+        return null;
+    }
+
+    function initializeCharts() {
+        const BarY = getBarY();
+        if (!BarY) return;
+
+        const projectData = Array.from(document.querySelectorAll('#project-summary-table tbody tr.project-data-row')).map(row => {
+            const cells = row.querySelectorAll('td');
+            if (cells.length >= 9) {
+                return {
+                    project: cells[1].dataset.sortValue,
+                    new_lines: parseInt(cells[7].dataset.sortValue) || 0,
+                    existing_lines: parseInt(cells[8].dataset.sortValue) || 0
+                };
+            }
+            return null;
+        }).filter(Boolean);
+
+        if (projectData.length > 0) {
+            try {
+                const coveragePlot = Plot.plot({
+                    title: "New vs. Existing Code Coverage by Project",
+                    x: { label: "Project", domain: projectData.map(d => d.project) },
+                    y: { label: "Lines of Code" },
+                    marks: [
+                        BarY(projectData, { x: "project", y: "existing_lines", fill: "#94a3b8", title: "Existing Coverage" }),
+                        BarY(projectData, { x: "project", y: "new_lines", fill: "#3b82f6", title: "New Coverage" })
+                    ],
+                    width: 800,
+                    height: 400
+                });
+                const el = document.getElementById('coverage-chart');
+                if (el) { el.innerHTML = ''; el.appendChild(coveragePlot); }
+            } catch (error) {
+                const el = document.getElementById('coverage-chart');
+                if (el) el.innerHTML = '<p class="text-red-500">' + error.message + '</p>';
+            }
+        }
+
+        const bugsData = {};
+        projectData.forEach(project => { bugsData[project.project] = 0; });
+        const bugRows = document.querySelectorAll('#project-summary-table tbody tr.project-data-row');
+        bugRows.forEach(row => {
+            const cells = row.querySelectorAll('td');
+            if (cells.length >= 6) {
+                const project = cells[1].dataset.sortValue;
+                const bugs = parseInt(cells[5].dataset.sortValue) || 0;
+                if (project in bugsData) bugsData[project] += bugs;
+            }
+        });
+
+        const bugsChartData = Object.entries(bugsData).map(([project, bugs]) => ({ project, bugs }));
+        if (bugsChartData.length > 0) {
+            try {
+                const bugsPlot = Plot.plot({
+                    title: "Bugs Found by Project",
+                    x: { label: "Project", domain: bugsChartData.map(d => d.project) },
+                    y: { label: "Number of Bugs" },
+                    marks: [
+                        BarY(bugsChartData, { x: "project", y: "bugs", fill: "#ef4444", title: "Bugs Found" })
+                    ],
+                    width: 800,
+                    height: 400
+                });
+                const el = document.getElementById('bugs-chart');
+                if (el) { el.innerHTML = ''; el.appendChild(bugsPlot); }
+            } catch (error) {
+                const el = document.getElementById('bugs-chart');
+                if (el) el.innerHTML = '<p class="text-red-500">' + error.message + '</p>';
+            }
+        }
+    }
+
+    waitForPlot();
+
     // Project summary table expand/collapse buttons
     const projectSummaryExpandAllButton = document.getElementById('project-summary-expand-all');
     if (projectSummaryExpandAllButton) {
diff --git a/report/templates/sample/sample.html b/report/templates/sample/sample.html
index 41a536c0d..27cec449f 100644
--- a/report/templates/sample/sample.html
+++ b/report/templates/sample/sample.html
@@ -306,14 +306,14 @@ <h3>Build Script</h3>
                                 </button>
                                 <div x-show="stepOpen" class="px-3 pb-3">
                                   {% for log_part in step.log_parts %}
-                                    <pre class="log-part-content {% if log_part.chat_prompt %}chat_prompt{% elif log_part.chat_response %}chat_response{% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
+                                    <div class="log-part-content {% if log_part.chat_prompt %}chat_prompt{% elif log_part.chat_response %}chat_response{% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</div>
                                   {% endfor %}
                                 </div>
                               </div>
                             {% endfor %}
                           {% else %}
                             {% for log_part in agent_data.logs %}
-                              <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
+                              <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight(default_lang)|safe }}</div>
                             {% endfor %}
                           {% endif %}
                         </div>
@@ -367,19 +367,19 @@ <h3>Build Script</h3>
                                     {% endif %}
                                     {% if step.log_parts %}
                                       {% for log_part in step.log_parts %}
-                                        <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
+                                        <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</div>
                                       {% endfor %}
                                     {% else %}
-                                      <pre class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</pre>
+                                      <div class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</div>
                                     {% endif %}
                                   </div>
                                 {% else %}
                                   {% if step.log_parts %}
                                     {% for log_part in step.log_parts %}
-                                      <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
+                                      <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</div>
                                     {% endfor %}
                                   {% else %}
-                                    <pre class="p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</pre>
+                                    <div class="p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</div>
                                   {% endif %}
                                 {% endif %}
                               {% else %}
@@ -425,10 +425,10 @@ <h3>Build Script</h3>
                                     <div x-show="stepOpen" class="ml-5 px-3 pb-3 mt-3">
                                       {% if step.log_parts %}
                                         {% for log_part in step.log_parts %}
-                                          <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
+                                          <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight(default_lang)|safe }}</div>
                                         {% endfor %}
                                       {% else %}
-                                        <pre class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</pre>
+                                        <div class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</div>
                                       {% endif %}
                                     </div>
                                   </div>
@@ -436,7 +436,7 @@ <h3>Build Script</h3>
                               {% endif %}
                             {% else %}
                               {% for log_part in agent_data.logs %}
-                                <pre class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight|safe }}</pre>
+                                <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight(default_lang)|safe }}</div>
                               {% endfor %}
                             {% endif %}
                           </div>
@@ -462,7 +462,7 @@ <h3>Build Script</h3>
         <div x-show="logsOpen"
              class="p-4 border-t">
               {% for part in logs %}
-                <pre id="logs" class="{% if part.chat_prompt %}chat_prompt bg-gray-50{% elif part.chat_response %}chat_response bg-gray-100{% endif %} p-4 rounded-md mb-4 overflow-x-auto">{{ part.content|syntax_highlight|safe }}</pre>
+                <div id="logs" class="{% if part.chat_prompt %}chat_prompt bg-gray-50{% elif part.chat_response %}chat_response bg-gray-100{% endif %} p-4 rounded-md mb-4 overflow-x-auto">{{ part.content|syntax_highlight(default_lang)|safe }}</div>
               {% endfor %}
         </div>
       </div>
diff --git a/report/web.py b/report/web.py
index aa052882a..bf729efc8 100644
--- a/report/web.py
+++ b/report/web.py
@@ -191,6 +191,25 @@ def _copy_and_set_coverage_report(self, benchmark, sample):
       sample.result.coverage_report_path = \
         f'/sample/{benchmark.id}/coverage/{sample.id}/linux/'
 
+  def _copy_plot_library(self):
+    """Copies the Plot.js library to the output directory."""
+    d3_js_path = os.path.join(self._jinja.get_template_search_path()[0] + '/../trends_report_web/',
+                                 'd3.min.js')
+    plot_js_path = os.path.join(self._jinja.get_template_search_path()[0] + '/../trends_report_web/',
+                                 'plot.min.js')
+    if os.path.exists(d3_js_path):
+      os.makedirs(self._output_dir, exist_ok=True)
+      shutil.copy(d3_js_path, os.path.join(self._output_dir, 'd3.min.js'))
+      logging.info('Copied d3.min.js to %s', os.path.join(self._output_dir, 'd3.min.js'))
+    else:
+      logging.warning('d3.min.js not found at %s', d3_js_path)
+    if os.path.exists(plot_js_path):
+      os.makedirs(self._output_dir, exist_ok=True)
+      shutil.copy(plot_js_path, os.path.join(self._output_dir, 'plot.min.js'))
+      logging.info('Copied plot.min.js to %s', os.path.join(self._output_dir, 'plot.min.js'))
+    else:
+      logging.warning('Plot.js not found at %s', plot_js_path)
+
   def _read_static_file(self, file_path_in_templates_subdir: str) -> str:
     """Reads a static file from the templates directory."""
 
@@ -218,6 +237,8 @@ def _read_static_file(self, file_path_in_templates_subdir: str) -> str:
 
   def generate(self):
     """Generate and write every report file."""
+    self._copy_plot_library()
+    
     benchmarks = []
     samples_with_bugs = []
     # First pass: collect benchmarks and samples
@@ -377,6 +398,7 @@ def _write_benchmark_sample(self, benchmark: Benchmark, sample: Sample,
                                     agent_cycles=agent_cycles,
                                     logs=logs,
                                     logs_parser=logs_parser,
+                                    default_lang=(benchmark.language.lower() if getattr(benchmark, 'language', '') else ''),
                                     triage=triage,
                                     targets=sample_targets,
                                     sample_css_content=sample_css_content,

From 812b6c8fb3990700362b49e311a008c05ba377a0 Mon Sep 17 00:00:00 2001
From: "Myan V." <myanvoos@gmail.com>
Date: Thu, 14 Aug 2025 23:06:42 +1200
Subject: [PATCH 6/7] Add basic charts on the index page

---
 report/parse_logs.py              |  85 +++--
 report/templates/index/index.html |   5 +-
 report/templates/index/index.js   | 584 +++++++++++++++++-------------
 report/web.py                     |  66 ++--
 4 files changed, 419 insertions(+), 321 deletions(-)

diff --git a/report/parse_logs.py b/report/parse_logs.py
index d45725095..ba0f55c8f 100644
--- a/report/parse_logs.py
+++ b/report/parse_logs.py
@@ -210,7 +210,9 @@ def _parse_steps_by_chat_pairs(self, agent_logs: list[LogPart]) -> list[dict]:
 
     return steps
 
-  def _syntax_highlight_content(self, content: str, default_language: str = "") -> str:
+  def _syntax_highlight_content(self,
+                                content: str,
+                                default_language: str = "") -> str:
     """Syntax highlights content while preserving visible tags."""
 
     # Escape everything first so raw logs are safe to render in HTML
@@ -240,45 +242,48 @@ def _normalize_lang(lang: str) -> str:
 
     lang_key = _normalize_lang(default_language)
 
-    escaped = _sub(r'&lt;conclusion&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/conclusion&gt;',
-                   r'<span class="log-tag">&lt;conclusion&gt;</span>'
-                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto reason-block">\1</pre>'
-                   r'<span class="log-tag">&lt;/conclusion&gt;</span>', escaped)
-    escaped = _sub(r'&lt;reason&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/reason&gt;',
-                   r'<span class="log-tag">&lt;reason&gt;</span>'
-                   r'<div class="markdown-block whitespace-pre-wrap break-words overflow-x-auto">\1</div>'
-                   r'<span class="log-tag">&lt;/reason&gt;</span>', escaped)
-
-    escaped = _sub(r'&lt;bash&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/bash&gt;',
-                   r'<span class="log-tag">&lt;bash&gt;</span>'
-                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
-                   r'<span class="log-tag">&lt;/bash&gt;</span>',
-                   escaped)
-    escaped = _sub(r'&lt;build_script&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/build_script&gt;',
-                   r'<span class="log-tag">&lt;build_script&gt;</span>'
-                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-cpp">\1</code></pre>'
-                   r'<span class="log-tag">&lt;/build_script&gt;</span>',
-                   escaped)
-    escaped = _sub(r'&lt;fuzz target&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/fuzz target&gt;',
-                   rf'<span class="log-tag">&lt;fuzz target&gt;</span>'
-                   rf'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-{lang_key}">\1</code></pre>'
-                   rf'<span class="log-tag">&lt;/fuzz target&gt;</span>',
-                   escaped)
-
-    escaped = _sub(r'&lt;stdout&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/stdout&gt;',
-                   r'<span class="log-tag">&lt;stdout&gt;</span>'
-                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
-                   r'<span class="log-tag">&lt;/stdout&gt;</span>',
-                   escaped)
-    escaped = _sub(r'&lt;stderr&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/stderr&gt;',
-                   r'<span class="log-tag">&lt;stderr&gt;</span>'
-                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
-                   r'<span class="log-tag">&lt;/stderr&gt;</span>',
-                   escaped)
-    escaped = _sub(r'&lt;return_code&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/return_code&gt;',
-                   r'<span class="log-tag">&lt;return_code&gt;</span>'
-                   r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code>\1</code></pre>'
-                   r'<span class="log-tag">&lt;/return_code&gt;</span>', escaped)
+    escaped = _sub(
+        r'&lt;conclusion&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/conclusion&gt;',
+        r'<span class="log-tag">&lt;conclusion&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto reason-block">\1</pre>'
+        r'<span class="log-tag">&lt;/conclusion&gt;</span>', escaped)
+    escaped = _sub(
+        r'&lt;reason&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/reason&gt;',
+        r'<span class="log-tag">&lt;reason&gt;</span>'
+        r'<div class="markdown-block whitespace-pre-wrap break-words overflow-x-auto">\1</div>'
+        r'<span class="log-tag">&lt;/reason&gt;</span>', escaped)
+
+    escaped = _sub(
+        r'&lt;bash&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/bash&gt;',
+        r'<span class="log-tag">&lt;bash&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+        r'<span class="log-tag">&lt;/bash&gt;</span>', escaped)
+    escaped = _sub(
+        r'&lt;build_script&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/build_script&gt;',
+        r'<span class="log-tag">&lt;build_script&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-cpp">\1</code></pre>'
+        r'<span class="log-tag">&lt;/build_script&gt;</span>', escaped)
+    escaped = _sub(
+        r'&lt;fuzz target&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/fuzz target&gt;',
+        rf'<span class="log-tag">&lt;fuzz target&gt;</span>'
+        rf'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-{lang_key}">\1</code></pre>'
+        rf'<span class="log-tag">&lt;/fuzz target&gt;</span>', escaped)
+
+    escaped = _sub(
+        r'&lt;stdout&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/stdout&gt;',
+        r'<span class="log-tag">&lt;stdout&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+        r'<span class="log-tag">&lt;/stdout&gt;</span>', escaped)
+    escaped = _sub(
+        r'&lt;stderr&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/stderr&gt;',
+        r'<span class="log-tag">&lt;stderr&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+        r'<span class="log-tag">&lt;/stderr&gt;</span>', escaped)
+    escaped = _sub(
+        r'&lt;return_code&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/return_code&gt;',
+        r'<span class="log-tag">&lt;return_code&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code>\1</code></pre>'
+        r'<span class="log-tag">&lt;/return_code&gt;</span>', escaped)
 
     return escaped
 
diff --git a/report/templates/index/index.html b/report/templates/index/index.html
index 55b36f1ed..079ce8803 100644
--- a/report/templates/index/index.html
+++ b/report/templates/index/index.html
@@ -506,7 +506,10 @@
             <div x-show="chartsOpen" class="p-4 border-t">
                 <div class="chart-row">
                     <div id="coverage-chart" class="chart-box"></div>
-                    <div id="bugs-chart" class="chart-box"></div>
+                    <div id="language-coverage-chart" class="chart-box"></div>
+                </div>
+                <div class="chart-row">
+                    <div id="crash-reasons-chart" class="chart-box"></div>
                 </div>
             </div>
         </div>
diff --git a/report/templates/index/index.js b/report/templates/index/index.js
index 99cacef5b..6a431976f 100644
--- a/report/templates/index/index.js
+++ b/report/templates/index/index.js
@@ -1,277 +1,363 @@
 document.addEventListener('DOMContentLoaded', function() {
-    function waitForPlot() {
-        if (typeof Plot !== 'undefined') {
-            setTimeout(initializeCharts, 100);
-        } else {
-            setTimeout(waitForPlot, 100);
-        }
-    }
+	function waitForPlot() {
+		if (typeof Plot !== 'undefined') {
+			setTimeout(initializeCharts, 100);
+		} else {
+			setTimeout(waitForPlot, 100);
+		}
+	}
 
-    function getBarY() {
-        if (Plot.barY) return Plot.barY;
-        if (Plot.BarY) return Plot.BarY;
-        if (Plot.rectY) {
-            return (data, opts) => {
-                const { x, y, fill, title } = opts || {};
-                return Plot.rectY(data, { x, y2: y, y1: 0, fill, title });
-            };
-        }
-        return null;
-    }
+	function getBarY() {
+		if (Plot.barY) return Plot.barY;
+		if (Plot.BarY) return Plot.BarY;
+		if (Plot.rectY) {
+			return (data, opts) => {
+				const { x, y, fill, title } = opts || {};
+				return Plot.rectY(data, { x, y2: y, y1: 0, fill, title });
+			};
+		}
+		return null;
+	}
 
-    function initializeCharts() {
-        const BarY = getBarY();
-        if (!BarY) return;
+	function readUnifiedData() {
+		const el = document.getElementById('unified-data');
+		if (!el) return null;
+		try { return JSON.parse(el.textContent); } catch (_) { return null; }
+	}
 
-        const projectData = Array.from(document.querySelectorAll('#project-summary-table tbody tr.project-data-row')).map(row => {
-            const cells = row.querySelectorAll('td');
-            if (cells.length >= 9) {
-                return {
-                    project: cells[1].dataset.sortValue,
-                    new_lines: parseInt(cells[7].dataset.sortValue) || 0,
-                    existing_lines: parseInt(cells[8].dataset.sortValue) || 0
-                };
-            }
-            return null;
-        }).filter(Boolean);
+	function containerSize(el, fallbackW = 800, fallbackH = 300) {
+		if (!el) return { width: fallbackW, height: fallbackH };
+		const rect = el.getBoundingClientRect();
+		const width = Math.max(300, Math.floor(rect.width - 20));
+		const height = Math.max(220, Math.floor(rect.height - 20));
+		return { width, height };
+	}
 
-        if (projectData.length > 0) {
-            try {
-                const coveragePlot = Plot.plot({
-                    title: "New vs. Existing Code Coverage by Project",
-                    x: { label: "Project", domain: projectData.map(d => d.project) },
-                    y: { label: "Lines of Code" },
-                    marks: [
-                        BarY(projectData, { x: "project", y: "existing_lines", fill: "#94a3b8", title: "Existing Coverage" }),
-                        BarY(projectData, { x: "project", y: "new_lines", fill: "#3b82f6", title: "New Coverage" })
-                    ],
-                    width: 800,
-                    height: 400
-                });
-                const el = document.getElementById('coverage-chart');
-                if (el) { el.innerHTML = ''; el.appendChild(coveragePlot); }
-            } catch (error) {
-                const el = document.getElementById('coverage-chart');
-                if (el) el.innerHTML = '<p class="text-red-500">' + error.message + '</p>';
-            }
-        }
+	function appendTitle(el, text) {
+		const title = document.createElement('div');
+		title.textContent = text;
+		title.style.fontWeight = '600';
+		title.style.marginBottom = '8px';
+		el.appendChild(title);
+	}
 
-        const bugsData = {};
-        projectData.forEach(project => { bugsData[project.project] = 0; });
-        const bugRows = document.querySelectorAll('#project-summary-table tbody tr.project-data-row');
-        bugRows.forEach(row => {
-            const cells = row.querySelectorAll('td');
-            if (cells.length >= 6) {
-                const project = cells[1].dataset.sortValue;
-                const bugs = parseInt(cells[5].dataset.sortValue) || 0;
-                if (project in bugsData) bugsData[project] += bugs;
-            }
-        });
+	function renderLanguagePie(langData) {
+		const el = document.getElementById('language-coverage-chart');
+		if (!el || typeof d3 === 'undefined') return;
+		el.innerHTML = '';
+		appendTitle(el, 'Language Coverage (Experiment new lines)');
+		const { width, height } = containerSize(el);
+		const reserved = 60;
+		const svgHeight = Math.max(220, height - reserved);
+		const legend = d3.select(el).append('div').style('display','flex').style('flexWrap','wrap').style('gap','10px').style('justifyContent','center').style('marginBottom','8px');
+		const color = (d3.schemeTableau10 || d3.schemeCategory10 || []).length ? d3.scaleOrdinal((d3.schemeTableau10 || d3.schemeCategory10)) : d3.scaleOrdinal().range(['#3b82f6','#22c55e','#ef4444','#f59e0b','#8b5cf6','#06b6d4','#84cc16','#e11d48','#64748b','#a855f7']);
+		color.domain(langData.map(d=>d.language));
+		langData.forEach(d => {
+			const item = legend.append('div').style('display','flex').style('alignItems','center').style('gap','6px');
+			item.append('span').style('display','inline-block').style('width','12px').style('height','12px').style('background', color(d.language));
+			item.append('span').text(`${d.language}: ${d.experiment_new}`);
+		});
+		const values = langData.map(d => d.experiment_new || 0);
+		const sum = values.reduce((a,b)=>a+b,0);
+		if (sum <= 0) { el.innerHTML = '<p class="text-gray-500">No language coverage data</p>'; return; }
+		const radius = Math.min(width, svgHeight) / 2 - 8;
+		const svg = d3.select(el).append('svg').attr('width', width).attr('height', svgHeight)
+			.append('g').attr('transform', `translate(${width/2},${svgHeight/2})`);
+		const pie = d3.pie().sort(null).value(d => d.experiment_new)(langData);
+		const arc = d3.arc().outerRadius(radius).innerRadius(radius*0.5);
+		svg.selectAll('path').data(pie).enter().append('path')
+			.attr('d', arc)
+			.attr('fill', d => color(d.data.language))
+			.append('title').text(d => `${d.data.language}: ${d.data.experiment_new}`);
+	}
 
-        const bugsChartData = Object.entries(bugsData).map(([project, bugs]) => ({ project, bugs }));
-        if (bugsChartData.length > 0) {
-            try {
-                const bugsPlot = Plot.plot({
-                    title: "Bugs Found by Project",
-                    x: { label: "Project", domain: bugsChartData.map(d => d.project) },
-                    y: { label: "Number of Bugs" },
-                    marks: [
-                        BarY(bugsChartData, { x: "project", y: "bugs", fill: "#ef4444", title: "Bugs Found" })
-                    ],
-                    width: 800,
-                    height: 400
-                });
-                const el = document.getElementById('bugs-chart');
-                if (el) { el.innerHTML = ''; el.appendChild(bugsPlot); }
-            } catch (error) {
-                const el = document.getElementById('bugs-chart');
-                if (el) el.innerHTML = '<p class="text-red-500">' + error.message + '</p>';
-            }
-        }
-    }
+	function initializeCharts() {
+		const BarY = getBarY();
+		if (!BarY) return;
 
-    waitForPlot();
+		const projectData = Array.from(document.querySelectorAll('#project-summary-table tbody tr.project-data-row')).map(row => {
+			const cells = row.querySelectorAll('td');
+			if (cells.length >= 9) {
+				return {
+					project: cells[1].dataset.sortValue,
+					new_lines: parseInt(cells[7].dataset.sortValue) || 0,
+					existing_lines: parseInt(cells[8].dataset.sortValue) || 0
+				};
+			}
+			return null;
+		}).filter(Boolean);
 
-    // Project summary table expand/collapse buttons
-    const projectSummaryExpandAllButton = document.getElementById('project-summary-expand-all');
-    if (projectSummaryExpandAllButton) {
-        projectSummaryExpandAllButton.addEventListener('click', () => {
-            document.querySelectorAll('[x-ref^="benchmarks_"]').forEach(el => {
-                el.classList.remove('hidden');
-            });
-        });
-    }
+		const coverageEl = document.getElementById('coverage-chart');
+		if (projectData.length > 0 && coverageEl) {
+			try {
+				coverageEl.innerHTML = '';
+				appendTitle(coverageEl, 'New vs Existing Code Coverage by Project');
+				const legendDiv = document.createElement('div');
+				legendDiv.style.display = 'flex';
+				legendDiv.style.gap = '16px';
+				legendDiv.style.alignItems = 'center';
+				legendDiv.style.fontSize = '14px';
+				legendDiv.style.marginBottom = '6px';
+				legendDiv.innerHTML = '<span style="display:inline-flex;align-items:center;gap:6px"><span style="display:inline-block;width:12px;height:12px;background:#94a3b8"></span>Existing Coverage</span><span style="display:inline-flex;align-items:center;gap:6px"><span style="display:inline-block;width:12px;height:12px;background:#3b82f6"></span>New Coverage</span>';
+				coverageEl.appendChild(legendDiv);
+				const { width, height } = containerSize(coverageEl);
+				const plot = Plot.plot({
+					title: null,
+					x: { label: 'Project', domain: projectData.map(d => d.project) },
+					y: { label: 'Lines of Code' },
+					marks: [
+						BarY(projectData, { x: 'project', y: 'existing_lines', fill: '#94a3b8', title: 'Existing Coverage' }),
+						BarY(projectData, { x: 'project', y: 'new_lines', fill: '#3b82f6', title: 'New Coverage' })
+					],
+					width,
+					height: Math.max(240, height - 56)
+				});
+				coverageEl.appendChild(plot);
+			} catch (error) {
+				coverageEl.innerHTML = '<p class="text-red-500">' + error.message + '</p>';
+			}
+		}
 
-    const projectSummaryCollapseAllButton = document.getElementById('project-summary-collapse-all');
-    if (projectSummaryCollapseAllButton) {
-        projectSummaryCollapseAllButton.addEventListener('click', () => {
-            document.querySelectorAll('[x-ref^="benchmarks_"]').forEach(el => {
-                el.classList.add('hidden');
-            });
-        });
-    }
+		const langRows = document.querySelectorAll('#language-coverage-gain tbody tr');
+		const langData = Array.from(langRows).map(row => {
+			const cells = row.querySelectorAll('td');
+			if (cells.length >= 6) {
+				return {
+					language: cells[0].dataset.sortValue,
+					ossfuzz_covered: parseInt(cells[2].dataset.sortValue) || 0,
+					experiment_new: parseInt(cells[3].dataset.sortValue) || 0
+				};
+			}
+			return null;
+		}).filter(Boolean);
+		if (langData.length > 0) {
+			try { renderLanguagePie(langData); } catch (_) {}
+		}
 
-    const crashesExpandAllButton = document.getElementById('crashes-expand-all');
-    if (crashesExpandAllButton) {
-        crashesExpandAllButton.addEventListener('click', () => {
-            document.querySelectorAll('[x-ref^="project_"]').forEach(el => {
-                el.classList.remove('hidden');
-            });
-            document.querySelectorAll('[x-ref^="samples_"]').forEach(el => {
-                el.classList.remove('hidden');
-            });
-        });
-    }
+		const unified = readUnifiedData();
+		if (unified) {
+			const crashReasons = {};
+			for (const projectName in unified) {
+				const project = unified[projectName];
+				if (project.benchmarks) {
+					for (const benchId in project.benchmarks) {
+						const bench = project.benchmarks[benchId];
+						if (bench.samples) {
+							bench.samples.forEach(s => {
+								const reason = (s.crash_reason || '').trim() || 'N/A';
+								crashReasons[reason] = (crashReasons[reason] || 0) + (s.crashes ? 1 : 0);
+							});
+						}
+					}
+				}
+			}
+			const crEl = document.getElementById('crash-reasons-chart');
+			const crashReasonData = Object.entries(crashReasons).map(([reason, count]) => ({ reason, count })).sort((a,b) => b.count - a.count);
+			if (crashReasonData.length > 0 && crEl) {
+				try {
+					crEl.innerHTML = '';
+					appendTitle(crEl, 'Crash Reasons');
+					const { width, height } = containerSize(crEl);
+					const crPlot = Plot.plot({
+						title: null,
+						x: { label: 'Reason', domain: crashReasonData.map(d => d.reason) },
+						y: { label: 'Count' },
+						marks: [
+							BarY(crashReasonData, { x: 'reason', y: 'count', fill: '#f59e0b' })
+						],
+						width,
+						height: Math.max(240, height - 28)
+					});
+					crEl.appendChild(crPlot);
+				} catch (error) {
+					crEl.innerHTML = '<p class="text-red-500">' + error.message + '</p>';
+				}
+			}
+		}
+	}
 
-    const crashesCollapseAllButton = document.getElementById('crashes-collapse-all');
-    if (crashesCollapseAllButton) {
-        crashesCollapseAllButton.addEventListener('click', () => {
-            document.querySelectorAll('[x-ref^="project_"]').forEach(el => {
-                el.classList.add('hidden');
-            });
-            document.querySelectorAll('[x-ref^="samples_"]').forEach(el => {
-                el.classList.add('hidden');
-            });
-        });
-    }
+	waitForPlot();
 
-    // Project-level expand/collapse buttons
-    document.querySelectorAll('[id^="project-expand-all-"]').forEach(button => {
-        button.addEventListener('click', () => {
-            const projectIndex = button.id.split('-').pop();
-            document.querySelectorAll(`[x-ref^="samples_"][x-ref$="_${projectIndex}"]`).forEach(el => {
-                el.classList.remove('hidden');
-            });
-        });
-    });
+	// Project summary table expand/collapse buttons
+	const projectSummaryExpandAllButton = document.getElementById('project-summary-expand-all');
+	if (projectSummaryExpandAllButton) {
+		projectSummaryExpandAllButton.addEventListener('click', () => {
+			document.querySelectorAll('[x-ref^="benchmarks_"]').forEach(el => {
+				el.classList.remove('hidden');
+			});
+		});
+	}
 
-    document.querySelectorAll('[id^="project-collapse-all-"]').forEach(button => {
-        button.addEventListener('click', () => {
-            const projectIndex = button.id.split('-').pop();
-            document.querySelectorAll(`[x-ref^="samples_"][x-ref$="_${projectIndex}"]`).forEach(el => {
-                el.classList.add('hidden');
-            });
-        });
-    });
+	const projectSummaryCollapseAllButton = document.getElementById('project-summary-collapse-all');
+	if (projectSummaryCollapseAllButton) {
+		projectSummaryCollapseAllButton.addEventListener('click', () => {
+			document.querySelectorAll('[x-ref^="benchmarks_"]').forEach(el => {
+				el.classList.add('hidden');
+			});
+		});
+	}
 
-    function compareTableCells(cellA, cellB, sortNumber, sortAsc) {
-        if (!cellA || !cellB) return 0;
+	const crashesExpandAllButton = document.getElementById('crashes-expand-all');
+	if (crashesExpandAllButton) {
+		crashesExpandAllButton.addEventListener('click', () => {
+			document.querySelectorAll('[x-ref^="project_"]').forEach(el => {
+				el.classList.remove('hidden');
+			});
+			document.querySelectorAll('[x-ref^="samples_"]').forEach(el => {
+				el.classList.remove('hidden');
+			});
+		});
+	}
 
-        let valueA_str = cellA.dataset.sortValue;
-        let valueB_str = cellB.dataset.sortValue;
-        let comparison = 0;
+	const crashesCollapseAllButton = document.getElementById('crashes-collapse-all');
+	if (crashesCollapseAllButton) {
+		crashesCollapseAllButton.addEventListener('click', () => {
+			document.querySelectorAll('[x-ref^="project_"]').forEach(el => {
+				el.classList.add('hidden');
+			});
+			document.querySelectorAll('[x-ref^="samples_"]').forEach(el => {
+				el.classList.add('hidden');
+			});
+		});
+	}
 
-        if (sortNumber) {
-            let numA = parseFloat(valueA_str);
-            let numB = parseFloat(valueB_str);
+	// Project-level expand/collapse buttons
+	document.querySelectorAll('[id^="project-expand-all-"]').forEach(button => {
+		button.addEventListener('click', () => {
+			const projectIndex = button.id.split('-').pop();
+			document.querySelectorAll(`[x-ref^="samples_"][x-ref$="_${projectIndex}"]`).forEach(el => {
+				el.classList.remove('hidden');
+			});
+		});
+	});
 
-            if (isNaN(numA) && isNaN(numB)) {
-                comparison = 0;
-            } else if (isNaN(numA)) {
-                comparison = 1;
-            } else if (isNaN(numB)) {
-                comparison = -1;
-            } else {
-                comparison = numA - numB;
-            }
-        } else {
-            const strA = (valueA_str === undefined || valueA_str === null) ? "" : String(valueA_str);
-            const strB = (valueB_str === undefined || valueB_str === null) ? "" : String(valueB_str);
-            comparison = strA.localeCompare(strB);
-        }
-        return sortAsc ? comparison : -comparison;
-    }
+	document.querySelectorAll('[id^="project-collapse-all-"]').forEach(button => {
+		button.addEventListener('click', () => {
+			const projectIndex = button.id.split('-').pop();
+			document.querySelectorAll(`[x-ref^="samples_"][x-ref$="_${projectIndex}"]`).forEach(el => {
+				el.classList.add('hidden');
+			});
+		});
+	});
 
-    const tables = Array.from(document.querySelectorAll('table.sortable-table'));
-    tables.forEach(table_element => {
-        const headers = Array.from(table_element.querySelectorAll('th'));
-        headers.forEach((th, colindex) => {
-            if (th.innerText.trim() === '' && colindex === 0) {
-                return;
-            }
+	function compareTableCells(cellA, cellB, sortNumber, sortAsc) {
+		if (!cellA || !cellB) return 0;
 
-            th.addEventListener('click', () => {
-                const sortAsc = th.dataset.sorted !== "asc";
-                const sortNumber = th.hasAttribute('data-sort-number');
+		let valueA_str = cellA.dataset.sortValue;
+		let valueB_str = cellB.dataset.sortValue;
+		let comparison = 0;
 
-                const currentTableHeaders = Array.from(table_element.querySelectorAll('th'));
-                currentTableHeaders.forEach(innerTH => delete innerTH.dataset.sorted);
-                th.dataset.sorted = sortAsc ? "asc" : "desc";
+		if (sortNumber) {
+			let numA = parseFloat(valueA_str);
+			let numB = parseFloat(valueB_str);
 
-                const tbody = table_element.querySelector('tbody');
-                if (!tbody) return;
+			if (isNaN(numA) && isNaN(numB)) {
+				comparison = 0;
+			} else if (isNaN(numA)) {
+				comparison = 1;
+			} else if (isNaN(numB)) {
+				comparison = -1;
+			} else {
+				comparison = numA - numB;
+			}
+		} else {
+			const strA = (valueA_str === undefined || valueA_str === null) ? "" : String(valueA_str);
+			const strB = (valueB_str === undefined || valueB_str === null) ? "" : String(valueB_str);
+			comparison = strA.localeCompare(strB);
+		}
+		return sortAsc ? comparison : -comparison;
+	}
 
-                let allRowsInBody = Array.from(tbody.children);
-                let sortableUnits = [];
-                let appendedRows = [];
+	const tables = Array.from(document.querySelectorAll('table.sortable-table'));
+	tables.forEach(table_element => {
+		const headers = Array.from(table_element.querySelectorAll('th'));
+		headers.forEach((th, colindex) => {
+			if (th.innerText.trim() === '' && colindex === 0) {
+				return;
+			}
 
-                if (table_element.id === 'project-summary-table') {
-                    for (let i = 0; i < allRowsInBody.length; i += 2) {
-                        if (allRowsInBody[i] && allRowsInBody[i+1] &&
-                            allRowsInBody[i].classList.contains('project-data-row') &&
-                            allRowsInBody[i+1].classList.contains('project-benchmarks-container-row')) {
-                            sortableUnits.push({
-                                representativeRow: allRowsInBody[i],
-                                actualRows: [allRowsInBody[i], allRowsInBody[i+1]]
-                            });
-                        } else {
-                            appendedRows.push(...allRowsInBody.slice(i));
-                            break;
-                        }
-                    }
-                } else if (table_element.id === 'crashes-table') {
-                    for (let i = 0; i < allRowsInBody.length; i += 2) {
-                        if (allRowsInBody[i] && allRowsInBody[i+1]) {
-                            sortableUnits.push({
-                                representativeRow: allRowsInBody[i],
-                                actualRows: [allRowsInBody[i], allRowsInBody[i+1]]
-                            });
-                        }
-                    }
-                } else if (table_element.closest('[x-ref^="project_"]')) {
-                    for (let i = 0; i < allRowsInBody.length; i += 2) {
-                        if (allRowsInBody[i] && allRowsInBody[i+1]) {
-                            sortableUnits.push({
-                                representativeRow: allRowsInBody[i],
-                                actualRows: [allRowsInBody[i], allRowsInBody[i+1]]
-                            });
-                        }
-                    }
-                } else {
-                    if (table_element.id && table_element.id.startsWith('benchmarks-table-')) {
-                        const averageRowIndex = allRowsInBody.findIndex(row => row.cells.length > 0 && row.cells[0].innerText.trim() === 'Average');
-                        if (averageRowIndex !== -1) {
-                            appendedRows.push(allRowsInBody.splice(averageRowIndex, 1)[0]);
-                        }
-                    }
-                    allRowsInBody.forEach(row => {
-                        sortableUnits.push({ representativeRow: row, actualRows: [row] });
-                    });
-                }
+			th.addEventListener('click', () => {
+				const sortAsc = th.dataset.sorted !== "asc";
+				const sortNumber = th.hasAttribute('data-sort-number');
 
-                sortableUnits.sort((unitA, unitB) => {
-                    const cellA = unitA.representativeRow.children[colindex];
-                    const cellB = unitB.representativeRow.children[colindex];
-                    return compareTableCells(cellA, cellB, sortNumber, sortAsc);
-                });
+				const currentTableHeaders = Array.from(table_element.querySelectorAll('th'));
+				currentTableHeaders.forEach(innerTH => delete innerTH.dataset.sorted);
+				th.dataset.sorted = sortAsc ? "asc" : "desc";
 
-                tbody.innerHTML = '';
-                sortableUnits.forEach(unit => {
-                    unit.actualRows.forEach(row => tbody.appendChild(row));
-                });
-                appendedRows.forEach(row => tbody.appendChild(row));
+				const tbody = table_element.querySelector('tbody');
+				if (!tbody) return;
 
-                let visualIndex = 1;
-                Array.from(tbody.children).forEach(r => {
-                    if (appendedRows.includes(r)) {
-                        return;
-                    }
-                    const firstCell = r.children[0];
-                    if (firstCell && firstCell.classList.contains('table-index') && !firstCell.querySelector('button')) {
-                         firstCell.innerText = visualIndex++;
-                    }
-                });
-            });
-        });
-    });
+				let allRowsInBody = Array.from(tbody.children);
+				let sortableUnits = [];
+				let appendedRows = [];
+
+				if (table_element.id === 'project-summary-table') {
+					for (let i = 0; i < allRowsInBody.length; i += 2) {
+						if (allRowsInBody[i] && allRowsInBody[i+1] &&
+							allRowsInBody[i].classList.contains('project-data-row') &&
+							allRowsInBody[i+1].classList.contains('project-benchmarks-container-row')) {
+							sortableUnits.push({
+								representativeRow: allRowsInBody[i],
+								actualRows: [allRowsInBody[i], allRowsInBody[i+1]]
+							});
+						} else {
+							appendedRows.push(...allRowsInBody.slice(i));
+							break;
+						}
+					}
+				} else if (table_element.id === 'crashes-table') {
+					for (let i = 0; i < allRowsInBody.length; i += 2) {
+						if (allRowsInBody[i] && allRowsInBody[i+1]) {
+							sortableUnits.push({
+								representativeRow: allRowsInBody[i],
+								actualRows: [allRowsInBody[i], allRowsInBody[i+1]]
+							});
+						}
+					}
+				} else if (table_element.closest('[x-ref^="project_"]')) {
+					for (let i = 0; i < allRowsInBody.length; i += 2) {
+						if (allRowsInBody[i] && allRowsInBody[i+1]) {
+							sortableUnits.push({
+								representativeRow: allRowsInBody[i],
+								actualRows: [allRowsInBody[i], allRowsInBody[i+1]]
+							});
+						}
+					}
+				} else {
+					if (table_element.id && table_element.id.startsWith('benchmarks-table-')) {
+						const averageRowIndex = allRowsInBody.findIndex(row => row.cells.length > 0 && row.cells[0].innerText.trim() === 'Average');
+						if (averageRowIndex !== -1) {
+							appendedRows.push(allRowsInBody.splice(averageRowIndex, 1)[0]);
+						}
+					}
+					allRowsInBody.forEach(row => {
+						sortableUnits.push({ representativeRow: row, actualRows: [row] });
+					});
+				}
+
+				sortableUnits.sort((unitA, unitB) => {
+					const cellA = unitA.representativeRow.children[colindex];
+					const cellB = unitB.representativeRow.children[colindex];
+					return compareTableCells(cellA, cellB, sortNumber, sortAsc);
+				});
+
+				tbody.innerHTML = '';
+				sortableUnits.forEach(unit => {
+					unit.actualRows.forEach(row => tbody.appendChild(row));
+				});
+				appendedRows.forEach(row => tbody.appendChild(row));
+
+				let visualIndex = 1;
+				Array.from(tbody.children).forEach(r => {
+					if (appendedRows.includes(r)) {
+						return;
+					}
+					const firstCell = r.children[0];
+					if (firstCell && firstCell.classList.contains('table-index') && !firstCell.querySelector('button')) {
+						 firstCell.innerText = visualIndex++;
+					}
+				});
+			});
+		});
+	});
 });
diff --git a/report/web.py b/report/web.py
index bf729efc8..ec5ee3881 100644
--- a/report/web.py
+++ b/report/web.py
@@ -193,22 +193,24 @@ def _copy_and_set_coverage_report(self, benchmark, sample):
 
   def _copy_plot_library(self):
     """Copies the Plot.js library to the output directory."""
-    d3_js_path = os.path.join(self._jinja.get_template_search_path()[0] + '/../trends_report_web/',
-                                 'd3.min.js')
-    plot_js_path = os.path.join(self._jinja.get_template_search_path()[0] + '/../trends_report_web/',
-                                 'plot.min.js')
-    if os.path.exists(d3_js_path):
-      os.makedirs(self._output_dir, exist_ok=True)
-      shutil.copy(d3_js_path, os.path.join(self._output_dir, 'd3.min.js'))
-      logging.info('Copied d3.min.js to %s', os.path.join(self._output_dir, 'd3.min.js'))
-    else:
-      logging.warning('d3.min.js not found at %s', d3_js_path)
-    if os.path.exists(plot_js_path):
-      os.makedirs(self._output_dir, exist_ok=True)
-      shutil.copy(plot_js_path, os.path.join(self._output_dir, 'plot.min.js'))
-      logging.info('Copied plot.min.js to %s', os.path.join(self._output_dir, 'plot.min.js'))
-    else:
-      logging.warning('Plot.js not found at %s', plot_js_path)
+    search_path = self._jinja.get_template_search_path()
+    templates_dir = search_path[0] if search_path else 'report/templates'
+    libs_dir = os.path.abspath(
+        os.path.join(templates_dir, '..', 'trends_report_web'))
+
+    os.makedirs(self._output_dir, exist_ok=True)
+
+    for lib_name in ['plot.min.js', 'd3.min.js']:
+      lib_src = os.path.join(libs_dir, lib_name)
+      lib_dst = os.path.join(self._output_dir, lib_name)
+      if os.path.exists(lib_src):
+        try:
+          shutil.copy(lib_src, lib_dst)
+          logging.info('Copied %s to %s', lib_name, lib_dst)
+        except Exception as e:
+          logging.warning('Failed to copy %s: %s', lib_name, e)
+      else:
+        logging.warning('%s not found at %s', lib_name, lib_src)
 
   def _read_static_file(self, file_path_in_templates_subdir: str) -> str:
     """Reads a static file from the templates directory."""
@@ -238,7 +240,7 @@ def _read_static_file(self, file_path_in_templates_subdir: str) -> str:
   def generate(self):
     """Generate and write every report file."""
     self._copy_plot_library()
-    
+
     benchmarks = []
     samples_with_bugs = []
     # First pass: collect benchmarks and samples
@@ -391,20 +393,22 @@ def _write_benchmark_sample(self, benchmark: Benchmark, sample: Sample,
       agent_sections = logs_parser.get_agent_sections()
       agent_cycles = logs_parser.get_agent_cycles()
 
-      rendered = self._jinja.render('sample/sample.html',
-                                    benchmark=benchmark,
-                                    sample=sample,
-                                    agent_sections=agent_sections,
-                                    agent_cycles=agent_cycles,
-                                    logs=logs,
-                                    logs_parser=logs_parser,
-                                    default_lang=(benchmark.language.lower() if getattr(benchmark, 'language', '') else ''),
-                                    triage=triage,
-                                    targets=sample_targets,
-                                    sample_css_content=sample_css_content,
-                                    sample_js_content=sample_js_content,
-                                    crash_info=crash_info,
-                                    **common_data)
+      rendered = self._jinja.render(
+          'sample/sample.html',
+          benchmark=benchmark,
+          sample=sample,
+          agent_sections=agent_sections,
+          agent_cycles=agent_cycles,
+          logs=logs,
+          logs_parser=logs_parser,
+          default_lang=(benchmark.language.lower() if getattr(
+              benchmark, 'language', '') else ''),
+          triage=triage,
+          targets=sample_targets,
+          sample_css_content=sample_css_content,
+          sample_js_content=sample_js_content,
+          crash_info=crash_info,
+          **common_data)
 
       self._write(f'sample/{benchmark.id}/{sample.id}.html', rendered)
     except Exception as e:

From c49c9e8cccdc5438dcfeea85bae4eb7f52429d40 Mon Sep 17 00:00:00 2001
From: "Myan V." <myanvoos@gmail.com>
Date: Fri, 29 Aug 2025 19:27:01 +1200
Subject: [PATCH 7/7] Add syntax highlighting inside execution stages

---
 report/parse_logs.py                | 326 +++++++++++++++++++++-------
 report/templates/base.html          |  31 ++-
 report/templates/sample/sample.html |   6 +-
 report/web.py                       |  12 +-
 4 files changed, 276 insertions(+), 99 deletions(-)

diff --git a/report/parse_logs.py b/report/parse_logs.py
index ba0f55c8f..16e0c52b7 100644
--- a/report/parse_logs.py
+++ b/report/parse_logs.py
@@ -44,77 +44,91 @@ def _extract_bash_commands(self, content: str) -> list[str]:
     for i, line in enumerate(lines):
       line = line.strip()
       if line == '<bash>':
-        for j in range(i + 1, len(lines)):
-          if lines[j].strip() == '</bash>':
-            bash_content = '\n'.join(lines[i + 1:j]).strip()
-            if bash_content:
-              first_line = bash_content.split('\n')[0].strip()
-              if first_line:
-                # skip comments and placeholder text
-                if (first_line.startswith('#') or
-                    first_line.startswith('[The command') or
-                    first_line.startswith('No bash') or
-                    'No bash' in first_line or len(first_line) < 3):
-                  continue
-
-                parts = first_line.split()
-                if parts:
-                  cmd = parts[0]
-
-                  if cmd == 'grep':
-                    # Extract the search term (usually the first quoted argument)
-                    import re
-                    quoted_match = re.search(r"'([^']+)'", first_line)
-                    if quoted_match:
-                      search_term = quoted_match.group(1)
-                      command_summary = f"grep '{search_term}'"
-                    else:
-                      key_args = []
-                      for part in parts[1:]:
-                        if not part.startswith('-') and len(part) > 1:
-                          if len(part) > 20:
-                            part = part[:17] + '...'
-                          key_args.append(part)
-                          if len(key_args) >= 1:  # Limit to 1 arg for grep
-                            break
-                      command_summary = f"{cmd} {' '.join(key_args)}".strip()
-                  else:
-                    key_args = []
-                    for part in parts[1:]:
-                      if not part.startswith('-') and len(part) > 1:
-                        if len(part) > 20:
-                          part = part[:17] + '...'
-                        key_args.append(part)
-                        if len(key_args) >= 2:  # Limit to 2 key args
-                          break
-
-                    command_summary = f"{cmd} {' '.join(key_args)}".strip()
-
-                  if len(command_summary) > 40:
-                    command_summary = command_summary[:37] + '...'
-
-                  if command_summary not in commands:
-                    commands.append(command_summary)
-            break
+        command = self._process_bash_block(lines, i)
+        if command and command not in commands:
+          commands.append(command)
 
     return commands
 
+  def _process_bash_block(self, lines: list[str], start_idx: int) -> str:
+    """Process a single bash block and extract command summary."""
+    for j in range(start_idx + 1, len(lines)):
+      if lines[j].strip() == '</bash>':
+        bash_content = '\n'.join(lines[start_idx + 1:j]).strip()
+        if bash_content:
+          return self._extract_command_from_content(bash_content)
+        break
+    return ""
+
+  def _extract_command_from_content(self, bash_content: str) -> str:
+    """Extract command summary from bash content."""
+    first_line = bash_content.split('\n', 1)[0].strip()
+    if not first_line:
+      return ""
+
+    # Skip comments and placeholder text
+    if (first_line.startswith('#') or first_line.startswith('[The command') or
+        first_line.startswith('No bash') or 'No bash' in first_line or
+        len(first_line) < 3):
+      return ""
+
+    parts = first_line.split()
+    if not parts:
+      return ""
+
+    cmd = parts[0]
+    command_summary = self._build_command_summary(cmd, parts, first_line)
+
+    if len(command_summary) > 40:
+      command_summary = command_summary[:37] + '...'
+
+    return command_summary
+
+  def _build_command_summary(self, cmd: str, parts: list[str],
+                             first_line: str) -> str:
+    """Build command summary based on command type."""
+    if cmd == 'grep':
+      quoted_match = re.search(r"'([^']+)'", first_line)
+      if quoted_match:
+        search_term = quoted_match.group(1)
+        return f"grep '{search_term}'"
+      return self._extract_key_args(cmd, parts[1:], 1)
+    return self._extract_key_args(cmd, parts[1:], 2)
+
+  def _extract_key_args(self, cmd: str, parts: list[str], max_args: int) -> str:
+    """Extract key arguments from command parts."""
+    key_args = []
+    for part in parts:
+      if not part.startswith('-') and len(part) > 1:
+        if len(part) > 20:
+          part = part[:17] + '...'
+        key_args.append(part)
+        if len(key_args) >= max_args:
+          break
+    return f"{cmd} {' '.join(key_args)}".strip()
+
   def _extract_tool_names(self, content: str) -> list[str]:
     """Extract tool names from content."""
     tool_counts = {}
     lines = content.split('\n')
 
+    # For step titles
+    relevant_tool_tags = [
+        '<bash>', '<conclusion>', '<stderr>', '<gdb>', '<gdb command>',
+        '<gdb output>', '<solution>', '<system>', '<return_code>'
+    ]
+
     for i, line in enumerate(lines):
       line = line.strip()
-      if (line in ['<bash>', '<conclusion>'] and not line.startswith('</')):
-        tool_name = line[1:-1].title()
+      if line in relevant_tool_tags and not line.startswith('</'):
+        tool_name = line[1:-1].replace('_', ' ').title()
         tool_counts[tool_name] = tool_counts.get(tool_name, 0) + 1
       elif line == '<stderr>':
         if i + 1 < len(lines) and lines[i + 1].strip():
           tool_counts['Stderr'] = tool_counts.get('Stderr', 0) + 1
 
     tool_names = []
-    for tool_name, count in tool_counts.items():
+    for tool_name in tool_counts:
       tool_names.append(tool_name)
 
     return tool_names
@@ -126,7 +140,6 @@ def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
 
     steps_dict = {}
     current_step_number = None
-    current_step_name = None
 
     for log_part in agent_logs:
       content = log_part.content.strip()
@@ -167,6 +180,7 @@ def _parse_steps_from_logs(self, agent_logs: list[LogPart]) -> list[dict]:
     return self._parse_steps_by_chat_pairs(agent_logs)
 
   def _parse_steps_by_chat_pairs(self, agent_logs: list[LogPart]) -> list[dict]:
+    """Parse steps from agent logs by grouping chat prompt/response pairs."""
     steps = []
 
     first_prompt_idx = -1
@@ -210,15 +224,44 @@ def _parse_steps_by_chat_pairs(self, agent_logs: list[LogPart]) -> list[dict]:
 
     return steps
 
-  def _syntax_highlight_content(self,
-                                content: str,
-                                default_language: str = "") -> str:
+  def _convert_newlines_outside_tags(self, content: str) -> str:
+    """Convert \\n to <br> tags when they appear outside XML tags."""
+    tag_pattern = r'&lt;/?[^&]*?&gt;'
+
+    tag_matches = list(re.finditer(tag_pattern, content))
+
+    if not tag_matches:
+      return content.replace('\\n', '<br>')
+
+    result = []
+    last_end = 0
+
+    for match in tag_matches:
+      # Process text before this tag
+      before_tag = content[last_end:match.start()]
+      result.append(before_tag.replace('\\n', '<br>'))
+
+      # Add the tag itself (unchanged)
+      result.append(match.group())
+
+      last_end = match.end()
+
+    remaining = content[last_end:]
+    result.append(remaining.replace('\\n', '<br>'))
+
+    return ''.join(result)
+
+  def syntax_highlight_content(self,
+                               content: str,
+                               default_language: str = "",
+                               agent_name: str = "") -> str:
     """Syntax highlights content while preserving visible tags."""
 
     # Escape everything first so raw logs are safe to render in HTML
     escaped = html.escape(content)
 
-    # Helper to simplify substitutions
+    escaped = self._convert_newlines_outside_tags(escaped)
+
     def _sub(pattern: str, repl: str, text: str) -> str:
       return re.sub(pattern, repl, text, flags=re.DOTALL)
 
@@ -243,50 +286,171 @@ def _normalize_lang(lang: str) -> str:
     lang_key = _normalize_lang(default_language)
 
     escaped = _sub(
-        r'&lt;conclusion&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/conclusion&gt;',
+        r'&lt;conclusion&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/conclusion&gt;',
         r'<span class="log-tag">&lt;conclusion&gt;</span>'
-        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto reason-block">\1</pre>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto '
+        r'reason-block">\1</pre>'
         r'<span class="log-tag">&lt;/conclusion&gt;</span>', escaped)
     escaped = _sub(
-        r'&lt;reason&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/reason&gt;',
-        r'<span class="log-tag">&lt;reason&gt;</span>'
-        r'<div class="markdown-block whitespace-pre-wrap break-words overflow-x-auto">\1</div>'
+        r'&lt;reason&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/reason&gt;', r'<span class="log-tag">&lt;reason&gt;</span>'
+        r'<div class="markdown-block whitespace-pre-wrap break-words '
+        r'overflow-x-auto">\1</div>'
         r'<span class="log-tag">&lt;/reason&gt;</span>', escaped)
 
     escaped = _sub(
-        r'&lt;bash&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/bash&gt;',
-        r'<span class="log-tag">&lt;bash&gt;</span>'
-        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+        r'&lt;bash&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/bash&gt;', r'<span class="log-tag">&lt;bash&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-bash">\1</code></pre>'
         r'<span class="log-tag">&lt;/bash&gt;</span>', escaped)
     escaped = _sub(
-        r'&lt;build_script&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/build_script&gt;',
+        r'&lt;build_script&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/build_script&gt;',
         r'<span class="log-tag">&lt;build_script&gt;</span>'
-        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-cpp">\1</code></pre>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-cpp">\1</code></pre>'
         r'<span class="log-tag">&lt;/build_script&gt;</span>', escaped)
     escaped = _sub(
-        r'&lt;fuzz target&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/fuzz target&gt;',
+        r'&lt;fuzz target&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/fuzz target&gt;',
         rf'<span class="log-tag">&lt;fuzz target&gt;</span>'
-        rf'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-{lang_key}">\1</code></pre>'
+        rf'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        rf'<code class="language-{lang_key}">\1</code></pre>'
         rf'<span class="log-tag">&lt;/fuzz target&gt;</span>', escaped)
 
     escaped = _sub(
-        r'&lt;stdout&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/stdout&gt;',
-        r'<span class="log-tag">&lt;stdout&gt;</span>'
-        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+        r'&lt;stdout&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/stdout&gt;', r'<span class="log-tag">&lt;stdout&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-bash">\1</code></pre>'
         r'<span class="log-tag">&lt;/stdout&gt;</span>', escaped)
     escaped = _sub(
-        r'&lt;stderr&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/stderr&gt;',
-        r'<span class="log-tag">&lt;stderr&gt;</span>'
-        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code class="language-bash">\1</code></pre>'
+        r'&lt;stderr&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/stderr&gt;', r'<span class="log-tag">&lt;stderr&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-bash">\1</code></pre>'
         r'<span class="log-tag">&lt;/stderr&gt;</span>', escaped)
     escaped = _sub(
-        r'&lt;return_code&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/return_code&gt;',
+        r'&lt;return_code&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/return_code&gt;',
         r'<span class="log-tag">&lt;return_code&gt;</span>'
-        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto"><code>\1</code></pre>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code>\1</code></pre>'
         r'<span class="log-tag">&lt;/return_code&gt;</span>', escaped)
 
+    escaped = _sub(
+        r'&lt;build script&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/build script&gt;',
+        r'<span class="log-tag">&lt;build script&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-bash">\1</code></pre>'
+        r'<span class="log-tag">&lt;/build script&gt;</span>', escaped)
+
+    escaped = _sub(
+        r'&lt;gcb&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/gcb&gt;',
+        r'<span class="log-tag">&lt;gcb&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-bash">\1</code></pre>'
+        r'<span class="log-tag">&lt;/gcb&gt;</span>', escaped)
+
+    escaped = _sub(
+        r'&lt;gdb&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/gdb&gt;',
+        r'<span class="log-tag">&lt;gdb&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-bash">\1</code></pre>'
+        r'<span class="log-tag">&lt;/gdb&gt;</span>', escaped)
+
+    escaped = _sub(
+        r'&lt;gdb command&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/gdb command&gt;',
+        r'<span class="log-tag">&lt;gdb command&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-bash">\1</code></pre>'
+        r'<span class="log-tag">&lt;/gdb command&gt;</span>', escaped)
+
+    escaped = _sub(
+        r'&lt;gdb output&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/gdb output&gt;',
+        r'<span class="log-tag">&lt;gdb output&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        r'<code class="language-bash">\1</code></pre>'
+        r'<span class="log-tag">&lt;/gdb output&gt;</span>', escaped)
+
+    escaped = _sub(
+        r'&lt;code&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)&lt;/code&gt;',
+        r'<span class="log-tag">&lt;code&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        rf'<code class="language-{lang_key}">\1</code></pre>'
+        r'<span class="log-tag">&lt;/code&gt;</span>', escaped)
+
+    escaped = _sub(
+        r'&lt;solution&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/solution&gt;', r'<span class="log-tag">&lt;solution&gt;</span>'
+        r'<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+        rf'<code class="language-{lang_key}">\1</code></pre>'
+        r'<span class="log-tag">&lt;/solution&gt;</span>', escaped)
+
+    def process_system_content(match):
+      content = match.group(1)
+      return (r'<span class="log-tag">&lt;system&gt;</span>'
+              r'<div class="whitespace-pre-wrap break-words '
+              r'overflow-x-auto">' + content +
+              r'</div><span class="log-tag">&lt;/system&gt;</span>')
+
+    escaped = re.sub(
+        r'&lt;system&gt;(\s*[^\s].*?[^\s]\s*|(?:\s*[^\s].*?)?)'
+        r'&lt;/system&gt;',
+        process_system_content,
+        escaped,
+        flags=re.DOTALL)
+
+    # Handle steps tag (usually opening only, no closing tag)
+    escaped = _sub(r'&lt;steps&gt;',
+                   r'<span class="log-tag">&lt;steps&gt;</span>', escaped)
+
+    # Generic fallback for any remaining XML tags not explicitly handled above
+    # This ensures all XML tags get the log-tag styling
+    escaped = _sub(r'&lt;([^/&][^&]*?)&gt;',
+                   r'<span class="log-tag">&lt;\1&gt;</span>', escaped)
+    escaped = _sub(r'&lt;(/[^&]*?)&gt;',
+                   r'<span class="log-tag">&lt;\1&gt;</span>', escaped)
+
+    # Handle ExecutionStage-specific highlighting for fuzz target source
+    if "ExecutionStage" in agent_name:
+      escaped = self._highlight_execution_stage_content(escaped, lang_key)
+
     return escaped
 
+  def _highlight_execution_stage_content(self, content: str,
+                                         lang_key: str) -> str:
+    """Add syntax highlighting for ExecutionStage-specific content patterns."""
+
+    # Pattern to match "Fuzz target source:" followed by code until
+    # "Build script source:"
+    fuzz_target_pattern = (r'(Fuzz target source:)\s*\n'
+                           r'(.*?)'
+                           r'(?=Build script source:|$)')
+
+    def replace_fuzz_target(match):
+      header = match.group(1)
+      code_content = match.group(2).strip()
+
+      if code_content:
+        return (
+            f'<div class="font-medium text-blue-600 mb-2">{header}</div>'
+            '<pre class="whitespace-pre-wrap break-words overflow-x-auto">'
+            f'<code class="language-{lang_key}">{code_content}</code></pre>')
+      return f'<div class="font-medium text-blue-600 mb-2">{header}</div>'
+
+    content = re.sub(fuzz_target_pattern,
+                     replace_fuzz_target,
+                     content,
+                     flags=re.DOTALL)
+
+    return content
+
   def _create_step_data(self, step_number: int,
                         log_parts: list[LogPart]) -> dict:
     """Create step data from log parts."""
@@ -310,7 +474,7 @@ def _create_step_data(self, step_number: int,
   def get_agent_sections(self) -> dict[str, list[LogPart]]:
     """Get the agent sections from the logs."""
 
-    pattern = re.compile(r"\*{24}(.+?)\*{24}")
+    pattern = re.compile(r"\*{20,}([^*]+?)\*{20,}")
     agent_sections = {}
     current_agent = None
     agent_counters = {}
diff --git a/report/templates/base.html b/report/templates/base.html
index d0d43b0b8..4fd070e36 100644
--- a/report/templates/base.html
+++ b/report/templates/base.html
@@ -282,6 +282,24 @@
 .dark-mode .toc-item {
     color: #9ca3af;
 }
+
+.log-tag {
+    color: #8b7355;
+}
+
+.dark-mode .log-tag {
+    color: #a08968;
+}
+
+.chat_prompt .log-tag {
+    color: #5a6b8a;
+}
+
+.dark-mode .chat_prompt .log-tag {
+    color: #7a8ba8;
+}
+
+
 </style>
 <body
       x-data="{
@@ -924,30 +942,19 @@ <h2 class="signature">
   <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/python.min.js"></script>
   <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/rust.min.js"></script>
   <script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.8.0/languages/go.min.js"></script>
-  <script src="https://cdnjs.cloudflare.com/ajax/libs/marked/12.0.2/marked.min.js"></script>
+
   <script>
     window.addEventListener('DOMContentLoaded', function() {
       if (window.hljs && typeof window.hljs.highlightAll === 'function') {
         window.hljs.highlightAll();
       }
 
-      function renderMarkdownBlocks(root) {
-        if (!window.marked) return;
-        const blocks = (root || document).querySelectorAll('.markdown-block');
-        blocks.forEach((el) => {
-          try {
-            el.innerHTML = window.marked.parse(el.textContent || '');
-          } catch (_) {}
-        });
-      }
 
-      renderMarkdownBlocks(document);
       if (window.hljs) {
         const observer = new MutationObserver((mutations) => {
           for (const mutation of mutations) {
             for (const node of mutation.addedNodes) {
               if (!(node instanceof HTMLElement)) continue;
-              renderMarkdownBlocks(node);
               node.querySelectorAll('pre code:not(.hljs)').forEach((el) => {
                 try { window.hljs.highlightElement(el); } catch (_) {}
               });
diff --git a/report/templates/sample/sample.html b/report/templates/sample/sample.html
index 27cec449f..6cda4f139 100644
--- a/report/templates/sample/sample.html
+++ b/report/templates/sample/sample.html
@@ -313,7 +313,7 @@ <h3>Build Script</h3>
                             {% endfor %}
                           {% else %}
                             {% for log_part in agent_data.logs %}
-                              <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight(default_lang)|safe }}</div>
+                              <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight_agent(default_lang, agent_name)|safe }}</div>
                             {% endfor %}
                           {% endif %}
                         </div>
@@ -425,7 +425,7 @@ <h3>Build Script</h3>
                                     <div x-show="stepOpen" class="ml-5 px-3 pb-3 mt-3">
                                       {% if step.log_parts %}
                                         {% for log_part in step.log_parts %}
-                                          <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight(default_lang)|safe }}</div>
+                                          <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-3 rounded-md mb-2 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight_agent(default_lang, agent_name)|safe }}</div>
                                         {% endfor %}
                                       {% else %}
                                         <div class="p-3 rounded-md whitespace-pre-wrap break-words">{{ step.content|syntax_highlight|safe }}</div>
@@ -436,7 +436,7 @@ <h3>Build Script</h3>
                               {% endif %}
                             {% else %}
                               {% for log_part in agent_data.logs %}
-                                <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight(default_lang)|safe }}</div>
+                                <div class="{% if log_part.chat_prompt %}chat_prompt {% elif log_part.chat_response %}chat_response {% endif %} p-4 rounded-md mb-4 whitespace-pre-wrap break-words">{{ log_part.content|syntax_highlight_agent(default_lang, agent_name)|safe }}</div>
                               {% endfor %}
                             {% endif %}
                           </div>
diff --git a/report/web.py b/report/web.py
index ec5ee3881..9c352f0f8 100644
--- a/report/web.py
+++ b/report/web.py
@@ -109,8 +109,13 @@ def __init__(self, template_globals: Optional[Dict[str, Any]] = None):
 
     # Add a new filter for syntax highlighting
     logs_parser = LogsParser([])
-    self._env.filters[
-        'syntax_highlight'] = logs_parser._syntax_highlight_content
+    self._env.filters['syntax_highlight'] = logs_parser.syntax_highlight_content
+
+    def syntax_highlight_with_agent(content, default_lang="", agent_name=""):
+      return logs_parser.syntax_highlight_content(content, default_lang,
+                                                  agent_name)
+
+    self._env.filters['syntax_highlight_agent'] = syntax_highlight_with_agent
 
     if template_globals:
       for key, val in template_globals.items():
@@ -148,7 +153,8 @@ def __init__(self,
     self._output_dir = output_dir
     self._jinja = jinja_env
     self.results_dir = results_dir
-    # If cloud, this will be `llm-exp.oss-fuzz.com/Result-reports/ofg-pr/experiment-name`
+    # If cloud, this will be
+    # `llm-exp.oss-fuzz.com/Result-reports/ofg-pr/experiment-name`
     self._base_url = base_url
 
   def read_timings(self):