scieloorg · robertatakenaka · Jan 16, 2026 · Jan 16, 2026 · Jan 16, 2026 · Jan 16, 2026
diff --git a/scielo_classic_website/spsxml/detector.py b/scielo_classic_website/spsxml/detector.py
@@ -192,6 +192,15 @@ def analyze_xref(text: str = None, rid: str = None) -> Dict[str, Optional[str]]:
             result["prefix"] = prefix
             result["number"] = number
             result["source"] = "text"
+        else:
+            ref_type_text, element_name_text, prefix, number = detect_from_text(text.split()[0])
+            if ref_type_text:
+                result["ref_type"] = ref_type_text
+                result["element_name"] = element_name_text
+                result["prefix"] = prefix
+                result["number"] = number
+                result["source"] = "text"
-            ref_type_text, element_name_text, prefix, number = detect_from_text(text.split()[0])
-            if ref_type_text:
-                result["ref_type"] = ref_type_text
-                result["element_name"] = element_name_text
-                result["prefix"] = prefix
-                result["number"] = number
-                result["source"] = "text"
+            parts = text.split()
+            if parts:
+                ref_type_text, element_name_text, prefix, number = detect_from_text(parts[0])
+                if ref_type_text:
+                    result["ref_type"] = ref_type_text
+                    result["element_name"] = element_name_text
+                    result["prefix"] = prefix
+                    result["number"] = number
+                    result["source"] = "text"
-            ref_type_text, element_name_text, prefix, number = detect_from_text(text.split()[0])
-            if ref_type_text:
-                result["ref_type"] = ref_type_text
-                result["element_name"] = element_name_text
-                result["prefix"] = prefix
-                result["number"] = number
-                result["source"] = "text"
+            parts = text.split()
+            if parts:
+                ref_type_text, element_name_text, prefix, number = detect_from_text(parts[0])
+                if ref_type_text:
+                    result["ref_type"] = ref_type_text
+                    result["element_name"] = element_name_text
+                    result["prefix"] = prefix
+                    result["number"] = number
+                    result["source"] = "text"
+
 
-
-
     # Análise do ID
     if rid:

diff --git a/scielo_classic_website/spsxml/detector_config_xref.py b/scielo_classic_website/spsxml/detector_config_xref.py
@@ -85,7 +85,9 @@
         # Africâner
         r"(?i)^figs?\.?(?:\s*\d+)?$",
         r"(?i)^figure?(?:\s*\d+)?$",
-        r"(?i)^beelde?(?:\s*\d+)?$"
+        r"(?i)^beelde?(?:\s*\d+)?$",
+        # Padrão Fig. No
+        r"(?i)^fig\.?\s*no\.?\s*\d+$"
     ],
     # Tabelas
     "table": [
@@ -107,7 +109,9 @@
         r"(?i)^tafeln?(?:\s*\d+)?$",
         # Africâner
         r"(?i)^tabelle?(?:\s*\d+)?$",
-        r"(?i)^tabs?\.?(?:\s*\d+)?$"
+        r"(?i)^tabs?\.?(?:\s*\d+)?$",
+        # Padrão cuadro No
+        r"(?i)^cuadro\s*no\.?\s*\d+$"
     ],
     # Referências bibliográficas
     "bibr": [
@@ -548,6 +552,7 @@
     r"^c\d+": "corresp",
     r"^e\d+": "disp-formula",
     r"^f\d+": "fig",
+    r"^cuadro\d+": "table",  # cuadro em espanhol para table
     r"^gf\d+": "graphic",
     r"^suppl\d+": "supplementary-material",
     r"^m\d+": "math",

diff --git a/scielo_classic_website/spsxml/sps_xml_body_pipes.py b/scielo_classic_website/spsxml/sps_xml_body_pipes.py
@@ -16,6 +16,7 @@
     detect_from_text,
     detect_element_type,
     detect_sec_type,
+    detect_from_id,
 )
 from scielo_classic_website.spsxml.detector_title_parent import identify_parent_by_title
 from scielo_classic_website.htmlbody.html_merger import (
@@ -128,7 +129,7 @@ def convert_html_to_xml(document):
         convert_html_to_xml_step_60_ahref_and_aname,
         convert_html_to_xml_step_70_complete_fig_and_tablewrap,
         convert_html_to_xml_step_80_fix_sec,
-        convert_html_to_xml_step_80_fix_sec,
+        convert_html_to_xml_step_80_fix_sec,
+        # NOTE: Step 90 (`convert_html_to_xml_step_90_complete_disp_formula`) is
+        # temporarily disabled because it may incorrectly transform some <disp-formula>
+        # elements and generate invalid SPS XML. Re-enable this step only after the
+        # underlying issues are fixed and regression tests for complex formula markup
+        # are in place and passing.
-        convert_html_to_xml_step_80_fix_sec,
+        convert_html_to_xml_step_80_fix_sec,
+        # NOTE: Step 90 (`convert_html_to_xml_step_90_complete_disp_formula`) is
+        # temporarily disabled because it may incorrectly transform some <disp-formula>
+        # elements and generate invalid SPS XML. Re-enable this step only after the
+        # underlying issues are fixed and regression tests for complex formula markup
+        # are in place and passing.
-        convert_html_to_xml_step_90_complete_disp_formula,
+        # convert_html_to_xml_step_90_complete_disp_formula,
         convert_html_to_xml_step_95_fix_body,
     )
     document.exceptions = []
@@ -1135,8 +1136,10 @@ def transform(self, data):
         self.remove_top_and_back(xml)
         self.remove_multiplicity(xml)
         for node in xml.xpath(".//a[@name]"):
-            node.tag = "element"
-            node.set("id", node.attrib.pop("name"))
+            name = node.attrib.pop("name")
+            ref_type, elem = detect_from_id(name)
+            node.tag = elem or "element"
+            node.set("id", name)
         return data
 
 
@@ -1910,6 +1913,7 @@ def rename_center(self, root):
                 center.tag = "p"
                 continue
             center.tag = "title"
-            center.tag = "title"
+            center.tag = "title"
+        # Remove os elementos marcados com STRIPTAG, usados apenas como marcadores
+        # temporários para <center> vazios, para que essas tags artificiais não
+        # apareçam no XML final.
-            center.tag = "title"
+            center.tag = "title"
+        # Remove os elementos marcados com STRIPTAG, usados apenas como marcadores
+        # temporários para <center> vazios, para que essas tags artificiais não
+        # apareçam no XML final.
+        ET.strip_tags(root, "STRIPTAG")
 
 
 class XMLBoldToTitlePipe(plumber.Pipe):