Skip to content

get_sections returns incomplete section list #311

@alkanex-xyz

Description

@alkanex-xyz

Hey i have an issue on following page:
https://de.wikipedia.org/w/index.php?title=Wikipedia:Auskunft&oldid=238242639

Get_sections does not return all sections.

seite_wikitext = mwparserfromhell.parse(seite.text)
abschnitte = seite_wikitext.get_sections(levels=[1,])

# print(abschnitte)
abschnitt = abschnitte[-1]
ueberschriften = abschnitt.filter_headings()

returns following in ueberschriften:

['= 14. Oktober =', '== Motivation der Parteien im Gazastreifen ==', '== Gaza-Streifen ==', '== ubuntu update hate-speak? ==', '== Nonbinär ==', '== Wieviele Sprachen kennen lautharmonische Prinzipien/Variationen? ==', '== Wo befindet sich die Kunstgalerie [[Teterow]]? ==', '== [[Erregung öffentlichen Ärgernisses]] ==', '== Israel/Palästina auf DDR-Karten ==', '== Löschungen von Erstellungsversuchen von Artikeln über 1 bestimmten Film ==', '== Hot chip verbot==', '= 15. Oktober =', '== Umzeichnung ==', '== Grenzen der Vorstellungskraft bei einer großen Anzahl ==', '== Woher weiß mein digitales Autotachometer die jeweils geltende Höchstgeschwindigkeit? ==', '= 16. Oktober =', '== Knollenblätterpilzvergiftung — wie behandelbar/tödlich ==', '== Sprachenlernen in einer Woche? ==', '== Vorschlag, eine Seite für den iranischen Schauspieler und Komponisten Javad Nazari Shekarchi zu erstellen ==', '== [[ChatGPT]] ist nicht mein Metier ==', '== Metall in Mikrowelle ==', '== CaMKII ==', '== Nägel schneiden ==', '== Apollo 13-Mission EDV ==', '= 17. Oktober =', '== Wie wird man Jude? ==', '== Bietet das russische Namensrecht ähnliche Freiheiten wie ... ==', '== Wie unterscheidet man Betrüger von echtem MS Windows Sicherheitsalarm? ==', '== Museen in Deutschland, wie viele Prozente der Einnahmen werden durch Eintrittskarten erwirtschaftet? ==', '== Der Ethanolanteil in fossilen Kraftstoffen ==', '== Scheidungen als Funktion des Hochzeitsmonats ... ==', "== 'Gebildete Umgangssprache'? =="]

but it should start from the 17. October instead of the 14. October. On other Pages it returns as intended the last section

Python 3.11
mwparserfromhell 0.6.5

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions