Teinpä kokeilun Python Pandalla. Aluksi ilman lxml:ää, mutta kun virheilmoitus antoi ymmärtää, että se tarvitaan, niin asensin pipillä sen. Sitten kun ajoin ohjelman, tuli monta riviä virheilmoitusta. Kun katselee tuota sivua, siinä on monimutkaisia rakenteita. Ja vielä kun katsoo sivun lähdekoodia, ei siellä taulukoita olekaan. Ilmeisesti Pandalla ei voikaan lukea tuota sivua. Yksi esimerkkiohjelma kykeni lataamaan Wikipediasta ison taulukon tiedot helposti.
import pandas as pd # version 1.5.2
import lxml # version 4.9.2
if __name__ == '__main__':
site = 'https://www.iihf.com/en/events/2023/wm20/schedule'
games = pd.read_html(site)
games.info()