dolovani dat z html tabulky

ahoj,

mám html tabulku a potřebuji ji převést do xml souboru. a zajimalo by mě, jak vy profesionalové, dolujete data z te tabulky? mě napadl jediny zpusob: projit cely html soubor a vyhledavat v něm substringy "<td>" pomoc funkci substr() a strcmp();

dela se to jinak?
No, ono "html tabulku a potřebuji ji převést do xml souboru." je dost širokej pojem, takže to možná nebude přesně to, co máš na mysli:
nevim jak profesionálové, ale já bych zkusil fci strip_tags(), čímž bych se zbavil toho "tabulkového balastu" a potom bych asi nasadil nějakou již hotovou třídu (sem děsně pohodlnej tvor) ... ?
Já jsem nikdy na wz z html nic tahat nemusel. Nejotročtější je asi parsovat tabulku element po elementu a pokud nevíš, že je vše (nebo třeba každý celý tr - table row) v texťáku na jednom řádku, tak ti ani regexpy moc nepomůžou (nebo jo? Já o žádném způsobu nevím, ale budu rád, když mi to někdo vyvrátí).

Asi bych se uchýlil k triku - zadoufal bych v inteligenci vývojářů php a sablotronu a zkusil tabulku/html stránku prohnat xsl transformací. Někde jsem četl, že php podporuje i html zdroje (tedy nevalidní xml a umí si to opravit), ale nejsem si jistý, jestli už v php4.
mi prijde tabulka uz dost XML, ne? Mozna akorat dokoncit neuzavrene tagy.
tak už jsem to vyřešil ... to co jsem od vás chtěl slyšet je, že existují nějaké ragulární výrazy a metody typu preg_replace()
Zdravím
Tabulkové data lze importovat do libreOffice calc,pokud ma tabulka tr,td tagy.
Přes externí odkaz,
Pokud je založena na <div> tak to je problem,jde o dynamickou stránku.
Zatím jsem nepřišel jak takové tabulky importovat,jdou jedině kopírovat ale po vložení do txt souboru vytvoří sloupec dat.
Pokud někdo může poradit?