[ruby-it] I: hlep- ho un problema
Luca de Marinis
loop a interact.it
Lun 15 Dic 2008 17:26:40 CET
piccio84 a libero.it wrote:
>
> Devo realizzare in ruby un programma che data una pagina web rintracci dei
> file testuali in essa contenuti e ne faccia il parsing in un file xml. Il mio
> problema è quello di trovare questi file testuali...>Una volta che attraverso
> la libreria open-uri scarico tutto il file html associato a quella pagina come
> faccio a rintracciare i fiel. Grazie per l'aiuto
>
>
Intendi dei files testuali linkati dalla pagina da cui parti?
Dovresti dare un'occhiata alla gemma hpricot ; in linea di massima, ti
fai dare da hpricot i nodi di tipo 'a', li esamini per vedere se puntano
a un file di testo (si spera che sia sufficiente vedere se linkano a
qualcosa che finisce in .txt, altrimenti e' un bel po' piu' complicato),
poi per ognuno dei files trovati ci fai quello che vuoi (a dire il vero
non capisco perche' parli di parsing dei files testuali, un xml si
parsa, un file testuale si legge dato che non ha struttura!).
Dai un occhiata al minitutorial:
http://code.whytheluckystiff.net/hpricot/
Ciao
--
________________________________________________________________________
*Luca S.G. de Marinis
*/Senior developer/**
Roma - tel.+39.0658318301 fax.+39.0658318303 P.I. 04856801008 **
*
*Rispetta l'ambiente e non stampare questa e-mail a meno che non ti sia
realmente utile.
Please consider the environment and don't print this e-mail unless you
really need to.
*NOTE SULLA PRIVACY*
Le informazioni trasmesse attraverso la presente e-mail ed i suoi
allegati sono diretti esclusivamente al
destinatario e devono ritenersi riservati con divieto di diffusione e di
uso. La diffusione e la comunicazione
da parte di soggetto diverso dal destinatario è vietata dall'art. 616 e
ss. c.p. e dal d. l.vo n. 196/03.
Se la presente e-mail ed i suoi allegati fossero stati ricevuti per
errore da persona diversa dal destinatario
siete pregati di distruggere tutto quanto ricevuto e di informare il
mittente con lo stesso mezzo.
________________________________________________________________________
More information about the Ml
mailing list