[ruby-it] I: hlep- ho un problema

Luca de Marinis loop a interact.it
Lun 15 Dic 2008 17:26:40 CET


piccio84 a libero.it wrote:
>
> Devo realizzare in ruby un programma che data una pagina web rintracci dei 
> file testuali in essa contenuti e ne faccia il parsing in un file xml. Il mio 
> problema è quello di trovare questi file testuali...>Una volta che attraverso 
> la libreria open-uri scarico tutto il file html associato a quella pagina come 
> faccio a rintracciare i fiel. Grazie  per l'aiuto
>
>   
Intendi dei files testuali linkati dalla pagina da cui parti?
Dovresti dare un'occhiata alla gemma hpricot ; in linea di massima, ti 
fai dare da hpricot i nodi di tipo 'a', li esamini per vedere se puntano 
a un file di testo (si spera che sia sufficiente vedere se linkano a 
qualcosa che finisce in .txt, altrimenti e' un bel po' piu' complicato), 
poi per ognuno dei files trovati ci fai quello che vuoi (a dire il vero 
non capisco perche' parli di parsing dei files testuali, un xml si 
parsa, un file testuale si legge dato che non ha struttura!).

Dai un occhiata al minitutorial:

http://code.whytheluckystiff.net/hpricot/

Ciao

-- 

________________________________________________________________________

*Luca S.G. de Marinis
*/Senior developer/**

 Roma - tel.+39.0658318301 fax.+39.0658318303 P.I. 04856801008 **

*
*Rispetta l'ambiente e non stampare questa e-mail a meno che non ti sia 
realmente utile.
Please consider the environment and don't print this e-mail unless you 
really need to.

*NOTE SULLA PRIVACY*
Le informazioni trasmesse attraverso la presente e-mail ed i suoi 
allegati sono diretti esclusivamente al
destinatario e devono ritenersi riservati con divieto di diffusione e di 
uso. La diffusione e la comunicazione
da parte di soggetto diverso dal destinatario è vietata dall'art. 616 e 
ss. c.p. e dal d. l.vo n. 196/03.
Se la presente e-mail ed i suoi allegati fossero stati ricevuti per 
errore da persona diversa dal destinatario
siete pregati di distruggere tutto quanto ricevuto e di informare il 
mittente con lo stesso mezzo.
________________________________________________________________________

 

 



More information about the Ml mailing list