Si tratta di uno "pseudo spider" che visiti tutte le pagine di nostro interesse, in un particolare url passato in input, ed un parser sui contenuti, che estragga ciò che ci interessa dell'url, mediante le espressioni regolari.
[PHP prevede molte funzioni avanzate per il parsing di stringhe e il matching di espressioni regolari]
Esempio: http://www.paginegialle.it/naviga/000347100-5/aziende-agricole.html
Oltre 200 risultati trovati | pagina 1 di 20
Se volessimo recuperare tutte le aziende agricole di pagine gialle, dovremmo visitare tutte le 20 pagine di risultati
ed estrarre le singole inserzioni.
E' un lavoro semplice utilizzando le espressioni regolari sul codice html. Essendo
generato in automatico il codice html, in base ad una query nel db di PagineGialle, probabilmente i "box" che
racchiudono le inserzioni saranno uguali, o molto simili.
Nel tool Content Grab sono presenti opzioni che, opportunamente settate possono far si che l'utente eviti l'inserimente di una propria... continua
download free tool versione 2.0.1
13/Jun/2008
-------------------------------------
Il webtool Content Grab é realizzato in php, una volta scaricato il tool e scompattato sul proprio server locale,si puó... continua
download free tool versione 2.0
12/Jun/2008
-------------------------------------
Con Content Grab versione 1.0 l’utente si trova finalmente davanti ad uno strumento facile, comprensibile e immediato con cui effettuare... continua
download free tool versione 1.0
13/Apr/2008
-------------------------------------