Browsing Posts published in November, 2006

Per tutti quanti coloro che desiderano pubblicare degli indirizzi email visibili sulle loro pagine web, ma sono terrorizzati dallo spam, questo semplice script in php vi consente di mettervi in parte al riparo da questo problema.

Quello che fa lo script è produrre un’immagine PNG al volo contenente l’indirizzo email da voi passato, inoltre per evitare che gli spider dediti alla raccolta di email riconoscano nel vostro codice html l’indirizzo, questo può essere invalidato con due tecniche (che in realtà possono essere anche abinate insieme):

  1. con l’inserimento di un numero arbitrario di spazi bianchi all’interno dell’email
  2. con la sostituzione del carattere @ con la stringa [___AT___] (N.B. sono tre gli underscore prima e dopo AT).

Lo script prevede anche la possibilità di rendere lo sfondo dell’immagine trasparente in modo da adattarla allo sfondo della pagina sulla quale deve visualizzare l’immagine, per questa funzionalità basterà decommentare la linea 15 del file emailToImage.php

Per quanto riguarda l’utilizzo del file vi propongo qui di seguito un breve codice HTML (perdonatemi se non è un codice perfetto ma non è questo l’intento dell’articolo):

Error: Could not open Test_emailToImage.html

mentre per quanto riguarda il codice dello script PHP continue reading…

JavaDay Roma

1 comment

Siamo quasi giunti al fatidico giorno del JavaDay a Roma.

Questa manifestazione si terrà sabato 2 dicembre 2006 presso l’Università Roma Tre.

Tanti gli argomenti in programma e questo è il link dove troverete il programma ufficiale

Web GraphHello, today I wanna tell you about my last python script (really nuts and bolts), called sitemaps.
With it you can build your website sitemaps, it works as a simple spider, it doesn’t produce a xml file but later maybe i can implement this function, for now it only produces a txt file.

This little spider, starts its crawling from a user specified starting page, and it moves all around the internal links it founds. At the end it produces a txt file with all the links, one per line, found during its crawl, this file could be submitted to Google SiteMaps and its syntax is legal.

The importans of using this kind of tool is that Google could index all your internal pages in less time, giving you the chance to increase your popularity.

As I said before this is really “nuts and bolts” but it’s a good starting point to write more sofisticated spider or web analysis tools.

The script core is a BFS (Breadth first search) visit of the graph composed from target web site internal links.

As usually if you have any comments, please don’t esitate, write them!

Here is the source code

Error: Could not open sitemap.py

and here sitemap.py you can download the script.

(English version Google sitemap tool)

Web GraphCiao a tutti, quello che vi presento oggi è un semplicissimo script python, che consente a partire da un indirizzo internet specificato all’avvio, di costruire un file indice contenente tutti i link interni del sito analizzato.

Con questo strumento è possibile creare dei file utilizzabili con Google SiteMaps che vi aiuteranno a far indicizzare l’intero contenuto del vostro sito.

Lo script essendo stato scritto in meno di mezz’ora è veramente spartano, non prevede alcuna personalizzazione né produce in output un file xml compatibile con lo standard definito da google per le sitemaps, ma un semplice file di testo con l’elenco dei link.

È comunque un buon inizio sia per poter sviluppare tool più sofisticati per la produzione di sitemap sia per gettare le basi per un piccolo web crawler in python, perché quello che fa questo script è effettuare una visita BFS cioè in ampiezza, del grafo dei link interni di un sito.

Come al solito se avete commenti non esitate, anzi più ce ne sono migliore sarà il prodotto finale.

Clicca qui per il codice

Error: Could not open sitemap.py

e clicca sitemap.py per scaricare il file.