Detagger is a Windows program that can either convert HTML files into good-looking text, or selectively remove HTML markup. As a markup remover, you can tidy up your HTML in a number of ways. Simply select the classes of tags to be removed, sections of code to be stripped out, or tag manipulations to be performed. Options include - remove all FONT tags; remove tags added by MS Office applications; strip out FORM, HEAD, OBJECT, STYLE or SCRIPT sections; convert tags to upper or lower case; and replace hyperlinks by their display values.
As a HTML-to-Text converter, Detagger allows you to convert HTML newsletters into a more compact and email-friendly format. The program will output the document as text, preserving the marked up headings, lists, tables of the original and turning them into suitable text formats. Text is laid out as faithfully as possible to the original, within the constraints of your chosen page width. Detagger can process tables, laying them out as formatted text, or optionally turning them into comma-delimited data (CSV format). Hyperlinks are replaced by the display text, with the URL either displayed in the text or as an entry in a reference table added at the end of the document.
Formatting options include dictating the page width of the output, or adding custom headers and footers to the output text. Selected options are saved in so-called policy files which may be reloaded in later sessions.
The utility supports wildcards and drag and drop operation, making it well suited to whatever mode of operation you prefer. After conversion, results can be viewed in a browser or text editor (depending on the type of conversion).
A console version in available for batch or automated conversions, and is included with the Windows version for users who register. An API version is available for developers under separate license for those wishing to add Detagger"s functionality to their own software.Detagger è un programma Windows che permette di trasformare un HTML in diversi modi, eliminando parzialmente i tag, oppure totalmente, convertendo in testo.
Quando è usato per la rimozione parziale l'utente sceglie quali tag vanno rimossi, o le manipolazioni da effettuare. Ad esempio si possono eliminare tutti i tag FONT, oppure tutti i tag aggiunti dalle applicazioni MS Office; togliere le sezioni HEAD o SCRIPT; convertire i tag in maiuscole o minuscole; sostituire i link solo con il loro contenuto.
Quando è usato come convertitore da HTML a testo, Detagger permette per esempio di convertire newsletter HTML in un formato più compatto ed "email-friendly". La conversione avviene preservando formato, titoli, liste e tabelle. Il testo viene disposto il più fedelmente possibile all'originale, rispettando la dimensione scelta per pagine. Il software può gestire la maggior parte delle tabelle (includendo quelle annidate), cercando di convertirle in testo. Gli Hyperlink sono sostituiti dal testo mostrato, e si può scegliere se includere la URL nel testo oppure alla fine del documento. Le opzioni consentono di definire intestazioni, pie' di pagina, e la larghezza della pagina creata.
In entrambi i modi le varie opzioni possono essere salvate in "policy files" e caricate per un riutilizzo successivo.
Supporta "wildcard" e operazioni drag and drop. Dopo la conversione i risultati si possono vedere in un browser o in un editor di testo (a seconda del tipo di conversione effettuato). Una versione "Console" è disponibile agli utenti registrati e permette conversioni batch / automatiche. Una versione API è disponibile per gli sviluppatori che vogliano inserire le funzioni di Detagger nei propri programmi.
 |