WCM Forum - HTML Filtern

WCM Forum (http://www.wcm.at/forum/index.php)

- Internet (http://www.wcm.at/forum/forumdisplay.php?f=8)

- - HTML Filtern (http://www.wcm.at/forum/showthread.php?t=65358)

Hi !

Meine Frage passt irgendwie nirgends so recht rein, aber ich versuche es mal hier.

Ich will lokal abgespeicherte HTMLs derart filtern, dass (meiner Meinung nach, kommt der Syntax in allen Dateien vor) nur Zeilen zwischen Text1 "" und Text2 "" übrig bleiben, und der Rest gelöscht wird.

Die Lösung soll auch zig-Dateien abarbeiten können (Batch) und das Resultat (eventuell) in eine einzige Output-Datei schreiben.

Als OS hätte ich W2k und Linux zur Verfügung.

Wäre über jede Anregung für die Lösung meines Problems dankbar:)

mfg
BOfH

hi!

mit perl lässt sich sowas relativ schnell erledigen. bin aber anfänger und deshalb nicht die person die dir ein solches skript liefern kann ...

Code:

#!/usr/bin/perl -w

use strict;



my $ausgabe = 0;



open(IN, $ARGV[0]) or die "Lesefehler! Konnte Datei '$ARGV[0]' nicht lesen - $!\n";

while(<IN>) {

        chomp;

        if( // ) {

                $ausgabe = 1;

        } elsif( //) {

                $ausgabe = 0;

        } else {

                print "$_\n" if($ausgabe);

        }

}

close(IN);

UNTESTED!

m3 ... danke erstmal.

Nach ein paar Testläufen scheint das .pl richtig zu funktionieren, müsste jetzt nur mehr die Bearbeitung von vielen Dateien hintereinander implemtieren.