WCM Forum

WCM Forum (http://www.wcm.at/forum/index.php)
-   Internet (http://www.wcm.at/forum/forumdisplay.php?f=8)
-   -   HTML Filtern (http://www.wcm.at/forum/showthread.php?t=65358)

BOfH 05.08.2002 00:25

HTML Filtern
 
Hi !

Meine Frage passt irgendwie nirgends so recht rein, aber ich versuche es mal hier.

Ich will lokal abgespeicherte HTMLs derart filtern, dass (meiner Meinung nach, kommt der Syntax in allen Dateien vor) nur Zeilen zwischen Text1 "" und Text2 "" übrig bleiben, und der Rest gelöscht wird.

Die Lösung soll auch zig-Dateien abarbeiten können (Batch) und das Resultat (eventuell) in eine einzige Output-Datei schreiben.

Als OS hätte ich W2k und Linux zur Verfügung.

Wäre über jede Anregung für die Lösung meines Problems dankbar:)

mfg
BOfH

mcs_ 05.08.2002 08:00

hi!

mit perl lässt sich sowas relativ schnell erledigen. bin aber anfänger und deshalb nicht die person die dir ein solches skript liefern kann ...

_m3 05.08.2002 08:15

Code:

#!/usr/bin/perl -w
use strict;

my $ausgabe = 0;

open(IN, $ARGV[0]) or die "Lesefehler! Konnte Datei '$ARGV[0]' nicht lesen - $!\n";
while(<IN>) {
        chomp;
        if( // ) {
                $ausgabe = 1;
        } elsif( //) {
                $ausgabe = 0;
        } else {
                print "$_\n" if($ausgabe);
        }
}
close(IN);

UNTESTED!

BOfH 06.08.2002 12:22

m3 ... danke erstmal.

Nach ein paar Testläufen scheint das .pl richtig zu funktionieren, müsste jetzt nur mehr die Bearbeitung von vielen Dateien hintereinander implemtieren.


Alle Zeitangaben in WEZ +2. Es ist jetzt 23:29 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
© 2009 FSL Verlag