WCM - Das österreichische Computer Magazin Forenübersicht
 

Zurück   WCM Forum > Rat & Tat > Programmierung

Programmierung Rat & Tat für Programmierer

Microsoft KARRIERECAMPUS

Antwort
 
Themen-Optionen Ansicht
Alt 22.11.2006, 12:42   #1
tricipitinus
Senior Member
 
Registriert seit: 21.11.2001
Alter: 43
Beiträge: 160


Standard PERL: Titel aus HTML Quellcode auslesen

Hi!

Ich will aus einer Liste von eingegebenen URLs den Titel aus dem jeweiligen quellcode auslesen und ausgeben.
was ich schon habe:

Code:
#!/usr/bin/perl

 
use LWP::Simple;
  $Url = get 'http://orf.at/ticker/236327.html';

@html = split ( /\s+/, $Url );

if ($html == "<title>") {print "Titel gefunden!"};
mir fällt nun aber keine möglichkeit ein, wie ich die Zeichen zwischen
Code:
 <title> und </title>
extrahieren und ausgeben kann..
____________________________________
Es kann passieren was will, es gibt immer jemanden, der es kommen sah.
tricipitinus ist offline   Mit Zitat antworten
Alt 22.11.2006, 13:25   #2
colossus
Master
 
Registriert seit: 24.02.2002
Ort: Wien
Alter: 40
Beiträge: 611


Standard

Mit Perl kann ich nicht dienen, vielleicht hilft dir aber auch ein sed-Script:

Code:
sed -r '/<title>.*<\/title>/!d;s/<title>(.+)<\/title>/\1/' file1 file2 ... fileN
____________________________________
Free Software. Free Society. Better Lives.
colossus ist offline   Mit Zitat antworten
Alt 23.11.2006, 22:54   #3
tricipitinus
Senior Member
 
Registriert seit: 21.11.2001
Alter: 43
Beiträge: 160


Standard

danke, habs schon geschafft...falls es jm. interessiert ^^

Code:
#! /usr/bin/perl -w

use LWP::Simple;

#Eingabeaufforderung der URLs
print "Enter URLs including http:// , use blanks to seperate them: ";
chomp ($input  = <>);
@urls = split ( /\s+/,$input);

#Jeder link wird geladen und nach dem Muster <title>*</title> durchsucht
foreach $url (@urls) {
  my($html)=get($url);
  print "\nThe webpage: $url has the title: ";
  $html =~ m/(<title>.*<\/title>)/i; #Hier wird ein Patternmatch durchgeführt, das /i bewirkt no-case-sensitivity
  print $1 . "\n";
}
____________________________________
Es kann passieren was will, es gibt immer jemanden, der es kommen sah.
tricipitinus ist offline   Mit Zitat antworten
Antwort


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.

Gehe zu


Alle Zeitangaben in WEZ +2. Es ist jetzt 02:39 Uhr.


Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Forum SEO by Zoints
© 2009 FSL Verlag