Test-Datei für die Umwandlung von Mail- und Webadressen in Links

   \
    +--------- für den Test der Option "1. Zeile als Überschrift formatieren"
    
********************************************************************************
* Test-Datei "URLtest.txt" für die Umwandlung vom Mail- und Webadressen in Links
* ==============================================================================
* Diese ANSI-Testdatei dient zum Testen der FUNCTIONs URL2link$ und mail2link$
* im QBasic-Programm TXT2HTM.BAS..
*
* Thomas Antoni --- thomas@antonis.de --- www.antonis.de , 16.1.07 - 28.9.09 
********************************************************************************

Inhalt
================================================================================
1. Testfälle für Webadressen
2. Testfälle für Mail-Adressen
3. Testfälle für Mailadressen mit URLs/Webadressen gemischt in einer Zeile


1. Testfälle für Webadressen
================================================================================

Das Programm lehnt sich im Erkennen von Webadressen an MS Outlook an
--------------------------------------------------------------------------------
Outlook beginnt nach folgenden Zeichen, von einer URL auszugehen:
www.x      'x=beliebiges Zeichen
WWW.x      'dito
wWw.x      'dito

http:/
HTTP:/
hTtP:/

https:/
HTTPS:/
HtTpS:/


Als vorangehende Trennzeichen werden außer dem Blank folgende Zeichen anerkannt:
;,.([{)]}-, aber nur nach einem Zeilenvorschub! TXT2HTML.BAS hat diese
Einschränkung nicht.


Als abschließende Trennzeichen werden außer d. Blank folgende Zeichen anerkannt:
;,.([{)]}-, aber nur vor einem Zeilenvorschub! TXT2HTML.BAS hat diese
Einschränkung nicht.


Weitere interessante Testfälle, die das Programm TXT2HTML.BAS, ebenso wie
Outlook beherrscht 

http://www2ftp.de/
http://members.aa.net/~skeksis/Star_Trek/
http://aia.wu-wien.ac.at/Startrek/titelseite.html
http://skd.mchm.siemens.de/ckm/
http://home.att.net/~dfisher-seadrives/
http://ourworld.compuserve.com/homepages/Mi_software/


Weitere Testfälle für die Umwandlung von URLs/Webadressen in Links
--------------------------------------------------------------------------------
www.antonis.de, www.qbasic.de und HtTp://wWw.o-bizz.de sind meine Webseiten.
Ich habe die Webseiten www.qbasic.de, https://qbasic.de und wWw.o-bizz.de
www.qbasic.de

Keine gültigen Internetadressen sind: www.taube, "HTTP" und https://
Alles über QBasic findest Du auf www.qbasic.de. Das ist weltweit die größte
QBasic-Seite nach www.qbasic.com.


Behandlung von Trennzeichen und Domainnamen mit Punkten
--------------------------------------------------------------------------------
Folgende URLs sind gültig: www.thomas.familie.antoni.info, (www.ab.cd).
www.abc.def.gh,
[www.ab.cd}
und auch www.ab.cd, www.ef.gh und (www.ij.kl) sind gültig sowie (www.delta.com).

Anführungszeichen sind ebenfalls Trennzeichen: "www.qbasic.de")]}
"www.ab.cde", "https://www.qwe.tzu.io" ("www.yx.we.rt".


Weitere Testfälle (z.T. aus meinen Bookmarks)
--------------------------------------------------------------------------------
- www.bike-together.de - Bernward Eisels Afrika-Tour mit dem Liege-Tandem
- www.frankonbiketour.de - Webseite des Rad-Fernreisenden Frank Lorenz
- www.end2end.de.tc - Reisebericht über eine Durchquerung der brit.Insel per
- www.heise.de - c't 
- www.trekkingbike.com - Zeitschrift
- www.radfahren.de - Zeitschrift "Aktiv Radfahren"
- www.RADtouren-magazin.com - Magazin fuer Radreisende
- www.athen-peking.de ) Radtour Athen-Peking
- www.china-by-bike.de) China-Radtouten
- www.engine-magazin.de/extras/index.htms - Vokabeln herunterladen
- www.adv-cycling.org - Adventure Cycling Association
- www.reporter-tdf.de - Timmendorfer Anzeigenblatt "Reporter"
- www.kontaktvoll.de - tiefergehende Surftipps
- www.host-a-fan.AUS - Unterkuenfte bei Privatleuten
- www.photographie.de - Fotozeitschrift mit Schwerpunkt auf Bildgestaltung
- www.rhenania-zeit.de/rhenania - Versand guenstiger Buecher
- https://www.reinhard-pantke.de/
- http://www.webdesign/hpkoch/html.htm. www.webdesign/rezepte/form1.htm    
- www.denic.de 13.10.07:
- www.antoni.de.

3 URLs in einer Zeile:
www.antonis.de http://qbasic.de https://q-basic.de


Einige komplexe Webadressen mit PHP-Parametern für dynamische Webseiten usw.
--------------------------------------------------------------------------------
- http://www.heise.de/mobil/MWC-Yahoo-will-das-gesamte-Web-fuers-Handy-erschliessen--/newsticker/meldung/132710
- http://oas.heise.de/RealMedia/ads/click_lx.ads/www.heise.de/4in1_middle3hp/458443007/x42/OasDefault/wp06_trolltech_48nbox_08/accenture06_30nros_08_textlink.html/64396664623735303439326565373630?http://www.heise.de/whitepapers/Benutzerinterfaces-mit-Nokia-Qt-flexibel-gestalten--/detail/157/?&source=News_RoS_ab_kw_03
- https://signin.ebay.de/ws/eBayISAPI.dll?SignIn
- http://training.ebay.de/online-training/content_manager/redirect.php?flag=kaufen
- http://my.ebay.de/ws/eBayISAPI.dll?MyEbay&gbh=1&ssPageName=STRK:ME:LNLK&CurrentPage=MyeBayMyMessages
- http://trc1.emv2.com/I?a=A9X7CqiX6xD38WxyvK9KtvXkHw
- https://www.expedia.de/pub/agent.dll?qscr=logi&hsuc=&fram=&uurl=qscr%3Dlitn%96&ussl=&uact=4&slgn=&zz=1235142104711
- www.suchen.de/text?what=uhrmacher&where=erlangen&portalview=2&x=37&y=13&sort=relevance&radius=10&fedsearch=true
- http://www2.computeruniverse.net/list.asp?searchname=mju+1030&language=deutsch&order=&pagetitle=Ergebnisse+Ihrer+Suche&searchgroupoption=on&searchmanuoption=on&searchnameoption=on&searchwordoption=allwords&source=searchdb&sourceurl=%2Fsearch%2Fdefault.asp


Nicht erkannte Webadressen
--------------------------------------------------------------------------------
Die folgenden URLs werden nicht richtig verarbeitet, weil hinter den Trennzeich
(Komma, Punkt usw.) das Blank fehlt:
www.ab.cd,www.ef.gh;http://www.ij.klm.www.fritz.de

"Problemfälle", die Outlook nur erkennt, wenn das "http://" vorangestellt ist:

http://www-stud.htw-kempten.de:80/surfboard/all.html
http://www1.buch.de/
http://www2.latech.edu/~acm/HelloWorld.shtml
http://www3.elternratgeber.de/SID=971281057/shop/index.php3
http://www3.vw-online.de/international/deutsch/index_2.htm
http://www5.cd4you.de/


Auch TXT2HTML beherrscht diese Problemfälle ohne "http://" nicht, wie der folgende
Test zeigt:

*** Test (nicht funktionierende Problemfälle)
www-stud.htw-kempten.de:80/surfboard/all.html
www1.buch.de/
www2.latech.edu/~acm/HelloWorld.shtml
www3.elternratgeber.de/SID=971281057/shop/index.php3
www3.vw-online.de/international/deutsch/index_2.htm
www5.cd4you.de/
*** Test-Ende


2. Testfälle für Mail-Adressen
================================================================================

gültige Mailadressen
--------------------------------------------------------------------------------
thomas@antonis.de und tomant@gmx.de sind meine Mailadressen.
Ich habe die Mailadressen Thomas.Antoni@T-Online.de, ab@cdf.de u. thomas-antoni@web.de
Schick's an meine Mailadresse (thomas@antonis.de).
(thomas@online.de) geht ebenfalls sowie [tom@qbasic.de}.
{webmaster@antonis.de}     ;marlies@antonis.de, marc@antonis.de
abc@def.de, xyz@uvw.de, doedel@ass.com.
Eine gultige Adresse ist auch thomas@antonis.egon.de. Es kann also mehr als
Punkt hinter dem @-Zeichen vorkommen.


Werden Trennzeichen richtig erkannt und ausgeblendet?
--------------------------------------------------------------------------------
{thomas@antonis.de}; (wein@bier.info}, (salz@pfeffer.com. schwarz@weiss.ire)]} 
"aa@bb.cd.ef")]}, ([{"gg.aa@hh.info"


Einige exotische gültige Mailadressen
--------------------------------------------------------------------------------
(aus meinem Mail-Adressbuch)
zik-101@ilona.auswaertiges-amt.de
abendzeitung.04@gmx.de
Joerg.Bild-Sommer@ffw8.siemens.com
micky@oakdale2.freeserve.co.uk
micky@oakdale2.freeserve.co.uk.info
martina.inge.sandbrot@osnanet.de

Ungültige Mailadressen
--------------------------------------------------------------------------------
Ungültige Mailadressen sind @eisen.de, Witz.de, thomas*antonis.de,
wein@bier,info und thomas@.
Folgende Mailadresse kann nicht richtig erkannt werden: thomas@antonis.de.Weil hinter
dem Satzende-Punkt nach "de" kein Blank folgt!
Folgende Mailadresse ist ungültig: thomas@antoni. Es fehlt hier das Top-Level-
Domainkürzel.


3. Testfälle für Mailadressen mit URLs/Webadressen gemischt in einer Zeile
================================================================================
thomas@antonis.de www.antonis.de
Meine Mail: thomas@antonis.de, meine Webseite: www.antonis.de
Ich bin zu erreichen unter thomas@antonis.de, www.antonis.de und tomant@gmx.de

4 URLs und 2 Mailadressen in einer Zeile:
www.antonis.de, thomas@antoni.de http://www.qbasic.de thomas.antoni@t-online.de www.qbasic.de https://q-basic.de



                       ----==== Ende von URLtest.txt ====----


Converted to HTML by TXT2HTML (©Thomas Antoni), 29.09.2009, 21:53:42