12.01.2001
Projekt "Genefinding"=================
Zu Bearbeiten ist eine Virus-DNA von ca. 180 Kilobasen Länge.
Die DNA liegt im FASTA-Format vor. Dieses Dateiformat sieht ungefähr folgendermaßen aus:
===
> identifier
AATT......... (ca. 80 Zeichen/Zeile o.ä.)
:
:
:
===
Es sind folgende Aufgaben zu erledigen:
1. Datei einlesen
2. Reverse-Completement (in der Datei steht nur ungefähr die Hälfte der DNA, d.h. die andere Seite muß0 ergänzt werden)
3. Gene suchen
3.1. Längenrestriktion: mindestens 51 Basen
4. Regelmäßigkeiten in den 50 Basen vor dem Gen finden
Allgemeiner Aufbau eines Gens: ......ATG__| Vielfaches von 3 |____Stop
Gene können grundsätzlich verschachtelt sein, sind es hier aber nicht.
Die Ausgabedatei sollte pro Gen folgendes enthalten:
- Absolute Start- und Endposition
- das Gen selbst ;-)
- die 50 Basen vor dem Gen