TRAININGSMATERIALIEN ZUR ETIKETTIERUNG DEUTSCHER INTONATION MIT GTOBI

Ralf Benzmüller, Martine Grice & Stefan Baumann

Version 2 – Überarbeitete Fassung

Zurück zur GToBI-Seite



Index


 

1. Töne und ihre Diakritika Zurück zum Index

 

In ToBI werden die Tonhöhenverläufe mit zwei verschiedenen Ebenen beschrieben: H und L. H steht für einen hohen und L für einen tiefen lokalen Zielpunkt eines Tonhöhenverlaufs. Die Rekonstruktion der beschriebenen Kontur erfolgt durch regelhafte, meist lineare Interpolation zwischen den Zielpunkten. Zum Beispiel um eine Steigung zu beschreiben, müssen die Töne L und H aufeinander folgen; für eine fallende Bewegung ist die Reihenfolge der Töne H L. Mit diesen Folgen von H und L Tönen wird der tonale Verlauf beschrieben.

Neben der tonalen Ebene gibt es noch die textuelle. Beide Ebenen sind nicht isoliert voneinander. Im Deutschen (wie in den meisten anderen Intonationssprachen) sind die textuelle und die tonale Ebene an zwei Stellen miteinander verknüpft:

 

• An akzentuierten Silben: Diese Verknüpfung wird durch einen ΄*΄ (Stern) markiert, d.h. der Ton, der mit der akzentuierten Silbe verknüpft ist, erhält einen Stern. Ein Beispiel: Wenn bei einer steigenden Bewegung - beschrieben mit L H - die akzentuierte Silbe tief ist, dann ergibt sich L* und H; ist die Akzentsilbe hoch, so wird diese Verknüpfung mit L und H* beschrieben.

 

• An den Grenzen für die Intonation relevanter Einheiten, sog. Phrasen.

 

Grundsätzlich wird unterschieden zwischen Tonhöhenbewegungen, die dazu dienen, Silben in Wörtern und Sätzen hervorzuheben und solchen, die an Phrasengrenzen stattfinden. Erstere heißen Akzenttöne (oder Tonakzente), letztere Grenztöne.

 

Bei den Akzenttönen unterscheidet man einfache und zusammengesetzte.

• Die einfachen sind H* und L*.

• Zusammengesetzte Akzenttöne bestehen aus zwei Zielpunkten. Der Ton, vor oder nach der Akzentsilbe wird durch ein ΄+΄ (Plus) mit dem gesternten Ton des Akzents verbunden. Z.B. bei L*+H erreicht die Tonhöhe einen Tiefpunkt auf der Akzentsilbe. Kurz danach, meist auf der folgenden Silbe, wird ein hoher Zielpunkt erreicht. Es können jeweils nur zwei Töne kombiniert werden. In GToBI gibt es folgende zusammengesetzte Tonakzente: L+H*, L*+H, H+L* und H+!H*.

 

Die Grenztöne stehen - wie ihr Name schon sagt - an den Rändern der für die Intonation relevanten Einheiten. Für die tonale Beschreibung werden zwei Intonationseinheiten unterschieden: Eine Intonationsphrase (IP) beinhaltet mindestens eine Intermediärphrase (ip). Um einen Eindruck der Größe der Phrasen zu geben, hilft ein Vergleich mit der Syntax, ohne damit eine 1:1-Beziehung zwischen intonatorischen und syntaktischen Einheiten nahezulegen. Sätze lassen sich in Satzteile zerlegen, wie IPs in ips. Hier wie dort gibt es lange und kurze Phrasen bzw. Sätze/ Satzteile. Das Beispiel zeigt eine mögliche Lesart für folgenden Satz:

 

[[ Meinst du nicht auch ]ip [daß fernsehen langweilig ist ]ip ]IP

    1. H- ^H%

 

Zwischen auch und daß befindet sich eine Intermediärphrasengrenze. Der ganze Satz wird als eine Intonationsphrase realisiert.

• Der Grenzton einer Intermediärphrase (ip) wird durch einen einzigen Ton repräsentiert, dem ein ΄-΄ (Minus) folgt: L- oder H-.

• Die Grenze einer Intonationsphrase fällt immer mit einer Intermediärphrasen-G renze zusammen, so daß am Ende einer Intonationsphrase immer zwei Grenzen vorkommen: eine Intermediär- und eine Intonationsphrasengrenze. Letztere wird mit einem ΄%΄ (Prozent) gekennzeichnet. In der neuen GToBI-Notation kommen folgende Grenztonkombinationen vor:

L-%, H-%, H-^H% und L-H%.

L-% symbolisiert ein tiefes Ende einer Intonationsphrase, H-% ein hohes Plateau am Phrasenende. Die Kombination H-^H% beschreibt eine hohe Grenze mit weiterem Anstieg auf der letzten Silbe. Dieser Anstieg wird durch ΄^΄ (Zirkumflex), das Zeichen für Upstep (s. Kap. 5), markiert. Die Kombination L-H% symbolisiert eine steigende Tonbewegung von einer tiefen auf eine mittlere Lage.

• Darüberhinaus ist es möglich, einen hohen Grenzton an den Anfang einer Intonationsphrase zu setzen. Hier steht ein einziger Ton an der IP-Grenze. Er wird durch ein vorangestelltes % gekennzeichnet, also %H. Der Beginn einer Intonationsphrase auf tiefem oder mittlerem Tonniveau wird als Normalfall betrachtet und braucht daher nicht notiert zu werden.

 

Wichtig: Die Zielpunkte, die zur tonalen Beschreibung herangezogen werden, sind also immer mit einem Akzent oder einer Grenze verbunden. Daher gibt es keine H und L Töne ohne Diakritikum.

 

Oft kommt es in Sequenzen von H Tönen vor, daß die Zielpunkte nicht gleich hoch sind, sondern stufenweise abfallen. Diese Tonhöhenmodifikation heißt Downstep und wirkt sich nur auf Hs in Akzenttönen und auf H- aus. Downstep wird in Kapitel 4 ausführlicher beschrieben. Das Gegenstück zu Downstep heißt Upstep. Upstep liegt vor, wenn (z.B. nach einer Folge herabgestufter H Töne) ein H Ton deutlich höher ist als ein vorhergehender. Upstep wird in Kapitel 5 genauer beschrieben. Ein ΄!΄ (Ausrufezeichen) vor dem H markiert Downstep, ein ΄^΄ (Zirkumflex) Upstep.

Tabelle 1 enthält eine Übersicht über die in GToBI verwendeten Zeichen.

 

Tabelle 1. Übersicht über die in GToBI benutzten Zeichen und Töne

H und L sind Zielpunkte einer Tonhöhenbewegung

 

*  kennzeichnet einen Zielpunkt auf der akzentuierten Silbe

 

+  verbindet den Zielpunkt vor oder nach der Akzentsilbe mit dem

Zielpunkt auf der Akzentsilbe

 

–   kennzeichnet den Grenzton einer Intermediärphrase (ip)

 

%  kennzeichnet die Grenztöne einer Intonationsphrase (IP)

 

?  nach einem Ton = unsicher, ob der Ton stimmt

 

$  nach einem Ton = sehr sicher, Musterbeispiel eines Tons

 

Grenztöne und Kombinationen

Akzenttöne

L-, H-,

L-%, H-%, H-^H%, L-H%

%H

H*, L*,

L+H*, L*+H, H+L*, H+!H*

!  kennzeichnet den Downstep eines H Tons in Akzenten und bei H-

 

^  kennzeichnet den Upstep eines H Tons in Akzenten und bei Grenztönen

 

Es gibt keinen Ton ohne Diakritikum

 

 

 

2. Tonakzente Zurück zum Index

 

Zur Beschreibung der einzelnen Akzent- und Grenztöne werden jeweils angegeben:

• Eine schematische Darstellung der Tonbewegung

• Eine Auflistung der wichtigsten Kriterien

• Musterhafte Audio-Beispiele

In den schematischen Darstellungen beziehen sich die zwei geraden Linien auf die obere bzw. untere Grenze des Registers. Es verringert sich im Verlauf einer Äußerung und fällt insgesamt ab. Die obere Linie fällt dabei steiler als die untere. Die Registerlinien sind lediglich ein Konstrukt, das zur Verdeutlichung der Konturen dient. Sie spiegeln einige Erfahrungen beim Labeln wider. Sie sind aber nicht als absolut zu betrachten und können, falls sie Verwirrung stiften sollten, ignoriert werden. Die dicken Linien zeigen vereinfacht den F0-Verlauf auf der akzentuierten Silbe, die mit einem H* oder L* innerhalb eines Tonakzents dargestellt wird. Die gepunkteten Linien davor oder danach zeigen den Verlauf im Umfeld der akzentuierten Silbe.

 

In den eckigen Kästchen werden die Kriterien für prototypische Realisierungen der Akzente aufgelistet.

 

Wichtig: Nicht alle Kriterien müssen in jeder Äußerung erfüllt sein.

Die Labels für die Akzenttöne werden auf die lokalen Extremwerte der F0-Kurve (Gipfel bzw. Täler) in der akzentuierten Silbe gesetzt, es sei denn, der Extremwert liegt außerhalb der Akzentsilbe. In diesem Fall muß die genaue Position des Gipfels oder Tals gesondert markiert werden. Dies wird in Abschnitt 6.2. genauer erläutert.

 

2.1. H* Zurück zum Index

H* zeichnet sich durch eine Abweichung der Tonhöhe nach oben aus. Daher zählt er zu den Gipfelakzenten. Die akzentuierte Silbe hört sich hoch an. Die Aufwärtsbewegung ist nicht so steil wie bei L+H*. Unmittelbar vor dem Akzent befindet sich keine höhere Silbe.

H* wird verwendet, wenn keine klaren Anzeichen für einen anderen Akzent sprechen. Es ist in diesem Sinne der Normalakzent.

Folgen zwei (oder mehrere) H* Akzente aufeinander, so wird zwischen den beiden Akzenten angenommen, daß die Tonhöhe leicht abfällt und zum nächsten Akzent wieder ansteigt. Die entstehende Einbuchtung im F0-Verlauf (engl. sagging interpolation) stellt keinen tiefen Zielpunkt dar.

 

 

Screenshots mit Audio-Beispielen: blumen2, train7, njk2k017

blumen2



train7



njk2k017





2.2. L+H* Zurück zum Index

Bei L+H* findet auf der akzentuierten Silbe ein steiler Anstieg statt, so daß der Höhepunkt der Bewegung erst spät in der akzentuierten Silbe (manchmal auch danach) erreicht wird. Wichtig ist auch, daß sich die akzentuierte Silbe hoch anhört. Ebenso wichtig ist, daß auf der Silbe vor dem Akzent (oder zu Beginn der Akzentsilbe) ein Tiefpunkt erreicht wird, die Kontur bis dahin also fällt, falls genügend Silben vor dem Akzent zur Verfügung stehen. Oft ist der Stimmumfang erweitert.

 

 

Screenshots mit Audio-Beispielen: august, blaue, train8

august



blaue



train8





 

2.3. L* Zurück zum Index

Dieser Akzenttyp zeichnet sich durch eine Abweichung der Tonhöhe nach unten und/oder eine tiefe Stimmlage aus. Der Akzent erreicht also ein Tal im F0-Verlauf. Das Tal liegt im unteren Drittel des Sprechstimmumfangs. Üblicherweise liegt der Tiefpunkt der Tonbewegung etwa in der Mitte des Vokals der Akzentsilbe.

 

Screenshots mit Audio-Beispielen: m049n000, train1, wohnwagen

m049n000



train1



wohnwagen





 

 

2.4. L*+H Zurück zum Index

Hier wird auf der akzentuierten Silbe ein Tiefpunkt erreicht. Spät in der Akzentsilbe findet ein Anstieg statt, der auf der folgenden Silbe (manchmal später) gipfelt. Die Akzentsilbe hört sich aber tief an. Wenn nur wenige Silben im Nachlauf vorkommen, ist das Tal oftmals nach vorne verschoben.

 

Screenshots mit Audio-Beispielen: nps1k010, train1, nein1

nps1k010



train1



nein1





2.5. H+L* Zurück zum Index

Bei H+L* ist die akzentuierte Silbe tief. Die vorhergehende Silbe ist hoch. Es entsteht der Eindruck eines großen Tonhöhensprungs in eine tiefe Stimmlage.

 

 

Screenshots mit Audio-Beispielen: schraeg3, durchzeichnenb, s14_f1kw

schraeg3



durchzeichnenb



s14_f1kw





2.6. H+!H* Zurück zum Index

Hier findet auf der akzentuierten Silbe ein Fall von einer hohen in eine mittlere Lage des Registers statt. Die vorangehende Silbe ist höher. Wird H+!H* von einem L- Grenzton gefolgt, dann fällt die Tonhöhe weiter. Wird er von einem H- gefolgt, bleibt sie auf der Ebene von !H* (zu Downstep vgl. Kapitel 4).

Dieser Akzent sollte nur verwendet werden, wenn auf der Silbe vor dem Akzent deutlich ein hoher Zielpunkt erkennbar ist. In unsicheren Fällen sollte der einfachere Ton !H* transkribiert werden.

 

 

Screenshots mit Audio-Beispielen: machen, s02_f1cb

machen



s02_f1cb





3. Grenztöne Zurück zum Index

 

Bei Grenztönen wird unterschieden zwischen solchen, die am Ende einer Phrase vorkommen (müssen) und solchen, die am Anfang einer Phrase auftreten (können). Es werden zwei Arten von Phrasengrenzen unterschieden:

 

• Intermediärphrase   = ip  =  kleine Grenze

• Intonationsphrase   = IP  =  große Grenze

 

Eine Intonationsphrase besteht aus mindestens einer Intermediärphrase und enthält daher immer zwei Grenztöne.

 

Die Grenztöne bestimmen den Verlauf der Intonation vom letzten Akzent (= Nuklearakzent) bis zum Ende einer Phrase. Die Anzahl der Silben, auf denen die Grenztöne realisiert werden, kann sehr stark variieren. Wenn die nuklear akzentuierte Silbe die letzte der Phrase ist, dann fallen sowohl der Akzentton als auch die Grenztöne auf diese eine Silbe. Im anderen Extrem können mehrere betonte (aber nicht akzentuierte) Silben folgen. Entsprechend unterscheidet sich der F0-Verlauf, der bei wenig Silben im Nachlauf stark gestaucht oder verkürzt wird, während die einzelnen Stationen des Verlaufs bei vielen Silben deutlich zu erkennen sind. Auf einen solchen deutlichen Verlauf beziehen sich im folgenden die Abbildungen.

 

Der Grenzton der Intermediärphrase wird in der Regel auf einer postnuklear betonten (nicht akzentuierten!) Silbe erreicht (Phrasenakzent, s. Kap. 6.1.), oder, bei kurzem Nachlauf, am Ende der Phrase.

 

Der Grenzton der Intonationsphrase wird auf der letzten Silbe der Phrase realisiert.

 

Die Grenztöne werden hinter dem letzten Wort der Phrase markiert. Da diese Notierung nicht dem exakten Tonhöhenverlauf entspricht, ist sie lediglich als Konvention zu verstehen. Eine exakte(re) Notation der Grenztöne wird in Kapitel 6.1. vorgestellt.

 

Die Darstellungen enthalten in gestrichelten Linien den schematischen Verlauf der Grenztöne. Der Ton in Klammern ist der letzte Ton eines vorhergehenden Akzents, z.B. das H von L*+H. Die Dateien mit den Musterbeispielen stehen wieder in den Kästchen mit den gerundeten Ecken.

 

3.1. L- Zurück zum Index

Nach H*, L+H*, H+!H*, L*+H (ab jetzt als ΄H Akzenttöne΄ bezeichnet) beschreibt L- ein Absinken in den unteren Bereich des Sprechstimmumfangs.

Nach einem L* oder H+L* Tonakzent (im folgenden als ΄L Akzenttöne΄ bezeichnet) ist L- kaum tiefer als das vorhergehende L*. Die Folge L* L- ist sehr selten.

Wenn nur wenige unbetonte Silben nach dem Akzent folgen, was bei ip-Grenzen häufig der Fall ist, sinkt die Tonhöhe einfach zum Ende der Phrase ab. Wenn nach der Akzentsilbe mehrere unbetonte Silben auftreten, erfolgt das Absinken der Tonhöhe zunächst relativ abrupt und wird dann flacher.

 

Screenshots mit Audio-Beispielen: nonnenweiher, train2, train7

nonnenweiher



train2



train7





3.2. L-% Zurück zum Index

L-% bezeichnet eine größere Grenze als L-. Der Abfall der Tonhöhe ist meist tiefer als bei einer tiefen ip-Grenze. Ansonsten sind die Verläufe der beiden vergleichbar. Nach der fallenden Bewegung, die nur nach H Akzenttönen vorkommt, verläuft die Kontur flach entlang der unteren Registerlinie. Auf der letzten Silbe fällt die Tonhöhe oft noch weiter ab, d.h. unter diese Linie. Dies passiert besonders am Ende einer Äußerung und heißt auf englisch final lowering, was man mit ΄Endabsenkung΄ übersetzen kann.

 

Screenshots mit Audio-Beispielen: blumen2, pension, train2

blumen2



pension



train2





Screenshots mit Audio-Beispielen: lor, oberhalb3,

lor



oberhalb3





 

 

3.3. L-H% Zurück zum Index

Nach H Akzenttönen ist L-H% eine fallend-steigende Bewegung. Nachdem der Tiefpunkt der fallenden Bewegung - wie bei L- beschrieben - erreicht ist, verläuft die Kontur auf tiefem Niveau. Auf der letzten Silbe (oder auch kurz vorher) beginnt ein Anstieg bis ca. zur Mitte des Sprechstimmumfangs, wobei die obere Registerlinie meist überschritten wird.

 

Screenshots mit Audio-Beispielen: vormittag, train9a,

vormittag



train9a





Nach L Akzenttönen ist L-H% eine konkav steigende Bewegung, die erst auf der letzten Silbe anfängt. Wenn nur eine Silbe die Bewegung trägt, beginnt der Anstieg darin sehr spät.

 

Screenshots mit Audio-Beispielen: train1, obena,

train1



obena





 

3.4. H- Zurück zum Index

H- wird nach einem H*, L+H*, L*+H oder H+!H* Akzent als gleichbleibende Intonation realisiert. Die Tonhöhe bleibt auf dem Niveau des H Tons (bzw !H Tons) des Akzents oder etwas darüber; sie kann auch leicht fallen oder steigen. Sie folgt meist nicht der oberen Registerlinie.

 

Screenshots mit Audio-Beispielen: goldmine1, nms1k016, dina4a, nochmalb

goldmine1



nms1k016



dina4a



nochmalb





 

H- führt nach L* zu einer Steigung auf ein mittelhohes Niveau, das entweder am Ende des akzentuierten Wortes oder auf einer folgenden betonten Silbe erreicht wird. Der genaue Zielpunkt kann durch ein H(*) markiert werden (vgl. Kapitel 6.1.). Danach ergibt sich ein Plateau bis zum Ende der ip. Sollten nur wenige Silben im Nachlauf vorhanden sein, erfolgt ein linearer Anstieg, und das Plateau wird verkürzt.

 

Screenshots mit Audio-Beispielen: oberhalb3, train7

oberhalb3



train7





 

3.5. H-% Zurück zum Index

Der Tonverlauf von H-% ist von H- nicht zu unterscheiden. Nur die Wahrnehmung der Grenze ist stärker bei H-%.

 

3.6. H-^H% Zurück zum Index

Nach einem H-Akzentton wird H-^H% mit einer zunächst gleichbleibenden und dann auf der letzten Silbe steigenden Intonation realisiert. Der Anstieg auf der letzten Silbe, markiert durch das Upstep-Zeichen ΄^΄, erstreckt sich bis in die obersten Bereiche des Sprechstimmumfangs. H% nach einem H- Ton ist höher als alle andere H Töne. Bei kurzem Nachlauf erfolgt nur der hohe Anstieg ohne das Plateau.

 

Screenshot mit Audio-Beispiel: goldmine1a

goldmine1a





 

Nach einem L* bzw. H+L* Akzent wird H-^H% mit einer Steigung bis hoch in den Sprechstimmumfang realisiert. Die Steigung ist konvex, d.h nach der Akzentsilbe findet ein mittelhoher Anstieg statt. Nach dem Plateau erfolgt auf der letzten Silbe der Intonationsphrase ein Anstieg bis ganz hoch in den Sprechstimmumfang. Falls nur wenige Silben im Nachlauf stehen, erfolgt ein rascher Anstieg in die obersten Bereiche des Sprechstimmumfangs.

 

Screenshots mit Audio-Beispielen: wohnwagen, nhk1k018

wohnwagen



nhk1k018





 

 

3.7. Grenztöne am Anfang von IPs: %H Zurück zum Index

Die Verwendung von Grenztönen am Ende von Phrasen ist obligatorisch. Dies ist anders bei Grenztönen am Anfang einer Intonationsphrase. Hier nimmt man an, daß es einen relativ großen Bereich gibt, der nicht markiert wird. Phraseninitiale hohe Grenztöne (%H) werden nur gesetzt, wenn die Tonhöhe im Extrembereich, d.h. im oberen Viertel des Stimmumfangs, liegt und wenn der tonale Verlauf nicht mit Akzenttönen beschrieben werden kann (z.B. H+!H*).

 

 

4. Downstep Zurück zum Index

Die Tonhöhe von Akzenttönen, die einen H Ton enthalten, sowie die Tonhöhe des ip-Grenztons H- kann durch Downstep modifiziert werden. Downstep bedeutet einen Schritt nach unten von einem H zum anderen, der sogar innerhalb eines Tonakzents stattfinden kann (H+!H*). Einem Downstep muß in der gleichen ip ein H Ton vorausgehen, d.h. der erste H Ton einer ip kann kein !H sein. Downstep kann sich auf alle weiteren H Töne in einer Intermediärphrase auswirken, egal ob Grenz- oder Akzentton, allerdings nicht auf H%.

 

Die möglichen Töne, die Downstep erfahren können, sind in Tabelle 2 zusammengefaßt.

 

 

Tabelle 2. Töne mit Downstep

Akzente

Grenzen

!H*, L+!H*, L*+!H

!H+L*, !H+!H*

!H-,

!H-%, !H-^H%.

 

Jeder Downstep reduziert das Register bis zum nächsten Downstep oder bis zum Ende der Intermediärphrase (dies wird durch die Absenkung der oberen Registerlinie dargestellt). Folgt auf einen herabgestuften H Ton ein H Ton von etwa gleicher Tonhöhe, so wird dieser nicht mit ΄!΄ markiert. Dies gilt auch für alle folgenden Akzent- und Grenztöne, die einen H Ton enthalten. Downstep wirkt sich nicht über eine ip-Grenze hinweg aus.

 

Am Ende von Downstepsequenzen kann das Register in eine so tiefe Stimmlage absinken, daß eine akzentuierte Silbe nicht mehr hoch klingt. Dennoch wird kein L*, sondern ein abgestufter !H* Ton gelabelt.

 

 

 

4.1. Downstep in Akzentsequenzen Zurück zum Index

 

Screenshots mit Audio-Beispielen: laengs, goldmine2, nbs1k002b

laengs



goldmine2



nbs1k002b





Vergleichen Sie !H* mit H+!H*, wo der Downstep im Bereich des Akzenttons stattfindet:

 

Screenshots mit Audio-Beispielen: dina4, nicht-fertig

dina4



nicht-fertig





Hier zeigt sich eine lineare Verbindung entlang der Deklinationslinie vom vorhergehenden H* bis unmittelbar vor die zweite Akzentsilbe. Anschließend fällt die Tonhöhe auf die Akzentsilbe, die etwa in der Mitte des bis dahin gültigen Registers liegt.

 

Vergleichen Sie H+!H* mit H+L* (ohne Downstep). Hier erfolgt ein Sprung in eine tiefe Stimmlage.

 

kein Downstep

Screenshot mit Audio-Beispiel: schraeg3

schraeg3





Bei L+!H* ist, anders als bei !H*, deutlich ein tiefer Zielpunkt vor der Akzentsilbe erkennbar.

 

Screenshots mit Audio-Beispielen: nonnenweiher, train9a, mstpd026c

nonnenweiher



train9a



mstpd026c





 

4.2. Downstep auf H- Zurück zum Index

 

!H-, !H-%

Diese Kombination von Grenzen kommt häufig - aber nicht nur - in sogenannten stilisierten Äußerungen (bei H*!H-% und L+H* !H-%) vor, z.B. im Singsang von AUF-stehen!, oder beim Rufen (z.B. HAllo oder suSANne). Hier erfolgt auf einer Silbe nach dem Akzent ein Sprung (von ca. einer kleinen oder großen Terz) in eine mittlere Tonlage.

 

Screenshots mit Audio-Beispielen: nein4

nein4





 

Vergleichen Sie die Tonfolge L+H* !H-% und H* !H-% in der Datei "nein4" mit H* !H-^H% in der Datei "g-essen"!

 

Screenshots mit Audio-Beispielen: goldmine, g-essen

goldmine



g-essen





 

 

5. Upstep Zurück zum Index

 

Das Gegenstück zu Downstep heißt Upstep. Folgen mehrere H Töne aufeinander, können spätere Töne höher sein als vorhergehende. Dabei wird das Register erhöht.

 

5.1. Upstep bei Akzenten Zurück zum Index

Durch Upstep von aufeinanderfolgenden Akzenten entsteht eine insgesamt steigende Folge. Dabei wird jeweils das Register erhöht. Upstep wird durch ein ΄^΄ vor dem H gekennzeichnet.

 

 

Screenshot mit Audio-Beispiel: letzte

letzte





 

Vergleichen Sie die Tonfolge L+H* !H-% und H* !H-% in der Datei "nein4" mit H* !H-^H% in der Datei "g-essen"!

 

Upstep kann auch einen voraufgehenden Downstep aufheben. Nach einem Downstep wird das Register verkleinert. Durch einen Upstep wird es wieder erweitert. Wenn also ein Zielpunkt deutlich oberhalb der heruntergesetzten oberen Registerlinie liegt, dann wird er als upstepped markiert.

 

 

 

Wenn nach einem ^H* ein H Ton auf etwa der gleichen Höhe folgt, wird er einfach als H* gelabelt. Dies gilt analog für andere H Akzenttöne.

 

Es gibt also: ^H*, L+^H*, L*+^H, ^H+L*

 

 

5.2. Upstep bei Grenztönen Zurück zum Index

Bei ip-Grenztönen wird Upstep nicht transkribiert. Dies geschieht nur bei einem IP-Grenzton, wenn dieser erheblich höher ist als ein vorangehendes H-.

 

 

6. Optionale Labels Zurück zum Index

 

6.1. Phrasenakzente Zurück zum Index

Phrasenakzente sind Grenztöne der Intermediärphrase, Sie können auch mit betonten Silben, die zwischen dem Nukleus und der Phrasengrenze vorkommen, verknüpft werden. Diese Prominenzen, die keine ΄vollwertigen΄ Akzente sind, fallen oft mit tonalen Zielpunkten zusammen. Sie werden mit L(*) oder H(*) innerhalb der prominenten Silbe markiert, müssen aber nicht unbedingt mit der genauen Position der Zielpunkte übereinstimmen. Im folgenden Satz stellen die Silben ma und wol in bemalen bzw. wollen Beispiele für postnukleare Prominenzen dar.

 

 

Hatten die Schüler die WOHnungen beMAlen WOLlen?

L+H* L(*) L(*) L-H%

Screenshots mit Audio-Beispielen: wohnungen, meine, schraeg1

wohnungen



meine



schraeg1





 

Die Transkription der postnuklearen Prominenzen ist allerdings optional, d.h. sie kann verwendet werden, muß aber nicht. Wir schlagen vor, solche Prominenzen nur in eindeutigen Fällen zu markieren.

 

 

6.2. Gipfel und Täler kurz vor oder nach der Akzentsilbe Zurück zum Index

Wie bereits in Abschnitt 2 erwähnt, werden die Akzentton-Labels auf die lokalen Extremwerte der F0-Kurve in der akzentuierten Silbe gesetzt. Es kommt allerdings vor, daß ein Tonhöhenmaximum (Gipfel) oder –minimum (Tal) nicht innerhalb, sondern kurz vor oder nach der Akzentsilbe erreicht wird, ohne daß ein eigener tonaler Zielpunkt angenommen werden müßte (wie etwa bei L+H*, wo ein tiefer Zielpunkt deutlich vor einer hohen Akzentsilbe wahrgenommen wird). In GToBI wird die genaue Position eines tonalen Extremwerts vor oder nach der akzentuierten Silbe mit einem > (größer-als-Zeichen) bzw. < (kleiner-als-Zeichen) extra markiert. Auch in unklaren Fällen, z.B. wenn der Extremwert an einer Silbengrenze liegt, sollen diese Markierungen gesetzt werden. Der gesternte Ton wird weiterhin innerhalb der Akzentsilbe gelabelt.

 

>  F0-Minimum oder -Maximum vor der akzentuierten Silbe

<  F0-Minimum oder -Maximum nach der akzentuierten Silbe

 

Im Deutschen wird der Gipfel eines H Tonakzents (vor allem bei L+H*) meistens relativ spät in der Akzentsilbe erreicht, oft erst auf der nachfolgenden Silbe (besonders wenn die Akzentsilbe kurz ist). Für eine genaue Beschreibung letztgenannter Fälle ist eine explizite Markierung des Tonhöhengipfels (z.B. L+H* <) wichtig.

Screenshots mit Audio-Beispielen: vormittag, goldmine, nein4

vormittag



goldmine



nein4





 

7. Break Indizes Zurück zum Index

 

Unabhängig von der tonalen Beschreibung wird auf einer eigenen Ebene angegeben, wie stark oder schwach die aufeinanderfolgenden Wörter rhythmisch zusammenhängen. Im englischen ToBI wird die Klassifizierung nach Break Indizes (BI) sehr ausführlich vorgenommen. Die Zahlen von 0 bis 4 beschreiben die Größe der Grenze - je größer die Zahl, desto größer die Grenze. In GToBI wird nur ein kleiner Teil der BIs von EToBI verwendet. Die Markierung von klitischen Gruppen mit 0 und normalen Wortgrenzen mit 1 unterbleibt, da sie für intonatorische Zwecke nicht relevant ist. Die BIs 3 und 4 sind vorhersagbar aus den tonalen Labels: 3 entspricht einer Intermediärphrase und 4 einer Intonationsphrase. Auch diese beiden Break Indizes werden normalerweise nicht gesondert gelabelt. Folgende Break Indizes werden verwendet: 2r, 2t, 3-, 4-.

 

7.1. Break Index 2 (2r und 2t) Zurück zum Index

Es kann vorkommen, daß man sich nicht sicher ist, ob eine Phrasengrenze vorliegt oder nicht. In diesem Fall wird die fragliche Stelle mit dem BI 2 markiert. Diese Einteilung kann weiter verfeinert werden.

 

7.1.1. 2r Zurück zum Index

Zum einen kann es zu einer sprechrhythmischen Verzögerung kommen, ohne daß die tonale Bewegung unterbrochen wird. Dies wird mit BI 2r (r für rhythmisch) gekennzeichnet.

Screenshots mit Audio-Beispielen: train1, dina4

train1



dina4





 

7.1.2. 2t Zurück zum Index

Umgekehrt kann die tonale Bewegung eine Grenze markieren, und zwar ohne rhythmischen Bruch. In solchen Fällen wird in dem Feld für die Break Indizes 2t (t für tonal) eingetragen.

 

 

7.2. Break Indizes 3- und 4- Zurück zum Index

Wenn man sich sicher ist, daß eine Phrasengrenze vorliegt, aber Unklarheit über die Größe der Grenze herrscht, dann setzt man ein Minuszeichen (-) hinter den jeweiligen Break Index. Es symbolisiert eine Grenze, die kleiner sein könnte als das angegebene Label anzeigt, d.h. 3- liegt zwischen 2 und 3, 4- zwischen 3 und 4.

Screenshots mit Audio-Beispielen: goldmine1, train7

goldmine1



train7





 

8. Umgang mit (Un-)Sicherheit Zurück zum Index

8.1. '?' hinter Tonlabels Zurück zum Index

Besonders zweifelhafte Labels können mit einem ΄?΄ (Fragezeichen) versehen werden. Das Fragezeichen wird hinter das betreffende Label gesetzt.

 

Z.B.: L*+H? oder !H-^H%?

 

Das Symbol ΄?΄ wird oft verwendet, wenn die Kriterien, die für die Auswahl der Tonakzente gelten, im fraglichen Fall für verschiedene Tonakzente sprechen.

 

8.2. Einfache Labels Zurück zum Index

Wenn keine klaren tonalen Bewegungen für einen komplexen Tonakzent sprechen, sollten die einfachen Töne gelabelt werden. Dies gilt insbesondere für die ersten Töne in den beiden Tonakzenten L+H* und H+!H*. Wenn keine klaren hohen oder tiefen Zielpunkte vor der akzentuierten Silbe auszumachen sind, dann sollte H* oder !H* gelabelt werden.

 

8.3. Prototypen Zurück zum Index

Es kann natürlich auch vorkommen, daß man ein Musterbeispiel eines Tons findet. Solche prototypischen Vertreter von Tönen kann man mit einem ΄$΄ hinter dem Label kennzeichnen. Dies erleichtert die Suche nach illustrativen Beispielen (z.B. bei der Erstellung von Trainingsmaterialien) und kann in der automatischen Sprachverarbeitung nützlich sein.

 

 

9. Weitere Informationen Zurück zum Index

 

Eine erste Version der vorliegenden Trainingsmaterialien entstand als Teil eines Experimentes, das die Konsistenz zwischen verschiedenen Versuchspersonen beim Etikettieren mit GToBI überprüfte. Die Ergebnisse sind dargestellt in:

 

• Grice, M., Reyelt, M., Benzmüller, R., Mayer, J. & Batliner, A. (1996). Consistency in Transcription and Labelling of German Intonation with GToBI. Proc. ICSLP Philadelphia,

• Reyelt, M., Grice, M., Benzmüller, R., Mayer, J. & Batliner, A. (1996). Prosodische Etikettierung des Deutschen mit ToBI. Proc. KONVENS 96, 290-299.

 

Die Prinzipien des englischen ToBI Systems und die von GToBI sind vergleichbar. Daher kann auch ein Blick in die "Guidelines for ToBI labelling" von M. Beckman & G. Ayers hilfreich sein. Sie sind verfügbar unter: http://ling.ohio-state.edu/Phonetics/E_ToBI/etobi_homepage.html oder auf Anfrage per e-mail an tobi@ling.ohio-state.edu.

 

Auch das vorliegende Dokument ist - in aktualisierter Form - verfügbar unter: ftp://ftp.coli.uni-sb.de/pub/ToBI/guidelines-version2.ps.gz. Ferner werden auf der GToBI Homepage in http://www.coli.uni-sb.de/phonetik/projects/Tobi/gtobi.html ständig aktualisierte Informationen zu GToBI bereitgestellt.

 

Die aktuellste ausführliche Beschreibung von GToBI (inklusive Vergleich mit anderen Intonationsmodellen für das Deutsche) ist folgende:

 

  • Grice, M. & Baumann, S. (im Druck). Deutsche Intonation und GToBI. Linguistische Berichte.


  • • Grice, M., Baumann, S. & Benzmüller, R. (im Druck). German Intonation within the Framework of Autosegmental-Metrical Phonology. In: Jun, Sun-Ah (Hg.). Prosodic Typology and Transcription: A Unified Approach. Oxford University Press.

     

    10. Appendix: Kurzübersicht Zurück zum Index

     

    Tonakzente und ihre Kriterien

     

    H*

    • Der Akzent bildet den Gipfel einer eher flachen Aufwärtsbewegung

    • Es gibt keinen tiefen oder hohen Zielpunkt vor der akzentuierten Silbe

    • Ist der Normalakzent, der verwendet wird, wenn es keine klaren Anzeichen für andere Töne gibt.

    L+H*

    • Tiefer Zielpunkt vor der akzentuierten Silbe

    • Steiler Anstieg, der spät in der akzentuierten Silbe endet

    • Höreindruck: hoch

    • Manchmal ist auch der Stimmumfang erweitert

    L*+H

    • Tiefer Zielpunkt in der Akzentsilbe oder kurz davor

    • Hoher Zielpunkt auf einer Silbe nach dem Akzent

    • Tiefe Stimmlage im Akzent

    L*

    • Tiefer Zielpunkt (F0 Minimum) in der Akzentsilbe

    • Tiefe Stimmlage

    H+L*

    • Hoher Zielpunkt vor der akzentuierten Silbe

    • Starker Abfall auf die akzentuierte Silbe

    • Akzentsilbe ist tief

    H+!H*

    • Hoher Zielpunkt vor der Akzentsilbe

    • Es erfolgt ein Sprung zur Mitte

    • Die Akzentsilbe ist fallend, wenn eine tiefe Grenze folgt

     

     

    Grenztöne

     

    L-

    • Fallend oder flach in tiefer Stimmlage

    • Starker Abfall nach dem letzten Akzent, wenn dieser mit einem H Ton endet

    • Untere Registerlinie wird auf einer folgenden akzentuierten Silbe erreicht, sofern vorhanden.

    L-%

    • Wie L-, jedoch tieferer Fall

    L-H%

    • Nach H Ton: fallend-steigende Bewegung

    Abfall wie bei L-

    • Nach L Ton: bis in mittlere Lage steigende Bewegung, auf der letzten Silbe der Phrase (oder an deren Ende, wenn nur eine vorhanden)

    • Der Anstieg erfolgt auf der letzten Silbe

    H-

    • Nach H Ton: flach, in der gleichen Höhe wie der vorangehende H-Ton

    • Nach L Ton: steigend bis in eine mittlere Lage: danach flach

    H-%

    • Tonaler Verlauf wie bei H-, aber die Grenze ist größer

    H-^H%

    • Wie H-: steigend bis in mittlere Lage.

    • Auf der letzten Silbe Anstieg in den obersten Bereich des Sprechstimmumfangs.

     

     

    Break Indizes

     

    2r

    • sprechrhythmischer Bruch bei tonaler Kontinuität

    2t

    • tonaler Bruch ohne Unterbrechung des rhythmischen Flusses

    4-

    • unsicher, ob ip- oder IP-Grenze

     

    11. Kontakt Zurück zum Index

    Die Sprachdateien, die in den vorliegenden Trainingsmaterialien angegeben wurden, sind auf Anfrage in verschiedenen Audioformaten bei den Autoren erhältlich (e-mail S. Baumann: stefan.baumann@uni-koeln.de, e-mail M. Grice: martine.grice@uni-koeln.de , e-mail R.Benzmueller: benzmueller@gdata.de).