The role of logical and generic document structure in relational discourse analysis
Maja Bärenfänger | Fachgebiet Angewandte Sprachwissenschaft und Computerlinguistik, Institut für Germanistik, Justus-Liebig-Universität Gießen
Harald Lüngen | Fachgebiet Angewandte Sprachwissenschaft und Computerlinguistik, Institut für Germanistik, Justus-Liebig-Universität Gießen
Mirco Hilbert | Fachgebiet Angewandte Sprachwissenschaft und Computerlinguistik, Institut für Germanistik, Justus-Liebig-Universität Gießen
Henning Lobin | Fachgebiet Angewandte Sprachwissenschaft und Computerlinguistik, Institut für Germanistik, Justus-Liebig-Universität Gießen
This study examines what kind of cues and constraints for discourse interpretation can be derived from the logical and generic document structure of complex texts by the example of scientific journal articles. We performed statistical analysis on a corpus of scientific articles annotated on different annotations layers within the framework of XML-based multi-layer annotation. We introduce different discourse segment types that constrain the textual domains in which to identify rhetorical relation spans, and we show how a canonical sequence of text type structure categories is derived from the corpus annotations. Finally, we demonstrate how and which text type structure categories assigned to complex discourse segments of the type “block” statistically constrain the occurrence of rhetorical relation types.