Köbler, Gerhard

 

Die Häufigkeit der zur Darstellung des Mittelniederdeutschen verwendeten Buchstaben

 

Das Mittelniederdeutsche (German Middle Low ISO 639-3 gml) ist die dem vom 9. bis zum 12. Jahrhundert bezeugten Altsächsischen (sowie in gewisser Weise auch dem Altniederfränkischen zeitlich) ab etwa 1200 nachfolgende mittlere Sprachstufe des Niederdeutschen im Raum etwa zwischen den deutschen Mittelgebirgen (ich/ik-Linie an Ruhr und Harz) und der Nordsee und Ostsee bzw. den skandinavischen und slawischen Sprachen, die zeitlich dem im Wesentlichen nur mündlich lebenden Neuniederdeutschen bis in das 17. Jahrhundert vorausgeht. Es unterscheidet sich vom etwa gleichzeitigen Mittelhochdeutschen vor allem durch das Fehlen der Verschiebung von p, t und k sowie durch das Fehlen der Diphthongierung langer Vokale (e/ei). Gegen 1600 wird es mit dem Niedergang der Hanse vom Neuhochdeutschen als Schreibsprache verdrängt. Wichtige schriftlich überlieferte Denkmäler sind Eike von Repgows Sachsenspiegel (um 1221-1224), die Sächsische Weltchronik (13. Jh.), das Berliner Stadtbuch (Ende 14. Jh.), Hermann Körners Chronica novella (ab 1416), das Redentiner Osterspiel (1464), die bei Steffen Arndes in Lübeck 1494 gedruckte niederdeutsche Bibel, das von Hans van Ghetelen in Lübeck 1498 gedruckte Tierepos Reynke de vos (Reineke Fuchs), die Lübecker Bibel (Bugenhagenbibel von 1533/1534), Johannes Strickers geistliches Drama De düdesche Schlörner (1584), Schriften Nikolaus (Nicolaus) Gryses (1543-1614), Tönnies Fönnes Handbuch der russischen Sprache (1607) sowie seit dem 13. Jahrhundert in allmählich steigender Zahl überlieferte Urkunden. Die wichtigsten Wörterbücher des Mittelniederdeutschen sind Schiller/Lübben (1875ff.), Lübben(/Walther) (1888, digitalisiert von Heiko Evermann 2008 und von Gerhard Köbler) und Mittelniederdeutsches Handwörterbuch (Bd. 1ff. 1928ff., 2010 einschließlich f/v bis telderen erschienen, mehr als 1,2 Millionen Belege, ungefähre Verdreifachung gegenüber Schiller/Lübben und Lübben/Walther, geplanter Abschluss 2020).

 

Auf dieser Grundlage habe ich zwecks Schließung einer bisherigen Lücke in Parallele zu einem indogermanischen Wörterbuch (2006), einem germanischen Wörterbuch (2007), (einem altgriechischen Wörterbuch, einem lateinischen Abkunfts- und Wirkungswörterbuch,) einem gotischen Wörterbuch, einem altnordischen Wörterbuch, einem altenglischen Wörterbuch, einem altfriesischen Wörterbuch, einem altniederfränkischen Wörterbuch, einem altsächsischen Wörterbuch, einem althochdeutschen Wörterbuch (1993) und einem mittelhochdeutschen Wörterbuch (2007), ein möglichst vollständiges einfaches mittelniederdeutsches Wörterbuch versucht, das für jedermann überall jederzeit unentgeltlich im Internet zugänglich ist. Es umfasst (in seinem Zustand vom Jahresende 2013 einschließlich der erschlossenen, vermutlich nur zufällig nicht überlieferten Wörter) rund 106221 Ansätze und Verweise, die strikt alphabetisch entsprechend der angesetzten Schreibweise geordnet sind (knapp 80000 Ansätze, gut 25000 Verweise, insgesamt etwa 5400 DIN A4-Seiten). Es gliedert sich in Ansatz (normalisierte Hauptform und Nebenformen), Sprachangabe (mnd.), grammatische Bestimmung, neuhochdeutsche Bedeutungsangabe (»…« bei bloßen der Verständnishilfe dienenden Lehnübersetzungen), Verweise (von Grundwörtern auf Komposita und von Nebenformen auf Hauptformen), (sonstige) Hinweise, Quelle (Angabe des Erstbelegs leider entsprechend den Vorlagen bisher nicht vollständig möglich), Interferenzen (Lehnwort, Lehnübersetzung, Lehnübertragung, Lehnschöpfung, Lehnbedeutung), Etymologie, Redewendung(en), Literatur und Sonstiges.

 

In den 106221 erfassten Ansätzen und Verweisen sind 933151 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 8,7850 Zeichen. Zur Darstellung des Mittelniederdeutschen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Mittelniederdeutschen angepasst werden muss.

 

Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z). Hinzu kommen als mittelhochdeutsche Zusatzzeichen gegenüber dem Lateinischen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.

 

Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

 

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 83 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:

 

Asc

Hex

Zeichen

Häufigkeit

97

61

a

26908

65

41

A

32

225

0

á

7

257,774

101,0306

ā̆

33

257

101

ā

16315

226

0

â

11

230

0

æ

6604

228

0

ä

5

229

0

å

1

98

62

b

19692

66

42

B

44

99

63

c

32063

67

43

C

7

231

0

ç

1

100

64

d

31295

68

44

D

46

101

65

e

140803

69

45

E

30

233

0

é

14

275,774

113,0306

ē̆

76

275

113

ē

28629

234

00EA

ê

13

102

66

f

7958

70

46

F

23

103

67

g

29284

71

47

G

46

104

68

h

40094

72

48

H

48

105

69

i

37700

73

49

I

12

299

012B

ī

13708

298

012A

Ī

1

238

00EE

î

18

106

006A

j

1013

74

004A

J

20

107

006B

k

31132

75

004B

K

30

108

006C

l

48304

76

004C

L

25

109

006D

m

20075

77

004D

M

35

110

006E

n

78551

78

004E

N

24

111

006F

o

13949

79

004F

O

12

243

00F3

ó

2

333,774

014D,0306

ō̆

25

333

014D

ō

15613

332

014C

Ō

2

244

00F4

ô

3

212

00D4

Ô

1

246

00F6

ö

5357

214

00D6

Ö

2

555

022B

ȫ

9387

111,868

006F,0364

3

112

70

p

19075

80

50

P

98

113

71

q

680

81

51

Q

2

114

72

r

77052

82

52

R

50

115

73

s

55804

223

00DF

ß

24

83

53

S

39

116

74

t

60041

84

54

T

14

117

75

u

10601

363

016B

ū

5362

251

00FB

û

2

252

00FC

ü

4207

470

01D6

ǖ

2828

117,868

75,0364

1

367

016F

ů

44

117,815

0075,032F

1

118

76

v

25047

86

56

V

45

119

77

w

14425

87

57

W

16

120

78

x

173

121

79

y

1129

89

59

Y

2

122

007A

z

1160

90

005A

Z

4

Hieraus lassen sich folgende Häufigkeiten ermitteln:

Zeichen

Varianten

Häufigkeit

Prozent

A

a A á ā̆ ā â æ ä å

49916

5,30%

B

b B

19736

2,10%

C

c C ç

32071

3,40%

D

d D

31341

3,40%

E

e E é ē̆ ē ê

169565

18,20%

F

f F

7981

0,90%

G

g G

29330

3,10%

H

h H

40142

4,30%

I

i I ī Ī î

51439

5,50%

J

j J

1033

0,10%

K

k K

31162

3,30%

L

l L

48329

5,20%

M

m M

20110

2,20%

N

n N

78575

8,40%

O

o O ó ō̆ ō Ō ô Ô ö Ö ȫ oͤ

44356

4,80%

P

p P

19173

2,10%

Q

q Q

682

0,10%

R

r R

77102

8,30%

S

s ß S

55867

6,00%

T

t T

60055

6,40%

U

u ū û ü ǖ uͤ ů

23045

2,50%

V

u̯ v V

25093

2,70%

W

w W

14441

1,50%

X

x

173

0,00%

Y

y Y

1131

0,10%

Z

z Z

1164

0,10%

Summe

933012

100%

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:

E

e E é ē̆ ē ê

169565

18,20%

N

n N

78575

8,40%

R

r R

77102

8,30%

T

t T

60055

6,40%

S

s ß S

55867

6,00%

I

i I ī Ī î

51439

5,50%

A

a A á ā̆ ā â æ ä å

49916

5,30%

L

l L

48329

5,20%

O

o O ó ō̆ ō Ō ô Ô ö Ö ȫ oͤ

44356

4,80%

H

h H

40142

4,30%

C

c C ç

32071

3,40%

D

d D

31341

3,40%

K

k K

31162

3,30%

G

g G

29330

3,10%

V

u̯ v V

25093

2,70%

U

u ū û ü ǖ uͤ ů

23045

2,50%

M

m M

20110

2,20%

B

b B

19736

2,10%

P

p P

19173

2,10%

W

w W

14441

1,50%

F

f F

7981

0,90%

Z

z Z

1164

0,10%

Y

y Y

1131

0,10%

J

j J

1033

0,10%

Q

q Q

682

0,10%

X

x

173

0,00%