Köbler, Gerhard

 

Die Häufigkeit der zur Darstellung des Indogermanischen verwendeten Buchstaben

 

Die seit der Mitte des 18. Jahrhunderts von Philologen aus der gesamten weltweiten Textüberlieferung erschlossene Sprache des vermuteten, nachträglich als Indogermanen bezeichneten Volkes, deren Wortschatz zuletzt von Julius Pokorny gesammelt und danach von Gerhard Köbler einfach und übersichtlich strikt alphabetisch geordnet wurde, enthält in ihrer zuletzt festgelegten Fassung insgesamt 6263 Ansätze mit 26219 Zeichen (d. h. 4,18633 Zeichen pro Ansatz), die aber - wie nahezu alles in den Geisteswissenschaften - , einer eigenen Geschichte und Zukunft unterworfen sind. Zu ihrer Darstellung ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Indogermanischen angepasst werden muss.

Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z). Davon werden aber die vier Zeichen c, f, q und y für die Darstellung des indogermanischen Wortschatzes nicht verwendet, sodass jedenfalls die 20 Zeichen (a, b, d, e, g, h, i, k, l, m, n, o, p, r, s, t, u, v, x, z) des lateinischen Alphabets für die Darstellung des Indogermanischen verbleiben. Hinzu kommen als indogermanische Sonderzeichen, einschließlich von vier Laryngallauten, die 15 Zeichen (bʰ, dʰ, gʰ, gᵘ̯, gᵘ̯ʰ, H, h₁, h₂, h₃, i̯, kʰ, kᵘ̯, pʰ, tʰ, þ), so dass sich ein Zeichensatz von 35 Zeichen ergibt. Ausgesondert werden zusätzlich die vier silbischen Liquide l̥, m̥, n̥ und r̥, sodass sich ein Gesamtzeichensatz von 39 Zeichen ergibt.

 

Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

 

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller (35, bei Trennung von l̥, m̥, n̥, und von l, m, n und r) 39 Buchstaben (z. B. a, b, c, d usw.) und (69) Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:

 

Asc

Hex

Z

Häufigkeit

97

61

a

653

225

0

á

5

257,774

101,0306

ā̆

72

257

101

ā

454

257,769

101,0301

ā́

5

98

62

b

188

98,688

0062,02B0

530

100

64

d

623

273

111

đ

10

100,688

0064,02B0

432

101

65

e

3007

233

0

é

40

232

0

è

1

275,774

113,0306

ē̆

114

275

113

ē

423

7703

1E+17

8

601

259

ə

425

8337

2091

99

103

67

g

489

103,785

67,0311

206

103,688

0067,02B0

264

103,785,688

0067,0311,02B0

g̑ʰ

241

103,7512,815

0067,1D58,032F

gᵘ̯

149

103,785,7512,815

0067,0311,1D58,032F

g̑ᵘ̯

2

103,7512,815,688

0067,1D58,032F,02B0

gᵘ̯ʰ

85

103,785,7512,815,688

0067,0311,1D58,032F,02B0

g̑ᵘ̯ʰ

2

104

68

h

13

72

48

H

6

104,8321

68,2081

h₁

57

104,8322

68,2082

h₂

125

104,8323

68,2083

h₃

25

105

69

i

1193

237

00ED

í

2

299,774

012B,0306

ī̆

52

299

012B

ī

126

105,815

0069,032F

282

107

006B

k

1136

107,785

006B,0311

471

107,688

006B,02B0

5

107,7512,815

006B,1D58,032F

kᵘ̯

160

107,7512,815,688

006B,1D58,032F,02B0

kᵘ̯ʰ

3

108

006C

l

1238

108,805

006C,0325

39

108,805,772

006C,0325,0304

l̥̄

7

109

006D

m

858

109,805

006D,0325

23

110

006E

n

1070

110,805

006E,0325

93

111

006F

o

2006

243

00F3

ó

77

333,774

014D,0306

ō̆

68

333

014D

ō

215

8338

2092

21

112

70

p

873

112,688

0070,02B0

10

114

72

r

1848

114,805

72,0325

108

114,805,772

0072,0325,0304

r̥̄

14

115

73

s

2056

116

74

t

1261

116,688

0074,02B0

28

254

00FE

þ

6

117

75

u

1016

250

00FA

ú

18

363,774

016B,0306

ū̆

65

363

016B

ū

94

117,815

0075,032F

874

739

2000

ˣ

8

122

007A

z

42

 

 

 

 

Hieraus lassen sich folgende Häufigkeiten ermitteln

 

 

Z

zusammengefasste Zeichen

Häufigkeit

Prozent

A

a á ā̆ ā ā́

1189

4,50%

B

b

188

0,70%

530

2,00%

D

d đ

633

2,40%

432

1,60%

E

e é è ē̆ ē ḗ ə ₑ

4117

15,70%

G

g g̑

695

2,70%

gʰ g̑ʰ

505

1,90%

Gᵘ̯

gᵘ̯ g̑ᵘ̯

151

0,60%

Gᵘ̯ʰ

gᵘ̯ʰ g̑ᵘ̯ʰ

87

0,30%

h

h

13

0,10%

H

H

6

0,00%

h₁

h₁

57

0,20%

h₂

h₂

125

0,50%

h₃

h₃

25

0,10%

I

i í ī̆ ī

1373

5,20%

J

282

1,10%

K

k k̑

1607

6,10%

5

0,00%

Kᵘ̯

kᵘ̯ kᵘ̯ʰ

163

0,60%

L

l

1238

4,70%

l̥ l̥̄

46

0,20%

M

m

858

3,30%

23

0,10%

N

n

1070

4,10%

93

0,40%

O

o ó ō̆ ō ₒ

2387

9,10%

P

p

873

3,30%

10

0,00%

R

r

1848

7,00%

r̥ r̥̄

122

0,50%

S

s

2056

7,80%

T

t

1261

4,80%

28

0,10%

Þ

þ

6

0,00%

U

u ú ū̆ ū

1193

4,60%

V

874

3,30%

X

ˣ

8

0,00%

Z

z

42

0,20%

Summe (ohne Sonderzeichen)

 

26219

100%

 

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung

E

e é è ē̆ ē ḗ ə ₑ

4117

15,70%

O

o ó ō̆ ō ₒ

2387

9,10%

S

s

2056

7,80%

R

r

1848

7,00%

K

k k̑

1607

6,10%

I

i í ī̆ ī

1373

5,20%

T

t

1261

4,80%

L

l

1238

4,70%

U

u ú ū̆ ū

1193

4,60%

A

a á ā̆ ā ā́

1189

4,50%

N

n

1070

4,10%

V

874

3,30%

P

p

873

3,30%

M

m

858

3,30%

G

g g̑

695

2,70%

D

d đ

633

2,40%

530

2,00%

gʰ g̑ʰ

505

1,90%

432

1,60%

J

282

1,10%

B

b

188

0,70%

Kᵘ̯

kᵘ̯ kᵘ̯ʰ

163

0,60%

Gᵘ̯

gᵘ̯ g̑ᵘ̯

151

0,60%

h₂

h₂

125

0,50%

r̥ r̥̄

122

0,50%

93

0,40%

Gᵘ̯ʰ

gᵘ̯ʰ g̑ᵘ̯ʰ

87

0,30%

h₁

h₁

57

0,20%

l̥ l̥̄

46

0,20%

Z

z

42

0,20%

28

0,10%

h₃

h₃

25

0,10%

23

0,10%

h

h

13

0,10%

10

0,00%

X

ˣ

8

0,00%

H

H

6

0,00%

Þ

þ

6

0,00%

5

0,00%

 

Danach ist der am häufigsten zur Darstellung des in der Gegenwart anerkannten indogermanischen Wortschatzes verwendete Buchstabe das e (4117 15,7 Prozent), gefolgt von o (2387 9,1 Prozent), s (2056 7,8 Prozent), r (1970), k (1607) und i (1373), während kʰ, H, þ, x, pʰ, h und h₃ nur selten gebraucht werden.