Ich habe vor, zumindest einmal bei den bis zu 4-buchstabigen Wörtern folgende Kategorien einzuführen:
1 = † (griechische Wörter) 2 = †† (Wörter aus anderen Sprachen) 3 = ‡ (Wörter, die nur in Inschriften oder bei den alten Grammatikern vorkommen) 4 = * (Wörter, die nur einmal vorkommen)
Ich bin aber nicht ganz sicher, ob ich mich dabei sklavisch an L&S halten soll. Z.B. ist mir aufgefallen, dass ENS mit einem Stern (*) markiert ist. In nachklassischer Zeit ist dieses Wort aber sicher häufig verwendet worden. Ob man so etwas berücksichtigen soll?
Andererseits gibt es Wörter, die ziemlich eindeutig griechisch sind, aber nicht mit einem Kreuz (†) markiert sind, z.B.:
zēa, ae, f., = ζεια. I. A kind of grain, spelt : Triticum spelta, Linn. (pure Lat. alica); Plin. 18, 8, 19, § 81 sq.; Hier. in Isa. 9, 28, 25; id. in Ezech. 4, 9.— II. A kind of rosemary, App. Herb. 97.
Wir könnten es bei den Gräzismen ja so machen, dass wir das betreffende Wort mitsamt seinen Beugungformen immer dann, wenn griechische Buchstaben in dem Artikel zum fraglichen Lemma vorkommen, in die Kategorie "griechische Fremdwörter" verfrachten, egal, ob im L&S ein Kreuz † davor steht oder nicht.
Ich befürchte allerdings, dass bei solch einer pauschalen maschinellen Behandlung dieser Wörter möglicherweise auch echt lateinischen Wörter in der falschen Kategorie landen könnten, nur weil deren indogermanische Etymologie und deren Bezug zu irgendeinem griechischen Wort im Artikel genannt wird.
Ich glaub, das ist nicht so eine gute Idee. Ich habe nämlich bemerkt, dass manchmal griechische Wörter angegeben werden, auch wenn sie etymologisch gar nicht verwandt sind.
Mir fällt gerade kein gutes Beispiel ein, aber vielleicht genügt das folgende:
bŏnĭfātus, = ευμοιρος, lucky, fortunate, Gloss. Gr. Lat.
Hier ist anscheinend das griechische Wort deswegen angegeben, weil das lateinische eine Art wörtliche Übersetzung darstellt. Ich glaube aber, dass ich noch anders geartete Beispiele gesehen habe.
Zitat von BussinchenIch befürchte allerdings, dass bei solch einer pauschalen maschinellen Behandlung dieser Wörter möglicherweise auch echt lateinischen Wörter in der falschen Kategorie landen könnten, nur weil deren indogermanische Etymologie und deren Bezug zu irgendeinem griechischen Wort im Artikel genannt wird.
Ja, deine Beispiele FRACES und BONIFATUS bestätigen meine Befürchtung. Mein Vorschlag war dummes Zeug. Vergiss es!
Ich muss demnächst unbedingt Clint Hagen nochmal anschreiben. Vielleicht kann er uns ja eine elektronische L&S-Liste aufbereiten, wo die Kreuze alle mit drin sind.
Ich habe die griechischen Wörter in die Kategorie 1 getan, weil das im Vergleich zu den anderen bei weitem die "gewöhnlichsten" Wörter sind. Inbesondere die Hapax legomena und die Wörter aus den Inschriften und von den Grammatikern sind häufig äußerst ungewöhnlich und/oder problematisch . Das ist zumindest der Eindruck, den ich bis jetzt gewonnen habe.
Ich habe bereits alle Wörter bis zu vier Buchstaben dementsprechend klassifiziert und nun begonnen, das ganze Wörterbuch diesbezüglich durchzugehen. Da bin ich aber erst auf Seite 20 (von ca. 2000). Das wird also noch dauern ...
Wenn du eine andere Numerierung der Kategorien haben willst, kann ich das natürlich leicht machen. Ich würde dir aber vorher empfehlen, die Wörter der verschiedenen Kategorien bei den vierbuchstabigen Wörtern anzusehen.
Wenn wir Inschriften in eine eigene Kategorie legen, würde ich folgende Nummerierung vorschlagen:
1 = † griechische Wörter 2 = †† Wörter aus anderen Sprachen 3 = ‡ Wörter, die nur bei den alten Grammatikern oder Lexikographen vorkommen 4 = * Wörter, die nur einmal vorkommen 5 = Wörter, die nur in Inschriften vorkommen
Wenn ein Wort sowohl bei einem Grammatiker als auch in einer Inschrift vorkommt, würde ich es in Kategorie 3 legen.
Wenn ein Wort nur einmal, und zwar in einer Inschrift vorkommt, kommt es in die Kategorie 5.
Das ist letztlich Ermessenssache. Vielleicht sollten wir erst mal abwarten, was für Wörter am Ende in der Kategorie 5 stehen werden. Wenn da hauptsächlich so höchst seltsame Wörter wie SAXUS, SAKSUM und KARUS drinstehen, etwa weil irgendwelche Parther mit der lateinischen Rechtschreibung auf Kriegsfuß standen , dann sollten wir diese Kategorie ruhig als Nummer 5 führen. Diese genannten Beispiele sind ja sehr grenzwertig, und ich verstehe nicht, warum L&S da keinen Vermerk (incorrect) oder (incorrect spelling) oder dgl. eingefügt haben. Mit SAXUS ist es ja auch so eine Sache...
Aber noch haben wir zu wenige Beispiele, um uns ein Bild davon machen zu können, ob die ausschließlich in Inschriften belegten Wörter wirklich alle grenzwertig sind oder nicht.
Lass daher die Nummerierung ruhig mal so. Die Wörterliste, die als zukünftiges latin.dic heranwächst, ist ja sowieso erst mal nur eine Arbeitsfassung. Bevor das latin.dic eines Tages online geht, kann man immer noch überlegen, ob wir an der Reihenfolge der Kategorien etwas ändern wollen. Oder?
Ja, die Nummerierung können wir auch noch später festlegen.
Ich denke überhaupt, dass diese Frage mit den Inschriften nicht höchste Priorität hat. Das größte Problem sind derzeit immer noch die vielen Wörter aus der Spellcheckerliste, die nicht im L&S stehen (schätzungsweise ein paar Tausend). Die kann man leider nicht automatisch herausstreichen, weil das oft Genitive oder Perfektformen oder sonstige besondere Formen sind. Ich habe jetzt die fünfbuchstabigen diesbezüglich durchgesehen und beginne nun mit den sechsbuchstabigen (das sind alleine schon 1228 Wörter, die ich einzeln durchgehen muss).
Ich werde also das Kategorienproblem im Auge behalten, aber mich nur nebenher damit beschäftigen.
Zitat von linhartDas größte Problem sind derzeit immer noch die vielen Wörter aus der Spellcheckerliste, die nicht im L&S stehen (schätzungsweise ein paar Tausend). Die kann man leider nicht automatisch herausstreichen, weil das oft Genitive oder Perfektformen oder sonstige besondere Formen sind. Ich habe jetzt die fünfbuchstabigen diesbezüglich durchgesehen und beginne nun mit den Sechsbuchstabigen (das sind alleine schon 1228 Wörter, die ich einzeln durchgehen muss).