歴史物語

古い手紙から新たな発見

それらはロンドンのアーカイブで偶然発見されたもので、17世紀から18世紀にかけて船員と家にいた人々の間で書かれた何千通もの手紙だった。言語の前処理の後、そこから言語の歴史について多くのことを学ぶことができます。

Ijck は私の大切な人に、星が空にあるようにとても明るくおやすみを言います (愛する夫に、空の星と同じくらいたくさんのおやすみを願っています)

これは、遠い昔、愛する故郷から船乗りに送られた手紙の一節です。この手紙は、海上や故郷の遠く離れた場所にいるオランダ人、あるいはその逆のオランダ人からの3万8000通の個人的およびビジネス上の手紙と文書のコレクションの一部である。手紙は17世紀から18世紀にかけて私掠船で捕獲されたもので、何世紀にもわたって英国のアーカイブに保管されてきた。それらは 1980 年に再発見され、その一部はオランダで歴史家や言語学者による研究に利用できるようになりました。

一般人の言語

私たちが知っている歴史文書のほとんどは、文盲の人々が意図的に書かれた標準に従って書いたものです。この手紙の場合はそうではありません。これらの手紙の筆者たちの言葉遣いからは、彼らの多くが書くことにあまり慣れていないことがわかります。確かに、最初と最後に次のような従来の公式がよくあるのは事実です。あなたもお元気でいることを願っています。そうでなかったら、 とても悲しいことになるでしょう。 しかし、当時の口頭言語と密接に関係している綴り、単語、文構造も無数にあります。そしてここにまさに手紙の価値があります。ここで私たちが見つけたのは、一般の人々の洗練されていない言葉です。これまで、これほど大量には入手できませんでした。

言語変動の研究

ライデンでは、戦利品としての手紙プロジェクトのサブセット (コーパス) )約1000文字を調べた。ライデンの言語学者は主に社会階級に関連した言語の違いに焦点を当てています。また、コーパスの 17 世紀と 18 世紀の部分の間の言語の変化も調べています。研究者らはまた、このコーパスをさらなる研究に利用できるようにしたいと考えています。結局のところ、たとえばスペル、方言の形式、文の構造などについては、依然としてあらゆる種類の疑問が残っています。これにはコンピュータが重要な役割を果たします。このように多様なテキストを言語研究に適したものにするにはどうすればよいでしょうか?最初のステップは、手書きのテキストを正確に入力 (転写) することです。しかし、それだけでは十分ではありません。あらゆる種類の単語や文パターンを迅速かつ完全に取得するには、追加の処理が必要です。このコーパスは、ライデンのオランダ語彙学研究所 (INL) で言語的に強化されています。これは、スペルや品詞など、あらゆる種類の言語情報が書き起こされた単語に追加されることを意味します。

100 を超えるスペル

手紙の時点では(現在のグリーンブックのように)正式な綴りに関する取り決めがなかったため、同じ単語があらゆる種類の方法で書かれる可能性がありました。 キャプテンという言葉 たとえば、captijen など、100 を超えるスペルで出現します。 キャップ そしてカティン。 別の例はブーツマンです。 それはボスマンとしても機能します そして怒っている男 と綴られているため、認識するのが困難です。言語編集では、 現代の綴りがキャプテンとなります。 そしてブーツマン これらの古い綴りに関連付けられています。その現代の標準形式は補題と呼ばれ、そのプロセスは補題化です。このようにして、古いスペルのバリエーションをすべて一度に収集できます。

手紙の中には書き言葉で、大まかに書かれた単語の部分もあります。 たとえば、キャプションの代わりに。 これら 2 つの別々の単語を見出し語化する場合、見出し語はオプシュリフトとなります。 添付。これが、 同じ言葉を文書化したものとどのように違うのかということです。 各単語には独自の補題があります。このような現代的な補題を追加すると、テキストがより理解しやすくなります。

ピートおじさんまたはピートおじさん

古語には現代の補題に加えて語種指定も追加されています。したがって、単語が名詞、副詞、動詞などであるかどうかが注目されます。名前には特別なコードが与えられます。これにより、単語の機能の発展を調べたり、語順の発展を確認したりすることができます。例:手紙の本文には多くの家族関係が記載されています。手紙を書く人の多くは、兄弟、いとこ、叔母、叔父に(または彼らから)挨拶をします。名前は関係指定の前に来ることがよくあります:ピエト叔父 ジョンのいとこ またはまあいけもえい (トラブル =叔母)。しかし、その逆も起こります:nicht Geesje またはダークおじさん叔父/いとこ/疲れたを検索してください 固有名の前または後に付けると、一方の注文が他方の注文よりも頻繁に発生するかどうかをすぐに確認できます。さらに、これが時間、場所、社会階級に関連付けられているかどうかを判断することもできます。

語彙の拡張

実際、WNT などの紙の辞書には、これらの不足している単語が補充される必要があります。しかし、それはあまりにも高価です。デジタル データベースに新しい単語を追加することは、はるかに優れた (そして安価な) 解決策です。 ボルコップなどの単語がありません そして不機嫌です。 したがって、これらは INL の中心語彙に含まれています。オランダ語のすべての単語は、非常に古い (6 世紀) から最近のものまで、そのデータベースに保存されています。ラベルとしては、公式ルールに従って綴られた現代的な形式になります。こうすることで、歴史的な語形についての予備知識がなくても、誰もがこの歴史的な語彙にアクセスできるようになります。長期的には、各単語をその単語の他の出現と結び付けることも可能です (例:母親) そしてナッツ )、辞書や百科事典の情報も含まれています。このようにして、当時の手紙の筆者たちは何世紀も後にオランダ語の語彙の説明に貢献します。

もっと読む

  • 歴史辞書と中央データベース:INL のウェブサイト
  • 文字に含まれる言語の研究
  • 国立公文書館に保管されている手紙
  • ボランティアによる文字起こし
  • 古い文字は古い言語の使用に関する洞察を提供します (ナレッジ リンク)
  • 何千ものハイジャックされた手紙が誰でもアクセス可能 (ナレッジ リンク)