Kavânin-i Osmâniyye Hakkında
Hukuki Mirasımızı Dijitalleştirme
01 Başlangıç
Yaklaşık 10 yıl önce yüksek lisans tezim için Osmanlıca öğrenmeye başladıktan sonra benim için yeni bir dünyanın kapısı açılmış oldu. Hem anadilimi daha iyi tanıdığımı hem de tarihimizi birinci elden incelemenin verdiği heyecanı hissettim.
2023-2024 yıllarında büyük dil modellerinin tüketicilere açılması, ChatGPT'nin ve daha sonra rakiplerinin de piyasaya çıkmasıyla bu teknolojinin tarihçiler için nasıl kullanılabileceği konusunda kafamda soru işaretleri oluştu. Bir internet forumunda Avrupa tarihine ait eski belgeleri transkribe etmede Claude.AI kullanan bir gönderiyi gördükten sonra ben de bu fikri denemeye karar verdim. O denemenin sonuçlarını 2 numaralı başlıkta aşağıda paylaştım.
Bir süre ara verdikten sonra, yakın zamanda başka bir gönderide Google'ın Gemini modelinin yine Avrupa tarihi metinleri üzerinde çok iyi çalıştığını okudum ve tekrar denemeye karar verdim. Birkaç sayfa Osmanlıca matbu metin gönderdikten sonra oldukça iyi sonuçlar geldiğini gördüm ve deneysel olarak Osmanlı'nın en önemli hukuki kaynaklarından biri olan Düstur'u bu yöntemle dijitalleştirmeyi denedim.
- Bu sayfanın ilk amacı da bu sonuçları paylaşmaktır.
- 19. yüzyıl ve sonrası Osmanlı hukuk kaynaklarının değişimine, gelişimine ve bolluğuna dikkat çekmek.
- Dönemin hukukunu daha erişilebilir kılmak.
- Genel olarak Osmanlı tarihine ve hukuk tarihimize olan ilgiyi arttırmak.
Kısacası: Osmanlı'nın hukuk kaynaklarının daha erişilebilir olmasına, Osmanlıca ve tarihimize olan ilginin artmasına bir nebze faydam olursa ne mutlu! ❤️
02 Önceki Proje: Ottoman Mobility Analyzer
Bu yaklaşımı ilk olarak Cerîde-i Mehâkim adlı 19. yüzyıl Osmanlı hukuk dergisi üzerinde denedim. Proje, tarihsel metinlerden Osmanlı kamu görevlilerinin hareketliliğini (atama, tayin, terfi) çıkarmayı amaçlıyordu.
Çıkarılan Bilgiler:
- Memurun adı ve mevcut pozisyonu
- Görev yeri
- Yeni pozisyon ve yeni görev yeri
- Bazı durumlarda eğitim bilgileri
Teknik Özellikler:
- Matbu Osmanlıca metinlerin uçtan uca Latinizasyonu
- Latinize metinden yapılandırılmış veri çıkarımı
- Otomatik yer adı önerisi/düzeltmesi
- Google Document AI + Claude.AI entegrasyonu
Ön Sonuçlar
1901-1903 yılları arasında yaklaşık 725 atama kaydı çıkarılarak görselleştirildi:
Çıkan sonuçlar beni hem şaşırttı hem de çok heyecanlandırdı. Birkaç sene önce belki 4-5 kişilik bir araştırma ekibinin aylarca uğraşması gereken okuma, veri toplama ve veri girme işlemini LLM'ler (bazen hatalarla da olsa) yapabiliyordu. Üstelik, ortaya çıkan sonuç oldukça anlamlıydı da. Cerîde-i Mehâkim'de yer alan ve sadece iki yılı kapsayan atama verisi bile Osmanlı bürokrasi ağının genişliğini ve Balkanlardaki yoğunluğunu ortaya koyuyordu!
Cerîde-i Mehâkim
Cerîde-i Mehâkim'den veri çıkarımı
1901-1903 yılları arasında gerçekleşen adli atamaları gösteren harita. 3 veya daha fazla atama olan noktalar haritaya eklenmiştir
03 Teknik Detaylar
Önce Kongre Kütüphanesi adresinden Düstur PDF olarak indirildi.
Her sayfayı küçük bir python kodu ile ayırıp, sayfaların çerçevesindeki fazla boşluklar kesildi ve sayfalar PNG olarak kaydedildi.
Daha sonra her sayfayı tek tek Gemini modeline göndererek Latin alfabesine transkribe ettirildi. Aşağıda kullanılan prompt ve ayarları görebilirsiniz.
model = "gemini-3-pro-preview"
contents = [
types.Part.from_bytes(
data=image_bytes,
mime_type='image/jpeg',
), '''
This is a 19th century Ottoman legal text.
Transliterate into latin alphabet. Do not add your explanation. Just do transliteration.
You may use ^ for a, u, ı, i if they are relevant.
Most pages start with a page number. Also convert them into arabic numberals and wrap with **
'''
]
tools = [
types.Tool(googleSearch=types.GoogleSearch(
)),
]
generate_content_config = types.GenerateContentConfig(
thinking_config = types.ThinkingConfig(thinking_level="high"),
tools=tools,
)
📚 Düstur metni Kongre Kütüphanesi adresinden alınmıştır. (Turkey, and Abdülhamid Ii Collection. Düstur. [Istanbul: Matbaa-i Amire Ankara: Başbakanlık Basımevi, 1863] Periodical. https://www.loc.gov/item/ne62000951/.)
📖 Birinci cildin önemli bir kısmını en önemli hukuk kaynaklarından biri olan Mecelle kaplamaktadır.
Önemli Uyarı
Özellikle bilimsel çalışmalarda LLM çıktılarının birincil kaynaktan kontrol edilmeden kullanılması önemli hatalara sebep verebilir. Her zaman orijinal kaynağı kontrol edin!
04 Gelecek Planları
- Vakit buldukça diğer ciltleri de benzer şekilde dijitalleştirmeyi planlıyorum.
- Arama motorunun geliştirilmesi.
- Diğer matbu hukuki metinlerin de benzer şekilde dijitalleştirilmesi.