Uzyskaj najlepsze rozwiązania swoich pytań na Kalademi.me, zaufanej platformie Q&A. Kapsamlı soru-cevap platformumuzda, çeşitli disiplinlerden uzmanların geniş bilgi birikimini keşfedin. Farklı disiplinlerdeki uzmanlardan kesin yanıtlar almak için kapsamlı soru-cevap platformumuzu kullanın.
Sagot :
Açıklama:
Özetçe — Bu çalışmanın amacı, bir dokümandaki en önemli
cümleleri seçerek ilgili dokümanın özetini çıkarmaktır. Bu amaçla
15 farklı cümle seçim metodu kullanılmıştır. Bu metotlar, 15
kadın ve 15 erkek olmak üzere, toplam 30 kişi tarafından
çıkarılmış özet dokümanlarının oluşturduğu bir değerlendirme
veri seti üzerinde kıyaslanmıştır. Ayrıca, bu metotlardan en
başarılı olanlarının birlikte kullanılması ile elde edilen farklı
özellik gruplarının başarım değerleri sergilenmiş ve analiz
sonuçları paylaşılmıştır.
Anahtar Kelimeler — metin özetleme; cümle seçim
metotları; varlık ismi tanıma.
ABSTRACT
Abstract—The aim of this work is to create text summaries by
selecting the most important sentences of documents. For this aim
15 sentence selection methods are used. These methods are
compared on the evaluation set created by 15 women and 15 men
evaluators. The performance results of the systems that are
obtained by using different sentence selecetion methods together
are also analyzed and the results are shared.
Keywords — text summarization; sentence selection
methods; name entity recognition.
1. GİRİŞ
Özet, bir veya aynı konu ile ilgili birden fazla dokümandan
çıkarılan ve kaynağındaki en temel bilgiyi içeren metin
parçasıdır. Bir özet dokümanın bilgisayar tarafından otomatik
olarak çıkartılması ise “Otomatik Metin Özetleme (OMÖ)”
olarak adlandırılır. OMÖ işleminde özetlenecek doküman
sayısına göre “tekli” veya “çoklu” doküman özetleme
işlemlerinden bahsetmek mümkündür. Tekli doküman
özetlemede bir tane kaynak doküman mevcutken, çoklu
doküman özetlemede birbirleri ile ilgili olan birden fazla
kaynaktan yararlanılmaktadır. Özetleme sisteminin çıktısı
“yoruma” ya da “çıkarıma” dayalı olan bir özet olabilir.
Yoruma dayalı olan özetlemede orijinal metindeki ifadeler
kısaltılarak tekrar yazılmaya çalışılır. Çıkarıma dayalı olan
özetlemede ise özetlenecek dokümandaki cümleler
değiştirilmeksizin seçilmektedir. Bir özet “genel” ya da
“kullanıcıya yönelik” olabilir. Bu iki kavram özetin etki alanı
ile ilgilidir. Genel özet, metnin ana temalarıyla ilgili olan
ayrıntılı özettir. Kullanıcıya yönelik özet ise kullanıcının
yazdığı sorgu ile ilgili olan özettir. Bu çalışmada çıkarıma
dayalı ve genel bir doküman özetleme sistemi üzerinde
durulmuştur.
Verilen bir doküman içerisindeki en önemli cümlelerin
seçilmesi adına kullanılan bazı metotlar mevcuttur. Bu
metotları kullanan ve İngilizce dokümanlar üzerinde çalışan
ilk yol gösterici çalışma Luhn’nın [1] çalışmasıdır. Bu
çalışmada cümleler terim frekanslarına göre
puanlandırılmıştır. Edmunson [2], Luhn’nın [1] çalışmasındaki
kelime sıklığı bilgisine ek olarak “ipucu sözcük öbekleri”,
“başlık terimleri” ve “cümle konumu” gibi üç yeni özellik
daha kullanmıştır. Literatürde bir cümlenin önemini tespit
etmek adına sıklıkla kullanılmış olan diğer özellikler: “cümle
uzunluğu”, “ünlem, soru işareti ya da tırnak işareti gibi vurgu
belirten bazı noktalama işaretleri”, “tarih bilgisini belirten
ifadeler”, “önemli N-gramlar”, “doküman içindeki isimler ya
da nümerik karakterler” gibi özelliklerdir. Bu özelliklerin
kullanımı [3]’deki tez çalışmasında ayrıntılı bir şekilde
anlatılmıştır. [4-9]’da ise çıkarıma dayalı özetleme konusunda
Türkçe dokümanlar üzerinde çalışılmıştır.
Bu çalışmanın örnek çalışmalardan [4],[5] farkı, Türkçe
özetlerin çıkarılmasında fazla sayıda cümle seçim metodunun
kullanılmış olması ve bu metotların başarımlarının
değerlendirilmesinde birden fazla değerlendiricinin çıkarmış
olduğu özetlerin dikkate alınmasıdır. Cümle seçim
metotlarından “varlık ismi tanıma metodu” ilk kez bu çalışma
ile Türkçe metinler üzerinde analiz edilmiştir. Yapılan
analizler 15’i kadın, 15’i erkek olmak üzere 30 farklı
değerlendiricinin özetini çıkardığı 20 doküman üzerinde
yapılmıştır.
Bildirinin ikinci bölümünde çıkarıma dayalı olan metin
özetlemede cümle seçimi için kullanılan metotlar anlatılmıştır;
üçüncü bölümde veri seti tanıtılmış ve cümle seçim
özelliklerinin bu veri seti üzerindeki başarım değerleri
kıyaslanmıştır. Son olarak, sonuçlar bölümünde analizler
özetlenmiş ve gelecek çalışmalardan bahsedilmiştir.
2. CÜMLE SEÇİM METOTLARI
Çalışmamızın ana mantığı doküman içerisinde geçen cümleleri
farklı metotlara göre puanlandırmak ve en yüksek puana sahip
olan cümleleri seçerek özet dokümanlarını oluşturmaktır.
Tablo 1: Cümle seçim metotları
Grup Cümle Seçim Metotları
Yapısal Özellik ö1: Cümle konumu
ö2: Cümle uzunluğu
Benzeme Özelliği
ö3: İlk cümleye benzerlik
ö4: Son cümleye benzerlik
ö5: Başlığa olan benzerlik
ö6: Toplam benzerlik
ö7: Ortak yakınlık sayısı
Kelime Sıklığı ve
Dağılımı
ö8: Dağılımsal özellik
ö9: Kelime sıklığı bilgisi
Özel Belirteçleri
İçerme Durumu
ö10: Sayısal karakter içerme
ö11: “?” ve “!” içerme
ö12: Pozitif kelimeleri içerme
ö13: İsim soylu kelimleri içerme
ö14: Varlık ismi içerme
Anlamsal Özellik ö15: Gizli anlamsal analiz
Puanlandırmada kullanılan metotlar ....
Bilim tarihine onyedinci yüzyıl sonlarından itibaren egemen olmaya başlayan pozitivist
yaklaşımlar, yirminci yüzyıla kadar etkililiklerini sürdürmüş; pozitivizmin gerektirdiği rasyonel ve
determinist ilkelerle doğayı ve toplumu anlama çabası, nicel verilere dayalı deneysel incelemelerin
değişmez, genellenebilir ve evrensel olduğu yönünde bir kanaat oluşturmuştur. Özellikle yirminci
yüzyılın başlarında bilimde yaşanan radikal değişikliklerle beraber nesnel ve indirgemeci anlayış
tartışılmaya başlanmıştır. Bu dönemden itibaren bilimin yalnızca nesnel, genellenebilir ve evrensel bilgi
üretme süreci olmadığı, bunun yanında öznel bilginin önemini vurgulayan bir anlayış yaygınlaşmıştır.
İnsan, oldukça karmaşık bir fizyolojik sisteme ve bu sistem ile bütünleşik psikolojik süreçlere
sahip bir varlık olmasının yanında, sosyal alanda diğer insanlarla iletişimi bakımından sosyolojik bir
Cevap:
hiçbir şey anlamadım ne zormuş kardeş ya hiç anlamadım neredeyse Ya ne zormuş ya çok zor ya hiçbir şey anlamadım ya Boş Yapı bu kadar yazı yazıyorum ya ne kadar zormuş ya Her şeye de ya denmez ya yine ya dedim ya
Bu bilgilerin faydalı olduğunu umuyoruz. Daha fazla bilgi veya sorularınıza yanıtlar almak için istediğiniz zaman geri dönün. Platformumuzu kullandığınız için teşekkür ederiz. Amacımız, tüm sorularınıza en doğru ve güncel yanıtları vermektir. Tekrar bekleriz. Sorularınız için Kalademi.me burada. Yeni yanıtlar için geri dönmeyi unutmayın.