Uzyskaj najlepsze rozwiązania swoich pytań na Kalademi.me, zaufanej platformie Q&A. Kapsamlı soru-cevap platformumuzda, çeşitli disiplinlerden uzmanların geniş bilgi birikimini keşfedin. Farklı disiplinlerdeki uzmanlardan kesin yanıtlar almak için kapsamlı soru-cevap platformumuzu kullanın.

Bir Metin üzerinde Cümlenin Tespiti Çalışması Proje konum acil yardımlarınızı bekliyorum​

Sagot :

Açıklama:

Özetçe — Bu çalışmanın amacı, bir dokümandaki en önemli

cümleleri seçerek ilgili dokümanın özetini çıkarmaktır. Bu amaçla

15 farklı cümle seçim metodu kullanılmıştır. Bu metotlar, 15

kadın ve 15 erkek olmak üzere, toplam 30 kişi tarafından

çıkarılmış özet dokümanlarının oluşturduğu bir değerlendirme

veri seti üzerinde kıyaslanmıştır. Ayrıca, bu metotlardan en

başarılı olanlarının birlikte kullanılması ile elde edilen farklı

özellik gruplarının başarım değerleri sergilenmiş ve analiz

sonuçları paylaşılmıştır.

Anahtar Kelimeler — metin özetleme; cümle seçim

metotları; varlık ismi tanıma.

ABSTRACT

Abstract—The aim of this work is to create text summaries by

selecting the most important sentences of documents. For this aim

15 sentence selection methods are used. These methods are

compared on the evaluation set created by 15 women and 15 men

evaluators. The performance results of the systems that are

obtained by using different sentence selecetion methods together

are also analyzed and the results are shared.

Keywords — text summarization; sentence selection

methods; name entity recognition.

1. GİRİŞ

Özet, bir veya aynı konu ile ilgili birden fazla dokümandan

çıkarılan ve kaynağındaki en temel bilgiyi içeren metin

parçasıdır. Bir özet dokümanın bilgisayar tarafından otomatik

olarak çıkartılması ise “Otomatik Metin Özetleme (OMÖ)”

olarak adlandırılır. OMÖ işleminde özetlenecek doküman

sayısına göre “tekli” veya “çoklu” doküman özetleme

işlemlerinden bahsetmek mümkündür. Tekli doküman

özetlemede bir tane kaynak doküman mevcutken, çoklu

doküman özetlemede birbirleri ile ilgili olan birden fazla

kaynaktan yararlanılmaktadır. Özetleme sisteminin çıktısı

“yoruma” ya da “çıkarıma” dayalı olan bir özet olabilir.

Yoruma dayalı olan özetlemede orijinal metindeki ifadeler

kısaltılarak tekrar yazılmaya çalışılır. Çıkarıma dayalı olan

özetlemede ise özetlenecek dokümandaki cümleler

değiştirilmeksizin seçilmektedir. Bir özet “genel” ya da

“kullanıcıya yönelik” olabilir. Bu iki kavram özetin etki alanı

ile ilgilidir. Genel özet, metnin ana temalarıyla ilgili olan

ayrıntılı özettir. Kullanıcıya yönelik özet ise kullanıcının

yazdığı sorgu ile ilgili olan özettir. Bu çalışmada çıkarıma

dayalı ve genel bir doküman özetleme sistemi üzerinde

durulmuştur.

Verilen bir doküman içerisindeki en önemli cümlelerin

seçilmesi adına kullanılan bazı metotlar mevcuttur. Bu

metotları kullanan ve İngilizce dokümanlar üzerinde çalışan

ilk yol gösterici çalışma Luhn’nın [1] çalışmasıdır. Bu

çalışmada cümleler terim frekanslarına göre

puanlandırılmıştır. Edmunson [2], Luhn’nın [1] çalışmasındaki

kelime sıklığı bilgisine ek olarak “ipucu sözcük öbekleri”,

“başlık terimleri” ve “cümle konumu” gibi üç yeni özellik

daha kullanmıştır. Literatürde bir cümlenin önemini tespit

etmek adına sıklıkla kullanılmış olan diğer özellikler: “cümle

uzunluğu”, “ünlem, soru işareti ya da tırnak işareti gibi vurgu

belirten bazı noktalama işaretleri”, “tarih bilgisini belirten

ifadeler”, “önemli N-gramlar”, “doküman içindeki isimler ya

da nümerik karakterler” gibi özelliklerdir. Bu özelliklerin

kullanımı [3]’deki tez çalışmasında ayrıntılı bir şekilde

anlatılmıştır. [4-9]’da ise çıkarıma dayalı özetleme konusunda

Türkçe dokümanlar üzerinde çalışılmıştır.

Bu çalışmanın örnek çalışmalardan [4],[5] farkı, Türkçe

özetlerin çıkarılmasında fazla sayıda cümle seçim metodunun

kullanılmış olması ve bu metotların başarımlarının

değerlendirilmesinde birden fazla değerlendiricinin çıkarmış

olduğu özetlerin dikkate alınmasıdır. Cümle seçim

metotlarından “varlık ismi tanıma metodu” ilk kez bu çalışma

ile Türkçe metinler üzerinde analiz edilmiştir. Yapılan

analizler 15’i kadın, 15’i erkek olmak üzere 30 farklı

değerlendiricinin özetini çıkardığı 20 doküman üzerinde

yapılmıştır.

Bildirinin ikinci bölümünde çıkarıma dayalı olan metin

özetlemede cümle seçimi için kullanılan metotlar anlatılmıştır;

üçüncü bölümde veri seti tanıtılmış ve cümle seçim

özelliklerinin bu veri seti üzerindeki başarım değerleri

kıyaslanmıştır. Son olarak, sonuçlar bölümünde analizler

özetlenmiş ve gelecek çalışmalardan bahsedilmiştir.

2. CÜMLE SEÇİM METOTLARI

Çalışmamızın ana mantığı doküman içerisinde geçen cümleleri

farklı metotlara göre puanlandırmak ve en yüksek puana sahip

olan cümleleri seçerek özet dokümanlarını oluşturmaktır.

Tablo 1: Cümle seçim metotları

Grup Cümle Seçim Metotları

Yapısal Özellik ö1: Cümle konumu

ö2: Cümle uzunluğu

Benzeme Özelliği

ö3: İlk cümleye benzerlik

ö4: Son cümleye benzerlik

ö5: Başlığa olan benzerlik

ö6: Toplam benzerlik

ö7: Ortak yakınlık sayısı

Kelime Sıklığı ve

Dağılımı

ö8: Dağılımsal özellik

ö9: Kelime sıklığı bilgisi

Özel Belirteçleri

İçerme Durumu

ö10: Sayısal karakter içerme

ö11: “?” ve “!” içerme

ö12: Pozitif kelimeleri içerme

ö13: İsim soylu kelimleri içerme

ö14: Varlık ismi içerme

Anlamsal Özellik ö15: Gizli anlamsal analiz

Puanlandırmada kullanılan metotlar ....

Bilim tarihine onyedinci yüzyıl sonlarından itibaren egemen olmaya başlayan pozitivist

yaklaşımlar, yirminci yüzyıla kadar etkililiklerini sürdürmüş; pozitivizmin gerektirdiği rasyonel ve

determinist ilkelerle doğayı ve toplumu anlama çabası, nicel verilere dayalı deneysel incelemelerin

değişmez, genellenebilir ve evrensel olduğu yönünde bir kanaat oluşturmuştur. Özellikle yirminci

yüzyılın başlarında bilimde yaşanan radikal değişikliklerle beraber nesnel ve indirgemeci anlayış

tartışılmaya başlanmıştır. Bu dönemden itibaren bilimin yalnızca nesnel, genellenebilir ve evrensel bilgi

üretme süreci olmadığı, bunun yanında öznel bilginin önemini vurgulayan bir anlayış yaygınlaşmıştır.

İnsan, oldukça karmaşık bir fizyolojik sisteme ve bu sistem ile bütünleşik psikolojik süreçlere

sahip bir varlık olmasının yanında, sosyal alanda diğer insanlarla iletişimi bakımından sosyolojik bir

Cevap:

hiçbir şey anlamadım ne zormuş kardeş ya hiç anlamadım neredeyse Ya ne zormuş ya çok zor ya hiçbir şey anlamadım ya Boş Yapı bu kadar yazı yazıyorum ya ne kadar zormuş ya Her şeye de ya denmez ya yine ya dedim ya