GERİ DÖN

Ders Öğretim Planı


Dersin Kodu Dersin Adı Dersin Türü Yıl Yarıyıl AKTS
9105055462013 Arama Motorları Seçmeli Ders Grubu 1 2 8,00

Yüksek Lisans


Türkçe


Bu dersin amacı öğrencilere arama motorlarına ilişkin temel teknolojilerin ve araçların tanıtılmasıdır. Google, Yahoo, MSN Search gibi genel kullanımı olan büyük ölçekli arama motorları incelenecek ve kıyaslamaları yapılacaktır.


Prof. Dr. Bahar Karaoğlan


1 Arama motorlarının genel yapısı ve çalışma sistemini anlama
2 BGG sistemlerinin bileşenlerini analiz edebilme
3 Belge temsilinde kullanılan terim ağırlıklandırma süreci için gerekli olan unsurları kavrayabilme
4 Sayfa önem derecesinin belirlenmesinde kullanılan ölçütleri kavrayabilme
5 Dizinleme yapılarını kavrayabilme
6 Temel metin işleme algoritmalarını yazılımsal olarak gerçekleştirebilme
7 Belge-sorgu alaka hesaplamasını kavrayabilme
8 Arama motorlarının değerlendirmesini yapabilme
9 Belge kümeleme yöntemlerini anlama
10 Piton dilinde web örümceği yazabilme


Yok


Yok


Bu dersin kapsamı: arama motorlarının mimarisi; web örümceklerinin geliştirilmesi; yazılı metinlerin işlenmesi, indekslenmesi, organizasyonu ve sınıflanması; arama motorlarının performans değerlendirmesi; web madenciliği konularına yoğunlaşmıştır. Ayrıca pratik uygulamalar için Piton dili de anlatılacaktır.


Hafta Konular (Teorik) Öğretim Yöntem ve Teknikleri Ön Hazırlık
1 Giriş: Arama Motorlarının genel mimarisi, mevcut sistemler ve karşılaştırmaları
2 Web Örümcekleri Web Örümceklerinin çalışması. Piton dilinde Web örümceğinin yazılması için metin işleme komutları
3 Yazılı Metinlerin İşlenmesi Yazılı metinlerde gövdeleme, durma kelimeleri, tamlamaların tespiti, noktalama işaretlerinin çıkarılması, cümle sonu tespiti.
4 Terim Ağırlıklandırma Vektör uzayı modeli.Terim ağırlıklandırma yöntemleri: ikili, terim frekansı, ters belge frekansı
5 Sorguların oluşturulması Anahtar kelime tabanlı sorgulama, şablon eşleştirme ve yapısal sorgular.
6 İndeksleme ve Arama: Ters dosyalar, Tek geçişli ve iki geçişli indeksleme yöntemleri
7 Belge-Sorgu Alaka Sıralaması metin ve sorgu arasındaki benzerlik ölçülmesi
8 Arama Motorlarının Değerlendirilmesi: Anma, Duyarlık ve F ölçütleri, alternatif başarım ölçütleri.
9 Ara sınav
10 Bağ Yapılarının analizi Arama analizinde bağ yapılarının kullanımı
11 Spam ve kopyaların tespiti Spamlerin tespiti, , filitrelemeler
12 Hesaplamalı Reklamcılık Reklamların önceliklendirilmesi ve ücretlendirilmesi
13 Belge Kümeleme Yöntemleri Bayes, K-nn, Gizli Anlamsal İndisleme
14 Web’de veri madenciliği Sosyal ağlardan bilgi çıkarımında veri madenciliği yöntemlerinin uygulanması
15 Öğrenci Proje Sunumları
16 Final sınavı

Ders kitabı: Modern Information Retrieval R. Baeza-Yates ve B. Ribeiro-Yeto, 1999 Diğer önemli kaynaklar: Information Retrieval: A survey, E. Greengrass,2000, http://www.cs.umbc.edu/research/cadip/readings/IR.report.120600.book.pdf Information retrieval, C.J. van Rijsbergen, http://www.dcs.gla.ac.uk/Keith/Preface.html Precision and Recall, S.M. Shafi ve R.A. Rather http://www.webology.ir/2005/v2n2/a12.html


Etkinlikler ayrıntılı olarak "Değerlendirme" ve "İş Yükü Hesaplaması" bölümlerinde verilmiştir.


Yarıyıl (Yıl) İçi Etkinlikleri Adet Değer
Ara Sınav 1 100
Toplam 100
Yarıyıl (Yıl) Sonu Etkinlikleri Adet Değer
Final Sınavı 1 100
Toplam 100
Yarıyıl (Yıl) İçi Etkinlikleri 40
Yarıyıl (Yıl) Sonu Etkinlikleri 60

Yok


Etkinlikler Sayısı Süresi (saat) Toplam İş Yükü (saat)
Ara Sınav 1 3 3
Final Sınavı 1 3 3
Derse Katılım 13 3 39
Uygulama/Pratik 6 5 30
Rapor Hazırlama 8 8 64
Proje Hazırlama 1 25 25
Proje Sunma 1 1 1
Ara Sınav İçin Bireysel Çalışma 1 20 20
Final Sınavı içiin Bireysel Çalışma 1 25 25
Okuma 5 6 30
Toplam İş Yükü (saat) 240

PÇ 1 PÇ 2 PÇ 3 PÇ 4 PÇ 5 PÇ 6 PÇ 7
ÖÇ 1 3
ÖÇ 2 3 5
ÖÇ 3 5 4 3
ÖÇ 4 5
ÖÇ 5 4 5
ÖÇ 6 3
ÖÇ 7 4 5
ÖÇ 8 5
ÖÇ 9
ÖÇ 10
* Katkı Düzeyi : 1 Çok düşük 2 Düşük 3 Orta 4 Yüksek 5 Çok yüksek