| Dersin Kodu | Dersin Adı | Dersin Türü | Yıl | Yarıyıl | AKTS |
|---|---|---|---|---|---|
| 501004992025 | HIGH PERFORMANCE DATA PROCESSING | Seçmeli Ders Grubu | 4 | 7 | 5,00 |
Lisans
İngilizce
Ders kapsamında toplu işleme, akış işleme ve bunların birleşik mimarilerine odaklanılarak yüksek performanslı veri işleme mimarilerinin kapsamlı bir şekilde incelenmesi hedeflenmektedir. Hadoop, Spark, Kafka ve Flink gibi endüstri standardı araçları kullanılarak teorik temellerin pratik uygulamalarla bütünleştirilmesi amaçlanmaktadır. Ders sonunda öğrencilerin dağıtık ortamlarda hata toleransı, tutarlılık ve ölçeklenebilirlik gibi ölçütlere dikkat ederek büyük ölçekteki verileri verimli bir şekilde işleyen yüksek performanslı veri hatları tasarlaması, geliştirmesi ve bunları eniyileştirmesi beklenmektedir.
Öğr. Gör. Dr. Burak YÖNYÜL
| 1 | Veri-yoğun uygulamaların temel ilkelerini kavramak |
| 2 | Toplu ve akış işleme paradigmalarını gerçek dünya senaryoları üzerinde uygulamak |
| 3 | Yüksek performanslı ve dağıtık veri mimarileri tasarlamak ve eniyileştirmek |
| 4 | Gelişmiş çözümlemeler yapabilmek amacıyla uçtan uca veri hatları tasarlayabilmek ve gerçekleştirebilmek |
Birinci Öğretim
Yok
Yok
1. Veri Yoğun Uygulamaların Temelleri • Dağıtık veri sistemlerinde güvenilirlik, ölçeklenebilirlik ve sürdürülebilirlik. • Veri modellerinin kıyaslanması (ilişkisel, NoSQL, belge tabanlı, grafik tabanlı). 2. Toplu İşleme Mimarileri • Hadoop ve MapReduce'a Giriş. • Spark ile toplu iş akışlarının optimizasyonu (RDD'ler, DataFrames, MLlib) • Apache Airflow ve Oozie ile veri hattı orkestrasyonu. 3. Akış İşleme Mimarileri • Apache Kafka ile gerçek zamanlı olay odaklı işleme. • Apache Flink kullanarak durum bilgisi (stateful) akışı işleme (olay zamanı, pencereleme, hata toleransı). • Geciken (Late-arriving) verileri işleme, tutarlılık ve hata kurtarma. 4. Birleşik Toplu ve Akış Mimarileri • Hibrit veri işleme için Lambda ve Kappa mimarileri. • Kafka, Spark ve Flink'i entegre eden pratik uygulamalar. 5. Performans Optimizasyonu ve Gelişmiş Analizler • Sorgu optimizasyonu, indeksleme, bölümlendirme ve depolama verimliliği. • Spark MLlib ve GraphX ile ölçeklenebilir makine öğrenimi ve grafik işleme. • Netflix, LinkedIn ve Uber'den gerçek dünya vaka çalışmaları.
| Hafta | Konular (Teorik) | Öğretim Yöntem ve Teknikleri | Ön Hazırlık |
|---|---|---|---|
| 1 | Yüksek Performanslı Veri İşlemeye Giriş | Kaynak-1 | |
| 2 | Veri Modelleri ve Sorgu Dilleri | Kaynak-1 | |
| 3 | Dağıtık Sistemlerde Veri Depolama ve Veri Alımı | Kaynak-1 | |
| 4 | Hadoop ile Toplu İşlemeye Giriş | Kaynak-2 | |
| 5 | Apache Spark ile Gelişmiş Toplu İşleme | Kaynak-3 | |
| 6 | Veri Boru Hatları ve İş Akışı Orkestrasyonu | Kaynak-3 | |
| 7 | Apache Kafka ile Akış İşlemeye Giriş | Kaynak-4 | |
| 8 | Ara Sınav | ||
| 9 | Apache Flink ile Akış İşleme | Kaynak-5 | |
| 10 | Akış İşlemede Hata Toleransı ve Tutarlılık | Kaynak-4, 5 | |
| 11 | Lambda ve Kappa Mimarileri | Kaynak-1 | |
| 12 | Veri İşlemede Performansı Optimize Etme | Kaynak-3, 5 | |
| 13 | Yüksek Performanslı Veri İşlemede Durum Çalışmaları | Kaynak-3, 4, 5 | |
| 14 | Veri İşlemede İleri Konular | Kaynak-3 | |
| 15 | Ders Özeti ve Proje Sunumları / Kontrolü | Sunum ve Tartışma | |
| 16 | Final Sınavı |
Ana Kaynak: 1. Kleppmann, Martin. Designing data-intensive applications: The big ideas behind reliable, scalable, and maintainable systems. " O'Reilly Media, Inc.", 2017. Yardımcı Kaynaklar: 2. White, Tom. "Hadoop: The Definitive Guide, Storage and Analysis at Internet Scale." White–London: O'Reill y Media(2015). 3. Ryza, Sandy, et al. Advanced analytics with spark: patterns for learning from data at scale. " O'Reilly Media, Inc.", 2017. 4. Narkhede, Neha, Gwen Shapira, and Todd Palino. Kafka: the definitive guide: real-time data and stream processing at scale. " O'Reilly Media, Inc.", 2017. 5. Hueske, Fabian, and Vasiliki Kalavri. Stream processing with Apache Flink: fundamentals, implementation, and operation of streaming applications. O'Reilly Media, 2019.
- Yarıyıl (Yıl) Ara Sınavının Başarı Notuna Katkısı : %30 - Dönem Projesi : %30 - Yarıyıl (Yıl) Sonu Sınavının Başarı Notuna Katkısı : %40 TOPLAM : %100
| Yarıyıl (Yıl) İçi Etkinlikleri | Adet | Değer |
|---|---|---|
| Ara Sınav | 1 | 50 |
| Proje Hazırlama | 1 | 50 |
| Toplam | 100 | |
| Yarıyıl (Yıl) Sonu Etkinlikleri | Adet | Değer |
| Final Sınavı | 1 | 100 |
| Toplam | 100 | |
| Yarıyıl (Yıl) İçi Etkinlikleri | 60 | |
| Yarıyıl (Yıl) Sonu Etkinlikleri | 40 | |
Yok
| Etkinlikler | Sayısı | Süresi (saat) | Toplam İş Yükü (saat) |
|---|---|---|---|
| Ara Sınav | 1 | 20 | 20 |
| Final Sınavı | 1 | 20 | 20 |
| Derse Katılım | 14 | 3 | 42 |
| Proje Hazırlama | 1 | 40 | 40 |
| Okuma | 14 | 2 | 28 |
| Toplam İş Yükü (saat) | 150 | ||
| PÇ 1 | PÇ 2 | PÇ 3 | PÇ 4 | PÇ 5 | PÇ 6 | PÇ 7 | PÇ 8 | PÇ 9 | PÇ 10 | PÇ 11 | |
| ÖÇ 1 | 5 | 2 | |||||||||
| ÖÇ 2 | 5 | 3 | 4 | 4 | 3 | 3 | |||||
| ÖÇ 3 | 5 | 4 | 5 | 5 | 5 | 5 | 3 | 3 | 3 | ||
| ÖÇ 4 | 5 | 4 | 5 | 5 | 5 | 5 | 3 | 3 |