Unfortunately, this event has been canceled.
Büyük Modellerin Gücü ile Küçük Modellerin Üstün Yeteneklerini Ortaya Çıkarmak
About

Bilgi damıtma, AI ve derin öğrenme alanlarında, büyük ölçekli modelleri gerçek uygulamalara uyarlarken karşılaşılan zorlukları ele alan kritik öneme sahip bir tekniktir. Bu süreç, bir "öğretmen" modelinden bilgi aktarımı yaparak daha küçük ve verimli bir "öğrenci" modeline geçiş yapmayı içerir (Gou ve diğ., 2021). Bu şekilde, küçük modellerin yeteneklerini artırabilir ve büyük modellerin kaynak kısıtlarından kaynaklanan sorunları hafifletebiliriz. Bu çalıştayda, önce bilgi damıtmanın temel kavramlarını ele alacak, ardından uygulamaya geçeceğiz! Spesifik olarak, Cohere'in 104 milyar parametreli Command-R+ modelini  kullanarak sentetik veri oluşturacak ve ardından bu verileri kullanarak açık kaynaklı 7 milyar parametreli bir modelini iyileştireceğiz.

Comments
empty post state
You must be logged in to comment.
No comments yet. Be the first to comment!
Büyük Modellerin Gücü ile Küçük Modellerin Üstün Yeteneklerini Ortaya Çıkarmak
Saturday, July 13, 2024
05:30 - 07:30
IPA Florya Kampus
Basınköy, Valilik Yolu Cd. No:2, 34153 Bakırköy/İstanbul, Türkiye
Show in Map
Registration
Full
Bünyamin Ergen
süha berk Kukuk
Gizem But
Zeynep Uslu
Beyza Baykal
+26 people going
This event has canceled
Hosted By
Kadın Yazılımcı
Kadın Yazılımcı
Join the Community
Contact the Host