Mart 6, 2021

Makine Öğrenmesi Yönetim Araçları (WMS)

3 min read
Paylaşmak ister misiniz?

Makine Öğrenmesi Yönetim Araçları (WMS)

Makine öğrenmesi süreçleri yaklaşık olarak 5 adımda tarif edilir. Takriben şu şekilde;

Tüm bu aşamaları geçerken aslında sizin bir takım soruları her daim cevaplayabilecek şekilde notlamanız gerekli. Bunlardan bir kısmını yukarıdaki adımlar için yazmam gerekirse;

 Veri nereden alındı? Veride hangi kolonlar var?

 Hangi kolonlardaki bulunan kayıp veriler hangi yöntemler ile dolduruldu? Hangi encoding metotları hangi kolonlara uygulandı? Bining yapıldı mı yapıldı ise hangi kolonlara ve hangi metot ile yapıldı? Birleştirilen kolonlar var mı? Feature Selection yapıldı mı yapıldı ise hangi metot ile yapıldı ve sonuçlar nasıldı?

 Model için hangi algoritma kullanıldı? GridSearch yapıldı mı? Kullanılan parametreler nelerdi? Veri bölme işlemi nasıl yapıldı? Cross-Validation kullanıldı mı? Validation seti kullanıldı mı?

 Hangi metrikler üstünden başarı ölçüldü? Bu metrik değerleri nelerdir?

Sanırım bu kadar soru ile anlatmak istediğim şey anlaşılmıştır. 5. aşamada yer alan improve aşaması zaten doğrudan bu soruların cevaplarına bakıyor.

Peki bu neden bu kadar önemli? Aslında unutkanız çünkü diyerek de cevaplayabilirim ama birden çok cevabı var bu sorunun. Genellikle bir  ile tamamlamazsınız iş hayatınızı ki bu imkansızdır zaten. Bir modeli hazırlarsınız ve mantıklı ise yayına alır bir başka işe geçersiniz.

Ancak veriniz değiştikçe modelinizi güncel tutmanız gerekir. İşte bu noktada her zaman dönüp kodlarınıza bakarak anlayamazsınız gerçekte ne yaptığınızı.

En basitinden verinizde kolon sayısı olarak ya da kolon içeriği olarak değişiklikler olabilir. Veya GridSearch yapmışsınızdır ve hangi parametrelerin hangi metriklerle ne sonuçlar verdiğini aklınızda tutamazsınız.

Evet çözümlerden birisi log kütüphanesi kullanarak .

Bir diğeri de kodun başında bir Excel dosyası oluşturup ona yazmanız olabilir. Ancak ikisinin de kendi içinde dezavantajları mevcut.

Log dosyasında arama yapmak vs istediğinizde ikincil bir işlem yapmanız gerekir mesela. Anlaşılır olsun isterseniz parse etmelisiniz.

Excel’de ise oluşacak verinin boyutu ve düzenli olmayan veri depolaması gereksinimi başınızı ağrıtabilir. Hemen açayım, mesela metrikler dediğimiz her zaman doğrudan  gibi F1 score gibi sayısal değerler olmayabilir. Bazen chart şeklinde görsel metrikler üstünden de ilerlemeniz gerekebilir ki işler burada biraz daha karışır.

Bir başka özellik ise WMS sistemlerinin hepsinde olmasa da bazılarında olan, devam edebilme özelliği. Yani makine öğrenmesi adımlarından herhangi birinde hata alırsanız hatayı düzelttikten sonra sistem kaldığınız yerden çalışmaya devam edebilir.

Bu ve bunlar gibi bir çok nedenden ötürü WMS araçları çözüm olarak görülmektedir. Öncelikle tamamen makine öğrenmesine özelleşmiş araçlar da olduğu gibi daha genel kullanıma da hitap eden araçlar olduğunu belirtmem gerekiyor.

Makine Öğrenmesi Yönetim Araçları (WMS) yazısı Kaynak

https://www.ekaynaklar.com/category/veri-bilimi/ adresindeki yazılarımıza da göz atabilirsiniz.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

© ekaynaklar 2021 | İsmail Can Karademir.