Download.it arama simgesi
Advertisement

Makine öğrenimi modelleri geliştirmek için kapsamlı algoritmalar ve görsel araçlar sunan güçlü analiz aracı

Makine öğrenimi modelleri geliştirmek için kapsamlı algoritmalar ve görsel araçlar sunan güçlü analiz aracı

Oyla (8 oy)

Program lisansı Ücretsiz

Geliştirici Weka Development Team

Sürüm 3.9.6

Şunun altında çalışır Windows

Oyla

(8 oy)

Geliştirici

Weka Development Team

Şunun altında çalışır

Windows

Program lisansı

Ücretsiz

Sürüm

3.9.6

Weka, veri madenciliği ve makine öğrenimi çalışmaları için tasarlanmış, hem geniş bir algoritma koleksiyonu hem de veri hazırlama ve sonuçları inceleme tarafında görsel araçlar sunan bir analiz ortamıdır. Veri setini hazırlama, yöntemleri karşılaştırma, çıktılarını değerlendirme ve görselleştirme gibi adımları tek bir çalışma alanında toplamayı hedefler.

Bu yazılım, Windows üzerinde makine öğrenimi denemelerini hızlıca yapmak isteyen veri analistlerine, aynı zamanda yöntemleri Java tarafında çağırarak kendi uygulamalarına entegre etmeyi düşünen geliştiricilere hitap eder.

Çalışma alanları: aynı amaç için farklı arayüzler

Weka’nın en çok kullanılan yüzü, menüler üzerinden ilerleyen Explorer arayüzüdür. Daha akış odaklı çalışmak isteyenler için Knowledge Flow, bileşenleri ekrana yerleştirip birbirine bağlayarak veri işleme ve analizi yöneten bir yaklaşım sunar. Deneyleri daha sistematik biçimde yürütmek ve yöntemleri karşılaştırmak için konumlanan Experimenter ise, farklı ayarlarla çalıştırmaları kolaylaştırıp performans istatistiklerini toplamaya ve anlamlılık testleri yapmaya dönük bir çerçeve sağlar. Bunların yanında komut satırıyla erişim de mümkündür ve arayüzlerin bir bölümünü tek çatı altında toplayan Workbench yaklaşımı da anlatılır.

Model geliştirme akışı: ön işleme, öğrenme ve inceleme

Explorer tarafında iş akışı net biçimde bölümlere ayrılır: Preprocess bölümü veri setini yükleme, dönüştürme ve filtreleme gibi hazırlık adımlarını merkezine alır. Ardından Classify paneli, hem sınıflandırma hem de regresyon senaryolarında öğrenme şemalarını eğitip test etmeye odaklanır. Cluster ve Associate panelleri ise sırasıyla kümeleme ve birliktelik kuralları gibi veri madenciliği görevlerine ayrılmıştır.

Öznitelik seçimi ve görselleştirme

Weka’nın güçlü yanlarından biri, veri setini “kutudan çıktığı hâliyle” bırakmak yerine onu farklı açılardan incelemeyi desteklemesidir. Explorer içindeki Select attributes bölümü öznitelik seçimi için farklı değerlendirme ve arama yaklaşımlarına kapı açar. Visualize paneli de veri setini iki boyutlu saçılım grafikleri matrisi üzerinden inceleyerek, sınıf renklendirmesi ve görünümü etkileyen kontrollerle keşif yapmaya yardım eder.

Veri biçimleri ve dönüştürme seçenekleri

Weka, veri setlerini çoğunlukla ARFF odaklı bir çalışma biçimiyle ele alır ve Explorer içinde dosyaları ARFF’a dönüştürmeye dönük dönüştürücülerden söz edilir. Bu dönüştürme hattında CSV benzeri tablo biçimleri yanında, ARFF’ın XML ve JSON tabanlı varyantları gibi seçenekler de anılır. Aynı bölümde, veri kaynağının yalnızca yerel dosyalarla sınırlı kalmayıp URL üzerinden ya da JDBC üzerinden veritabanından alınabildiği de belirtilir.

Paket sistemi ile kapsamı büyütme

Weka’nın kapsamı zaman içinde büyüdüğü için, çekirdeğin daha sade kalmasını ve ihtiyaç oldukça ek işlevlerin eklenmesini hedefleyen bir paket yönetim sistemi yaklaşımı anlatılır. Bu yapı, belirli özellikleri ve araçları ayrı paketler olarak düzenleyip seçerek eklemeye uygun bir model kurar ve paket yöneticisine hem grafik arayüzden hem komut satırından erişilebildiği belirtilir.

Genel değerlendirme

Weka, “tek bir arayüz içinde çok şey” yaklaşımıyla, veri hazırlamadan değerlendirmeye kadar uzanan hattı bir arada görmek isteyenler için oldukça üretken bir çalışma zemini sunuyor. Bununla birlikte aynı çeşitlilik, yeni başlayanlar için seçenek bolluğu nedeniyle yorucu görünebilir. Ayrıca Explorer’ın veri setini belleğe yükleyen doğası nedeniyle, çok büyük veri setlerinde yaklaşım seçimi önem kazanır, bu noktada akış yaklaşımına izin veren Knowledge Flow gibi seçenekler devreye girebilir.

AVANTAJLAR

  • Geniş kapsam: Makine öğrenimi algoritmaları, veri ön işleme araçları, değerlendirme ve görselleştirme adımlarını aynı ortamda bir araya getirir
  • Birden fazla çalışma tarzı: Explorer, Knowledge Flow, Experimenter ve komut satırı gibi farklı kullanım biçimlerini destekler
  • ARFF odaklı veri akışı ve dönüştürücülerle farklı veri biçimlerinden beslenebilme
  • Açık kaynak lisans yaklaşımıyla, Java tabanlı bir mimari üzerinde çalışır ve Windows üzerinde kullanılabildiği belirtilir
  • Paket yönetim sistemi sayesinde çekirdeği büyütmeden ek işlevleri dahil etmeye uygun bir yapı sunar

DEZAVANTAJLAR

  • Çok sayıda yöntem ve ayar, ilk kullanımda kalabalık bir deneyim yaratabilir
  • Explorer arayüzünde veri setinin belleğe alınmasına dayanan yaklaşım, daha büyük veri setlerinde sınırlayıcı olabilir
  • Experimenter ve Knowledge Flow gibi bölümler, daha sistematik ya da akış temelli düşünmeyi gerektirdiği için alışma süresi isteyebilir