Vincent’in Resimleri NetApp Teknolojisinin İmzasını Taşıyor

Cambridge Consultants, Öğrenen Makineler Birimi’nin geliştirdiği, insan yapımı eskizleri Van Gogh, Cézanne ve Picasso’yu anımsatan sanat eserlerine dönüştürebilen yapay zeka sistemi Vincent’ın arkasında NetApp teknolojisi yatıyor.

Avrupa’nın önde gelen yüksek teknoloji şirketi Cambridge Consultants’ın makine öğrenme yöntemiyle geliştirdiği yapay zeka sistemi Vincent, veriyle dünyayı değiştirmeleri için müşterilerini güçlendiren hibrit bulut çözümlerinde veri otoritesi NetApp‘ın depolama teknolojisi üzerine kuruldu. Vincent’i geliştirmek için kullanılan teknolojilere değinen Cambridge Consultants Öğrenen Makineler Birimi Direktörü Monty Barlow şunları söyledi: “Sanat eserlerini analiz edebilmek için derin öğrenme yöntemini kullanarak Vincent’i geliştirdik. Bu yöntemle, çok sayıda görüntü verisi ve pek çok eğitim seti kullandık, çok sayıda deneme-yanılma sürecinden geçtik. Gerçek öğrenme, eğitim sırasında birbirleriyle etkileşime giren yedi sinir ağıyla gerçekleşir. Vincent’a resim yapmayı öğretmek, 8 GPU ve milyonlarca çizim örneği ile birlikte yaklaşık 14 saatlik bir eğitim süreci gerektirdi. Öğrenme sistemi, NVIDIA DGX-1 sunucuları ve NetApp depolaması üzerine kurulmuştur. Bu, basit bir uygulama için çok fazla beygir gücü gibi görünebilir, ancak öğrenme sürecinde Vincent, sinir ağları içinde 200 milyondan fazla parametreyi ayarladığı için milyonlarca yineleme ve büyük miktarda veri üretiyor.”

Vincent’ın “öğrenme” sürecinde veri depolanması ön plana çıkıyor

Vincent’in geliştirilmesi esasen derin öğrenme yöntemine dayanıyor. Geliştirilme sürecinde, ele alınması gereken önemli noktalar, başlı başına algoritmalar, bilgi işlem bölümü ve verilerin toplanması ile depolanması olmak üzere üç ana başlık altında toplanıyor.
Bu üç ana başlığa değinen Barlow, “Bu üçgenin en az bir köşesinde, mutlaka çözülmesi gereken bir zorluk vardır. Ancak tedarikçiler sadece tek bir alana odaklanır ve sorunu başka bir yere yönlendirir. ‘İşte harika bir algoritma, ancak bir milyon daha veri noktası toplamanız gerekiyor’ diyebilirler. Ya da, ‘Satın alabileceğiniz bir veri seti var’ diyebilirler, ancak bu verilerle ne yapmanız gerektiği konusunda yardımcı olamazlar” dedi.

Vincen, hatalı verileri telafi etme yaklaşımı ile “eğitiliyor”

Dağıtılmış sistemlerde kopyalama, veri setinde boşluklar ve bu tür diğer sorunların olabildiğine değinen Barlow, boşlukları yamamak, sentezlemek ve zor verilerle çalışmak için ek bilgi işlem gücüne gerek duyduklarını belirtiyor: “Çoğu zaman, bir insanın yeni bir sorunla başa çıkması için biriktirdiği yaşam boyu deneyim gibi diğer veri setlerinden bilgi toplayabiliriz. Sürecin bu kısmı üretken yapay zeka olarak adlandırılır. Eğitim esnasında birbirleriyle etkileşim içerisindeki sinir ağları kullanılır. Vincent sistemini eğitirken yaklaşımımız buydu. Çoğu durumda bu yöntem, mükemmel veri setini toplamaktan daha hızlı ve daha uygun maliyetli” dedi.

Vincent, veri yönetimi zorluklarının aşılmasını gerektiriyor

Veriler bölümlere ayrılırken, bazı kısımları eğitilirken ve başka verilere karşı test edilirken, genellikle tüm verilere bir arada tek seferde erişime ihtiyaç duyuluyor. Bugün bu işlem, RAM’e veya yerel bir önbelleğe kolayca sığabileceğinden çok daha fazla, onlarca terabayt anlamına geliyor. Ayrıca, derin öğrenme sürecine özgü, veri yönetimi zorlukları yaratan bazı konuların da çözümlenmesi gerekiyor.
Örneğin, bir üretken yapay zeka yaklaşımı, bir sorun üzerinde çalışırken daha basit bir öğretme yaklaşımında olan tek seferlik okumanın yerine her bir dosyanın yüzlerce kez rastgele okunmasını gerektirebiliyor. Vincent™, sadece tekrar tekrar okunması gereken büyük veri setlerini kullanmakla kalmıyor; aynı anda aynı verilere erişebilen, problemlere yönelik farklı yaklaşımlar deneyen çoklu alt ekiplerin de bulunduğu bir sistem üzerine temellendiriliyor.

Barlow hızlı erişimin Vincent’ın geliştirilme sürecinde çok büyük bir gereklilik olduğunu belirterek şunları söyledi: “Bahsettiğimiz dosyalar genellikle çok küçük dosyalardır ve yapay zeka algoritmalarımız için kullandığımız NVIDIA GPU’larını beslemek için bunlara mümkün olduğunca hızlı bir şekilde erişmemiz gerekir. Her şeyin kombinasyonu, bir depolama sistemi için en kötü durum senaryosudur”.

Derin öğrenmenin tüm depolama gerekliliklerini NetApp karşılıyor

Veriler için ileriye dönük bir yaklaşım kullanıldığında gecikme çok kritik olmasa da her dosyaya düşük gecikmeyle erişmeye ihtiyaç duyuluyor. Daha da önemlisi, veri depolama sistemleri, üst veri-ağır iş yükü olarak isimlendirebilecek milyonlarca küçük dosyayı rastgele bir şekilde okurken, yüksek verim sağlaması gerekiyor.

Barlow depolama çözümü olarak neden NetApp’ı tercih ettiklerini şöyle açıklıyor: “Derin öğrenme depomuzun NetApp teknolojisine dayanmasının sebebi, kendi zorlu ortamımızda denenmiş ve test edilmiş olmasıdır. Çok farklı projelere sahip olduğumuz için yüksek performans ve esnekliğin bir kombinasyonuna ihtiyaç duyuyoruz. Dosyalarımızı farklı makineler için kullanılabilir hale getirmeliyiz, böylece çeşitli işleri taşımak zorunda kalmadan çalıştırabiliriz. NetApp ve yerel bayi ortağımız Scan, yardıma ihtiyaç duyduğumuzda bize mükemmel destek sağlıyorlar. Yeni zorlukları kabul eden ve benzer durumlarda diğer müşterilere de fayda sağlayacak sorunları çözmek için uğraş veren insanlarla çalışmayı seviyoruz.”

Vincent benzeri teknolojiler için potansiyel uygulamalar, otonom araçlar ve dijital güvenlik gibi sanatın çok ötesine uzanıyor. Aynı teknoloji, insanların verimli bir şekilde üretebildiklerinin ötesinde neredeyse sınırsız çeşitlilik ve detaylarla eğitim senaryoları ve simülasyonları üretmek için de kullanılabilir.