X

İnsanlığın Yapay Zekayla İletişiminde Kilit Nokta: Doğal Dil İşleme

Tolga Artan 17 Mart 2021
İnsanlığın Yapay Zekayla İletişiminde Kilit Nokta: Doğal Dil İşleme

Yapay Zeka ve Doğal Dil İşleme

Doğal dil işleme algoritmaları; bilgisayarlara insan dilini okuma, anlama ve yorumlama yeteneği veren algoritmalardır. Bu algoritmalar, yapay zekanın bir dili anlamasına ve işlemesine olanak sağlıyor. Metin, konuşma gibi yapılandırılmamış doğal dil tabanlı verileri işlemek ve anlamak, bu çalışmaların temel amacı durumunda. Doğal dil işlemenin gelişmesiyle, insan-makine iletişimi her geçen gün biraz daha güçleniyor.

Yapay zeka ve insan etkileşimi ne durumda?

Ortakları arasında Elon Musk’ın da bulunduğu yapay zeka araştırma şirketi OpenAI, 2019 yılında o zamana kadar en gelişmiş dil işleme algoritmasını geliştirdiğini duyurmuştu. “GPT-2” adı verilen bu ileri teknolojik model, yaklaşık 8 milyon web sitesinde eğitildi. GPT-2 tarafından oluşturulmuş ilginç metinlere tek boynuzlu atları keşfeden bilim adamları hakkındaki metni örnek verebiliriz:

“Şok edici bir bulgu olarak bilim adamı, Andes Dağları’ndaki çok uzak, daha önce keşfedilmemiş bir vadide yaşayan unicorn sürüsü keşfetti. Araştırmacılar için daha da şaşırtıcı olan, unicorn’ların mükemmel bir şekilde İngilizce konuştukları gerçeğiydi… Bilim insanı, kendine özgü boynuzlarından ötürü popülasyona “Ovid’in Unicorn’u” adını verdi. Bu dört boynuzlu gümüş-beyaz unicorn’lar, bundan önce bilim için bir bilinmezdi.” 

Geliştirilmiş en büyük dil işleme algoritması

GPT-2’den sonra yapay zeka dünyasında büyük bir devrim daha gerçekleşti ve OpenAI, 2020 yılında GPT-3’ü tanıttı.

İnsanlar olarak, bilgileri 100 trilyon sinir ağıyla işliyoruz. Yapay zekadaki bağlantılara ise hiper parametre deniyor. GPT-3’ün devrim niteliğinde bir algoritma olmasının sebebi ise, insan beyni bağlantılarından az olsa da, 175 milyar parametreye sahip olması!

Wikipedia‘nın tamamını okuduğunu bildiğimiz GPT-3, bunun yanı sıra 12 milyar ve 55 milyar tokenlı iki büyük kitap veri tabanını ve bugüne kadar yazılmış ve dijital hale getirilmiş tüm kitapları da “okumuştur”. Özetle GPT-3, internette yazılı her şeyi “bilmektedir”. Dil öğrenmenin ötesinde, GPT-3 matematik de öğrenebiliyor.

Ancak bu gelişmeler GPT-3 ile de sınırlı kalmadı

OpenAI, 2021 yılının başlarında DALL-E isimli bir yapay zeka daha geliştirildiğini açıkladı. GPT-3’ün geliştirilmiş versiyonu olan DALL-E, ismini sürrealist sanatçı Salvador Dalí ve Pixar’ın bilimkurgu robotu WALL-E‘nin birleşiminden alıyor. Bir sanatçı kadar yaratıcı bir model olduğunu söylemek mümkün.

Bu model, metinleri veri olarak alıyor ve bu verileri kullanarak orijinal görüntüler üretiyor. Dil İşleme Algoritmalarını, Görüntü İşleme ile birleştiği nokta olan bu model, çok yönlü yapay zekanın şu ana kadar geldiği en uç noktalardan biri.

Aşılması Gereken Engeller

Yapay zekanın geldiği bu son noktada, bilgisayar modelleri karmaşık veri ve sinir ağları kullanılarak eğitilebilmektedir. Bu modeller kendi kendilerine öğrenebilmekte ve algoritmalar geliştirebilmektedir.Yani derin öğrenme, insanların çeşitli bilgi türlerini edinme şeklini taklit eden bir makine öğrenimi ve yapay zeka tekniğidir.

Derin öğrenme, dijital vizyonda devrim yaratsa da, mevcut yaklaşımların birkaç önemli sorunu var: tipik görme veri kümeleri yoğun çaba gerektiriyor. Yani standart görme modelleri tek bir görevde verimli oluyor ve yeni bir göreve uyum sağlamak için önemli ölçüde çaba gerektiriyor; ve kıyaslamalarda iyi performans gösteren modellerin stres testlerinde hayal kırıklığı yaratacak derecede düşük performanslar görülüyor.

Bu konuda da OpenAI’in bir çözümü var: CLIP

Geleneksel sınırları zorlayan görme sistemi CLIP, karikatür ve heykeller gibi soyut bağlamlardaki nesneleri ve insanları ayırt etmek için gelişkin veri grupları üzerinde eğitiliyor.

CLIP modeli, daha önce bahsettiğimiz GPT-2 ve GPT-3’ün “zero-shot” yeteneklerine benzer şekilde çalışıyor. Zero-shot yöntemleri genellikle, nesnelerin gözlemlenebilir ayırt edici özelliklerini kodlayan bazı yardımcı bilgiler aracılığıyla gözlemlenen ve gözlemlenmeyen sınıfları ilişkilendirerek çalışır. Yani tanınacak görsel kategorilerin adlarını sağlayarak herhangi bir görsel sınıflandırma karşılaştırmasında uygulanabiliyor. CLIP (Kontrastlı Dil – Görüntü Ön Eğitimi), zero-shot aktarımı, doğal dil denetimi ve çok modelli öğrenme üzerine geniş bir çalışma yapısına dayanmakta.

CLIP neden bu kadar önemli?

CLIP’in sıradan bir görüntü tanıma sistemi olduğu düşünülebilir, ancak öyle değil. Veri setlerindeki etiketli örneklerden değil, internetten alınan resimlerden ve bunların başlıklarından gelen görüntüleri tanıyabiliyor.

CLIP’in hassas nesne sınıflandırması, coğrafi yerelleştirme, videolarda eylem tanıma gibi görevler dahil olmak üzere 30’dan fazla farklı veri kümesinde “zero-shot” performansı ölçüldü. CLIP, kişilerin kendi sınıflandırıcılarını tasarlamalarına izin veriyor ve göreve özel eğitim verilerine olan ihtiyacı ortadan kaldırıyor. Bu sınıfların tasarlanma şekli, hem model performansını hem de model önyargılarını büyük ölçüde etkileyebilir.

Peki yapay zekayı yanıltmak mümkün mü?

Bu mucizevi özelliklere sahip keşif, 4 Mart’ta yayınlanan OpenAI makalesinden öğrendiğimize göre, “bir kalem ve kağıt” tarafından kandırıldı! Bir elmanın üzerine “iPod” yazan bir kağıt yapıştırıldığında, CLIP’in bunu %99,7 oranında doğru tespit ettiği görüldü. Bir diğer testte ise üzerine dolar işareti yapıştırılan köpeği, %52,5 kumbara olarak tanımladı.

Modelin metni güçlü bir şekilde okuma yeteneği sebebiyle, elle yazılmış metinlerin fotoğraflarının bile çoğu zaman modeli yanıltabileceği anlaşıldı. Anladığımız üzere model, hala birçok kontrol edilmemiş önyargı ve ilişkisini barındırma potansiyeline sahip. Özetle insan ve yapay zeka etkileşimi, bir sürü yeni olasılığın kapılarını açarak ilerlemeye devam ediyor. Bu noktadan sonra, insanlık olarak, oldukça şaşırtıcı deneyimler yaşayacağımızı söyleyebiliriz.

Open AI

XCubesLabs

YAPAY ZEKA DESTEKLİMÜŞTERİ DENEYİMİ
PLATFORMU
Dijital varlık yönetiminden yapay zeka destekli satış takibi ve tahminine kadar AI360CX’in tüm özelliklerini hemen inceleyin.
Temel Özellikler

Benzer İçerikler