İnsan becerileri, kısmen yenilik arayışımızdan kaynaklanır. Bizler doğal olarak meraklıyız, ister yeni yerler keşfediyor ister bilimsel fikirleri test ediyor olalım. Yapay zekanın dünyayı kapsamlı ve incelikli bir şekilde anlayabilmesi için mesela günlük zorluklarla başa çıkabilmesi, yeni insanlarla etkileşim kurabilmesi veya yeni ilaçlar icat edebilmesi için, kendi başına yeni fikirler ve deneyimler keşfetme yeteneğine sahip olması gerekir. Ancak sonsuz olasılıklar arasında yapay zeka en yenilikçi ve faydalı yönleri nasıl seçebilir?
Bir yaklaşım, büyük dil modelleri aracılığıyla insan sezgisinden yararlanmak, geniş miktarda insan metniyle eğitilmiş bu modelleri kullanmaktır. ChatGPT gibi sohbet botlarının arkasındaki teknoloji de bu fikre dayanır. İki yeni makale bu yöntemi inceleyerek, daha zeki otonom araçlar veya otomatik bilimsel keşifler için bir yol önermektedir.
“Her iki çalışma da açık uçlu öğrenme sistemlerinin geliştirilmesi yönünde önemli ilerlemeler kaydediyor,” diyor Google DeepMind ve University College London’dan bilgisayar bilimcisi Tim Rocktäschel. Büyük dil modelleri (LLM’ler), hangi olasılıkların öncelikli olarak ele alınacağını belirlemek için bir yol sunuyor. “Daha önce aşırı büyük olan arama alanı bir anda yönetilebilir hale geliyor,” diye ekliyor Rocktäschel. Ancak bazı uzmanlar, geniş keşif yeteneklerine sahip açık uçlu yapay zekanın kontrol dışına çıkabileceğinden endişe duyuyor.
AI ajanları LLM’lerle nasıl yönlendirilir?
Büyük dil modelleri (LLM’ler), yapay zeka ajanlarına rehberlik ederek yardımcı olabilir. Mayıs ayında arXiv.org’da yayınlanan ve henüz hakem değerlendirmesinden geçmemiş olan iki yeni makale, Vancouver’daki British Columbia Üniversitesi’nden bilgisayar bilimcisi Jeff Clune’un laboratuvarından geliyor. Bu makaleler, Clune’un önceki çalışmalarının üzerine inşa ediliyor. 2018’de Clune ve ekibi, keşif gerektiren video oyunlarını oynamayı öğrenen bir sistem olan Go-Explore’u geliştirdiler (2021’de Nature‘da yayımlandı). Go-Explore, bir deneme-yanılma süreci olan pekiştirmeli öğrenme yöntemiyle gelişen bir ajan kullanıyor. Sistem, periyodik olarak ajanının ilerlemesini bir arşive kaydediyor ve daha sonra ilginç, kaydedilmiş durumları seçip oradan devam ediyor. Ancak, bu ilginç durumların seçimi, daha çok ziyaret edilmemiş bölgelerin seçilmesi gibi önceden tanımlanmış kurallara dayanıyor. Bu, rastgele seçimden daha iyi olsa da hâlâ katı bir yöntemdir.
Clune’un laboratuvarı şimdi de Intelligent Go-Explore (IGE) adlı sistemi geliştirdi. Bu sistem, arşivden “umut verici” durumları seçmek için önceden tanımlanmış kurallar yerine büyük bir dil modeli, bu durumda GPT-4, kullanıyor. Dil modeli ayrıca, sistemin “akıllıca” keşfetmesine yardımcı olacak eylemleri bu durumlardan seçiyor ve ortaya çıkan durumların arşivlenmeye yetecek kadar “ilginç ve yeni” olup olmadığını belirliyor.
New York Üniversitesi’nden ve bu çalışmaya katılmamış olan bilgisayar bilimcisi Julian Togelius’a göre, LLM’ler, geniş yetenekleri sayesinde bir yapay zeka sisteminde çeşitli rollerde görev alabilecek bir tür “zekâ yapıştırıcısı” olarak işlev görebilir. “İhtiyacınız olan bir yenilik algılayıcısının yerine koyabiliyorsunuz ve işe yarıyor. Oldukça şaşırtıcı,” diyor Togelius.
Araştırmacılar, IGE’yi metin işleme ve üretme gerektiren çok adımlı çözüm görevlerinde test ettiler. Bir görevde, sistem, sayılar ve aritmetik işlemleri düzenleyerek 24 sayısını elde etmeye çalışıyor. Başka bir görevde ise, 2D bir grid dünyasında nesneleri hareket ettirmek gibi görevleri metin açıklamaları ve talimatlara göre tamamlıyor. Üçüncü görevdeyse, sistem, metin tabanlı talimatlarla yönlendirilen yemek pişirme, hazine avı veya bir labirentte madeni para toplama gibi solo oyunlar oynuyor. Her eylemden sonra, sistem yeni bir gözlem alıyor, örneğin yemek pişirme oyununda “Bir kilerde bulunuyorsunuz ve bir raf görüyorsunuz. Raf tahtadan yapılmış. Rafın üzerinde un var…” gibi, ve yeni bir eylem seçiyor.
Araştırmacılar IGE’yi dört farklı yöntemle karşılaştırdılar. Bir yöntem rastgele eylemler seçerken, diğerleri mevcut oyun durumu ve geçmişini bir LLM’ye verip bir eylem önerisi aldı, ancak ilginç oyun durumlarını arşivlemedi. IGE, karşılaştırılan tüm yöntemlerden daha iyi performans gösterdi; madeni para toplama görevinde 25 oyundan 22’sini kazanırken, diğer hiçbir yöntem oyun kazanamadı. Sistem, muhtemelen ilginç durumlar ve eylemler üzerine yinelemeli ve seçici bir şekilde inşa edilerek , insanlardaki yaratıcılık sürecini taklit ettiği için bu kadar başarılı oldu.
Araştırmacılar, IGE’nin yeni ilaçlar veya malzemeler keşfetmeye yardımcı olabileceğini, özellikle de görüntüler veya diğer veri türlerini entegre ederse, düşünüyorlar. Çalışmanın ortak yazarı olan British Columbia Üniversitesi’nden Cong Lu, keşif için ilginç yönler bulmanın birçok açıdan “pekiştirmeli öğrenmenin merkezi sorunu” olduğunu belirtiyor. Clune ise bu sistemlerin yapay zekanın, “dev insan veri setlerinin omuzlarında yükselerek daha ileri görüşlü olmasını” sağladığını söylüyor.

Yapay zeka yeni görevler icat Ediyor
İkinci yeni yapay zeka sistemi, yalnızca verilen görevleri çözmekle kalmayıp, çocukların oyunlar icat etmesine benzer şekilde, yapay zeka ajanlarının yeteneklerini artırmak için yeni görevler oluşturur. Bu sistem, Clune’nin laboratuvarında geçen yıl geliştirilen OMNI (İlginçlik Kavramlarının Modelleriyle Açık Uçluluk) adlı başka bir sistem üzerine inşa edilmiştir. Minecraft’ın 2D versiyonu gibi bir sanal ortamda, LLM önceki görevlerde başarı veya başarısızlıklarına dayanarak yapay zeka ajanına yeni görevler önerirdi. Ancak OMNI, elle oluşturulmuş sanal ortamlarla sınırlıydı.
Araştırmacılar, bu sınırlamayı aşmak için OMNI-EPIC (Kodla Programlanmış Ortamlarıyla OMNI) geliştirdiler. Deneylerinde, daha esnek bir sanal ortam olan bir fizik simülatörü kullandılar ve arşive topu direkler arasından geçirmek, bir köprüyü geçmek ve merdiven çıkmak gibi birkaç örnek görev eklediler. Her görev, doğal dilde bir açıklama ve görevin gerektirdiği bilgisayar koduyla temsil edilmiştir.
OMNI-EPIC gibi bir algoritmanın başarısını nesnel olarak ölçmek zor, ancak sistemin ürettiği yeni görevler ve yeteneklerin çeşitliliği, University of British Columbia’dan ve makalenin yazarlarından biri olan Jenny Zhang’i şaşırttı. Zhang, her sabah deneylerinin sonuçlarını görmek için sabırsızlandığını belirterek heyecanını dile getirdi. Bir diğer araştırmacı olan Clune da yaratıcı çıktılardan etkilendi ve sistemin, iki kale ile futbol, hareketli hedeflere ateş etme, çok odalı bir binada arama-kurtarma, inşaat alanı temizliği ve kalabalık bir restoranda masalardan bulaşıkları toplama gibi çeşitli görevler icat ettiğini söyledi. OMNI-EPIC, hesaplama maliyetleri nedeniyle durdurulmadan önce 200’den fazla görev icat etti.
Araştırmacılar ayrıca OMNI-EPIC’in fiziksel görevlerle sınırlı olmadığını, teorik olarak matematik veya edebiyat gibi alanlarda da görevler üstlenebileceğini belirtiyorlar. Zhang, OMNI-EPIC’i kullanarak sonsuz ve uyarlanabilir kodlama zorlukları sunan, kullanıcıları yapay zeka ile öğrenim yolculuklarında yönlendiren CodeButter adında bir öğretim sistemi geliştirdiğini söylüyor. Sistem ayrıca yeni tür dünyalar yaratan simülatörler için kod yazabilir ve bu, gerçek dünyada uygulanabilecek her türlü yeteneğe sahip yapay zeka ajanlarının gelişmesine yol açabilir.
Açık uçlu yapay zeka geliştirilmeli mi?
Açık uçlu yapay zekâ inşa etmeli miyiz? Bu, yapay zekâ araştırmalarında önemli bir soru. Oxford Üniversitesi’nden bilgisayar bilimcisi Jakob Foerster, büyük dil modelleri (LLM) ile pekiştirmeli öğrenme (RL) arasındaki kesişimi heyecan verici buluyor. Bu alandaki makaleleri beğenmesine rağmen, bu sistemlerin tam anlamıyla açık uçlu olmadığını belirtiyor, çünkü bu sistemler insan verileriyle eğitilmiş ve artık statik hale gelmiş LLM’lere dayanıyor, bu da yaratıcılıklarını sınırlıyor. Togelius, LLM’lerin internetteki her şeyi ortalamaya eğilimli olduğunu ve bu yüzden “çok sıradan” olduklarını söylüyor, ancak bazı durumlarda bu normalliğin yararlı olabileceğini, “çok yenilikçi ama aşırıya kaçmayan” şeyler üretebileceğini ekliyor.
Clune ve Rocktäschel gibi bazı araştırmacılar, insan zekâsıyla eşleşebilecek veya onu aşabilecek yapay zekâ için açık uçluluğun önemli olduğuna inanıyorlar. Clune, OMNI-EPIC gibi başarılı bir açık uçlu algoritmanın nihayetinde insani kökenlerinden koparak insan düşünce biçimlerine bağlı olmayan, son derece ilginç ve çeşitli fikirler üretebileceğini öne sürüyor.
Bununla birlikte, birçok uzman, insan değerleriyle uyumlu olmayan bu tür süper zekâlı yapay zekâların yol açabileceği risklerden endişe duyuyor. Lu, “açık uçluluk, makine öğreniminin en tehlikeli alanlarından biridir” diyerek, bu tür algoritmaların tehlikeli fikirlere odaklanabileceği konusunda uyarıyor. Ancak Foerster, açık uçlu öğrenmenin aslında güvenliği artırabileceğini ve farklı çıkarları olan yapay zekâ “aktörleri” arasında bir güç dengesi sağlayabileceğini düşünüyor. Şu an için henüz süper zekâya ulaşmış değiliz; daha çok yeni video oyunları icat etme aşamasındayız.
Kaynak : sciencenews.org/article/ai-train-creative-human-intuition
Derleyen : Ahmet Semih Sümer

