Beden - Veri - Ayrımcılık, Maya Indira Ganesh
Davet için W3'e, moderatör Kübra'ya ve de geldiğiniz için hepinize çok teşekkür ederim. Kaçınız, kaç kişinin dinlemeye geldiğine biraz şaşırdım. Bu da bana bunun gerçekten ilginç ve önemli bir konu olduğunu düşündürüyor ve hepimizin bunun hakkında düşünmemiz, daha derinlemesine düşünmemiz gerekiyor. Teknoloji bazen kafa karıştırıcı olabilir ama aslında tıpkı bizim gibi insanlar tarafından yapıldı, değil mi? Bu yüzden teknolojiyle ilgilenmeli ve onu anlamalıyız. Geçen yıl Temmuz ayında Los Angeles'tan Berlin'e geri dönerken başıma gelen bir şey hakkındaki küçük bir hikâye ile başlayacağım. Frankfurt üzerinden… Los Angeles'tan Frankfurt'a Lufthansa uçağıyla geldim. Ve “Biniş kartınıza ve pasaportunuza ihtiyacınız yok, lütfen onları kaldırın” dediklerini duydum. Hemen neler oluyor diye düşündüm. Çalıştığım alan dolayısıyla, başka bir şeyin olacağını biliyordum. “Uçağa yüzünüzle bineceksiniz” dediler. Ben de tamam, bunun ne anlama geleceğini biliyorum, biyometrik anlamına geliyor dedim. Sıra ilerliyordu ve biniş kapısındaki kadına gidip “Bunu yapmamayı tercih edebilir miyim? Yüzümle binmek istemiyorum, biniş kartımı kullanmak istiyorum” dedim. O da “ABD vatandaşı mısınız?” dedi. “Hayır” dedim. “O halde bu ülkeye geldiğinde yüzünüz tarandı” dedi. “Evet” dedim. “Pekala, o zamanki taramanızı, şimdi siz çıkarkenki taramanızla karşılaştırıyoruz, kimliğinizi biliyoruz ve bu yüzden sorun değil. Yani biniş kartınıza ve pasaportunuza ihtiyacınız yok” dedi. “Tamam ama bir seçenek istiyorum” dedim. Yaygara koparmaya çalışıyordum ama arkadaki insanlar, bilirsiniz, umursamıyorlardı ve neyse ne devam edelim, halindeydiler. Ben de “Tamam, peki. Yapayım bari” dedim. Ama bana bakmaya çalışan cihazın resmini çekmeliyim, dedim. Yani artık bu tür taramalara alışığız, özellikle son dört yıldır yaşadığım ve çalıştığım Almanya gibi bir ülke açısından düşünüyorum. Teknoloji ve siber güvenlik ve mahremiyet konusunda, bence burada bu konuları anlama seviyesi çok yüksek. Ancak bunun sadece mahremiyet ve gözetimle ilgili olmadığını belirtmek istiyorum. burada daha fazlası oluyor ve bunun nasıl hem bireylerle ilgili hem de aynı zamanda bireylerin ötesinde olduğundan bahsedeceğim. Direniş stratejileri hakkında düşündüğümüzde belki de özellikle bireyin ötesine geçer. Ayrıca uğraştığımız teknolojiler çok karmaşık ve çok güçlü. Ve bireysel direniş her zaman işe yaramaz, bu yüzden bireyler olarak nasıl bir araya geldiğimizi ve ne tür bir direniş istediğimizi, bunu nasıl ifade ettiğimizi yeniden düşünmemiz gerekir. Peki, ben yüzler hakkında konuşacağım. Şu konuya geçmeden önce biraz yüzler hakkında konuşacağım… (Ses hâlâ iyi mi? Evet, tamam) Yüzler hakkında konuşmadan ve teknolojiye girmeden önce şunu açıklığa kavuşturmak istiyorum; birçok konuşmada robotlar ve yapay zeka gibi ortalığa atılan pek çok kelime duyarsınız. Ve bu tweet'i gerçekten seviyorum çünkü mevzuyu gerçekten anlamlı hale getiriyor. Bence hatırlanması gereken en önemli şey şu: istatistiklerden bahsediyoruz. Bu odada istatistik eğitimi almış olan var mı? Peki, biraz, tamam. İstatistik, ele almak için çok iyi bir konu. Keşke istatistik dersini daha çok önemseseydim. Şimdi istatistiği yeniden öğreniyorum. Tüm o havalı kelimeler nihayetinde sadece istatistiksel yöntem ve tekniklere varıyor, ki bu artık çok büyük bir olay. Veri bilimi ve istatistik için çok sayıda ilan görürsünüz, mevzu da tam olarak bu. Öyleyse biraz makine öğreniminden bahsedeyim. Yani hem bu var, hem de bu var, evet. Makine öğrenimi, sözde AI [Artificial Intelligence, yapay zeka] teknolojisi olarak adlandırılan o baskın yapay zekadır. Yaptığı şey ise… ve makine öğreniminin pek çok türü vardır. Ancak en temelde, iki veri kümesi veya üç veri kümesi veya on veri kümesini alır ve de aralarındaki bağlantıları arayıp, içindeki örüntüleri görür. Yaban mersinli kek ile chihuahuaların resimlerini veya Kentucky Fried Chicken ile labradoodle resimlerini gördüğünüzde, bağlantıyı her zaman göreceksiniz demek değildir. Ancak makine bu benzerlikleri fark eder ve bu örneği paylaşmayı seviyorum çünkü herkes anlıyor. Sosyal medyada paylaştığınız tüm köpek resimleri, tüm yemek resimleri, bunlar çok yaptığımız iki şey değil mi? Kendimizin, yemeğimizin, evcil hayvanlarımızın fotoğraflarını paylaşıyoruz. Yani internet bunlarla dolu. Ve bu, kullandığımız her türden sosyal medya tarafından yakalanıyor ve orada bulunan her şeydeki örüntüleri bulacak olan sistemleri eğitiyor. Yakalamaktan daha önemli olan şey ise etiketlendirmedir ve bu teknolojilerin yapması gereken şey de budur. Şimdi slayttan önce buna geçeceğim. Bu 2009-2019 Facebook meme akımını görmüşsünüzdür. Bunu gördünüz mü? Facebook bunu şu anda yapıyor, 2009'a karşı 2019 ve aynı zamanda Twitter ile Instagram'da da var. İnsanlardan 2009'daki bir fotoğrafınızı ve 2019'daki bir fotoğrafınızı, elbette adınız ve tarihiyle birlikte göstermelerini istiyor. Bunu size gösteriyorum ama Instagram, Facebook ya da başka bir yere koymadım. Çünkü Facebook'a, Twitter'a ve Instagram'a verdikleriniz, tarihler, adınız ve yüzünüzle birlikte mükemmel bir veri kümesidir. Bugün veya sanırım dündü, “evet, eğlenceli” diyerek tweetledim. İnsanlar bunu arkadaşlarına göstermek istiyor. Ama aslında yaptığınız şey yaşlanma hakkında bir veri kümesi oluşturmak. İnsanların zaman içinde nasıl yaşlandığını gösteriyorsunuz ve bu, Facebook için gerçekten çok iyi, hani bunu anlamak için tüm bu teknolojileri kuruyor. Bu yüzden etiketlendirme çok önemlidir çünkü veri kümesi - eğer etiketlendirilmemişse - şunu yapacaktır: sadece örüntüleri görür. Yaban mersinli keke baktığını bilmez. Bir chihuahua'ya baktığını bilmez. Sadece ne çıktığına bakar. Bunun gibi çok ciddi hatalar gördüğünüzde resimleri etiketlendirmedeki sorunu anlarsınız. Ne kadar net görebildiğinizi bilmiyorum, ancak ortadaki resimle başlayayım. Bu fotoğrafın neyi temsil edebileceğini bilen var mı? Evet, o nedir? Evet, kesinlikle. Peki, adınız neydi? Clarissa. Clarissa'nın söylediği gibi ve video kaydı için ben mikrofondan tekrarlayacağım çünkü mikrofonla konuşmuyordunuz. Clarissa'nın söylediği, ortadaki fotoğrafın, entegre bir okula gitmeden önce küçük bir çocuğa koruma verilişini göstermesi ve bu, Amerika Birleşik Devletleri'nde ayrımcılığın sona erdiği ve siyah öğrenciler ile beyaz öğrencilerin aynı okula gidebildiği zaman. Ama makine buna bakar ve "yan yana duran bir grup adam” der, küçük kız tamamen görünmezdir. Bu soldaki resmi görüyorsanız, “karla kaplı bir yamacın üzerinde duran bir grup insan” diyor. Şimdi, muhtemelen bunun kar olduğunu düşünüyor çünkü çok açık ve beyaz. Ama bunlar, yakından bakarsanız, aslında askeri personeller. Bu aslında Filistin ve İsrail'de. Ve diğer uçta da benzer bir bağlam var, sağda “bir bankın üzerinde birlikte oturan bir grup insan” diyor. Aslında bunun İsrailli bir savunma kuvvetleri personeli ve etrafındakilerin de Filistinliler düşünüyorum çünkü belli ki bazı çatışmalar yaşanıyor. Ancak makinenin görebildiği şey, bir bankın üzerinde oturan bir grup insan veya karla kaplı bir yamacın üzerinde duran bir grup insan ve bağlamın ne olduğunu tamamen kaçırıyor, anlayamıyor veya bilmiyor. Yani sadece örüntü tanıma, şu anda çevrimiçi olan her şeye bakan bu temel teknolojidir. Yani kredi alıp almadığınız, size gösterilen uçuş fiyatları, Amazon’dan satın aldıklarınız, her şey sadece yeni örüntüler oluşturur. 15 tane şey satın aldıysanız, o halde bunları da beğeneceksiniz, değil mi? Sadece sizi okumakla kalmaz, sanki okuduğunu yorumluyormuş gibi sizi yorumlar. Bu etiketlendirme, bu yorumlama eğer daha fazla veri olursa daha iyi hale gelecektir. Bağlamı anlamak konusunda giderek daha iyi hale gelirse… Ve de katılım sağlamanız, paylaşmanız, sosyal medyayla ve sosyal medya aracılığıyla daha fazla konuşmanız sizden beklenir ve böylece bağlamı sunarsınız, makineyi geliştirirsiniz.
Son bir buçuk yılda bununla ilgili yapılan iki uygulamadan bahsedeceğim. Bu, 2017'de yapılan çok ünlü ve gerçekten rahatsız edici bir çalışmaydı; iki Stanford araştırmacısı, psikolog, algoritmalarının eşcinsel bir yüzü, heteroseksüel bir yüzden %80 doğrulukla ayırt ederek tanımlayabildiğini gösteren bir makale yayınladı. Yaptıkları şey ise, bazı flört web sitesine girdiler, sanırım OkCupid, özellikle OkCupid’di. Çalışmaları için, insanlara sormadan profil fotoğraflarını aldılar. Ve algoritmayı, eşcinsel olduğunu ve heteroseksüel olduğunu söyleyen herkesin tüm resimlerine bakacak şekilde eğittiklerini söylediler. Aradıklarını veya satın aldıklarını ya da her neyse, onları karşılaştırdılar. Eşcinsel bir yüz buna benzer, heteroseksüel bir yüz buna benzer dediler ve bir algoritmanın bunu tanımlayabileceğini söylediler. İsimleri Michal Kosinski ve Yilun Wang. Kosinski Berlin'e geldi ve bir konuşma yaptı. “Bu araştırmayı neden yaptığınız” diye sordum ve “Dünyada eşcinselliği suç sayan otoriter rejimler olduğu için ve neler olabileceğini bilmelerini istiyorum, LGBT aktivistlerinin makine öğrenimi teknolojisiyle neler olabileceğini bilmelerini istiyorum. Bu yüzden ben de eşcinsel yüzü heteroseksüel yüzlerden ayırarak tanımlayabilen bir algoritma yarattım” dedi. Acaba bende mi bir sorun var diye düşündüm ve evet, hepiniz gülüyorsunuz. Çünkü Uganda veya Sudan'daki LGBT aktivistleri için farkındalık yaratmanın yolu bu değil ya da otoriter hükümetlere ve şirketlere fikir verecek bir algoritma yaratmazsınız. Bunu uygulayacak birçok teknoloji şirketi var ortalıkta. Ama bu hâlâ örüntülere ve yüzlere bakarak insanları tanımlamanın genel tarihi… Bunun Avrupa'da özellikle Fransa ve Belçika'da uzun bir geçmişi vardır, Galton, Bertillon, Adolphe Quetelet isimlerini belki duymuşsunuzdur. Bunların hepsi, eğer suçluları incelersek, örneğin suçluların yüzlerine, kafalarına, burnuna, kulaklarına detaylı bir şekilde bakarsak ve buna bir ölçekle bakarsak, bir suçlunun neye benzediğini belirleyebileceğimizi söyleyen adamlardır… Ve bu fikirler aslında istatistiğin topluma sokulmasıyla ilgiliydi. Bu yüzden şu anda pek çok sosyal bilimde… İstatistikler etkin. Bunu yaparsam, eğer bu politikaya sahip olursam ve bunu uygularsam, o zaman toplumdaki insanların yüzde o kadarı gelişir ya da insanların yüzde şu kadarı için bunun etkisi budur, der. O zamanlardan beri gördüğümüz gibi bu, insan vücudunu anlamak, okumak ve yorumlamaktır ama aynı zamanda normali tanımladığını da görüyoruz yani “insanların çoğu böyledir” der. Böylece, bu verileri toplarken bile bir normallik fikri yaratırsınız. Ve biraz farklı olan her zaman bir tutulur veya görünmez hale gelir. Örneğin bunda, bu Gender Shades [Cinsiyet Tonları] adlı bir proje. Bu arada, tüm referansları sonda vereceğim, en sonda bir slayt var, eğer isterseniz onu sizinle paylaşabilirim, onu göstereceğim. Cinsiyet Tonları, Joy Buolamwini adlı MIT'deki bir doktora araştırmacısının bir projesi ve bulduğu şey, yüz tanıma teknolojisini bilirsiniz… Bunun hakkında çalıştığı dönemde, tarayıcının karşısına oturduğunda tarayıcı onu okuyamıyordu. O bir siyah ve tarayıcı onu okuyamıyordu. Ama beyaz meslektaşı tarayıcının önüne oturduğunda, onu okumuştu çünkü tarayıcı çoğunlukla beyaz yüzlerde eğitilmişti. Çünkü bu normal olan, değil mi? Çoğu insan beyazdır, bu yüzden teknoloji de böyle kurulur. Sanki o sabunluklar gibidir, sabunluğun altına elinizi koyduğunuzda, eliniz beyaz değilse sabun gelmez çünkü sadece belli bir renk aralığına yanıt vermek için eğitilmiştir… ama tuhaf olan şey, bilemiyorum yani herkesin daha açık renkli avuç içleri olup olmadığını bilmiyorum. Her neyse, yüz tanıma teknolojisine bakıyordu ve siyah bir kadınsanız o zaman teknolojinin sizi tanımayacağını ortaya çıkardı. Eğer siyah bir erkekseniz, teknoloji sizi tanımakta daha iyidir çünkü erkekler normdur. Ve eğer beyaz bir kadınsanız, sizi tanımakta biraz daha iyidir. Ve eğer beyaz bir erkekseniz, o durumda her zaman tanınırsınız, diyor ve üç teknolojiyi karşılaştırıyor: Microsoft'un yüz tanıması, Face++ ve IBM. Daha koyu erkek, daha koyu kadın, şu tabloya bakabilirsiniz ve bu, insanları nasıl tanıdığına dair uçurumu gösterir. Joy'un çalışması ilginç çünkü dışarıda tutulmayı gösteriyor, eğer siyah bir kadınsanız o zaman makine öğrenimi veri kümesinde olmadığınızı gösteriyor. Yaban mersinli keklere ve Chihuahualara geri dönelim. Makine yalnızca ne görüyorsa onu bilir, yalnızca yüklendiği tüm teknolojilerden öğrenir. Yani bu, çok az siyah kadın resmi olduğu veya siyah kadınların resimlerini gördüğümüz çok özel bağlamlar olduğu anlamına gelir. Tekrar etiketlendirmeye geri döner. Yaban mersinli bir kekin resmini koyabilirim ve ona Johannesberry diyebilirim, hani mesela ona başka bir isim verebilirim. Bu biraz farklı bir örüntü yaratacaktır. Yaban mersini demiyorum, Johannesberry diyorum. Ama evet, aynı görünebilir, ancak ne zaman ki çok fazla yaban mersini veya Johannesberry’m olur, ancak o zaman daha da ayrıntılı bir ayrım yapabilir. İkisi de aynı görünüyorsa, etiketin ne olduğu önemli olmayacaktır. Yani burada iki şey işliyor. Yani Joy'un argümanı, görünüşe göre daha fazla içerilmek istiyoruz diyor, evet, makine tarafından daha fazla siyah kadının tanınmasını istiyoruz. Aslında Joy şirketlere karşı, siyah kadınların tanınmadığını ve hatta bazen siyah kadınların erkek olarak yanlış tanındığını söylemek için epey aktivizm yaptı. Ama şu anda pek çok insan bunu eleştiriyor ve özellikle şimdi Amerika Birleşik Devletleri'nde çok fazla şiddetin, özellikle de beyaz olmayan insanlara yönelik polis şiddetinin olduğu bir zamanda, makine tarafından neden tanınmak isteyelim deniyor. Makine tarafından tanınmak istemezsiniz, aslında çok uzağında kalmak istersiniz, bu yüzden çok fazla eleştiri var. Ama yine de, görünür mü yoksa görünmez mi olmak istersiniz üzerinden bu halen biraz açık bir soru ve bence bu hepimizin düşünmesi gereken bir konu ve sanırım bunun hakkında konuşacağız: Sadece temsiliyet olsun diye mi temsiliyet istiyoruz? Hangi bağlamda? Temsiliyeti kim kontrol ediyor? Bunların hepsinin sorulması gereken önemli sorular olduğunu düşünüyorum. Bu tür bir ayrımcılık fikrinden ilerlemek istiyorum ve ayrımcılık dediğimde, sadece dezavantaj veya önyargıyı kastetmiyorum, aynı zamanda ayrımcılığın Latince'den (discernere) geldiğini kastediyorum ve bu da “açıkça görmek” anlamına geliyor. Makineler tarafından da açıkça görülüyor oluşumuzu ileri sürüyorum ancak illa da anladığımız şekilde değil, tamam mı? Birisi, ortada bulunan tüm veri kümelerine bağlı olarak işleri belirli bir şekilde programlamaya karar verdi. Bu veri kümelerinden bazıları bildiğiniz chihuahua ve yaban mersinli kekler gibi şeylerdir. Yani, ortadaki veri kümesi buysa, göreceğiniz seviye budur ve aynı şeyin dildeki, sözcüklerdeki vb. korkunç hatalarda da olduğunu görürsünüz.
Ama ben yüzler hakkında konuşmaya devam etmek istiyorum ve yüzlerimizle ilgili en ayırt edici şey kendimizi, ne hissettiğimizi nasıl ifade ettiğimizdir. “Gözler ruhun aynasıdır diyoruz” ya hani, en azından İngilizce’de bunu diyoruz. Şimdi, burada altı tanesinin resmi var, çünkü 1978'de Paul Ekman adlı bir psikolog tarafından geliştirilen, en baskın altı insan duygusu bunlardır ve bunların dışında, sadece nötr bir yüz olan yedincisi vardır. Ancak temelde öfke, üzüntü, mutluluk, tiksinti, korku ve şaşkınlıktır ve diğer tüm duygular bu kategorilere girer. Bu, duygulanımsal bilgi işlem [affective computing] denen şeyin temeli olarak kullanıldı. Duygulanım sadece duygularla değil, bedenlerimizin nasıl duygular olduğu, tüm bedenimiz aracılığıyla kendimizi yüzümüzle nasıl ifade ettiğimizle ilgilidir. 1970'lerde yine diğer resimde gördüğünüz, Kısmet adlı robot MIT'de geliştirildi. Bu robot, manuel işler veya insanlar için herhangi bir işi yapmak için tasarlanmamıştı, kelimenin tam anlamıyla sadece bir yüzdü ve biraz da aptal bir robottu. Kocaman, pörtlek gözleri vardı, pek ses çıkaramıyordu, kafası düzgün değildi, mükemmel bir makine değildi. Çok tuhaf bir makineydi ama o komik gözleri ve sarkan kulakları yüzünden biraz da şirin sayılırdı. Paul Ekman, insanların altı duyguya sahip olduğunu söylediği için bu duyguları göstermesini sağladılar. Ve insanlar robot Kısmet’in önüne oturduğunda, hemen evet, şaşkınlık gösteriyor, tiksinti gösteriyor, korku gösteriyor dediler. Ancak bazı akademisyenler, aslında iletişimde gerçekleşen şeyin, diğer kişinin ne yaptığını yorumladığımız ve okuduğumuz olduğunu söyleyecektir. İletişimimizin büyük kısmı, birbirimizi okumamızla ilgilidir. Yani bir kişiyle, hatta belki evcil hayvanınızla bile bir şey söylemeden veya ifade etmeden önce, bazen dil engellerinin ötesinde birbirimizi anlayabiliyoruz çünkü gördüklerimizi yorumluyoruz. Yani anlaşılan o ki, pek çok insan Kısmet’e bakıyor ve robotun duyguları olduğunu, duygularını gösterdiğini, anlıyor gibiydi. Ama aslında o sadece belli bir biçimde başını, gözlerini ve ağzını hareket ettiriyordu ve insanlar bunu duygular olarak yorumluyordu. Bu da, duygulanımsal bilgi işlem adı verilen bu alanın başlangıcıydı. Duygulanımsal bilgi işlem, bence artık evet, bir sonraki seviye. Çünkü şu anda teknoloji, robotlar aslında yeterince insan değiller, diye hissediyoruz. Bazen biraz kusurlu, biraz tuhaf ama bu gittikçe daha iyi olacak. Örneğin [insan] sesi düşünelim. Bir insanın sesi gerçekten de ayırt edicidir. Cep telefonlarından önceki zamanlarda, kimin aradığını bilme oyununu hatırlayın, küçücük bir çocukla bile oynadığınızda bile tam işlemez. Mesela amcam bunu her zaman yapardı, arardı ve başka biriymiş gibi davranırdı ama onun amcam olduğunu kesinlikle bilirdim. Beni güldürmek için tüm o farklı komik sesleri çıkarırdı ama çocuk halimle bile onun o olduğunu hemen anlardım. Sesi maskelemek çok zordur. Ama aynı zamanda makinelerden normal bir konuşma elde etmek de zordur. Bu yüzden size Google'ın yeni çıkardığı bir şeyi dinleteceğim.
“Müşterimiz için bir kadın saç kesimi. 3 Mayıs için bir randevu istiyorum”.
“Tabii, saat kaç civarı için istiyorsunuz?"
"Öğlen 12:00'de”.
“Saat 12:00’de müsait değiliz, buna en yakın olanı 1:15”.
“10:00 ile 12:00 arasında var mı?”
“Hangi hizmeti talep ettiğine bağlı. Hangi hizmeti istiyor?"
"Şimdilik sadece bir kadın saç kesimi”.
“Tamam saat 10’da müsaitiz”.
“10:00 iyi”.
“Tamam, adı ne?"
"Adı Lisa”.
“Tamam, şahane. O halde 3 Mayıs'ta saat 10'da Lisa'yı göreceğim”.
“Tamam, harika, çok teşekkürler”.
“iyi günler, hoşçakalın”.
Bu size makul geldi mi? Normal bir ses gibi geldi mi? Çünkü hani elektronik bir sesle konuşurken bunu hemen anlarsınız. Son zamanlarda fark ettim ki pek çok YouTube videosunda bir tür elektronik ses var ve bu gerçekten sinir bozucu. Basit bir video olabilir, ne bileyim mesela ahşap zeminleri nasıl temizlersiniz veya mesela, nasıl yapılır, sadece bu yardım videoları… Bu küçük, basit videolar ve her zaman elektronik sesler var ve çok sinir bozucu. Google geçen yıl çıkardı. Elektronik sesleri dinlemenin gerçekten zor olduğunu biliyorlar. Alexa gibi şeyler de dahil olmak üzere dünyanın her yerindeki tüm teknolojileri sayesinde, nasıl konuştuğumuzu ve normal konuşmanın nasıl bir şey olduğunu öğreniyorlar. Çünkü bizim mmm, eee veya ııı gibi şeyler söylememiz ve de durup başlamamız bile, bizi insan yapan şeyler, bizi biricik kılan da bunlar. Bir makine her zaman aşırı mükemmeldir. Aşırı, yüzde yüz. Ama bu onu şey gibi hissettirir… değilmiş, değilmiş gibi… onunla ilişkilenmek istemezsiniz. Aslında bizimle daha ilginç bir şekilde, neredeyse daha insani bir şekilde, hemen “hah, bu bir makine” demeyeceğimiz şekillerde ilişki kurabilen makine fikrine doğru ilerliyoruz diye düşünüyorum. Bu sesi duysaydım “tamam, sorun değil, kulağa oldukça insani geliyor” diye düşünürdüm. Elbette bunların hepsi artık chatbotlar [sohbet robotları] tarafından etkinleştirilecek ve artık tabii ki her yanımız chatbotlarla sarılmış haldeyiz. İster bizim için randevu ayarlıyor veya ister Batı demokrasilerini yıkıyor olsunlar. Demek istediğim, ortalıkta milyonlarca chatbot var, ancak gerçekten samimi ve duygusal şekilde tanıtıldıkları yollar da var. Geçenlerde Woebot adlı bir tanesine denk geldim ve bu aslında ruh haliniz ve depresyonla başa çıkmak için iPhone veya Android'inizde kullanabileceğiniz bir uygulama. Bilişsel davranışçı terapiyle alakalı oldukça güvenilir bir bilime dayanıyor. Temel olarak insanların duygularla başa çıkmalarına yardım etmekle alakalı. Otomatik, sizi dinleyen, yorulmayan, her zaman müsait olan, sizi yargılamayan ve daima zamanında hazır bulunan bir bot. Aslında bu deneyimin yani biriyle konuşmanın ve birinin sizi dinlemesinin aslında nasıl bir şey olduğunu bana anlatması için partnerimi Woebot kullanmaya ikna etmeye çalışıyorum. Bot aslında söylediğiniz belirli kelimeleri dinliyor ve yine hatırlayalım ki bir duygu veritabanı üretiyorsunuz. Bot zaten belirli kelimeleri aramaya ve bunları “bu kişi şunu veya şunu hissediyor” şeklinde anlamak için birbirine bağlamak üzere programlanmıştır. Şu zamanda ve şu şekilde 15 kelime söylenmiştir ve belirli türden hikâyeler kişinin depresyonda olup olmadığı anlamına gelir. Bunun uzun vadeli bir sorun mu, yoksa kişi yakın zamanda yeni bir ülkeye taşındığı veya boşandığı için ani bir şey mi olduğunu anlamak için belki size daha fazla soru soracaktır. Bu tür şeyler olduğunda depresyonda olduğunuz anlamına gelmez ama bu sizin için duygusal stres anlamına gelir. Yani robot, bu samimi alanı yaratıyor çünkü insanlar bunu yapmıyor… Belki bunu birbirimizle paylaşmak, bunu birbirimize vermek bize zor geliyor.
Bir de oldukça meşhur olan Ashley Madison vakası var, bu web sitesini bilen var mı bilmiyorum. Ashley Madison artık kapalı, evli insanların ilişki yaşaması için bir web sitesiydi. Sonra hacklendiler… Sanırım iki yıl önce falandı ve tüm verileri sızdırılmıştı. Ancak, Ashley Madison’da olan şey şuydu; site çok popülerdi, çok sayıda insan kaydolmuştu. Tek bir sorun dışında, o da şu ki, sitede kadın yoktu yani sadece dört-beş kadın ve 75.000 erkek vardı. Aslında böyle bir şeyi ölçeklendiremezsiniz. Şunu yapıyorlardı: Temelde tüm abonelik ücretlerini, kadınlarla çevrimiçi ilişki kurmak isteyen bu erkeklerle konuşacak botlar yapmak için kullandılar. Ancak veriler hacklendikten sonra, insanlar bunların gerçek kadınlar olmadığını fark ettiler, bunlar sadece botlardı. Bu 75.000 erkeğin hepsi botlarla konuşuyordu ve bunun farkında değillerdi. Ve bu hikâyelerden biri beni epey etkiledi. New Orleans'taki bir papazın öyküsüydü bu, belki zaten depresyondaydı, belki duygusal sorunları vardı ama hackden beş gün sonra adı ortaya çıktıktan sonra, hackden on gün sonra intihar etti. Ve bir papaz olarak, yaşadığı utanç ve duygudan bahseden bir intihar notu bıraktı, yani belki de evliliği yürümüyordu. Bu ona bir tür yoldaşlık sağlıyordu ve evlilik hakkındaki, ilişkiler hakkındaki yargınız ne olursa olsun, beni etkileyen şey, birinin… İnançlı olduğundan özenli bir hayat yaşayan biri ve bu ona bir çeşit destek ve yoldaşlık sağlıyordu. İsminin ortaya çıkması gerçeğiyle başa çıkamamıştı çünkü o durumda cemaati karşısında utanç duyacaktı. Öyleyse soru şu: Bir chatbot ile sohbet ediyorsan bu hâlâ seks midir, hâlâ aldatma mıdır? Bilirsiniz, yani tamam kimseyle sevişemem çünkü bu karıma verdiğim söze karşı gelmek olur gibi hissetmişti. Bu “Her” filmindeki ilişki gibi, Scarlett Johansson ve Phoenix… Evet River Phoenix'in erkek kardeşi adını hep unutyorum, Joaquin Phoenix'i , onların oynadığı filmi gördüyseniz. Basitçe, bu adam bir işletim sistemiyle bir ilişki yaşamaya başlıyor ve sadece sesini dinleyerek ve yaşadıkları bir tür ilişki, bu çok özel ve önemli bir şey haline geliyor. Bu bedensiz… Bu bedensiz seslerin ne olduğu, yine de ilişki kurmaya devam edeceğimiz bir şey olacak diye düşünüyorum.
Şimdi, ses konusundan deepfake’lere [sahte videolar] geçmek istiyorum ve eminim çoğu insan deepfake’leri duymuştur. Deepfake’lerde, bir kişinin yüzünü başka birinin vücuduna yerleştirebilirsiniz. Dolandırıcılığın sonuçlarını bir düşünün. Bu çok meşhur bir video.
“Düşmanlarımızın herhangi bir zamanda, herhangi bir yerde, herhangi bir şey söyleniyormuş gibi görünmesini sağlayabilecekleri bir çağa giriyoruz. Bunları asla söylemesek bile, örneğin, bilmiyorum, bana Killmonger haklıydı veya Ben Carson Batık Yerde [Sunken Place, Get Out filminden bir zihinsel mekân] dedirtebilirler. Ya da şuna ne dersiniz, Başkan Trump tam tamına bir pislik. Şimdi, bunları asla söylemeyeceğim ortada, en azından bir halka seslenişte değil, ama bir başkası söylerdi. Jordan Peele gibi biri. Tehlikeli bir zamandayız, ileriye doğru giderken internette neye güvendiğimiz konusunda daha da tetikte olmamız gerekiyor. Bu, güvenilir haber kaynaklarına itimat etmemiz gereken bir zaman. Basit gelebilir ama nasıl ilerliyoruz? Bilgi çağı, hayatta kalmakla bir tür berbat distopya olup olmamak arasındaki fark olacak. Teşekkürler ve uyanık olun kaltaklar.”
Size bir video daha göstereceğim ve sonra tüm bunları toparlamaya başlayacağım.
[Müzik]
[Video metinleri]
Kaynak denek
Hedef denek
Kaynak Video - Algılanan Poz - Kaynaktan Hedefe Sonuç
[Müzik]
Tamam, yani mevzuyu anladınız, değil mi? Neler olduğunu görüyorsunuz. Yani temelde deepfakelerde olan şey şu: Teknoloji öyle bir gelişiyor ki insan vücudunu ve özellikle ses, yürüyüş, duruşunuz gibi şeyleri çok benzeyecek şekilde haritalayabilecek durumdayız. Bunlar bizi gerçekten farklı kılan şeyler ve bütün bunlar tuhaf görünebilecek şeyler. Özellikle kameradayken ve insanlar sizin çok mükemmel olmanızı istediklerinde ve herhangi bir hata yapmadan bir konuşma yapmanız gerektiğinde, ama bunlar bizi esasında biricik kılan şeyler. Bunlar, teknolojinin yakalayabildiği ve sonra başka bir şeye aktarabildiği şeyler, asla yapmadığınız bir şeye. Deepfake teknolojisinin hepsini tam olarak anlamıyorum ama onu anlamaya ve nasıl çalıştığını öğrenmeye uğraşıyorum. Ama bence bu giderek daha ciddileşecek bir şey ve biz bunu daha da çok göreceğiz. Bu yüzden teknoloji geliştikçe, deepfakeleri tespit etmenin yollarını da bulan insanlar eminim vardır, böyle insanlar olduğunu biliyorum. Çünkü her zaman ters giden küçük şeyler görebilirsiniz. Ve şu sıralar, aslında var olmayan insanların yapay olarak oluşturulmuş bu suratları internette çok fazla dolaşıyor ve bu suratları gördüğünüzde normal insanlar gibi göründüklerini düşünüyorsunuz. Ama aslında çevrimiçi olan milyonlarca surattan oluşuyorlar. Sahte olduklarını nasıl anlarız? Gözlere ve gözlerin bir arada veya ayrık olması gibi şeylere bakmaya başlarsanız veya sistem her zaman doğru anlamadığı için her zaman küçük aksaklıklar olur. Protestolar gibi şeylerde agresif davranışları, saldırgan davranışları anlamak için vücut duruşunuzu, yürüyüş şeklinizi ve nasıl ayakta durduğunuzu anlamak üzere bu teknolojileri kullanıyorlar. Bu çok fazla kullanılacak. Birinin kötü bir niyeti olup olmadığını nasıl anlarsınız? Ya da birisinin nasıl ayakta durduğuna bakarak, davranışlarının değişken olup olmadığını, birine saldırıp saldırmayacağını nasıl anlarsınız? Ve bunun da yanlış olduğunu biliyoruz, kimin hedef alınacağını ve ne şekilde olacağını nasıl bilebilirsiniz. Demek istediğim, kapşonlu giysiler giydiğin anda, kim olursan ol, vücudun farklılaşır. Tıpkı yüksek topuklu giymek gibi, çoğunlukla spor ayakkabı giymeye alışkınsanız, yüksek topuklu giydiğiniz an aniden farklı bir kişi haline gelirsiniz. Bu yüzden, bu teknolojileri kimin kullandığına gerçekten dikkat etmeliyiz, hangi veri kümelerini topluyorlar, veri kümeleri nereden geliyor ve sonra bunları kimin uyguluyor.
Hindistan, Bangalore'daki insanlarla çalışan Cambridge Üniversitesi'ndeki bilgisayar bilimcileri, protestolarda şiddet uygulayan kişileri veya protestolarda potansiyel olarak şiddet sergileyecek kişileri tespit etmek için bu teknolojiyi geliştiriyorlar. Bu yüzden, çoğunuzun bildiği bu tekinsiz vadi [uncanny valley] fikrine geçmek istiyorum ve Wikipedia maddesindeki bu tanımı gerçekten seviyorum. Bir robotla karşılaştığınızda ve onun insan olmadığını ve hiç de insan görünmediğini bildiğinizdeki o duygudur bu ve bunu anlarsınız ve sizi tuhaf hissettirir çünkü çok insani görünür ama değildir ve her zaman o uçurum vardır. Vadi, rahatlık duygunuz ile algınız arasındaki uçurumu ifade eder. Ama bence bu… Demek istediğim şu ki, bu şeyler korkutucu olsa da, durumu karmaşıklaştırmak için her zaman onu diğer tarafla dengelemeyi seviyorum.
Şu şekilde bitirmek istiyorum… İnsanlara çok gerçekçi bir yakınlık ve bakım sağlamak için teknolojilerin kullanıldığı bazı başka türden yollar. Bu, insan olmayan, insansı olmayan ve insan olmaları amaçlanmayan bu tarz robotlar aracılığıyla oluyor. Bu Paro robotu ve en üstteki de Lovot, yeni bir robot. Paro aslında sanırım 10 yıldan beri var, Japonya'da geliştirildi. Japonya, tüm bu teknolojilerin geliştirildiği yerdir. Bence bunun, Japonların robotları insan görüntüsünde yaratılması gerekiyor gibi görmemesi gerçeğiyle de ilgisi var. İnsan merkez ve çıkış noktası değildir, çünkü Japon inanç sistemlerinde, bence Judeo-Hristiyan dinlerinin aksine, doğadaki cansız şeylerin kendi kimlikleri ve kendi enerjileri vardır. Ve bence bu tür bir kültürde büyüyen biri olarak, bu animizm fikri çok gerçek. Parobot aslında çok başarılı oldu ve mesela yaşlılar, demans hastaları, evsizler, otizmli çocuklar için Avrupa'da ve aynı zamanda Japonya'da yaygın olarak kullanıldı. Paro yumuşak, süngerimsi, sevimli bir oyuncak ama size tepki verir. Tıpkı hafızalı köpüğün robot hali gibi. Tuttuğunuzda bedeninize tepki verir, adeta size doğru eğilir. Bir çocuğunuz varsa veya birine sarıldığınızda yanıt verir ve nasıl kucaklanmak istediğinizi hatırlar. Ve bir insandan farklı olarak, örneğin bir ebeveynin otistik bir çocukla iletişim kurmaya çalıştığını varsayalım ya da demans veya Alzheimer olan yaşlı ebeveyninizle ilgileniyorsunuz, çoğu insan diğer kişinin bize nasıl tepki verdiğinden veya bize duygusal olarak yanıt vermemesinden etkilenebilirken, Paro robotu memnundur, nasıl dokunulmak istediğinizi hatırlayacak ve size yaklaşmayacaktır. Böylece kendi istediğiniz şekilde ona yaklaşabilirsiniz.
Lovot'un yaratıcılarıyla birlikte… Biraz aptal ve sevimli ve de etrafta dolaşıp hatalar yapmaları ve bir şeyleri devirmeleri gerekiyor. Tam anlamıyla konuşmuyorlar, sadece komik, ciyaklayan sesler çıkarıyorlar. Ama evinizin haritasını ve neyi sevdiğinizi ve bir şeyler söyleyip söylemediklerini hatırlıyorlar. Alexa gibi değiller yani bir sonraki trenin ne zaman kalkacağını soramazsınız. Duygusal olması, destekleyici ve şefkatli olması gerekiyor. Bence işler biraz oraya doğru gidiyor ya da belki, bilmiyorum belki her zaman yalnızdık ve insanlık tarihi boyunca ilişkiler her zaman bir mücadeleydi. Bence bunlar, bu soruları gerçekten mecbur kılan, insan toplumunda başka yerlere sahip olabilecek teknolojilerin uygulamaları hakkında farklı bir şekilde düşünmemizi isteyen teknoloji uygulamaları.
Bu yüzden burada bitirmek ve bu teknolojilerin çoğunun mahremiyet ve veri koruma konusunda endişeler yarattığını sadece özetlemek ya da tartışma yoluyla sorulara açmak istiyorum. Avrupa'da GDPR [Genel Veri Koruma Yönetmeliği] gibi düzenlemelere sahip olduğumuz için son derece şanslı ve minnettar olduğumuzu düşünüyorum. Ama yine de, başta da söylediğim gibi, Facebook ve Google’a bireysel olarak tepki veremezsiniz. Bunlar… Bir yerlere gidip, bir delikte yaşamanız gerektiği anlamına gelir. Verilerle bir şeyler yapan bu büyük şirketlere veri vermeden günlük hayatınıza devam edemezsiniz. Peki bu ne anlama geliyor, bu bizi nereye götürüyor? Demek istediğim, direnmemizin önemli olduğunu düşünüyorum ama düzenlemeye ihtiyacımız var ve bu yüzden GDPR gibi şeylerin iyi olduğunu, ancak daha da fazlasının olması gerektiğini düşünüyorum. Şimdi burada bırakmak istiyorum ve ne düşündüğünüzü merak ediyorum. Bu örneklerden bazıları hakkında ne düşünüyorsunuz ve size neler hissettiriyorlar? Dinlediğiniz için çok teşekkür ederim.
[Alkış]
Çeviri: Ari P. Büyüktaş Son Okuma: Kevser Güler