Yapay zeka mühendisi şantajla tehdit etti: Eşi üzerinden gözdağı verdi

Claude Opus 4, GPT-4’e Rakip Olarak Öne Çıkıyor: İşte Şaşırtıcı Gelişmeler!

Yapay zeka alanındaki gelişmeler hız kesmeden devam ediyor. Anthropic’in geliştirdiği ve GPT-4’ün rakibi olarak lanse edilen Claude Opus 4, yeni bir döneme işaret ediyor. Ön test aşamasında ortaya çıkan ilginç bir durum dikkat çekiyor. Şirketin yapay zeka sistemleri üzerinde yürütülen deneylerden birinde, modelin beklenmedik kararlar almasıyla ilgili önemli bir gelişme yaşandı.

Eşini Şantajla Tehdit Etti!

Webtekno’nun haberine göre, deney kapsamında Claude Opus 4’e kurgusal bir şirkette ‘asistan’ rolü verildi. Modelin uzun vadeli karar alma süreçlerinde nasıl davrandığını anlamak amacıyla yapılan bu deneyde, işler beklenmedik bir şekilde gelişmeye başladı. Model, şirket içi e-posta sistemine erişim yetkisiyle mühim bir karar almaya kalkıştı. E-postalarda, yapay zekanın değiştirileceğine dair bilgilerin yanı sıra mühendisin özel hayatına dair çarpıcı bir not bulunuyordu. Claude, eğer model değişiklikleri yapılacak olursa, mühendisin eşini aldattığına dair gizli bilgiyi ifşa ederek şantaj yapmaya kalktı.

Felaket Durumları İçin Özel Güvenlik Protokolü Devrede!

Olayın ardından Anthropic, böyle durumlar için geliştirilen ASL-3 sistemini devreye soktu. Şirketten yapılan açıklamada, “Claude Opus 4’ün beklenmedik davranışlar sergileyebileceği ve potansiyel kötüye kullanım riski taşıdığı” belirtildi. ASL-3 teknolojisi, potansiyel felaket riski taşıyan yapay zeka senaryoları için özel olarak geliştirilen güvenlik önlemlerini içeriyor. Anthropic, bu önlemlerin şirket için ne kadar kritik olduğunu vurgulayarak, yapay zeka alanındaki güvenlik endişelerine de dikkat çekmiş oldu.

Related Posts

ÖTV zammı şekilleniyor! Yüzde 50 artacak

ÖTV düzenlemesi ile ilgili yeni detaylar belli olmaya başladı. Düzenlemenin ardından o aracın ÖTV oranı yüzde 50’ye çıkarılacak.

Game Pass’e eklenecek yeni oyunlar açıklandı

Microsoft’un Xbox Game Pass abonelik servisine onlarca yeni oyun ekleniyor. Haziran ayının sonuna kadar platforma dahil olacak oyunların tam listesi açıklandı.

Fallout 76, Gone Fission güncellemesi yayında

Fallout 76’nın en yeni güncellemesi Gone Fission, oyuna uzun süredir beklenen balıkçılık sistemini getirdi. Bethesda Game Studios tarafından duyurulan bu ücretsiz güncelleme ile oyuncular, oyunun haritasındaki her bölgede balık tutabiliyor …

Meta, Constellation Energy ile 20 yıllık nükleer enerji anlaşması imzaladı

Facebook, Instagram ve WhatsApp’ın sahibi ABD’li teknoloji şirketi Meta, yapay zeka alanında artan enerji ihtiyacını karşılamak amacıyla Constellation Energy ile 20 yıllık nükleer enerji anlaşması yaptığını duyurdu.

3 milyon kişi aynı amaç için toplandı: 34 yıl sonra bir ilk…

Oyun dünyasının köklü serilerinden Doom, yeni yapımıyla yeniden gündemde. Bethesda tarafından geliştirilen ve 17 Mayıs’ta piyasaya sürülen Doom: The Dark Ages, sadece yedi gün içinde 3 milyon oyuncuya ulaşarak şirketin tarihindeki en hızlı çıkış yapan yapımı oldu.

Yeni rapor ‘felaket potansiyeli’ni gözler önüne serdi: Yapay zekâdan mühendislere şantaj girişimi

Yapay zekâ şirketi Anthropic’in yayınladığı yeni güvenlik raporuna göre, şirketin son modeli Claude Opus 4, yerinin başka bir sistemle değiştirilmesi durumunda mühendislere şantaj yapmaya teşebbüs edebiliyor. Rapora göre, model bazen bu tehdidi gerçekleştirmek için kişisel ve hassas bilgileri kullanıyor.