Ortaya atılan yeni iddialara göre OpenAI, telif hakkı ihlalini bildiği halde GPT-4’ü milyonlarca YouTube videosuyla eğitti. Bu yeni iddianın kaynağı ise The New York Times oldu.
NYT tarafından yayınlanan yeni raporda ortaya çıkan bilgilere göre OpenAI yapay zeka modelinin yeni versiyonunu eğitmek adına Google verilerine başvurdu. Söylenene göre bir milyon saatten fazla YouTube videosu da GPT-4’ün eğitiminde kullanıldı.
GPT-4 İÇİN MİLYONLARCA SAAT YOUTUBE VİDEOSU KULLANDI
Yer alan iddiaların ayrıntılarında ise şirketin daha çok Youtube videolarına başvurduğu aktarıldı. Whisper adı verilen bir ses tanıma aracı, milyonlarca saatlik video verisini yazıya döktü. Bu da GPT-4’ün eğitilmesi içindi.
Ayrıca NYT haberinde şirketin başkanı Greg Brockman’ın, YouTube videolarının kullanılmasının yasal olarak soru işaretleri oluştursa da sorun yaratmayacağını söylediği de aktarıldı.
Öte yandan YouTube’un sahibi Google’ın sözcüsü Matt Bryant The Verge’e konuyla ilgili açıklama yaptı. Buna göre konuya ilişkin doğrulanmamış raporları gördüğünü, bu tarz izinsiz kullanımların yasak olduğunun altını çizdi.
Bunun yanı sıra Google’ın da YouTube verilerini kullanarak modellerini eğittiği ortaya çıktı.