[ad_1]
كما تم وصف SV2TTS بأنه “صندوق أدوات استنساخ الصوت في الوقت الفعلي”، وكان قادرًا على خداع Microsoft Azure في حوالي 30% من الوقت ولكنه خدع بشكل أكبر كل من WeChat و Amazon Alexa تقريبًا ثلثي الوقت، أو 63% من الوقت.
كان الصوت العميق أكثر نجاحًا في تزوير أصوات النساء وأصوات غير الناطقين باللغة الإنجليزية، وكتب الباحثون في تقرير نُشر على خادم الوصول المفتوح arxiv: “وجدنا أن كلاً من البشر والآلات يمكن أن ينخدع بشكل موثوق بالكلام الاصطناعي وأن الدفاعات الحالية ضد الكلام المركب ضعيفة”.
وأضاف الباحثون، “مثل هذه الأدوات في الأيدي الخطأ ستتيح مجموعة من الهجمات القوية ضد كل من البشر وأنظمة البرامج”.
يسمح WeChat للمستخدمين بتسجيل الدخول بأصواتهم، ومن بين الميزات الأخرى، تسمح أليكسا للمستخدمين باستخدام الأوامر الصوتية لإجراء مدفوعات لتطبيقات الطرف الثالث.
اختبرت فينجر وزملاؤها أيضًا برنامجًا آخر لتركيب الصوت، وهو AutoVC، والذي يتطلب خمس دقائق من الكلام لإعادة إنشاء صوت الهدف.
كان AutoVC قادرًا فقط على خداع Microsoft Azure في حوالي 15% من الوقت، لذلك رفض الباحثون اختباره ضد WeChat وAlexa.
وهناك العديد من برامج التزييف الصوتي القانونية في السوق، حيث أعلنت مؤخرا شركة Lyrebird، وهي شركة ناشئة مقرها سان فرانسيسكو، عن قدرتها على توليد الأصوات الاصطناعية الأكثر واقعية في العالم، وفي بيانها الأخلاقي، تعترف Lyrebird بأن برنامج تركيب الصوت “يحمل احتمال إساءة الاستخدام”.
[ad_2]