الذكاء الاصطناعي يمكنه نسخ خط اليد بدقة.. كيف سيؤثر ذلك في حياتنا؟
أدى تطور أدوات الذكاء الاصطناعي إلى انتشار عمليات التزييف على نطاق واسع، إذ تتيح هذه الأدوات إنشاء مقاطع صوتية، أو مقاطع فيديو مزيفة تبدو حقيقية بنحو مخيف، والآن يمكن أيضًا استخدام الذكاء الاصطناعي لمحاكاة أسلوب الكتابة اليدوية للشخص.
فقد طور فريق من الباحثين في جامعة محمد بن زايد للذكاء الاصطناعي نموذج ذكاء اصطناعي يمكنه تعلم نمط الكتابة اليدوية لشخص معين، وإنتاج نص مكتوب مشابه له تمامًا، وقد حصل هذا الابتكار على براءة اختراع من (مكتب الولايات المتحدة لبراءات الاختراع والعلامات التجارية).
ولكن كيف طور الباحثون في جامعة محمد بن زايد للذكاء الاصطناعي هذا النموذج، وما المزايا التي يقدمها، وكيف ستؤثر هذه التقنية الجديدة في حياتنا؟
أولًا؛ كيف طور الباحثون نموذج ذكاء اصطناعي يحاكي الكتابة بخط اليد؟
بدأ الباحثون في جامعة محمد بن زايد للذكاء الاصطناعي تطوير نموذج ذكاء اصطناعي يحاكي الكتابة بخط اليد بدافع الفضول العلمي، إذ يقول الدكتور هشام شولاكال؛ الأستاذ المساعد في قسم الرؤية الحاسوبية في الجامعة وأحد المشاركين في تطوير هذا النموذج الجديد: “أردنا فقط أن نعرف هل يمكن تغذية نموذج ذكاء اصطناعي بعينات مكتوبة بخط يد شخص، واكتشاف هل النموذج سيكون قادرًا على تعرّف نمط خط يد ذلك الشخص ومن ثم كتابة أي شيء وفق النمط نفسه”.
وقد قدم الباحثون النتائج الأولية لهذا البحث في عام 2021، خلال أعمال المؤتمر الدولي للرؤية الحاسوبية، وألقوا الضوء وقتها على المقاربات السابقة التي حاولت محاكاة نمط الكتابة باليد التي طُورت باستخدام تقنية التعلم الآلي المعروفة باسم (الشبكات التوليدية التنافسية) GANs، وهي تقنية يمكنها محاكاة نمط خط اليد، بما يشمل: محاكاة درجة ميلان الخط الذي يكتب به الشخص الحروف، أو درجة سُمك الخط؛ غير أن هذه التقنية تواجه صعوبة عندما يتعلق الأمر بمحاكاة نمط كتابة كل حرف، وكذلك الخطوط التي تربط بين هذه الحروف.
ولمعالجة هذه المشكلة، استخدم الباحثون تقنية (مُحولات الرؤية) Vision Transformers – بدلًا من تقنية (الشبكات التوليدية التنافسية) – وهي نوع من الشبكات العصبية المصممة لمهام الرؤية الحاسوبية، وقد ركز الباحثون في بحثهم في دراسة كيفية استخدام هذه المحولات لمحاكاة الكتابة باليد.
وتُعد تقنية (مُحولات الرؤية) بديلًا مثاليًا لتقنية (الشبكات التوليدية التنافسية) لأنها تعمل على معالجة ما يُعرف باسم (التبعيات الطويلة المدى)، ويشير هذا المفهوم إلى العناصر التي تتكون منها الصورة والكيفية التي تتباعد بها عن بعضها، والمعنى الذي تشكله العلاقة بين هذه العناصر في الصورة على الرغم من تباعدها.
ويوضح الدكتور فهد خان؛ وهو نائب رئيس قسم الرؤية الحاسوبية في الجامعة وأستاذ مشارك في القسم وأحد المشاركين في تطوير هذا النموذج الجديد، قائلًا: “تتطلب محاكاة نمط كتابة خط اليد لشخص ما النظر إلى النص المكتوب بأكمله حتى نتمكن من فهم طريقة الربط بين الحروف، أو بين أشكال الحروف، أو بين الكلمة وكلمة أخرى، ويتطلب رصد كل هذه العناصر رؤية مجالية شاملة، وتحقيق هذا الهدف اعتمادًا على الشبكات العصبية التلافيفية (CNNs) ليس بالأمر السهل، وهذه كانت الفجوة التي اكتشفها فريقنا البحثي وعلاجها اعتمادًا على المحولات”.
ثانيًا؛ ما مدى دقة هذه التقنية الجديدة؟
أطلق الباحثون على التقنية التي طورها اسم محول الكتابة اليدوية (HWT)، ولمعرفة مدى دقتها، قارنوها مع تقنيتين أخرتين لتوليد الكتابة اليدوية، هما: GANwriting، و Davis et al، إذ عرضوا النصوص المكتوبة بخط اليد التي أنتجتها التقنيات الثلاثة على 100 شخص وسألوهم عن النموذج الذي يفضلونه. وأظهرت النتائج أن المشاركين في الدراسة فضلوا تقنية محول الكتابة اليدوية (HWT) بنسبة تبلغ 81%.
وبهدف التأكد من مستوى أداء النموذج الذي طوره الباحثون، يقول الدكتور سلمان خان، الأستاذ المشارك في قسم الرؤية الحاسوبية، وأحد المشاركين في تطوير هذا النموذج الجديد: “لقد عرضنا النص المولد باستخدام التقنية الجديدة على مجموعة من الأشخاص الذين طُلب منهم مقارنة النص المولد بالنص الأصلي، والمفاجأة أن الكتابة اليدوية التي أُنشئت كانت جيدة جدًا إلى درجة أن المشاركين في هذه التجربة لم يتمكنوا من التمييز بين خط اليد المقلد وخط اليد الفعلي، وكان من المُرضي رؤية هذه النتيجة”.
ثالثًا؛ هل تدعم هذه التقنية اللغة العربية؟
ركز الفريق دراسته الأولية في محاكاة خط اليد باللغة الإنجليزية، ولكن يهتم الفريق كذلك باستخدام التقنية نفسها مع لغات أخرى، أبرزها: اللغة العربية التي يصعب تحليلها بسبب الطريقة التي ترتبط بها الحروف العربية في نص مكتوب بخط اليد.
رابعًا؛ كيف ستؤثر هذه التقنية الجديدة في حياتنا؟
يمكن لهذه التقنية أن تساعد الأشخاص الذين يعانون من إصابات تمنعهم من استخدام القلم، كما يمكن استخدامها بكفاءة لتوليد كمية كبيرة من البيانات لتحسين قدرة نماذج التعلم الآلي على معالجة النصوص المكتوبة بخط اليد.
ولكن في الوقت نفسه قد يساء استخدام هذه التقنية لتزييف خط اليد لأي شخص، الأمر الذي يجعلنا نقف أمام قضايا جديدة تتعلق بالاحتيال والمستندات المزورة، ومن المثير للدهشة أن نتائج النماذج الحالية لا يمكن تمييزها تقريبًا عن النص الحقيقي الذي صاغته اليد البشرية.
فعلى سبيل المثال: لا يتطلب النموذج الذي طوره الباحثون في جامعة محمد بن زايد للذكاء الاصطناعي الكثير من البيانات للتدريب، وكل ما يحتاج إليه هو بضع فقرات أصلية مكتوبة بخط اليد المراد محاكاته فقط؛ ومع هذا التطور يوجد هامش خطر يوضحه الدكتور راو محمد أنور، الأستاذ المساعد في قسم الرؤية الحاسوبية؛ وأحد المشاركين في تطوير هذا النموذج الجديد، قائلًا: “إننا في فريق العمل حذرون للغاية وندرك أنه قد يساء استخدام هذه التقنية التي تحاكي جزءًا من هوية الشخص ألا وهي كتابة خط اليد، وهذا أمر نأخذه على محمل الجد ونفكر فيه مليًا قبل أن نأخذ خطوة نشر استخدام هذه التقنية”.
ومن جانبه قال الدكتور تشولاكال: “إن النتائج الجديدة التي توصلنا إليها تعزز الوعي بالتهديدات المحتملة، إذ إنه من المهم إدراك أن استخدام الذكاء الاصطناعي لتوليد خط يحاكي نمط خط يد الإنسان هو أمر ممكن، على الرغم من المخاطر المحتملة.