بسّام طيارة (باريس)
ماذا يحصل لمنتجاتنا الفكرية بعد الطبع ثم النشر ؟ كتب ومقالات علمية في كافة المجالات وفي كل بقاع هذا «العالم ـ القرية» في جميع لغات الشعوب، كلها أعمال تترجم آليا لتغذي خوارزميات الذكاء الاصطناعي وتزيد من ثروات عدد من الشركات الرقمية التي تعرفمن من أين توكل «الثروة». إليكم السبيل الذي لن يدركه العرب بتعد أن تخلى عنهم الطيب الذكر «محمد بن موسى الخوارزمي».
لتدريب نموذج الذكاء الاصطناعي الخاص بها، قامت الشركة الأم لفيسبوك «ميتا» Meta (1200 مليار دولار) بتطبيق القول المأثور «السارق من السارق كالوارث عن أبيه»، وذلك بتحميل الكتب التي جمعها موقع القرصنة LibGen بشكل غير قانوني، وذلك منذ عام 2022.
على سبيل المثال وحسب موقع Mediapart الفرنسي يبدو أن عددا من الخبراء الفرنسيين اتبعوا أيضاً طريق القرصنة بعد أن عملوا في الشرمة العملاقة «ميتا» و من ثم إطلقوا شركة الذكاء الاصطناعي الفرنسية «ميسترال» Mistral، والتي تحظى بدعم حكومة ماكرون، وتبلغ قيمتها 12 مليار يورو.
وقد رفع العديد من الفنانين والكتاب وكذلك ممثلين وممثلات أو دور نشر دعاوى ضد الشركات العملاقة التي تصنع «نماذج عملاقة للغات » Large Language Model l(“LLMs”)، وهي محركات «الذكاء الاصطناعي» AI التوليدي (الذي ينتج النصوص والصور…). وتوجد أمام المحاكم الأميركية ما يزيد عن ٦٨ دعوى من هؤلاء المبدعين الذين يتهمون الشركات المنتجة للذكاء الاضطناعي مثل OpenAI وAnthropic وMeta، بسرقة أعمالهم. إذ يعتبرون انه انتهاك لقانون حقوق النشر، ويتم ذلك بهدف «تدريب» برامجهم والإشارة إلى هذه المعلومات لتستوعبها خوارزميات وتبثها في مراكزهم إذكاء لبرامج الذكاء الاصطناعي الخاص بها.
هذه الدعاوى مهمة جداً في عصر تهيمن فيه شركات الذكاء الاصطناعي والرقميات على مجالات عدة وخصوصاً في ظل ارتفاع قيمتها في بورصات العالم.
نتائج هذه الدعاوى إما أن تثبت قانونية قدرة هذه الشركات العملاقة رواد الذكاء الاصطناعي على «الغرف» من الأعمال الفكرية والمنتجات الفنية المتواجدة على شبكة انترنيت، أو تمهد الطريق لدفع تعويضات هائلة للمؤلفين والفنانين والعلماء الذين استُخدمت أعمالهم دون موافقتهم أو حتى دون علمهم وبالتالي دون تعويضهم مالياً.
وقد كشفت مجلة The Atlantic الأميركية أن Meta درّبت نموذجها للذكاء الاصطناعي التوليدي، باستخدام ملايين الكتب التي جمعها موقع «LibGen»، وهو موقع إلكتروني متخصص بقرصنة المقالات العلمية وينشر على موقعه الملايين منها.
وتُظهر الوثائق العامة أن الباحث ورائد الأعمال «غيوم لامبل» هو من بدأ عملية اختراق عشرات التترابايت TB من البيانات (التيترابايت يساوي مليون غيغابايت الذي يساوي مليار بايت) .
في حين كانت شركة «أوبن إي آي» (Open IA) تستعد لإطلاق ChatGPT. كانت شركة «مارك زوكربيرغ» مالك شركة «ميتا» (فيسبوك) تدرك أنها متأخرة عن الركب، فأطلقت فريقين للعمل على إنشاء آلة لتعلم اللغة (LLM) أحدهما في الولايات المتحدة والآخر في فرنسا، وكان على الفريقين أن يعملا بشكل سريع على جمع البيانات لتدريب آلة التعلم لإطلاق برنامج ذكاء اصطناعي .
يكمن التحدي في جانبين: من حيث الكم، إذ يتطلب تدريب آلة تعلم اللغة معالجة مليارات الصفحات من النصوص. ومن حيث النوعية أيضًا،إذ أن أن الذكاء الاصطناعي يُحاكي ما يستهلكه ويستوعبه قبل أن يعود لـ«يجتره». من هنا يجب على المهندسين تزويده بنصوص مكتوبة ومنظمة بشكل جيد. ولذلك، تُعدّ الكتب والمقالات العلمية مصادر قيّمة للغاية بالنسبة لكافة الشركات الساعية لإطلاق برامج ذكاء اصطناعي.
من هنا برزت مسألة استخدام LibGen وهو مشروع تعاوني، أُنشئ مدفوعًا بثقافة القرصنة بهدف إتاحة المقالات البحثية والأعمال الأدبية وغيرها مجانًا للجميع، وقد جمع الموقع أكثر من 6 ملايين كتاب وما لا يقل عن 80 مليون مقال علمي.
في أكتوبر/تشرين الأول عام 2022، بدأت عمليات التنزيل (أي القرصنة) ودامت عدة أشهر، وانصبّت بشكل أساسي على القسم العلمي من مكتبة LibGen.
وقد استخدم المهندسون بروتوكول «تورنت» Torrent، وهي تقنية ند للند (P to P) تسمح بتنزيل ملفات من آلاف المستخدمين الآخرين في آن، وتضمن هذه التقنية أيضاً إتاحة الملفات التي تم تنزيلها لمستخدمي الإنترنت بشكل مباشر، مما يُسهّل عمليات القرصنة مستقبلاً (أي احترار المعلومات السابقة).
يُقدّر المدّعون أمام المحاكم الأميركية أن الفرنسيين قاموا بتنزيل ما يقارب 70 تيترابايت من البيانات إجمالاً تركوها لدى ميتا واستجلبوا نسخ منها لإنشاء شركتهم الناشئة.
في سبتمبر 2023، نشرت شركة Mistral AI الفرنسية نموذجها ميسترال 7B، بأداء يُضاهي أداء منافسيها الأمريكيين. وبدأ المؤسسون المشاركون في شركة Mistral يبحثون عن مستثمرين، بعد أن وعدوا باستخدام بيانات تعهدت الشركة الناشئة بالتفاوض بشأن اتفاقيات ترخيص لها خوفاً من الدعاوى التي يمكن أن تلاحقهم في أوروبا.
أما ما يحصل خلف الأطلسي في أميركا فيطرح أسئلة عديدة حول كيفية حماية الحقوق في ظل التوجه العام الحالي (والسابق) لاعتبار أن القوانين تحمي داحل الولايات المتحدة وتسمح بتطبيقها خارج حدودها في كافة دول العالم بما يحاكي مسائل العقوبات الأميركية المفروضة خارج حدودها.
وبالتالي فمن المستبعد أن يحصل أصحاب الحقوق في المحاكم الأميركية تغويضات وأقصى ما يمكن أن تفرضه ضمائر القضاة قد يكون حفظ حقوق في … المستقبل، أي أن ما فات …مات!
هذه المغامرة الرقمية إن دلت على شيء فهو أن كل ما يدور على الشبكة وكل ما يتم نشره – حتى قبل أن يصل إلى عنكبوت أنترنت – يقوم بتغذية خوارزميات شركات الرقميات الكبرى ويجلب لها ثروات تقدر بمئات المليارات أكان عبر الاشتراكات أم عبر اسقاط قيمة الاشتراكات العالمية على وزنها في بورصات العالم.