أخبار

LLM النماذج اللغوية الكبيرة : كيف؟ ولماذا؟


يقوم هذا الفيديو على فكرة تعالج “إزالة الغموض عن النماذج اللغوية.” الفيديو يوفر نظرة عامة شاملة على موضوع النماذج اللغوية الكبيرة (LLMs)، ويقصد بالنماذج اللغوية نماذج الذكاء الاصطناعي المختلفة التي أصبحت حياتنا لا تخلو من تدخلها لتوفير معلومة أو فهم أو الإجابة عن سؤال أو عن فضول.

وبينما هي تفعل ذلك، ينبغي التذكير أنها ليست مصممة لكي تفهم ما تقول وتكتب، ولو أنها تفعل ذلك ببراعة في الأغلب.

في البدء تعرف هذه الأدوات على أنها أنظمة تنبؤ إحصائية متطورة، لا تفهم المعنى بالطريقة البشرية، بل تتنبأ بالكلمة التالية بناءً على تحليل الأنماط.

يشرح الفيديو كيف تعالج النماذج اللغة عن طريق تقسيم النص إلى “رموز” (Tokens) وتحديد الكلمة الأكثر احتمالية في سياق الجملة، مع الإشارة إلى أهمية التحول الثوري الذي أحدثته بنية الترانسفورمر في معالجة الجملة كاملة.

كما يناقش مراحل تدريب النماذج (التدريب المسبق والضبط الدقيق)، ويختتم بذكر التحديات الجسيمة التي تواجهها هذه التقنية مثل “ظاهرة الهلوسة”، والتحيز، ووراء هذا وذاك هناك تأثيرها الهائل على البيئة من خلال مقادير الطاقة المستهلكة، بالإضافة إلى أن الفيديو يلقي نظرة مستقبلية على كفاءة النماذج وتعدد وسائطها.


وفي هذا الإيجاز سنحاول تقديم نظرة عامة على نماذج اللغة الكبيرة (LLMs)، بدءًا من مفاهيمها الأساسية وصولا إلى تأثيرها الاجتماعي.

يمكن شرح كيفية عمل هذه النماذج بأنها تنهض على آلية بسيطة لكنها فعالة، هي آلية توقع الكلمات بناءً على الاحتمالات، واستخدام “الرموز المميزة” (tokens) لمعالجة اللغة وتحليل السياق.

كما نركز أيضًا على عملية تدريب النماذج التي تشمل مرحلتين هما: مرحلة التكوين الأولي والتنقيح، ومرحلة تسليط الضوء على بنية “المحولات” (Transformers) وميكانيكية “الانتباه الذاتي” (self-attention) باعتبارها العناصر المعمارية المهيمنة.

ثم نستكشف مع الفيديو مصادر التحديات والقيود الرئيسية لـLLMs، مثل “الهلوسات” والتحيزات المتأصلة والآثار البيئية، ونناقش التأثيرات الاجتماعية والسياسية لهذه التكنولوجيا، بسبب الحاجة إلى تنظيمها وصولا إلى ضمان الاستخدام المسؤول والمنصف لها.

كيف يتم بناء وتشغيل النماذج اللغوية الكبيرة LLM

هذا سؤال جوهري لفهم آلية عمل النماذج اللغوية الكبيرة (LLMs)، والتي تُعد أدوات مذهلة نتعامل معها يوميًا سواء في البحث أو الترجمة أو استخدام المساعدات الافتراضية.

يمكن تقسيم الإجابة على كيفية بناء وتشغيل هذه النماذج إلى محطتين رئيسيتين: مراحل التدريب والبنية التحتية، وآلية معالجة اللغة والتنبؤ.


أولاً: كيفية بناء وتدريب النماذج اللغوية الكبيرة

يُمكن أن يتم تشبيه بناء النماذج اللغوية الكبيرة بمراحل التعليم البشري، ذلك أن قوّتها ستعتمد على ضخامة البيانات والمعلمات الداخلية.

1. التدريب المسبق (التعليم العام):

تُعد هذه هي المرحلة الأولى، وتُشبه التعليم العام. يقوم النموذج فيها بقراءة كميات هائلة من النصوص التي جُمعت من الإنترنت. الهدف من هذه القراءة الضخمة هو تعلم قواعد اللغة والمنطق العام.

2. الضبط الدقيق (التخصص):

تُشبه هذه المرحلة التخصص الجامعي. يتم فيها أخذ النموذج العام وتدريبه على بيانات متخصصة. هذا التدريب المتخصص يهدف إلى جعله خبيراً في مجال معين، مثل البرمجة أو الطب أو القانون.

3. سبب التسمية بـ “الكبيرة”:

تُسمى هذه النماذج بـ “الكبيرة” لسببين رئيسيين:

  • حجم البيانات: الحجم الخرافي للبيانات التي تتدرب عليها، والذي يعادل ملايين الكتب.
  • عدد المعلمات (Parameters): عدد المعلومات أو المعلمات الداخلية، والتي هي بمثابة مفاتيح تحكم صغيرة جداً. يصل عدد هذه المعلمات إلى المليارات، ويقوم النموذج بتعديلها باستمرار ليتعلم العلاقات المعقدة بين الكلمات.

4. البنية الثورية (الترانسفورمر):

كانت النماذج القديمة تقرأ النص كلمة وراء كلمة، مما كان يسبب مشكلة نسيان بداية الجملة عند الوصول إلى آخرها، ويصعّب فهم العلاقات المعقدة. تغير كل هذا مع ظهور بنية ثورية تُسمى الترانسفورمر (Transformer).

قدمت ورقة بحثية من جوجل في عام 2017 بعنوان “الانتباه هو كل ما تحتاجه” هذه البنية. وقد منحت الترانسفورمر النموذج القدرة على رؤية الجملة بأكملها مرة واحدة وفهم جميع العلاقات بين الكلمات في نفس اللحظة.

5. آلية الانتباه الذاتي:

قدمت بنية الترانسفورمر آلية عبقرية تُسمى الانتباه الذاتي (Self-Attention). يمكن تخيل هذه الآلية كقدرة النموذج على تسليط الضوء على كل كلمة في الجملة ورؤية علاقتها بكل الكلمات الأخرى في الوقت ذاته. هذا هو ما سمح بفهم السياق بشكل أعمق وأدق بكثير.

سمح ظهور بنية الترانسفورمر بحدوث قفزة انفجارية في حجم النماذج؛ حيث انتقلنا من 1.5 مليار معلمة في نموذج GPT-2 عام 2019 إلى 175 مليار معلمة في GPT-3 بعد سنة واحدة فقط.


ثانياً: كيفية تشغيل النماذج ومعالجة اللغة

النماذج اللغوية هي في الأساس أدوات مصممة لفهم وتوليد النصوص البشرية.

1. الفهم الإحصائي وليس الفلسفي:

من المهم التوضيح أن هذه النماذج لا تفهم المعنى مثل البشر، ولا تفكر أو تستنتج. الأفضل تخيلها كـ “خبيرة إحصائية عبقرية جداً” لا كفيلسوف.

مهمتها الأساسية هي التنبؤ بالكلمة التالية الأنسب في أي جملة. ويتم ذلك بناءً على تحليل الأنماط الموجودة في مليارات النصوص التي تدربت عليها.

2. تحويل النصوص إلى توكنز (Tokens):

لا يقرأ الكمبيوتر الكلمات والجمل كما نراها نحن. بدلاً من ذلك، يقوم بتكسير النص إلى قطع صغيرة جداً تُسمى التوكنز (Tokens). التوكنز هي اللغة التي يفهمها الذكاء الاصطناعي. يمكن أن يكون التوكن كلمة كاملة أو جزءاً من كلمة، وهذا يمنح النموذج مرونة هائلة للتعامل مع تركيبات وقواعد جميع لغات العالم.

3. عملية التنبؤ السياقي:

تتم قوة النظام وعبقريته الحقيقية في كيفية استخدام التوكنز للتنبؤ:

  1. إذا كانت هناك جملة ناقصة، يقوم النموذج بتحويلها إلى توكنز.
  2. يسأل النموذج نفسه: “ما هي الكلمة التي من المفترض أن تأتي بعدها؟”.
  3. بناءً على تدريبه الضخم، يحسب النموذج الاحتمالات لكل كلمة محتملة.
  4. يختار النموذج الكلمة التي حصلت على أعلى نسبة احتمال.

4. أهمية السياق:

السياق هو الملك. الدقة في التنبؤ لا تأتي من تخمين الكلمة التالية بناءً على الكلمة التي تسبقها فقط. بل يكمن السر كله في تحليل السياق الكامل للجملة.

على سبيل المثال، يتمكن النموذج من التفريق بين جملة “ذهبت إلى البنك” التي يرجح أن تكمل بـ “لأسحب بعض المال”، وجملة “جلست على ضفة البنك” التي يرجح أن تكمل بـ “لأستمتع بمنظر النهر”.


ملخص: إن النماذج اللغوية الكبيرة تُبنى عبر تدريب ضخم يمر بمرحلتي التعليم العام (التدريب المسبق) والتخصص (الضبط الدقيق)، مستخدمة بنية الترانسفورمر لفهم السياق الكلي للجملة بدلاً من القراءة المتتابعة.

وتعمل هذه النماذج عن طريق تفكيك النص إلى وحدات (توكنز) واستخدام قدرتها الإحصائية الهائلة للتنبؤ بالكلمة الأكثر احتمالاً بناءً على السياق الكامل.

يمكن النظر إلى عملية التشغيل والبناء هذه كمحرك بحث متطور للغاية، حيث أن المحرك لا “يفهم” نيتك للسفر (المعنى)، ولكنه ممتاز في التنبؤ بالكلمة التي من المرجح أن تتبع “حجز رحلة إلى” بناءً على مليارات الأنماط التي رآها (الوظيفة الإحصائية).

ما هو تأثير النماذج اللغوية على مستقبل العمل؟

تؤثر النماذج اللغوية الكبيرة (LLMs) تأثيراً عميقاً يتجاوز مجرد كونها برامج حاسوب متطورة، حيث إنها تعيد تشكيل كل شيء حولنا، مما يمس بشكل مباشر مستقبل العمل والهيكل التنظيمي والاجتماعي للعالم.

إليك تفصيل الكيفية التي ستؤثر بها هذه التقنية على هذين المجالين الرئيسيين بناءً على ما ورد في الفيديو، والمصادر التي اقتبس منها الفكرة:

أولاً: التأثير على مستقبل العمل وسوق العمل

تُعد هذه التقنية عاملاً أساسياً في تغيير ديناميكيات التوظيف والمهارات المطلوبة.

  1. إعادة تشكيل سوق العمل: إن النماذج اللغوية الكبيرة “قاعدة تعيد تشكيل كل شيء حولنا من سوق العمل”. هذا يشير إلى تغييرات هيكلية في طبيعة الوظائف، وربما استبدال بعض المهام الروتينية، وظهور وظائف جديدة تتطلب التفاعل مع أدوات الذكاء الاصطناعي.
  2. مبادرات الكفاءة والتخصص: تتجه الأبحاث حالياً إلى بناء نماذج “أصغر وأقوى وتستهلك طاقة أقل” (الكفاءة). هذا التطور قد يجعل دمج التقنية في بيئات العمل أصغر وأكثر انتشاراً وأقل تكلفة، مما يزيد من معدلات أتمتة المهام. كما أن النماذج يتم تدريبها للوصول إلى “التخصص الجامعي” (الضبط الدقيق) لتصبح “خبيرة في مجال معين مثل الطب أو القانون أو البرمجة”، مما يعني تحولاً في آليات الإنتاج المتخصص.

ثانياً: التأثير على التنظيم الاجتماعي وتركيز القوة

الآثار المترتبة على التنظيم الاجتماعي أعمق بكثير، وتتعلق بتوزيع القوة، وبنوعية العلاقات البشرية.

  1. تركيز القوة: تساهم هذه التقنية في “تركيز القوة في يد شركات قليلة”. بما أن بناء وتدريب هذه “الوحوش الرقمية” يتطلب بيانات هائلة وتكاليف بيئية ضخمة، فإن القدرة على تطويرها والتحكم فيها تنحصر في يد عدد محدود من الكيانات، مما قد يؤدي إلى تداعيات تنظيمية واجتماعية تتعلق بالهيمنة على المعلومات أو احتكار القدرة على الابتكار.
  2. تغيير العلاقات الاجتماعية وطرح الأسئلة الوجودية: تتجاوز التقنية مجرد التطبيقات الوظيفية؛ فهي “تطرح أسئلة وجودية عن طبيعة علاقاتنا الاجتماعية في المستقبل”. هذه النماذج ليست مجرد “أداة متطورة” أو “مساعد شخصي ذكي”، بل قد تكون “شيئا جديدا تماماً لم نتوقع مثله من قبل”.
  3. الحوار العالمي حول التنظيم: في ضوء القوة الهائلة لهذه النماذج، بدأت بوادر “حوار عالمي يناقش بجدية كيفية تنظيمها ووضع قوانين لها”. هذا الوضع يشير إلى الحاجة الملحة لإقامة أطر تنظيمية تتحكم باستخدامها وتحد من مخاطرها، مثلما هو شأن ظاهرة الهلوسة (تأليف معلومات خاطئة ومقنعة)، أو مشكلة التحيز (استخدام يستند إلى تعلم الصور النمطية والتحيزات المجتمعية وتضخيمها)، أو خطر الاستخدام السيئ (نشر الأخبار الكاذبة والكراهية).
  4. المرآة العاكسة: تُعتبر هذه النماذج في النهاية “مجرد مرآة ضخمة تعكس لغتنا، معرفتنا، وثقافتنا، وتتعدى ذلك حتى إلى تحيزاتنا كبشر”. وبالتالي، فإن تأثيرها الاجتماعي سيعتمد بشكل كبير على ما سيتعلمه البشر من هذه المرآة وكيف يقررون استخدام هذه القوة “لبناء مستقبل أفضل”.

باختصار، النماذج اللغوية الكبيرة ليست مجرد تحسينات تكنولوجية، بل هي قوى دافعة تُغير قواعد اللعبة في الاقتصاد الاجتماعي، حيث تتطلب جهداً عالمياً لتنظيمها وتوزيع فوائدها والحد من مخاطر تركيز القوة ومن التأثيرات غير المحسوبة لمختلف أنماط التحيزات.

اظهر المزيد

goals50.com

Goals50.com موقع أهداف 50. موقع لأخبار العلوم والمعارف في العالم، وفي الشرق الأوسط وشمال إفريقيا. موقع يخاطب قراء اللغة العربية أساسا، ولغات أخرى… More »
زر الذهاب إلى الأعلى