في الشهر الماضي، أطلقت شركة OpenAI أحدث منتجاتها من برامج المحادثة الآلية التي تعمل بالذكاء الاصطناعي، GPT-4. ووفقًا لموظفي OpenAI، فقد اجتاز البرنامج، الذي يستخدم التعلم الآلي لتوليد نص باللغة الطبيعية، اختبار نقابة المحامين بنتيجة 90.ي النسبة المئوية، اجتازوا 13 من 15 اختبار AP وكان لديهم درجة شبه مثالية في الاختبار الشفهي GRE.
كان الهدف من التحقيق هو معرفة مدى نجاح تقنية OpenAI في اختبارات المحاسبة. لذا، قاموا باختبار النسخة الأصلية، ChatGPT. يقول الباحثون إنه على الرغم من أن هذه التقنية لا تزال ذات أهمية كبيرة في المحاسبة، إلا أنها ستغير الطريقة التي ندرس بها والطريقة التي يتعلم بها الجميع – للأفضل.
وقال ديفيد وود، أستاذ المحاسبة في جامعة بريغهام يونغ، والمؤلف الرئيسي للدراسة: “عندما ظهرت هذه التكنولوجيا لأول مرة، كان الجميع قلقين من أن الطلاب قد يستخدمونها الآن للغش. لكن فرص الغش كانت موجودة دائمًا. لذلك، نحاول التركيز على ما يمكننا فعله بهذه التكنولوجيا الآن والذي لم نتمكن من فعله من قبل لتحسين عملية التدريس لأعضاء هيئة التدريس وعملية التعلم للطلاب. لقد كان الاختبار مذهلاً”.
منذ ظهوره لأول مرة في نوفمبر 2022، أصبح ChatGPT أسرع منصة تقنية نموًا على الإطلاق، حيث وصل إلى 100 مليون مستخدم في أقل من شهرين. واستجابةً للنقاش المكثف حول كيفية تأثير نماذج مثل ChatGPT على التعليم، قرر وود تجنيد أكبر عدد ممكن من الأساتذة لمعرفة أداء الذكاء الاصطناعي في مواجهة طلاب المحاسبة الجامعيين الفعليين.
انتشرت فكرة تجنيد مؤلف مشارك على وسائل التواصل الاجتماعي: شارك 327 مؤلفًا مشاركًا من 186 مؤسسة تعليمية في 14 دولة في البحث، وساهموا بـ 25181 سؤالاً في اختبار المحاسبة الفصلي. كما قاموا بتجنيد طلاب جامعيين في جامعة بريغهام يونغ (بما في ذلك ابنة وود، جيسيكا) لتغذية ChatGPT بـ 2268 سؤالاً آخر من بنك اختبار الكتب المدرسية. غطت الأسئلة أنظمة المعلومات المحاسبية (AIS)، والتدقيق، والمحاسبة المالية، والمحاسبة الإدارية والضرائب، وتنوعت في الصعوبة والنوع (صواب / خطأ، واختيار من متعدد، وإجابة قصيرة، وما إلى ذلك).
ورغم أن أداء ChatGPT كان مثيرًا للإعجاب، إلا أن أداء الطلاب كان أفضل. فقد سجل الطلاب متوسطًا إجماليًا بلغ 76.7%، مقارنة بنتيجة ChatGPT البالغة 47.4%. وفي 11.3% من الأسئلة، سجل ChatGPT درجات أعلى من متوسط الطلاب، وأدى أداءً جيدًا بشكل خاص في AIS والتدقيق. لكن أداء روبوت الذكاء الاصطناعي كان أسوأ في التقييمات الضريبية والمالية والإدارية، ربما لأن ChatGPT عانى من الحسابات المطلوبة للنوع الأخير.
عندما يتعلق الأمر بنوع السؤال، كان أداء ChatGPT أفضل في أسئلة الصواب والخطأ (68.7% صحيحة) وأسئلة الاختيار من متعدد (59.5%)، لكنه واجه صعوبة في أسئلة الإجابة القصيرة (بين 28.7% و39.1%). بشكل عام، كان من الصعب على ChatGPT الإجابة على الأسئلة ذات التصنيف الأعلى. في الواقع، قد يوفر ChatGPT أحيانًا أوصافًا مكتوبة موثوقة للإجابات غير الصحيحة، أو يجيب على نفس السؤال بطرق مختلفة.
قالت جيسيكا وود، وهي طالبة حاليًا في جامعة بريغهام يونغ: “إنه ليس مثاليًا؛ ولن تستخدمه في كل شيء. إن محاولة التعلم باستخدام ChatGPT فقط هي مهمة صعبة”.
وكشف الباحثون أيضًا عن بعض الاتجاهات الأخرى المثيرة للاهتمام من خلال الدراسة، بما في ذلك:
- لا يتعرف ChatGPT دائمًا على وقت إجراء العمليات الحسابية ويرتكب أخطاء غير منطقية مثل إضافة رقمين في مسألة طرح أو قسمة الأرقام بشكل غير صحيح.
- غالبًا ما يقدم ChatGPT تفسيرات لإجاباته، حتى لو كانت غير صحيحة. وفي أحيان أخرى، تكون أوصاف ChatGPT دقيقة، ولكنها ستستمر بعد ذلك في اختيار إجابة اختيارية متعددة خاطئة.
- في بعض الأحيان، يقوم ChatGPT باختلاق الحقائق. على سبيل المثال، عند توفير مرجع، فإنه ينشئ مرجعًا حقيقيًا مختلقًا تمامًا. في بعض الأحيان لا يكون العمل والمؤلفون حاضرين.
ومع ذلك، يتوقع المؤلفون تمامًا أن يعمل GPT-4 على تحسين الأسئلة المحاسبية التي طرحتها دراستهم، والقضايا المذكورة أعلاه بشكل كبير. وما وجدوه أكثر إيجابية هو كيف يمكن لروبوت المحادثة أن يساعد في تحسين التدريس والتعلم، بما في ذلك القدرة على تصميم واختبار المهام، أو ربما استخدامها لصياغة أجزاء من مشروع.
قالت ميليسا لارسون، أستاذة المحاسبة في جامعة بريغهام يونغ والمؤلفة المشاركة في الدراسة: “إنها فرصة للتفكير فيما إذا كنا ندرس معلومات ذات قيمة مضافة أم لا. هذا يشكل تغييراً جذرياً، ونحن بحاجة إلى تقييم المسار الذي نسلكه من هنا. بالطبع، سأظل أحصل على مساعدين تدريس، لكن هذا سيجبرنا على استخدامهم بطرق مختلفة”.
إرسال تعليق