مقابلتنا في معرض جيتكس 2018 ، انقر هنا لمعرفة المزيد
  • Arabic
  • 2
    product2
    offline media
     
     
    المقالات الشائعة
    sentiment-analysis
    26 أكتوبر, 2019

    تحليل المشاعر: هل السخرية ايجابية أم سلبية أم محايدة؟

    15 دقيقة قراءة

    أكدت دراسات حديثة أن الأشخاص الساخرون عادة ما يكونون أذكى، بل وأكثر نجاحًا من غيرهم. لكن و بغض النظر عن مدى دقة هذه النتائج، فإن السخرية تظل تمثل طريقة مثيرة للاهتمام للتفاعل والتواصل بين الناس، بل وأحيانًا بين أشخاص من بلدان وثقافات مختلفة. السخرية هي استخدام المفارقة من أجل الضحك من شيء أو شخص ما أو لإظهار الازدراء. لكن ما الدور الذي يمكن أن تلعبه في تحليل الشعور؟


    السخرية، ببساطة، هي عندما يكتب شخص ما شيئًا معينًا، لكنه يعني عكس ما كتبه تمامًا. يستخدم الناس السخرية على كل الشبكات الاجتماعية تقريبًا، وبالأخص على تويتر. ما يجعل مهمة أدوات مراقبة وسائل التواصل الاجتماعي أكثر صعوبة عند إجراء تحليل دقيق للمشاعر. هل من الممكن إذا تحديد المشاعر خلف السخرية؟ وإذا كانت الإجابة بنعم، فهل هي مشاعر محايدة أم إيجابية أم سلبية؟


    قبل الدخول في تفاصيل قياس السخرية وفهم كيف من الممكن تطبيق تحليل الشعور، نحتاج لأخذ خطوة إلى الوراء. دعونا أولاً نتعرف على علم معالجة اللغات الطبيعية (NLP) لشرح الكيفية التي تستقبل بها أجهزة الكمبيوتر اللغات البشرية وتتفاعل معها.

    تحليل المشاعر ومعالجة اللغات الطبيعية

    الـ NLP هو أحد فروع الذكاء الاصطناعي (Artificial Intelligence-AI) الذي يدرس التفاعل بين أجهزة الكمبيوتر واللغات الطبيعية -وهي جميع اللغات التي صنعها البشر. بطريقة أخرى، تهتم بقدرة برامج الكمبيوتر على معالجة اللغات البشرية وفهمها. إنه مجال مليء بالتحديات، لأن أجهزة الكمبيوتر استقبلت في الماضي خطاب الإنسان من خلال لغات برمجة مركبة، مثل: Java و Ruby و C. في هذه الحالة، وجدت أجهزة الكمبيوتر أنه من الأسهل تحليل المشاعر بناء على هذا الخطاب المحدد والواضح. مع ذلك، تحاول معالجة اللغات جعلهم يفهمون الخطاب البشري العادي. المشكلة هي أنه خطاب غامض وعادة ما يحمل معانٍ ملتبسة. يعتمد أيضا على متغيرات كثيرة مثل السياق واللهجات المحلية.

     تعتمد أحدث أساليب المعالجة اللغوية وأحدث خوارزمياتها على التعلم الآلي (Machine Learning - ML)، وهو أيضًا نوع من الذكاء الاصطناعي، لكنه يدرس الأنماط المتكررة في البيانات، ويستخدمها للمساعدة على تحسين فهم برنامج الكمبيوتر. إذا، كيف يختلف التعليم الآلي عن المعالجة اللغوية؟ وكيف يساعدان في تحليل اللغات البشرية وتحليل المشاعر؟ ببساطة ، النقاط التالية يمكن أن تفسر الفرق. تهدف المعالجة اللغوية إلى بناء أنظمة أو برامج قادرة على فهم اللغة. بينما يهدف التعلم الآلي إلى بناء أنظمة أو برامج قادرة على التعلم من خلال التعرف على الأنماط واكتساب الخبرات. معًا، NLP و ML ، يهدفان لإنشاء أنظمة أو برامج بإمكانها أن تتعلم كيف تكون منطقية ولديها قدرة على فهم اللغة.

    السخرية وتحليل الشعور

    كيف يمكننا ربط كل هذا بالسخرية وتعريف تحليلها للشعور؟ لقد أصبحت السخرية لغة في حد ذاتها، وتسببت في فقدان بعض الكلمات وفي بعض الأحيان، عبارات كاملة لمعناها الحرفي. ذلك لأن الناس نادرًا ما يستخدمونها في أي سياق غير السخرية. لذلك عادة ما يعتبر الناس السخرية شكلاً من أشكال النقد، لكن في نسخة أكثر تهذيبًا. إنها مثل إهانة أكثر لطفاً، كما يصفها بعض خبراء اللغة. علاوة على ذلك، فإن لها صفتان متناقضتان عادة ما تجعلان من الصعب على الناس فهم المعنى الكامن وراءها: السخرية أمر مضحك وفي نفس الوقت تصرف مؤذي أحيانا. ينظرون الناس للسخرية بطرق مختلفة، قد تبدو بعض العبارات إيجابية لشخص ما، وسلبية لشخص آخر. تخيل كم سيكون من الصعب على أجهزة الكمبيوتر أن تقرر وتتمكن بدقة من تحليل الشعور. يبقى السؤال الأهم الذي يجب التفكير فيه هو إن كان من الممكن لأجهزة الكمبيوتر الكشف عن السخرية عند معالجتها للغة؟


    إن ما يجعل اكتشاف السخرية أصعب من اكتشاف الاستخدامات الأخرى لمعالجة اللغات الطبيعية (NLP)، مثل تحديد رسائل البريد الإلكتروني غير المرغوبة على سبيل المثال، هو أنه لا توجد مفردات معينة يربطها الناس بالجمل الساخرة. تختبأ السخرية في سياق الجملة، إما في لهجتها أو تناقضها. لا يستطيع الكمبيوتر الكشف عن تعبيرات الوجه لتحليل للشعور، لذا يجب أن يفهم أن الشخص الذي كتب الجملة الساخرة، يعني في الواقع عكس ما كتبه. هذا ما فكر به ماتيو كليشيه، عالِم البيانات والباحث الفيزيائي الحاصل على الدكتوراه من جامعة كورنيل في الولايات المتحدة، في البداية عندما تسائل حول إمكانية بناء جهاز لكشف السخرية.

    كاشف السخرية عبر الإنترنت

    تفقد كليشيه أكثر من مائة ألف تغريدة سواء حملت علامة\هاشتاج #Sarcasm أو لم تحمل، ليعمل على خوارزمية تصنيف بإمكانها التفريق بين الجمل الساخرة وغير الساخرة، مما يساعد على تحديد تحليل أدق للشعور. في يوليو 2014 ، قام ببناء تطبيق ويب "كاشف للسخرية" باسم (Online Sarcasm Detector) ، يسمح للمستخدمين باختبار الكاشف بأنفسهم. وهنا كيف تمكن من فعل ذلك:

    كيف حصل على البيانات؟

    • عبر واجهة البرمجة الخاصة بتطبيق تويتر (Application programming interface-API)، تتبع التغريدات خلال فترة زمنية معينة واختار بعض التغريدات التي تحمل علامة\هاشتاج #Sarcasm، وبعض التغريدات التي لم تحمل أي علامة. واعتمد على الناس ليقرروا ما إذا كانت التغريدات ساخرة أم لا.
    • وفر له تويتر كل الأمثلة التي احتاجها.

     

    المعالجة المسبقة للبيانات

    • قام بحذف التغريدات التي استخدمت صورة أو رابط في السخرية، كما أزال أي هاشتاج أو تعليق.
    • كما حذف التغريدات المكررة.
    • بعد حذف كل هذه "المشتتات"، كما وصفها كليشيه، قام بإضافة التغريدات المكونة من ثلاث كلمات فقط إلى مجموعة البيانات.

     

    الميزات التقنية المستخدمة

    صمم كليشيه العديد من الميزات التي تساعد في تصنيف التغريدات إلى ساخرة وغير ساخرة.

    • Uni-grams: وهي كلمات مثل "رائع"، أو Bigrams والتي تتكون من كلمتان عادة ما تُذكران سويًا مثل "زبدة الفول السوداني". لاستخلاص الBigrams، تم تبسيط الكلمات ليسهل تحليلها.
    • الشعور: كان لدى كليشيه فرضية مفادها أن التغريدات الساخرة تحمل مشاعر متناقضة عند تحليلها شعوريًا. كان يعتقد أنها تبدأ بشكل إيجابي للغاية، ولكنها تنتهي بشكل سلبي. لتحليل الشعور، قام بتقسيم كل تغريدة إلى جزأين وثلاثة أجزاء، واختبر كل جزء على حدى. قام بحساب الدرجات باستخدام أداتين من أدوات تحليل المشاعر SentiWordNet و TextBlob.
    • الموضوعات: كثيرا ما تستخدم بعض الكلمات سوية في التغريدات، وتسمى هذه المجموعة من الكلمات بالمواضيع. يتم جمع هذه المواضيع من كل التغريدات، ويتم تصنيفها استنادًا إلى الموضوعات المرتبطة بشكل أكبر بالسخرية.

     

    النتائج التي توصل إليها:

    على مدار ثلاثة أسابيع، جمع كليشيه تغريدات خلال كأس العالم 2014. جاءت النتائج التالية من تحليل الشعور الناتجة عن المُصنِّف:

    • التغريدات الساخرة أكثر إيجابية من التغريدات غير الساخرة.
    • عادة ما يكون اﻟﻧﺻف اﻷول ﻣن اﻟﺗﻐرﯾدة اﻟﺳﺎﺧرة إيجابيًا، بينما اﻟﻧﺻف اﻟﺛﺎﻧﻲ ﻋﺎدة أﮐﺛر ﺳﻟﺑﯾﺔ.
    • التغريدات الساخرة أكثر قدرة على التعبير عن المشاعر من التغريدات غير الساخرة.
    • المواضيع التي تشمل هذه الكلمات (قميص الفريق، مماطلة، حار، شكوى، العاصفة، أمي) عادة ما يربطها الناس بتغريدات غير ساخرة. في حين يتم ربط هذه الكلمات (الحب، الحياة، اليوم، لول (lol)، يشعر، سيء) عادة بالتغريدات الساخرة.


    تحليل السخرية والمشاعر في الخوارزميات

    مع تطور علم معالجة اللغات الطبيعية يوم بعد يوم، ستتمكن أجهزة الكمبيوتر والبرامج من تطوير فهم أفضل للغات البشرية. وعلى الرغم من أن أجهزة الكمبيوتر تجد صعوبة في فهم السخرية عند إجراء تحليل دقيق للمشاعر، فإن الخوارزميات في تحسن مستمر ومبهر وأجهزة الكمبيوتر تصبح أكثر ذكاءً يوما بعد يوم.

    المقالات الشائعة

    اصدار IPhone X ... وهذا ما يقوله الناس عنه

    اصدار iPhone X خبر هام لأولئك المغرمين بمنتجات Apple. كثيرون كانوا في انتظار اصدار iPhone 8، لكنهم فوجئوا باصدار طرازين من iPhone لكل منهما ميزات مختلفة. ربما كانت شركة Apple تحاول استهداف شريحتين مختلفتين من المستخدمين، لكن iPhone X حقق نجاحًا كبيرًا وأثار ضجة كبيرة.

    20819033_1491914160874715_3466667812760742552_o2
    28 دقيقة قراءة

    سيارات تألقت في معرض دبي للسيارات

    الذي استمر 4 أيام، خلق ضجة كبيرة على منصات التواصل الاجتماعي، وكان معظمها مرتبطًا بالسيارات المعروضة. راقبت Crowd Analyzer الحدث لتضع التقرير التالي والذي يتضمن احصاءات...

    20819033_1491914160874715_3466667812760742552_o2
    42 دقيقة قراءة

    هكذا نحافظ على انتاجيتنا في كراود اناليزر

    تؤكد العديد من الدراسات على تأثير الطريقة التي يعمل بها الإنسان والمكان الذي يجلس فيه على مستوى إنتاجيته. على سبيل المثال، الجلوس لفترة طويلة يضر عظامنا وصحتنا العامة. تحث الأبحاث أيضًا على استخدام تقنية Pomodoro، وهي طريقة نعتمدها في كراود اناليزر ونحث فريقنا على اتباعها. تتمثل النتيجة الأساسية...

    20819033_1491914160874715_3466667812760742552_o2
    10 دقيقة قراءة