Sunday, 14 January 2018

Estimasi - معلمة regresi - logistik ثنائي - خيارات


إشعار: أنت تعرض نسخة قديمة من هذه الصفحة. يمكن العثور على المحتوى الجديد في النطاق الجديد stats. idre. ucla. edu. يمكنك أيضا مسح ذاكرة التخزين المؤقت للمتصفح وتحديث هذه الصفحة، والتي يجب أن تعيد توجيهك مباشرة إلى المحتوى المحدث. مرحبا بكم في معهد البحوث الرقمية والتعليم سبس تحليل البيانات أمثلة الانحدار اللوجستي لنسخ معلومات الإصدار: تم اختبار رمز لهذه الصفحة في عب سبس 20. يرجى ملاحظة: الغرض من هذه الصفحة هو إظهار كيفية استخدام مختلف أوامر تحليل البيانات. وهي لا تغطي جميع جوانب عملية البحث التي يتوقع من الباحثين القيام بها. وعلى وجه الخصوص، فإنه لا يغطي تنظيف البيانات وفحصها والتحقق من الافتراضات والتشخيص النموذجي والتحليلات المحتملة للمتابعة. أمثلة على الانحدار اللوجستي المطلوب مثال 1: ترغب شركة أبحاث تسويقية في التحقيق في العوامل التي تؤثر على حجم الصودا (صغيرة أو متوسطة أو كبيرة أو كبيرة جدا) التي يأمر بها الناس في سلسلة الوجبات السريعة. ويمكن أن تشمل هذه العوامل ما هو نوع من شطيرة أمر (برغر أو الدجاج)، أم لا يتم طلب البطاطس أيضا، وعمر المستهلك. في حين أن متغير النتيجة، وحجم الصودا، أمر أمر واضح، والفرق بين مختلف الأحجام ليست متسقة. و ديفيريس بين الصغيرة والمتوسطة هو 10 أوقية، بين المتوسطة والكبيرة 8، وبين الكبيرة والكبيرة الكبيرة 12. مثال 2: باحث مهتم في ما العوامل التي تؤثر على الميدالية في السباحة الأولمبية. وتشمل التنبؤات ذات الصلة في ساعات التدريب، والنظام الغذائي، والعمر، وشعبية السباحة في بلد الرياضيين الوطن. ويعتقد الباحث أن المسافة بين الذهب والفضة أكبر من المسافة بين الفضة والبرونز. مثال 3: دراسة تبحث في العوامل التي تؤثر على قرار ما إذا كان لتطبيق على مدرسة الدراسات العليا. ويطلب من صغار الكلية إذا كان من غير المرجح، من المحتمل إلى حد ما، أو من المرجح جدا أن تنطبق على مدرسة الدراسات العليا. وبالتالي، فإن متغير نتائجنا له ثلاث فئات. يتم أيضا جمع البيانات عن الوضع التعليمي الوالدين، سواء كانت مؤسسة البكالوريوس هي العامة أو الخاصة، و غبا الحالي. لدى الباحثين سبب للاعتقاد بأن المسافات بين هذه النقاط الثلاث ليست متساوية. فعلى سبيل المثال، قد تكون المسافة بين احتمال غير محتمل وأرجح إلى حد ما أقصر من المسافة بين الأرجح والمرجح إلى حد ما. وصف البيانات لتحليل البيانات لدينا أدناه، ونحن في طريقنا للتوسع في المثال 3 حول التقدم بطلب للحصول على مدرسة الدراسات العليا. لقد قمنا بمحاكاة بعض البيانات لهذا المثال ويمكن الحصول عليها هنا. تحتوي مجموعة البيانات الافتراضية هذه على متغير من ثلاثة مستويات يسمى تطبيق (مشفر 0، 1، 2)، سنستخدمه كمتغير ناتجنا. لدينا أيضا ثلاثة متغيرات التي سوف نستخدمها كما التنبؤات: باريد. وهو متغير 01 يشير إلى ما إذا كان أحد الوالدين على الأقل لديه درجة الدراسات العليا العامة. وهو متغير 01 حيث يشير 1 إلى أن المؤسسة الجامعية هي العامة و 0 خاصة، و غبا. وهو متوسط ​​درجة الطلاب. دعونا نبدأ مع الإحصاءات الوصفية لهذه المتغيرات. طرق التحليل التي قد تفكر بها فيما يلي قائمة ببعض طرق التحليل التي قد تكون قد واجهتها. بعض الأساليب المدرجة هي معقولة جدا في حين أن البعض الآخر إما سقطت لصالح أو لديها قيود. طلب الانحدار اللوجستي: محور هذه الصفحة. انحدار عملية شريان الحياة للسودان: هذا التحليل يمثل مشكلة لأن افتراضات عملية شريان الحياة للسودان تنتهك عند استخدامها مع متغير نتيجة غير متقطع. أنوفا: إذا كنت تستخدم متنبأ واحد مستمر فقط، هل يمكن كوتفليبوت نموذج حول بحيث، على سبيل المثال، كان غبا متغير النتيجة وتطبيق كان متغير التنبؤ. ثم هل يمكن تشغيل أنوفا في اتجاه واحد. هذا ليس شيئا سيئا القيام به إذا كان لديك متغير واحد فقط (من نموذج لوجستي)، وأنه مستمر. الانحدار اللوجستي المتعدد الحدود: يشبه ذلك الانحدار اللوجستي المطلوب، إلا أنه يفترض أنه لا يوجد ترتيب لفئات متغير النتائج (أي الفئات الاسمية). الجانب السلبي من هذا النهج هو أن المعلومات الواردة في ترتيب فقدت. أمر الانحدار بروبيت: هذا هو، جدا مشابهة جدا لتشغيل الانحدار اللوجستي أمر. والفرق الرئيسي هو في تفسير المعاملات. طلب الانحدار اللوجستي قبل أن نقوم بتشغيل نموذجنا اللوجستي الترتيبي، سنرى إذا كانت أي خلايا فارغة أو صغيرة للغاية. إن وجدت، قد يكون لدينا صعوبة في تشغيل نموذجنا. هناك طريقتان في سبس يمكننا القيام بذلك. الطريقة الأولى هي جعل الجداول الجدولية بسيطة. الطريقة الثانية هي استخدام خيار سلاينفو على الأمر الفرعي للطباعة. يجب عليك استخدام الخيار سيلينفو فقط مع متغيرات التنبؤ الفئوية الجدول سيكون طويلا ويصعب تفسير إذا قمت بتضمين تنبؤات مستمرة. أي من الخلايا صغيرة جدا أو فارغة (ليس لديه حالات)، ولذا فإننا سوف تشغيل نموذجنا. في بناء الجملة أدناه، قمنا بإدراج الأمر الفرعي لوجيت لينك، على الرغم من أنه هو الافتراضي، فقط لتذكير أنفسنا بأننا نستخدم وظيفة رابط لوجيت. لاحظ أيضا أنه في حالة عدم تضمين الأمر الفرعي للطباعة، يتم توفير جدول ملخص معالجة الحالة فقط في الإخراج. في جدول ملخص معالجة الحالة، نرى عدد ونسبة الحالات في كل مستوى من متغيرات الاستجابة لدينا. هذه الأرقام تبدو على ما يرام، ولكننا سوف تكون قلقة إذا كان مستوى واحد عدد قليل جدا من الحالات في ذلك. ونرى أيضا أن جميع المشاهدات ال 400 في مجموعة البيانات الخاصة بنا استخدمت في التحليل. وكان من الممكن استخدام عدد أقل من الملاحظات إذا كان لأي من متغيراتنا قيم مفقودة. افتراضيا، سبس ​​يفعل حذف قائمة من الحالات مع القيم المفقودة. بعد ذلك نرى الجدول نموذج المعلومات المناسب، والذي يعطي احتمال -2 لوغ لنماذج اعتراض فقط والنهائية. يمكن استخدام احتمال سجل -2 في مقارنات من نماذج متداخلة، ولكننا لن تظهر مثالا على ذلك هنا. في جدول تقديرات المعلمات نرى المعاملات، وأخطاءها القياسية، واختبار والد والقيم p المرتبطة بها (سيغ.)، وفترة الثقة 95 للمعاملات. كلا باريد و غبا جمهور إحصائي كبير ليس كذلك. لذلك ل باريد. ونحن نقول أنه لوحدة واحدة زيادة في باريد (أي الذهاب من 0 إلى 1)، ونحن نتوقع زيادة 1.05 في احتمالات سجل أمر يجري في مستوى أعلى من تطبيق. نظرا لكون جميع المتغيرات الأخرى في النموذج ثابتة. ل غبا. فإننا نقول أنه لوحدة واحدة زيادة في غبا. ونحن نتوقع زيادة 0.62 في احتمالات سجل يجري في مستوى أعلى من تطبيق. بالنظر إلى أن جميع المتغيرات األخرى في النموذج ثابتة. وتظهر العتبات في أعلى مخرجات تقديرات المعلمة، وهي تشير إلى مكان قطع المتغير الكامن لجعل المجموعات الثلاث التي نلاحظها في بياناتنا. لاحظ أن هذا المتغير الكامن مستمر. بشكل عام، لا تستخدم هذه في تفسير النتائج. بعض الحزم الإحصائية تستدعي نقاط القصور العتبات (العتبات ونقط النقاط هي نفس الشيء) حزم أخرى، مثل اعتراضات تقرير ساس، والتي هي سلبية من العتبات. في هذا المثال، سيكون الاعتراض -2.203 و -4.299. للحصول على مزيد من المعلومات، يرجى الاطلاع على الأسئلة الشائعة ستاتا: كيف يمكنني تحويل معلمات ستاتاس من النماذج بروبيت واللوجستية المطلوبة إلى واحد الذي يتم تقدير ثابت كما في الإصدار 15 من سبس، لا يمكنك الحصول مباشرة نسب نسبية من سبس. يمكنك إما استخدام نظام إدارة الإخراج سبس (أومز) لالتقاط تقديرات المعلمة و إكسبوننتيات لهم، أو يمكنك حسابها باليد. يرجى الاطلاع على انحدار أوردينال من قبل ماريجا J. نوروسيس للحصول على أمثلة عن كيفية القيام بذلك. وترد أدناه الأوامر لاستخدام أومز وحساب نسب الاحتمالات النسبية. لمزيد من المعلومات حول كيفية استخدام أومز، يرجى الاطلاع على أسئلة سبس: كيف يمكنني إخراج النتائج إلى ملف بيانات في سبس يرجى ملاحظة أن علامات الاقتباس المفردة في الأقواس المربعة مهمة وستحصل على رسالة خطأ إذا كانت محذوف أو غير متوازن. في العمود إكسب نرى النتائج المعروضة كنسب الأرجحية النسبية (معامل الأس). كما قمنا بحساب فترة الثقة الدنيا والعليا 95. ونحن سوف تفسر هذه إلى حد كبير كما أننا خلاف نسب من الانحدار اللوجستي ثنائي. ل باريد. فإننا نقول أنه بالنسبة لوحدة واحدة زيادة في باريد، أي الذهاب من 0 إلى 1، واحتمالات عالية تطبق مقابل الفئات المتوسطة والمنخفضة مجتمعة هي 2.85 أكبر، بالنظر إلى أن جميع المتغيرات الأخرى في النموذج ثابتا. وبالمثل، فإن احتمالات الفئات المتوسطة والعالية مجتمعة مقابل انخفاض تطبيق هو 2.85 مرات أكبر، بالنظر إلى أن جميع المتغيرات الأخرى في نموذج ثابتا. للحصول على زيادة وحدة واحدة في غبا. فإن احتمالات الفئات المنخفضة والمتوسطة من التطبيق مقابل الفئة العالية للتطبيق هي 1.85 مرة أكبر، بالنظر إلى أن المتغيرات الأخرى في النموذج تبقى ثابتة. بسبب افتراض خلاف النسبي (انظر أدناه لمزيد من التوضيح)، وجدت نفس الزيادة، 1.85 مرة، بين انخفاض تطبيق والفئات مجتمعة من المتوسطة والعالية تطبيق. واحدة من الافتراضات التي أمرت أمر لوجستي (والمرتبة بروبيت) الانحدار هو أن العلاقة بين كل زوج من مجموعات النتائج هي نفسها. وبعبارة أخرى، يفترض الانحدار اللوجستي المطلوب أن المعاملات التي تصف العلاقة بين الفئات الأقل مقابل جميع الفئات العليا لمتغير الاستجابة هي نفسها التي تصف العلاقة بين الفئة التالية التالية وكل الفئات الأعلى، وما إلى ذلك. وهذا ما يسمى افتراض الاحتمالات النسبية أو افتراض الانحدار المتوازي. لأن العلاقة بين جميع أزواج من المجموعات هي نفسها، وهناك مجموعة واحدة فقط من المعاملات (نموذج واحد فقط). إذا لم يكن هذا هو الحال، فإننا بحاجة إلى نماذج مختلفة لوصف العلاقة بين كل زوج من مجموعات النتائج. نحن بحاجة إلى اختبار افتراضات الاحتمالات النسبية، ويمكننا استخدام الخيار المتوازي في الأمر الفرعي للطباعة. الفرضية الفارغة لهذا الاختبار تشي مربع هو أنه لا يوجد فرق في المعاملات بين النماذج، لذلك نحن نأمل في الحصول على نتيجة غير هامة. ويشير الاختبار أعلاه إلى أننا لم ننتهك افتراض الاحتمالات النسبية. إذا تم افتراض افتراض الاحتمالات النسبية، قد نرغب في الذهاب مع الانحدار اللوجستي متعدد الحدود. نحن نستخدم هذه الصيغ لحساب الاحتمالات المتوقعة لكل مستوى من مستويات النتيجة، وتطبيق. وعادة ما يكون من السهل فهم الاحتمالات المتوقعة من المعاملات أو نسب الأرجحية. سنقوم بحساب الاحتمالات المتوقعة باستخدام لغة مصفوفة سبس. سوف نستخدم باريد كمثال مع توقع قاطع. هنا سوف نرى كيف احتمالات العضوية في كل فئة من التغييرات تطبيق ونحن نختلف باريد وتحمل المتغير الآخر في وسائلها. كما ترون، الاحتمال المتوقع ليكون في أدنى فئة من تطبيق هو 0.59 إذا كان أي من الوالدين لديه تعليم مستوى الدراسات العليا و 0.34 خلاف ذلك. بالنسبة للفئة المتوسطة للتطبيق. والاحتمالات المتوقعة هي 0.33 و 0.47، وبالنسبة لأعلى فئة من تطبيق. 0.078 و 0.196. وبالتالي، إذا كان أي من الآباء المجيبين لديهم التعليم على مستوى الدراسات العليا، والاحتمال المتوقع للتقدم إلى انخفاض الدراسات العليا. لاحظ أن الاعتراضات هي السلبيات من العتبات. أدناه، ونحن نرى الاحتمالات المتوقعة ل غبا في 2 و 3 و 4. كما ترون، لكل قيمة من غبا. وأعلى احتمال متوقع هو لأدنى فئة من تطبيق. وهذا أمر منطقي لأن معظم المجيبين في هذه الفئة. يمكنك أيضا أن ترى أن احتمال الاحتمالات المتوقعة لكل من الفئات الوسطى والأعلى من تطبيق زيادات غبا. الأمور التي يجب أخذها في الاعتبار التنبؤ المثالي: التنبؤ المثالي يعني أن قيمة واحدة لمتغير تنبؤي ترتبط بقيمة واحدة فقط لمتغير الاستجابة. إذا حدث هذا، ستاتا عادة إصدار مذكرة في الجزء العلوي من الإخراج وسوف إسقاط الحالات بحيث يمكن تشغيل النموذج. حجم العينة: كل من لوجستية أمرت و بروبيت أمر، باستخدام تقديرات أقصى احتمال، تتطلب حجم العينة كافية. ومدى كبر حجمها هو موضوع بعض الجدل، ولكنها تتطلب دائما تقريبا حالات أكثر من انحدار عملية شريان الحياة للسودان. خلايا فارغة أو خلايا صغيرة: يجب التحقق من وجود خلايا فارغة أو صغيرة عن طريق إجراء جدول زمني بين التنبؤات الفئوية ومتغير النتيجة. إذا كانت الخلية لديها حالات قليلة جدا، قد يصبح النموذج غير مستقر أو قد لا يعمل على الإطلاق. الزائفة - R - مربع: لا يوجد التناظرية بالضبط من R - تربيع وجدت في عملية شريان الحياة للسودان. هناك العديد من الإصدارات من الزائفة R - الساحات. يرجى الاطلاع طويل وفريز 2005 لمزيد من التفاصيل والتفسيرات لمختلف الزائفة R - الساحات. التشخيص: إجراء التشخيص للنماذج غير الخطية أمر صعب، وأمرت نماذج لوجيتبروبيت أكثر صعوبة من النماذج الثنائية. المراجع 13 بروبيت الانحدار سبس تحليل البيانات أمثلة يستخدم الانحدار بروبيت، وتسمى أيضا نموذج بروبيت، لنموذج متغيرات النتائج الثنائية أو الثنائية. وفي النموذج بروبيت، ينمذج التوزيع العادي المعكوس للاحتمال على أنه تركيبة خطية من المتنبئات. يرجى ملاحظة ما يلي: الغرض من هذه الصفحة هو إظهار كيفية استخدام مختلف أوامر تحليل البيانات. وهي لا تغطي جميع جوانب عملية البحث التي يتوقع من الباحثين القيام بها. وعلى وجه الخصوص، فإنه لا يغطي تنظيف البيانات وفحصها والتحقق من الافتراضات والتشخيص النموذجي والتحليلات المحتملة للمتابعة. مثال 1: افترض أننا مهتمون بالعوامل التي تؤثر على ما إذا كان مرشح سياسي يفوز في الانتخابات. متغير النتيجة هو ثنائي (01) الفوز أو الخسارة. المتغيرات المتوقعة من الفائدة هي مقدار الأموال التي تنفق على الحملة، ومقدار الوقت الذي يقضيه الحملات الانتخابية سلبا، وما إذا كان المرشح شاغلا. مثال 2: باحث مهتم في كيفية المتغيرات، مثل غري (درجات امتحان سجل الدراسات العليا)، غبا (متوسط ​​الصف)، وهيبة مؤسسة البكالوريوس، وتأثير القبول في كلية الدراسات العليا. متغير الاستجابة، اعترف admitdon8217t، هو متغير ثنائي. وصف البيانات لتحليل البيانات لدينا أدناه، ونحن في طريقنا للتوسع في المثال 2 حول الدخول في مدرسة الدراسات العليا. لقد قمنا بإنشاء بيانات افتراضية، والتي يمكن الحصول عليها عن طريق النقر على binary. sav. يمكنك تخزين هذا في أي مكان تريد، ولكن لدينا أمثلة سوف نفترض أنه تم تخزينها في ج: البيانات. أولا، نقرأ ملف البيانات إلى سبس. تحتوي مجموعة البيانات هذه على استجابة ثنائية (النتيجة، تعتمد) متغير يسمى اعترف. هناك ثلاثة متغيرات تنبؤ: غري. غبا والرتبة. وسوف نعامل المتغيرات غر و غبا كما مستمر. أما الترتيب المتغير فهو ترتيبي، فهو يأخذ القيم من 1 إلى 4. أما المؤسسات التي تحتل المرتبة 1 فتكون أعلى مكانة، في حين أن الفئة التي لها رتبة 4 هي الأقل. وسوف نعامل الرتبة كقائمة. دعونا نبدأ من خلال النظر في الإحصاءات الوصفية. طرق التحليل التي قد تفكر بها فيما يلي قائمة ببعض طرق التحليل التي قد تكون قد واجهتها. بعض الأساليب المدرجة هي معقولة جدا في حين أن البعض الآخر إما سقطت لصالح أو لديها قيود. بروبيت الانحدار، والتركيز من هذه الصفحة. الانحدار اللوجستي. نموذج لوجيت سوف تنتج نتائج انحدار بروبيت مماثل. اختيار بروبيت مقابل لوجيت يعتمد إلى حد كبير على تفضيلات الفردية. انحدار عملية شريان الحياة للسودان. وعند استخدامها مع متغير الاستجابة الثنائية، يعرف هذا النموذج بنموذج الاحتمال الخطي ويمكن استخدامه كوسيلة لوصف الاحتمالات المشروطة. ومع ذلك، فإن الأخطاء (أي المخلفات) من نموذج الاحتمالات الخطية تنتهك النزعة المثلية والطبيعية لافتراضات أخطاء انحدار عملية شريان الحياة للسودان، مما يؤدي إلى أخطاء معيارية غير صحيحة واختبارات فرضية. وللحصول على مناقشة أكثر شمولا لهذه المشاكل وغيرها من المشاكل مع نموذج الاحتمالات الخطية، انظر لونغ (1997، p.38-40). اثنين من مجموعة تحليل وظيفة التمييز. طريقة متعددة المتغيرات لمتغيرات النتائج ثنائية التفرع. Hotelling8217s T 2. يتم تحويل النتيجة 01 إلى متغير التجميع، ويتم تحويل المتنبئات السابقة إلى متغيرات النتيجة. وهذا سيؤدي إلى اختبار شامل للأهمية ولكن لن يعطي معاملات فردية لكل متغير، ومن غير الواضح إلى أي مدى يتم تعديل كل كوتوبريديكتوركوت لتأثير الانحدار بروبيت الآخر أدناه نستخدم الأمر البرقوق مع لينكروبويت سوبكوماند لتشغيل نموذج الانحدار بروبيت. بعد اسم الأمر (البرقوق)، يتبع متغير النتيجة (أعترف) مع الترتيب الذي يشير إلى أن رتبة هو توقع قاطع، تليها غرام غبا. مما يشير إلى أنه ينبغي التعامل مع التنبؤات غري و غبا على أنها مستمرة. يتم تقسيم الإخراج من الأمر البرقوق إلى عدة أقسام، ويناقش كل منها أدناه ويسمى الإخراج البرقوق كما الانحدار الترتيبي، ومع ذلك، يمكننا أن نؤكد أدناه (انظر الملاحظة في المجموعة التالية من الجداول) أن وظيفة الارتباط بروبيت كان مستعملا. لاحظ أن نموذجا مع نتيجة ثنائية يمكن أن ينظر إليها على أنها حالة خاصة من نموذج ترتيبي، حيث لا يوجد سوى فئتين. ويتضمن الجدول أعلاه ترددات للمتغيرين الفئويين المعترف بهما (النتيجة) والرتبة (أحد المتنبئات). يمكننا أن نرى أن جميع الملاحظات 400 استخدمت. وكان من الممكن استخدام عدد أقل من الملاحظات إذا كان لأي من متغيراتنا قيم مفقودة. يتضمن الجدول المسمى "معلومات تركيب النموذج" صفين، أحدهما للنموذج الذي طلبناه (المسمى فينال) وواحد لما يسمى بالنموذج الفارغ (اعتراض فقط). يمكن استخدام إمكانيات السجل -2 لمقارنة النموذج المناسب للنموذجين. احتمال -2 لوغ النهائي لنموذجنا هو 452.057. نموذج اعتراض فقط لديه احتمال -2 لوغ من 493.620. إحصائية اختبار مربع تشي 41.563 هو الفرق بين احتمالين لوغ -2، وهذا إحصائية الاختبار، مع 5 درجات من الحرية وقيمة p المرتبطة أقل من 0.0004 يخبرنا أن النموذج الحالي يناسب أفضل من نموذج مع مجرد اعتراض. القيم الزائفة - R-تربيع هي طريقة أخرى لتقييم تناسب النموذج. يتم إعطاء ثلاثة مختلفة الزائفة مربع - R في الإخراج، ولكن العديد من التدابير المختلفة من الزائفة - R - التربيع موجودة. وهم جميعا يحاولون تقديم معلومات مماثلة لتلك التي يوفرها المربعات R في انحدار عملية شريان الحياة للسودان، ولكن لا يمكن تفسير أي منها تماما كما تفسر R-تربيع في انحدار عملية شريان الحياة للسودان. من أجل مناقشة مختلف الزائفة R-سكاردز انظر لونغ و فريز (2006) أو صفحة الأسئلة الشائعة ما هي الزائفة R-سكاردز في الجدول المسمى تقديرات المعلمة، ونحن نرى المعاملات، وأخطاءها القياسية، والد الإحصاء اختبار مع دف المرتبطة و p-فالويس، وفترة الثقة 95 للمعاملات. المتغيرات غري. المعدل التراكمي . كما أن شروط الرتبة 1 والرتبة 2 ذات دلالة إحصائية. معاملات الانحدار بروبيت تعطي التغير في درجة z (وتسمى أيضا مؤشر بروبيت) لتغيير وحدة واحدة في التنبؤ. للحصول على زيادة وحدة واحدة في اللون الأخضر. تزداد درجة Z بمقدار 0.001. لكل زيادة وحدة واحدة في غبا. تزداد درجة Z بمقدار 0.478. شروط الترتيب لها تفسير مختلف قليلا. على سبيل المثال، بعد أن حضرت مؤسسة البكالوريوس مع رتبة 1، مقابل مؤسسة مع رتبة 4 (المجموعة المرجعية)، يزيد من درجة Z بنسبة 0.936. وقد نحتاج أيضا إلى اختبار التأثير الكلي للرتبة. يمكننا القيام بذلك باستخدام الاختبار الفرعي. ويتبع الاختبار الفرعي اسم المتغير الذي نود اختباره (أي الترتيب)، ثم قيمة واحدة لكل مستوى من مستويات هذا المتغير (بما في ذلك الفئة المحذوفة). ويشير السطر الأول من رتبة الاختبار الفرعي 1 0 0 0 إلى أننا نريد اختبار أن معامل الرتبة 1 هو 0. ولإجراء اختبار درجة متعددة من الحرية، فإننا ندرج سطور متعددة في الاختبار الفرعي للاختبار، وكل ذلك باستثناء السطر الأخير مفصولة بفواصل منقوطة. يشير الصفان الثاني والثالث إلى أننا نرغب في اختبار أن معاملات الرتبة 2 والرتبة 3 تساوي 0. لاحظ أنه لا توجد حاجة لتضمين صف للفئة الرابعة من الرتبة. لأن النماذج هي نفسها، فإن معظم الإخراج التي تنتجها أمر البرقوق أعلاه هو نفسه كما كان من قبل. والفرق الوحيد هو الناتج الإضافي الناتج عن الاختبار الفرعي للاختبار، ويظهر هذا الجزء فقط من المخرجات أدناه. ويبين الجدول الأول أعلاه، المسمى معاملات التباين، الفرضيات التي نختبرها. ويعطي الجدول الثاني نتائج التباين، لأن كل صف في اختبار الاختبار الفرعي يساوي معامل في النموذج يساوي 0، وهذه التقديرات والأخطاء المعيارية وما إلى ذلك تساوي تلك الواردة في الجدول المسمى تقديرات المعلمات في الجزء الرئيسي من الإخراج. الفرق الوحيد في هذا الجدول هو أن العمود المسمى الاختبار الذي يعطي صراحة الفرضية الصفرية، في حالتنا، أن كل من المصطلحات يساوي 0. (لاحظ أنه يمكن تحديد فرضيات فارغة أخرى). الجدول النهائي الذي تم إنتاجه من قبل اختبار الاختبار الفرعي، وصفت نتائج الاختبار، ويعطي درجة متعددة من اختبار الحرية نحن مهتمون، وإحصاء اختبار والد من 21.361، مع 3 درجات من الحرية، وقيمة p المرتبطة أقل من 0.001، يخبرنا أن التأثير الكلي من الرتبة ذات دلالة إحصائية. ويقدم الجدول المسمى تقديرات المعلمة اختبارات الفرضية للفروق بين كل مستوى من الرتب والفئة المرجعية. يمكننا استخدام الاختبار الفرعي اختبار لاختلافات بين المستويات الأخرى من رتبة. على سبيل المثال، قد نرغب في اختبار الفرق في معاملات الرتبة 2 والرتبة 3. في بناء الجملة أدناه أضفنا اختبار فرعي ثان. هذه المرة، والقيم المعطاة هي 0 1 -1 0 هذا يشير إلى أننا نريد حساب الفرق بين معاملات الرتبة 2 والرتبة 3 (أي، الرتبة 2 8211 الرتبة 3). مرة أخرى الإخراج من النموذج، فضلا عن الإخراج المرتبطة بالاختبار الفرعي الاختبار الأول هي مماثلة لتلك المبينة أعلاه، لذلك يتم حذفها. في الجدول المسمى نتائج التباين، نرى الفرق في المعاملات (أي 0.397). تشير إحصائية اختبار والد من 5.573، مع درجة واحدة من الحرية، وقيمة p ذات الصلة أقل من 0.02، إلى أن الفرق بين معاملات الرتبة 2 والرتبة 3 ذو دلالة إحصائية. ونظرا لأنه لم يتم تحديد سوى تقدير واحد في الاختبار الفرعي للاختبار، فإن درجة اختبار الحرية المتعددة (أي جدول نتائج الاختبار) غير مطبوعة. أشياء يجب مراعاتها خلايا فارغة أو خلايا صغيرة: يجب التحقق من وجود خلايا فارغة أو صغيرة عن طريق إجراء جدول زمني بين التنبؤات الفئوية ومتغير النتيجة. إذا كان لدى خلية عدد قليل جدا من الحالات (خلية صغيرة)، قد يصبح النموذج غير مستقر أو قد لا يعمل على الإطلاق. الفصل أو شبه الفصل (وتسمى أيضا التنبؤ المثالي)، وهو شرط لا تختلف فيه النتيجة على بعض مستويات المتغيرات المستقلة. راجع صفحتنا أسئلة وأجوبة: ما هو الفصل الكامل أو شبه الكامل في الانحدار لوجيستيسبروبيت وكيف يمكننا التعامل معها للحصول على معلومات عن نماذج مع التنبؤ الكمال. حجم العينة: تتطلب كل من النماذج المنطقية والبروبيتية حالات أكثر من انحدار عملية شريان الحياة للسودان لأنها تستخدم تقنيات تقدير احتمالية قصوى. ومن المهم أيضا أن نضع في اعتبارنا أنه عندما تكون النتيجة نادرة، حتى لو كانت مجموعة البيانات الشاملة كبيرة، يمكن أن يكون من الصعب تقدير نموذج لوجيت. الزائفة - R - تربيع: العديد من التدابير المختلفة من الزائفة - R - التربيع موجودة. وهم جميعا يحاولون تقديم معلومات مماثلة لتلك التي يوفرها المربعات R في انحدار عملية شريان الحياة للسودان، ولكن لا يمكن تفسير أي منها تماما كما تفسر R-تربيع في انحدار عملية شريان الحياة للسودان. للاطلاع على مناقشة لمختلف الزائفة-R-سكاردز انظر لونغ و فريز (2006) أو صفحة الأسئلة الشائعة ما هي الزائفة R-سكاردز التشخيص: التشخيص ل الانحدار اللوجستي تختلف عن تلك لانحدار عملية شريان الحياة للسودان. وللاطلاع على مناقشة لتشخيص نماذج الانحدار اللوجستي، انظر هوسمر أند ليمشو (2000، تشابتر 5). لاحظ أن التشخيصات التي تم إجراؤها للانحدار اللوجستي مشابهة لتلك التي تم إجراؤها من أجل الانحدار بروبيت. المراجع هوسمر، D. 038 ليمشو، S. (2000). تطبيق الانحدار اللوجستي (الطبعة الثانية). نيويورك: جون وايلي 038 سونس، Inc. لونغ، J. سكوت (1997). نماذج الانحدار للمتغيرات تعتمد الفئوية ومحدودة. ثاوزاند أوكس، كا: ساجا Publications. MultinomialLogistic ريدرسيون ستاتا داتا أناليسيس أمثلة معلومات الإصدار. تم اختبار رمز هذه الصفحة في ستاتا 12. يستخدم الانحدار اللوجستي متعدد الحدود لنمذجة متغيرات النتائج الاسمية، حيث يتم حساب نماذج السجل للنتائج كخطوة خطية للمتغيرات التنبؤية. يرجى ملاحظة ما يلي: الغرض من هذه الصفحة هو إظهار كيفية استخدام مختلف أوامر تحليل البيانات. وهي لا تغطي جميع جوانب عملية البحث التي يتوقع من الباحثين القيام بها. وعلى وجه الخصوص، فإنه لا يغطي تنظيف البيانات وفحصها والتحقق من الافتراضات والتشخيص النموذجي والتحليلات المحتملة للمتابعة. أمثلة على الانحدار اللوجستي متعدد الثقافات مثال 1. قد يتأثر الأشخاص 8217s الخيارات المهنية من قبل آبائهم 8217 المهن ومستوى تعليمهم الخاص. يمكن أن ندرس العلاقة بين اختيار الاحتلال واحد 8217s مع مستوى التعليم والاحتلال الأب 8217s. وستكون الخيارات المهنية هي متغير النتائج الذي يتألف من فئات المهن. مثال 2. قد يهتم اختصاصي البيولوجيا بالاختيارات الغذائية التي يقدمها التمساح. قد يكون لدى تماسيح البالغين تفضيلات مختلفة من الشباب. المتغير الناتج هنا سيكون أنواع الطعام، وقد تكون متغيرات التنبؤ حجم التمساح والمتغيرات البيئية الأخرى. مثال: .3 دخول طلاب المدارس الثانویة یختارون البرنامج من البرامج العامة والبرامج المھنیة والبرامج الأکادیمیة. ويمكن أن يكون اختيارهم على غرار درجاتهم الكتابة ووضعهم الاجتماعي الاجتماعي. وصف البيانات بالنسبة إلى مثال تحليل البيانات، سنقوم بتوسيع المثال الثالث باستخدام مجموعة بيانات هسبديمو. Let8217s أولا قراءة في البيانات. تحتوي مجموعة البيانات على متغيرات على 200 طالب. متغير النتيجة هو بروغ. نوع البرنامج. متغيرات التنبؤ هي الحالة الاقتصادية الاجتماعية، سيس، متغير فئوي من ثلاثة مستويات، والكتابة، والكتابة، ومتغير مستمر. Let8217s تبدأ مع الحصول على بعض الإحصاءات الوصفية للمتغيرات ذات الاهتمام. طرق التحليل التي قد تفكر في الانحدار اللوجستي متعدد الحدود: محور هذه الصفحة. الانحدار بروبيت متعدد الحدود: على غرار الانحدار اللوجستي متعدد الحدود ولكن مع شروط الخطأ العادية المستقلة. تحليل الوظائف التمييزية متعددة المجموعات: طريقة متعددة المتغيرات لمتغيرات النتائج متعددة الحدود تحليلات الانحدار اللوجستي المتعددة، واحدة لكل زوج من النتائج: مشكلة واحدة في هذا النهج هي أن كل تحليل يحتمل أن يتم تشغيله على عينة مختلفة. والمشكلة الأخرى هي أنه بدون تقييد النماذج اللوجستية، يمكن أن ينتهي بنا المطاف باحتمال اختيار جميع فئات النتائج الممكنة التي تزيد عن 1. انهيار عدد الفئات إلى قسمين ثم إجراء انحدار لوجستي: يعاني هذا النهج من فقدان المعلومات والتغييرات أسئلة البحث الأصلية إلى تلك مختلفة جدا. الانحدار اللوجستي العمودي: إذا كان متغير النتيجة أمر حقا وإذا كان يرضي أيضا افتراض الاحتمالات النسبية، ثم التحول إلى الانحدار اللوجستي الترتيبي سيجعل النموذج أكثر شاذا. انحدار بروبيت متعدد البدائل متعدد البدائل: يسمح لهياكل خطأ مختلفة تسمح بالتالي بالاسترخاء لاستقلالية البدائل غير ذات الصلة (إيا، انظر أدناه كوتينغز تو كونسيغنوت) افتراض. ويتطلب ذلك أن يكون هيكل البيانات محددا. متداخلة نموذج لوجيت: أيضا يخفف افتراض إيا، يتطلب أيضا بنية البيانات يكون اختيار محددة. الانحدار اللوجستي متعدد الحدود أدناه نستخدم الأمر ملوجيت لتقدير نموذج الانحدار اللوجستي متعدد الحدود. i. قبل أن يشير سيس إلى أن سيس هي متغير مؤشر (أي متغير فئوي)، وأنه ينبغي تضمينه في النموذج. لقد استخدمنا أيضا الخيار كوت كوت للإشارة إلى الفئة التي نريد استخدامها لمجموعة المقارنة الأساسية. في النموذج أدناه، اخترنا استخدام نوع البرنامج الأكاديمي كفئة الأساس. في الإخراج أعلاه، نرى أولا سجل التكرار، مما يشير إلى مدى سرعة نموذج التقارب. يمكن استخدام احتمال السجل (-179.98173) في مقارنات من النماذج المتداخلة، لكننا ربحنا 8217t عرض مثال لمقارنة النماذج هنا تخبرنا نسبة احتمال تشي مربع 48.23 بقيمة p لوت 0.0001 أن نموذجنا ككل يناسب أفضل بكثير من نموذج فارغ (أي نموذج مع عدم وجود تنبؤات) الإخراج أعلاه له جزأين، المسمى مع فئات المتغير النتيجة بروغ. وهي تتوافق مع المعادلتين التاليتين: حيث (ب) 8217s هي معاملات الانحدار. ترتبط زيادة وحدة واحدة في الكتابة المتغيرة مع انخفاض .058 في احتمال سجل النسبي لكونها في البرنامج العام مقابل البرنامج الأكاديمي. ويرتبط زيادة وحدة واحدة في الكتابة المتغيرة مع انخفاض .1136 في احتمال النسبية من احتمال أن يكون في برنامج مهنة مقابل البرنامج الأكاديمي. سوف تنخفض الاحتمالات النسبية لكونها في البرنامج العام مقابل في البرنامج الأكاديمي بنسبة 1.163 إذا انتقل من أدنى مستوى سيس (سيس 1) إلى أعلى مستوى سيس (سيس 3). وغالبا ما يشار إلى نسبة احتمال اختيار فئة واحدة من فئات النتائج على احتمالية اختيار فئة خط الأساس كمخاطر نسبية (كما يشار إليها أحيانا على أنها خلاف كما استخدمنا للتو لوصف معلمات الانحدار أعلاه). ويمكن الحصول على المخاطرة النسبية عن طريق تفسير المعادلات الخطية أعلاه، مما يؤدي إلى معاملات الانحدار التي تمثل نسبا نسبية للمخاطر بالنسبة لتغير الوحدة في متغير التنبؤ. يمكننا استخدام الخيار ر لأمر ملوجيت لعرض نتائج الانحدار من حيث النسب النسبية للمخاطر. نسبة الاختطار النسبية لوحدة واحدة زيادة في الكتابة المتغيرة هي .9437 (إكس (-. 0579284) من إخراج أول أمر ملوجيت أعلاه) لكونها في البرنامج العام مقابل البرنامج الأكاديمي. نسبة الاختطار النسبي التي تحول من 1 إلى 3 هي 3.126 لكونها في البرنامج العام مقابل البرنامج الأكاديمي. وبعبارة أخرى، فإن الخطر المتوقع للبقاء في البرنامج العام هو أقل بالنسبة للموضوعات التي هي عالية في سيس. يمكننا اختبار التأثير العام لل سيس باستخدام أمر الاختبار. ونرى أدناه أن التأثير العام لل سيس له دلالة إحصائية. وبشكل أكثر تحديدا، يمكننا أيضا اختبار ما إذا كان تأثير 3.ses في التنبؤ العام مقابل الأكاديمي يساوي تأثير 3.ses في التنبؤ المهنة مقابل الأكاديمي باستخدام أمر الاختبار مرة أخرى. ويظهر الاختبار أن الآثار لا تختلف إحصائيا عن بعضها البعض. يمكنك أيضا استخدام الاحتمالات المتوقعة لمساعدتك على فهم النموذج. يمكنك حساب الاحتمالات المتوقعة باستخدام أمر الهوامش. أدناه نستخدم الأمر هوامش لحساب احتمال توقع اختيار كل نوع البرنامج في كل مستوى من سيس. مع االحتفاظ بجميع المتغيرات األخرى في النموذج بوسائلها. نظرا لوجود ثلاث نتائج محتملة، سنحتاج إلى استخدام الأمر الهامش ثلاث مرات، واحد لكل قيمة ناتجة. يمكننا استخدام الأمر مارجينسبلوت لرسم الاحتمالات المتوقعة من قبل سيس لكل فئة من بروغ. وتستند المؤامرات التي أنشأتها مارجينزبلوت على المدى الأخير تشغيل الهوامش. وعلاوة على ذلك، يمكننا الجمع بين الهامشبلوتس الثلاثة في رسم بياني واحد لتسهيل المقارنة باستخدام الأمر الجمع بين الرسم البياني. As it is generated, each marginsplot must be given a name, which will be used by graph combine . Additionally, we would like the y-axes to have the same range, so we use the ycommon option with graph combine . Another way to understand the model using the predicted probabilities is to look at the averaged predicted probabilities for different values of the continuous predictor variable write . averaging across levels of ses . Sometimes, a couple of plots can convey a good deal amount of information. Below, we plot the predicted probabilities against the writing score by the level of ses for different levels of the outcome variable. We may also wish to see measures of how well our model fits. This can be particularly useful when comparing competing models. The user-written command fitstat produces a variety of fit statistics. You can find more information on fitstat and download the program by using command search fitstat in Stata (see How can I use the search command to search for programs and get additional help for more information about using search ). Things to consider The Independence of Irrelevant Alternatives (IIA) assumption: roughly, the IIA assumption means that adding or deleting alternative outcome categories does not affect the odds among the remaining outcomes. Test of the IIA assumption can be performed by using the Stata command mlogtest, iia . However, as of April 23, 2010, mlogtest, iia does not work with factor variables. There are alternative modeling methods that relax the IIA assumption, such as alternative-specific multinomial probit models or nested logit models. Diagnostics and model fit: unlike logistic regression where there are many statistics for performing model diagnostics, it is not as straightforward to do diagnostics with multinomial logistic regression models. Model fit statistics can be obtained via the fitstat command. For the purpose of detecting outliers or influential data points, one can run separate logit models and use the diagnostics tools on each model. Pseudo-R-Squared: the R-squared offered in the output is basically the change in terms of log-likelihood from the intercept-only model to the current model. It does not convey the same information as the R-square for linear regression, even though it is still quotthe higher, the betterquot. Sample size: multinomial regression uses a maximum likelihood estimation method, it requires a large sample size. It also uses multiple equations. This implies that it requires an even larger sample size than ordinal or binary logistic regression. Complete or quasi-complete separation: Complete separation implies that the outcome variable separates a predictor variable completely, leading to perfect prediction by the predictor variable. Unlike running a logit model, Stata does not offer a warning when this happens. Instead it continues to compute iteratively and requires a manual quit to stop the process. Perfect prediction means that only one value of a predictor variable is associated with only one value of the response variable. But you can tell from the output of the regression coefficients that something is wrong. You can then do a two-way tabulation of the outcome variable with the problematic variable to confirm this and then rerun the model without the problematic variable. Empty cells or small cells: You should check for empty or small cells by doing a cross-tabulation between categorical predictors and the outcome variable. If a cell has very few cases (a small cell), the model may become unstable or it might not even run at all. Perhaps your data may not perfectly meet the assumptions and your standard errors might be off the mark. You might wish to see our page that shows alternative methods for computing standard errors that Stata offers. Sometimes observations are clustered into groups (e. g. people within families, students within classrooms). In such cases, you may want to see our page on non-independence within clusters . References

No comments:

Post a Comment