جهات الاتصال

اختبار فعال وفعال ورشيق. تقييم فعالية اختبارات أتمتة الاختبارات في عملية تطوير البرمجيات

غالبًا ما يرتبط رفض الاختبار بموقف نقدي تجاهه من جانب العاملين في مجال الإعلان (وخاصة المبدعين) ، فضلاً عن المدخرات مالو الوقت. يمكن أن يؤدي الاختبار إلى إبطاء الإطلاق حملة إعلانية، ومن ثم المنتج نفسه. في الوقت نفسه ، من الواضح أنه مع الميزانيات الكبيرة ، تساعد الاختبارات على تجنب أخطاء تقدر بملايين الدولارات. يمكن أن يكون مفيدًا أيضًا للمعلنين الصغار الذين يجدون أنه من السهل العثور على اختبارات بسيطة وغير مكلفة. كما تقول الكلاسيكيات الإعلانية ، "يمكن أن يكون الاختبار محدودًا أو حتى غير ناجح ، لكنه سيظل يعطي شيئًا يمكن البناء عليه ، وما يمكن الاسترشاد به."

يحسب الباحثون عدة آلاف من أنواع الاختبارات. لا توجد آراء أقل حول فائدة وصحة إجراء اختبارات معينة.

من أهم الأسئلة البحثية التقييمية الرجوع إلى إصدار أقدم: "ما الذي يجب اختباره بالضبط؟" جادلت نفس الكلاسيكيات الإعلانية بأن "تأثير الإعلان (باستثناء إعلان الطلب عبر البريد) غير قابل للقياس إلى حد كبير ... يرغب المعلنون ، بالطبع ، في أن يكونوا قادرين على المحاسبة ، ولكن غالبًا ما يجب قياس الإعلان بشكل أكثر تواضعًا و طرق غير ملموسة أكثر مما يريدون. أخشى أنه سيتعين علينا أن نتصالح مع حقيقة أن معظم الإعلانات لن تتمكن من سداد تكاليفها بالكامل إلا بعد فترة طويلة من الزمن ، ومن المستحيل التحقق من درجة العائد بأي قدر من اليقين ".

في الواقع ، من الصعب جدًا تحديد العامل الحاسم في العلاقة بين الرسالة الإعلانية نفسها وتأثيرها (أو عدم وجود هذا التأثير) على الفرد. على سبيل المثال ، في إحدى الدراسات ، مجموعة تتكون من مديري المنتجات ومديري الإعلانات في الشركات وقادة مجموعات العمل وكالات الدعاية والإعلان، المحترفين المبدعين ومحترفي الإعلانات والمتخصصين في البحث "،" طُلب منهم اختيار أفضل الإعلانات من بين تلك التي تم اختبارها بالفعل بدقة في السوق. نتيجة؟ بينما كان الخبراء قادرون بشكل عام على تحديد الإعلانات التي من المفترض أن تجذب معظم القراء ، لم يتمكنوا من تحديد الإعلانات التي ساعدت في بيع معظم المنتجات ". كما ذكرنا سابقًا ، إلى جانب الإعلان ، هناك العديد من العوامل المختلفة التي تؤثر على المبيعات. ووفقًا لأكثر الخبراء موثوقية ، "لا توجد طرق للتحكم السريع وغير المعقد في العديد من العوامل التي تؤثر على المبيعات".

وفقًا لـ C. Sandage و V. Freiburger و K. يمكن للإعلان نفسه ، على سبيل المثال ، الإزعاج ، والإبلاغ ، والتسلية ، وتعزيز الثقة ، والحث على اتخاذ إجراء ، ويمكن تجاهله تمامًا في لحظة الاتصال ، وبعد ذلك يمكن نسيانه سريعًا أو تذكره جزئيًا ، كما يمكن أن يتسبب أيضًا في تغيير الموقف أو الوعي. لذلك ، من الواضح تمامًا أنه عند تحديد معايير الاستجابة المراد استخدامها ، يجب أن يسترشد الباحث إلى حد كبير بالفطرة السليمة ".

في ضوء ما سبق ، يبدو من الواضح أنه يجب مشاهدة الإعلان (قبل أن يتم الرد عليه). بعد الاتصال بالإعلان ، يجب أن يعرف الشخص أيضًا العلامة التجاريةأو اسم الشركةفهم خصائص ومزايا وفوائد المنتج. قد يطور الشخص نزعة عقلانية أو عاطفية للشراء منتج معين... يمكن أن يضاف إلى ذلك رأي إدارة أحد أكبر المعلنين في العالم جنرال موتورز: "ستُقاس الفعالية بالدرجة الأولى بالدقة والقدرة على استخدام العواطف والإقناع في الإعلان."

يمكن اختبار استجابات بشرية محددة. في هذه الحالة ، يجب تقييم إما معلمات فردية أو مجموعة صغيرة ، نظرًا لأن محاولات تحليل عدد كبير جدًا من معلمات الإعلان النشطة في وقت واحد قد تؤدي إلى إرباك النتائج. في الوقت نفسه ، كلما تم اختبار المزيد من المعلمات بشكل عام ، زادت دقة ذلك. النتيجة النهائية... "من خلال التحليل الدقيق لواحد أو جانبين فقط من الجوانب المحيطية لفعالية الإعلان ، قد تبدو نتائج اختباره عقيمة وغير واقعية للغاية بالنسبة لأولئك الذين سيتعين عليهم استخدامها في عملية صنع القرار. إذا ساوى بشكل غير نقدي بين درجة التذكر والتأثير أو التغيير في الموقف والتسويق ، فسيكون أمامه فرصة للاعتماد على الإيمان الذي لا يقدم أي ضمانات ".

لذلك ، للتحقق من فعالية الإعلان المكتمل أو شبه المكتمل ، يتم إجراء دراسات أو اختبارات تقييمية مختلفة. إنها تسمح لك بتوفير المال عن طريق تعديل إعلانك قبل تمويل أموال التوزيع. وبالتالي ، يساعد الاختبار على تجنب أخطاء بملايين الدولارات. أيضًا ، يمكن أن تكون الدراسات التقييمية مفيدة بعد وضع الإعلان ، على سبيل المثال ، عند تقييم عمليات تأثير الإعلان على المبيعات الحالية.

ومع ذلك ، من وجهة نظر الممارسين ، ليس كل البحوث وليس لها دائمًا قيمة. في بعض الأحيان لا يمكنهم المساعدة فحسب ، بل يمكنهم أيضًا إلحاق الضرر بالوظيفة. يمكن أن يكون حدس الممارسين أداة أكثر دقة من البحث العلمي. الاختبارات ونتائجها ليست حلولًا بحد ذاتها ، فهي تزود الممارسين بالمعلومات فقط ، استخدام منها، جنبًا إلى جنب مع الخبرة التجريبية عامل إعلان، يجعل من الممكن اتخاذ قرارات مستنيرة.

لقد غطى هذا الفصل الأنواع المختلفة من الاختبارات المستخدمة في الإعلان ، وطرق الاختبار المختلفة ، ومعايير الاختبار ، وخطوات الاختبار. تم أيضًا النظر في ميزات اختبار الإعلان في الوسائط المختلفة ، والتي غالبًا ما تستخدم طرقًا مختلفة.

تم إيلاء اهتمام خاص إلى t التمهيدي التصميم (الاختبار المسبق) ، حيث يزيد من احتمالية إعداد النصوص الأكثر فاعلية قبل إنفاق الأموال على الإعلان.

نوع آخر من الاختبار - الاختبار اللاحق (أو الاختبار النهائي) ، من جانبه ، ليس له العيب الرئيسي الكامن في الاختبار الأولي - قدر معين من الاصطناعية. في الاختبار النهائي ، سلوك الناس غير مشوه ، إنه طبيعي وواقعي. أثناء الاختبار النهائي ، يتم أخذ عدد من العوامل في الاعتبار ، والتي تؤثر أيضًا بشكل خطير على النتائج. بادئ ذي بدء ، هذه هي تفاصيل وسائل توزيع الإعلانات ، ووقت وضع الإعلان ، وتكرار عرضها للمستهلكين ، وما إلى ذلك.

إذا تم اختبار الرسالة الإعلانية بأكملها ، كقاعدة عامة ، للقدرة على تحفيز المبيعات ، ولإقناع المنتج أو العلامة التجارية ، والاعتراف بها وتذكرها ، فعادةً ما يتم اختبار نص الإعلان فقط من أجل الإقناع. في مثل هذه الاختبارات ، يتم الاهتمام بشكل أساسي بفهم العنوان والشعار والرموز والكلمات الرئيسية.

اليوم نحصل على أدوات اختبار جديدة. على سبيل المثال ، يمكن اختبار الكلمات الرئيسية والعناوين الرئيسية بنجاح باستخدام نظام إعلان سياقي.

لكل طريقة تقييم مجموعة محددة من المزايا والعيوب ، بالإضافة إلى التكاليف المختلفة. وسيلة مهمة وبسيطة للغاية ، والأهم من ذلك ، وسيلة رخيصة لاختبار الكفاءة نصوص إعلانيةهي قوائم التحقق (قوائم التحقق من الأسئلة).

نسخة فيديو من المحاضرة " اختبار فاعلية الإعلان الحديث"

(التحضير للنشر)

يمكن العثور على مزيد من المعلومات التفصيلية حول هذا الموضوع في كتاب أ. نازيكين

تظهر الأخطاء التي تؤدي إلى انخفاض فعالية الاختبار في الحالات التالية:

  • لم تتم كتابة الاختبار بشكل صحيح
  • الاختبار موحد بشكل غير صحيح
  • الاختبار يساء استخدامه

تصميم الاختبار

بادئ ذي بدء ، من الضروري أن نفهم بوضوح الخاصية النفسية التي سيقيسها الاختبار المستقبلي. لا يتم إنشاء أي اختبار من البداية ، وعادة ما يستغرق إنشائه وقتًا طويلاً. عمل علميعلى دراسة المواد الموضوعية.

قبل منشئ الاختبار النفسيالتكاليف مهمة صعبة- لتعكس بشكل كامل جميع جوانب الخاصية النفسية المقاسة من خلال الحد الأدنى من عدد المهام. الشرط الأخير هو أحد معايير فعالية الاختبار. هذا لا يعني أن استبيان شخصية كاتيل ، الذي يحتوي على نصف ألف سؤال ، يمكن اعتباره غير فعال. مع هذا العدد الكبير من عوامل الشخصية المقاسة (16) ، يكون هذا العدد من الأسئلة هو الأمثل. الشيء نفسه ينطبق على اختبارات الذكاء والتحفيز ومجالات عقلية أخرى واسعة. يجب على المرء أن يحذر من الاستبيان ، على سبيل المثال ، حول الرغبة في المخاطرة ، والذي يحتوي على 250 سؤالاً.

بالإضافة إلى هذه المتطلبات ، يجب أن يفي الاختبار المجموعة المستهدفةالتي يتم توجيهها إليها. مهام مناسبة من التعقيد وسهولة الوصول لمختلف الفئات العمرية، للأشخاص الذين يعانون من اضطرابات نفسية مختلفة ، لممثلي المجموعات الوطنية واللغوية المختلفة. إذا تم تقديم الاختبار في مجموعة لغة أو دولة مختلفة ، فيجب تكييفه.

للتكيفلا تشمل ترجمة المهام فحسب ، بل تشمل أيضًا إعادة هيكلة العبارات والمفاهيم واستبدال الوحدات اللغوية والأمثال والأقوال بتلك المشابهة لها في لغة معينة. يجب نقل معنى الأسئلة مع مراعاة الآراء الدينية للمجموعة.

من الضروري أيضًا مراعاة بعض التأثيرات التي لوحظت عند ملء الأشخاص عناصر الاختبار... يتم تشغيل ما يسمى بتأثير الرغبة الاجتماعية عندما يريد شخص في إجاباته تقديم نفسه أفضل ضوء... العديد من الاختبارات مسلحة حتى الأسنان ". موازين الأكاذيب"، فخاخ أسئلة ، إلخ. ولكن هذا لا يساعد دائمًا - يجد الشخص نفس الأسئلة ، ويحتفظ بإجاباته في الذاكرة.

هناك خدعة أخرى - استبدال هدف الاختبار في التعليماتإذا تم الكشف عن هذا الهدف للموضوع على الإطلاق. ثم يُظهر الشخص الذي يجيب على الأسئلة نفسه جيدًا على جانب واحد (هدف خاطئ) ويعطي معلومات موثوقة أكثر أو أقل عن الجانب الآخر (الهدف الحقيقي) ، والتي يتم قياسها بالفعل من خلال هذا الاختبار.

هناك أيضًا متطلبات لصياغة الأسئلة ، لترتيب وضعها في الاختبار. مرة أخرى ، يعتمدون على المجموعة المستهدفة التي يهدف الاختبار من أجلها.

لا يمكن تسمية الاختبار المصمم بشكل صحيح باختبار متطور. لهذا ، يجب أن تكون موحدة.

التوحيد

يتيح توحيد الاختبار إمكانية مقارنة البيانات التي تم الحصول عليها منه أناس مختلفون... لهذا ، من الضروري أن يكون كل هؤلاء الأشخاص في ظروف متساوية. من الناحية النفسية ، يسمى هذا "التحكم في جميع المتغيرات التابعة". من الناحية المثالية ، سيكون المتغير المستقل الوحيد في الاختبار هو شخصية الموضوع. لضمان تكافؤ الفرص ، سيقدم مصمم الاختبار إرشادات محددة حول كيفية إجراء الاختبار. وتشمل هذه:

  • خصوصية مادة التحفيز
  • حدود الوقت
  • تعليمات للمواضيع
  • تعيينات العينة
  • إجابات مقبولة على الأسئلة (إذا كانت هناك حاجة إلى أي قيود)

بالإضافة إلى هذه المؤشرات ، يتم تضمين معدلات الاستجابة المحددة خصيصًا (في "النقاط الأولية") وتفسيرها في ملحق الاختبار.

بالإضافة إلى التوحيد القياسي ، يجب التحقق من صحة الاختبار لفعاليته مقابل معايير الموثوقية والصلاحية. غالبًا ما تكون هذه المفاهيم قابلة للتبديل ، لذلك دعونا نفكر في المعنى الذي يحمله كل منها.

الموثوقية

تُفهم الموثوقية على أنها اتساق النتائج التي تم الحصول عليها مع كل تنفيذ متكرر للاختبار بواسطة نفس الموضوع ، مع نتائج اختباره الأول. لا توجد موثوقية مطلقة للاختبار ، ويسمح بالأخطاء ، ولكن كلما كانت أعلى ، انخفضت كفاءة الاختبار. يمكن التحقق من الموثوقية بالطرق التالية:

  • موثوقية الاختبار وإعادة الاختباريتضمن تنفيذًا متعددًا لنفس الاختبار ومقارنة الارتباط للنتائج.
  • الموثوقية المشتركةيتم تحديده بتقسيم الاختبار إلى جزأين ومقارنة نتائج أداء الجزأين بشكل منفصل.
  • موثوقية مكافئةيتم الكشف عن طريق تقديم موضوع الاختبار ونسخته البديلة. يتم أيضًا مقارنة النتائج التي تم الحصول عليها مع بعضها البعض.

صلاحية

تكشف القواميس النفسية عن مفهوم الصلاحية كدرجة امتثال الاختبار لغرضه لقياس الغرض الذي تم إنشاؤه من أجله ؛ القدرة الفعلية للاختبار على قياس الخاصية النفسية للتشخيص المطلوب. من الناحية الكمية ، يمكن التعبير عن صحة الاختبار من خلال ارتباط النتائج التي تم الحصول عليها بمساعدته مع المؤشرات الأخرى ، على سبيل المثال ، بنجاح النشاط المقابل.

بالإضافة إلى ذلك ، يمكن إثبات صحة الاختبار من خلال مقارنة نتائجه مع تلك التي تم الحصول عليها باستخدام طرق مماثلة. على سبيل المثال ، يمكن إجراء الاختبار المطور للذكاء اللفظي مع اختبار Amthauer المعروف ، ثم مقارنة نتائجهما. الارتباط الكبير للنتائج يعني صلاحية عالية ، مما يعني أن الاختبار الجديد يقيس بالفعل الذكاء اللفظي ، وليس القدرة على الكلام ، والذاكرة ، والانتباه ، وما إلى ذلك.

قيل أعلاه عن الأخطاء في مرحلة استخدام الاختبار. قد يؤدي انتهاك شروط تنفيذه ، الموصى بها في الملاحق ، إلى نقص في الصلاحية. لنفترض أننا نجري اختبار حفظ الكلمات ونرى أن الموضوع قادر بما فيه الكفاية ، فإننا نزيد من سرعة قراءة قائمة الكلمات. في هذه الحالة ، ستكون الزيادة في السرعة متغيرًا إضافيًا مستقلًا ، بمعنى آخر ، عائق. نتيجة لذلك ، بدلاً من سرعة الحفظ ، سنقيس مقاومة الإجهاد للفرد.

يتضمن تقييم صلاحية الاختبار الخطوات التالية:

  • تحديد الصلاحية الظاهرة(صلاحية الوجه). يمكن رؤية هذه الصلاحية ، كما يقولون ، "بالعين المجردة" - يتم تقييم الامتثال العام للاختبار مع الغرض منه.
  • تعريف الصلاحية المفاهيمية(بناء صلاحية). الدرجة التي يتوافق بها اختبار قياس خاصية ما مع المفاهيم النظرية المقبولة عمومًا لتلك الخاصية. كقاعدة عامة ، يتم تقييم هذه الصلاحية من قبل الخبراء.
  • تحديد الصلاحية التجريبية(صحة تجريبية). يتم تحديد معيار (متغير مستقل) لربط نتائج الاختبار به. على سبيل المثال ، يمكن أن يكون معيار اختبار الاستعداد للمدرسة هو الأداء العام لطالب الصف الأول.
  • تحديد صلاحية المحتوى(صلاحية المحتوى). يجب أن يتضمن الاختبار الذي تم تطويره أسئلة لتقييم أقصى عدد ممكن من معلمات الخاصية التي يقيسها هذا الاختبار (تم ذكر القاعدة الأولى لتكوين اختبار أعلاه - الحد الأقصى لعدد معلمات الخاصية من خلال الحد الأدنى لعدد المهام). يتم تقييم هذه الصلاحية أيضًا باستخدام حكم الخبراء.

بالمناسبة ، لا تجتاز الاختبارات الجديدة مثل هذا الاختبار فقط. حاليًا ، ينشغل العديد من الباحثين بتحليل فعالية الاختبارات المعروفة بالفعل. أثار الجدل الأخير على صفحات المجلة النفسية "علم النفس في المصلحة العامة" تساؤلات حول فعالية "أساتذة" أدوات التشخيص النفسي مثل اختبار Rorschach inkblot و TAT (اختبار الإدراك الموضوعي) والاختبار الإسقاطي للرسم شخصية الإنسان. اتضح أن تقنيات التشخيص النفسي هذه لها صلاحية تجريبية منخفضة وموثوقية منخفضة في الاختبار وإعادة الاختبار ومؤشرات معيارية مجمعة بشكل غير صحيح.

تساعد الأساليب المذكورة أعلاه لتقييم فعالية الاختبار عالم النفس ليس فقط في تصميم أدوات لقياس سمات شخصية معينة بنفسه ، ولكن أيضًا لاختيار الاختبارات الأكثر جودة وموثوقية من الاختبارات التي تم تطويرها بالفعل.

المجمع النفسي Effecton Studio

كانت الأولوية الرئيسية في إنشاء مجمع Effecton Studio هي تضمين الأساليب القائمة على المعرفة والمعلومات فقط. بالإضافة إلى ذلك ، نقدم دعمًا إعلاميًا للتقنيات النفسية لمستخدمينا ، وكذلك لزوار الموقع وقراء النشرة الإخبارية. نحن نولي اهتمامًا خاصًا بكفاءة العمل وبيئة العمل - بعد اجتياز الاختبارات النفسية لـ Effecton Studio ، لا يتم تزويد المستخدم بالنتائج الأولية فحسب ، بل أيضًا بتفسيرها ، ويتم توفير طرق مريحة للاختبار الجماعي والتحليل الإحصائي.

تم أيضًا تطوير العديد من الميزات الأخرى ، والتي نوصيك بالتعرف عليها عن طريق تنزيل إصدار تجريبي من موقعنا على الويب وطلب مجمع لاستخدامه في مؤسستك. يمكنك أيضًا إبلاغ المستخدمين المهتمين الآخرين بالمجمع ، وفي هذه الحالة ، ستحصل على 25 ٪ من قيمة المعاملة.

أولغا دانيلوفا.

المواد الحصرية للموقع "www .. استعارة النصوص و / أو المواد ذات الصلة ممكن فقط من خلال رابط مباشر ومرئي إلى الأصل. جميع الحقوق محفوظة.

نسخة تجريبية من المجمع

في في.أودينتسوفا

باستخدام العديد من تقنيات التشخيص النفسي ، نادرًا ما نفكر في جودة أدوات العمل هذه. وعبثا. بعد كل شيء ، يعرف أي طبيب نفساني ممارس أنه لا يمكن إجراء فحص نفسي بدون أدوات تشخيص جيدة.

في الوقت نفسه ، فإن المجموعات الشعبية للاختبارات النفسية ، التي نُشرت مؤخرًا على نطاق واسع ، للأسف ، لا تلبي متطلبات المحترف الحقيقي ، الذي يجب أن يكون واثقًا من القدرات التشخيصية للأداة التي يستخدمها في عمله. لذا، تظل مشكلة العثور على تقنية تشخيصية متطورة وموثوقة ذات صلة.

تتمثل المهمة الرئيسية لمختبر الموارد البشرية للتقنيات البشرية في تطوير منتجات عالية الجودة. أحد شروط إنشاء مثل هذه المنتجات هو إجراء فحوصات دورية لطرق الاختبار للتأكد من امتثالها لعدد من المتطلبات السيكومترية (الصلاحية ، الموثوقية ، التمثيلية ، الموثوقية). للقيام بذلك ، بعد تعيين عدد كافٍ من البروتوكولات ، تحليل احصائيطرق الاختبار.

خذ بعين الاعتبار التحليل النفسي (كانت العينة الإجمالية 660 شخصًا).

هذا الاختبار ، الذي تم تطويره في التسعينيات ، مخصص للتشخيص السريع لمستوى شدة خمسة مما يسمى عوامل "كبيرة" من المزاج والشخصية ويستخدم لدراسة شخصية البالغين لغرض الاختيار المهني ، والمشورة المهنية ، تحديد اتجاهات المساعدة النفسية ، ومجموعات التجنيد ، ومعرفة الذات ، إلخ.

أساس عالمية "العوامل الخمسة الكبرى" هو تعدد المواقف: تنطبق عوامل التقييم العالمي للنشاط الوظيفي للفرد على أي موقف تقريبًا للسلوك الاجتماعي والنشاط المرتبط بالكائن ، حيث توجد اختلافات مستمرة بين تم العثور على الناس.

يتضمن الاستبيان 75 فقرة مع ثلاثة خيارات للإجابة لكل منها.

مقاييستمثل الاختبارات استنساخًا دقيقًا للعوامل الخمسة الكبرى في نسختها الدولية (باستثناء العامل الخامس ، والذي تم تعيينه في عدد من الإصدارات الغربية من B5 على أنه "الانفتاح على التجربة الجديدة - التطبيق العملي المحدود"):

  • الانبساط - الانطواء
  • الموافقة - الاستقلال
  • منظمة - الاندفاع
  • الاستقرار العاطفي - القلق
  • قابلية التعلم - القصور الذاتي

1. التحقق من الصلاحية

عند التحقق من المقاييس الحالية بالطريقة التقليدية - عن طريق حساب الارتباطات بين إجابات الأسئلة وإجمالي الدرجات على المقياس - وجدنا أن جميع العناصر تقريبًا مرتبطة بشكل كبير بمقاييسها بمتوسط ​​معامل ارتباط 0.35.

عند التدقيق ذو معنى صحة الاختبار ، تم تحليل صياغة عناصر الاختبار ، مما يعكس بشكل مفيد المقابل موضوع النقاش(مجال السلوك) ووجود ارتباط معنوي (إيجابي أو سلبي) مع النتيجة الإجمالية:

حجم عناصر اختبار العينة معامل الارتباط
الانبساط من المهم بالنسبة لي أن أعبر عن رأيي للآخرين (0,31)
أحب المشاركة في جميع أنواع المسابقات والمسابقات وما إلى ذلك. (0,41)
أنا أستمتع بزيارة ومقابلة أشخاص جدد. (0,5)
اتفاق معظم الناس لا يمكن الوثوق بهم (-0,23)
اهتماماتي هي قبل كل شيء بالنسبة لي (-0,22)
"من يساعد الناس يضيع الوقت ، الاعمال الصالحةلا يمكنك أن تصبح مشهوراً " (-0,3)
"الجميع - لنفسه" - هذا هو المبدأ الذي لن يخذلك (-0,4)
التحكم فى النفس عندما أذهب إلى الفراش ، أعرف بالفعل على وجه اليقين ما سأفعله غدًا. (0,37)
آخذ كتابًا ، وأضعه دائمًا في مكانه (0,35)
قبل الأمور المسؤولة ، أقوم دائمًا بوضع خطة لتنفيذها. (0,37)
المزيد احمر خجلا بسهولة (-0,28)
إذا اكتشفت (أ) ظهور موقف غير مرغوب فيه في العمل ، فهذا دائمًا ما يسبب لي شكًا مؤلمًا حتى يتم توضيح الموقف (-0,3)
في نهاية اليوم ، عادة ما أشعر بالتعب لدرجة أن كل شيء صغير يبدأ بالفزع. (-0,32)
من السهل إفساد مزاجي (-0,42)

يشير تحليل الصيغ المذكورة أعلاه إلى درجة عالية من الصلاحية الموضوعية للاختبار.

2. التحقق من الموثوقية

يتم تحديد موثوقية الاختبار كوسيلة للقياس من خلال الاحتمال المنخفض للأخطاء في قياس درجات الاختبار ومدى إعادة إنتاج نتائج القياس عند استخدام الاختبار بشكل متكرر فيما يتعلق بمجموعة معينة من الموضوعات. من أجل تقييم مساهمة المصادر المختلفة في خطأ القياس ، من الضروري استخدام طرق مختلفة لتقييم الموثوقية. من الأمور ذات الأهمية الخاصة تقييم الاتساق الداخلي للاختبار ؛ فهو يحدد جزء الخطأ المرتبط باختيار العناصر.

تم تقييم الاتساق الداخلي للاختبار من خلال حساب معامل كرونباخ ألفا. هذا المعامل هو تقييم الموثوقية بناءً على تجانس المقياس أو مجموع الارتباطات بين إجابات الموضوعات على الأسئلة في نفس نموذج الاختبار.

في حالتنا ، أظهر معامل موثوقية كرونباخ ألفا المحسوب لكل مقياس مستوى لائقًا تمامًا من الاتساق الداخلي ، وهو تقليدي للاستبيانات الشخصية السريعة ، حيث تحتوي المقاييس الفرعية على عدد محدود من العناصر (أقل من 20):

تذكر أن المتطلبات السيكومترية الصارمة لاختبار شخصية عاملة فعالة تتوافق مع قيمة معاملات ألفا التي تزيد عن 0.8.

في حالتنا ، يمكن تفسير المستوى المنخفض نسبيًا لقيمة معاملات موثوقية كرونباخ من خلال الحجم الهادف لهذه المقاييس: كل مقياس يحتوي على 15 سؤالًا متنوعًا ، مما يسمح لنا بتوسيع نطاق العوامل المدروسة ، والتضحية في نفس الوقت الوقت على مستوى عال من الاتساق الداخلي.

كان لهذا تأثير حاد بشكل خاص على مقاييس عامل "الموافقة" و "التدريب" ، والتي وفقًا لها تبين أن معامل ألفا أقل من 0.6.

3. التحقق من التمثيل

في الانتقال من عينة التوحيد القياسي (الشكل 1-300 شخص) إلى عينة السكان (الشكل 2-660 شخصًا) ، يظهر استقرار تكوين توزيع نقاط الاختبار ، مما يشير إلى التمثيلية طريقة اختبار:

رسم بياني 1.عينة التوحيد (300 شخص)

الصورة 2.عينة من السكان (660 شخص)

بالإضافة إلى التشابه البصري لهذه التوزيعات ، أظهر اختبار Pearson chi-square الذي استخدمناه الدرجة التالية من التشابه في التوزيعات:

تقع قيم مربع كاي في فترة عدم اليقين: عندما يكون من المستحيل قبول أو رفض الفرضية المتعلقة باتساق التوزيعات بشكل لا لبس فيه.

قد تكون هذه النتيجة بسبب الخاصية الرئيسية للاختبار السريع ، وهي العدد القليل من الأسئلة التي تعمل على كل مقياس. بالنظر إلى هذه الحقيقة ، يمكن اعتبار نتائج اختبار التمثيل مرضية.

4. فحص المعقولية

نظرًا لأن الأشخاص الذين تم اختبارهم على الموقع كانوا في وضع العميل (كانوا مهتمين بنتائج موثوقة) ، يمكن اعتبار النتائج التي تم الحصول عليها باحتمالية عالية موثوقة.

ومع ذلك ، في حالة الخبرة (عندما يكون طرف ثالث مهتمًا بنتائج الاختبار) ، قد يتم تشويه البيانات من خلال تدخل التزوير الواعي (الأكاذيب ، عدم صدق الموضوع) أو عوامل التحفيز اللاواعية. لتجنب ذلك ، تمت إضافة مقياس كذب إلى الإصدار المصمم لمثل هذه الحالات (B5splus) (في الوقت الحالي يتم اختبار هذا الإصدار على موقعنا على الويب).

النتائج التي تم الحصول عليها هي دليل على الجودة العالية وفعالية المنهجية ، وهو أمر مهم ، لأن المستوى المهني للمتخصص غالباً ما يتم تحديده من خلال الأداة التي يستخدمها.

ومع ذلك ، ينبغي أن نتذكر أنه حتى قوية أداة حديثةلا يضمن الغياب التام للأخطاء. من أجل تجنبها ، لا يكفي أن يكون لديك جهاز كمبيوتر وبرنامج اختبار لذلك. مطلوب أيضًا طبيب نفساني متمرس للإشراف على الاختبار. لذا فإن وجود الاختبارات التي خضعت للتكيف النفسي الجاد لا ينفي على الإطلاق الكفاءة المهنية والخبرة التي يتمتع بها عالم النفس ، والذي يتم استدعاؤه للتحقق من معقولية نتائج الاختبار باستخدام مصادر معلومات موازية (بما في ذلك ملاحظته الخاصة ، ومحادثاته ، إلخ. ).

لقد كانت ذات صلة لسنوات عديدة ؛ تم تخصيص الكثير من الدراسات لهذه القضية. في هذه المقالة ، سننظر في عملية تنفيذ مؤشرات الأداء الرئيسية ومنهجية تقييم جودة عملنا باستخدام مشروع حقيقي كمثال.

ما هي مؤشرات الأداء الرئيسية؟

لذا ، أولاً ، دعنا ننتقل إلى مفهوم KPI ذاته. KPI (مؤشر الأداء الرئيسي) هو مؤشر على النجاح في نشاط معين أو في تحقيق أهداف معينة. يمكننا القول أن KPI هو مؤشر قابل للقياس الكمي للنتائج المحققة بالفعل.

في حالتنا ، يعد KPI في المشروع مؤشرًا لفعالية فريق الاختبار بأكمله. بالإضافة إلى مصطلح KPI ، ستستخدم المقالة مصطلح "المقاييس" ، والذي نعني به قيمة عددية لقياس هذه الكفاءة.

لماذا نحتاج مؤشرات الأداء الرئيسية؟

الآن دعنا نتحدث عن سبب احتياجنا لمؤشرات الأداء الرئيسية في المشروع ، ولماذا قررنا تنفيذها. كل شيء بسيط هنا: أردنا أن نرى حالة المشروع في أي وقت وأن نتخذ تدابير وقائية لتجنب المشاكل. شكرا ل مدير KPIاتجاهات الاختبار على المشروع لا يرى فقط قوية و نقاط الضعفالمشروع وفريقه بالكامل ، ولكن يمكنه أيضًا تتبع ديناميكيات عواقب قرارات الإدارة الخاصة به (ما تم القيام به بشكل صحيح ، وأي من القرارات المتخذة كانت ناجحة أو غير ناجحة) ، وفي المستقبل - تصحيحها.

بالإضافة إلى ذلك ، يمكن أن تشمل مؤشرات الأداء الرئيسية ليس فقط المؤشرات الكمية المقبولة عمومًا ، ولكن أيضًا المؤشرات النوعية (على سبيل المثال ، "مستوى رضا العملاء"). لكن دعنا نتحدث عن كل شيء بالترتيب!

من أين تحصل على مؤشرات الأداء الرئيسية؟

كل مشروع فريد من نوعه من نواح كثيرة. لا تفترض أن المقاييس المأخوذة من مشروع ما سوف "تترسخ" جيدًا في مشروع آخر ؛ يجب تطويرها مع مراعاة خصوصيات المشروع وتوقعات / اهتمامات عميلك. لكن تحويل التوقعات إلى مقاييس يستغرق وقتًا وصبرًا.

كيف كان الأمر معنا


الآن ، كما وعدت ، سأتحدث عن أعمالنا في المشروع.

لذلك ، اختبر فريقي البرنامج الداخلي للعميل ، والذي يتكون من العديد من الكتل الوظيفية الكبيرة ، بالإضافة إلى تكامل البرامج مع أنظمة تخزين المكتب الخلفي.
سأوضح على الفور أنه من خلال العميل في المقالة أعني أي شخص مهتم باختبار منتج والسعي لضمان أن المنتج يلبي احتياجات المستخدمين النهائيين ويدخل حيز التشغيل التجاري.

جاء العميل إلينا ببعض التوقعات المحددة من الاختبار بهدفه الخاص. في هذه المرحلة ، كانت مهمتي كرئيس لقسم الاختبار في المشروع تحديد هذه الأهداف والتوقعات بالذات. هناك العديد من الخيارات لمثل هذا التحليل - استطلاعات الرأي وملء الملخصات والاتصال الشفوي. أهم شيء هو معرفة ما يريده العميل ، وما الذي يقلقه ، وما الذي "يؤذيه".

دعونا نعطي أمثلة على صيغ العميل: "الكيانات لا" تصل "من وحدة برنامج إلى أخرى ، ولكن هناك حاجة إليها هناك ، والكثير منها مرتبط بها" ؛ "لا يمكننا نقل المعلومات من البرنامج القديم إلى الإصدار الجديد" ؛ "نحن نخطط بشكل كامل للانتقال من نظام إلى آخر ، لذلك سنقوم بتعديل النقل".

بعد تشكيل توقعات (أو مخاوف) عملائنا ، يجب علينا تحويلها إلى هدف. من السهل تخمين أن الغرض من اختبارنا هو إجراء الاختبار التقييم المتكاملجودة المنتج من خلال التكامل والاختبار الوظيفي البرمجياتعميل.

الآن كان علينا تنفيذ عملية التحلل ، أي تقسيم الهدف العالمي إلى مهام صغيرة قابلة للحل لفريق المشروع. بالمناسبة ، ساعدني الفريق نفسه في هذا! لنرى كيف حدث هذا ، ولكن أولاً ، دعنا نوضح مصطلح "التحلل" مرة أخرى ، بوضع كل شيء على الرفوف.

تقسيم

ما هو التحلل؟ التحلل طريقة علمية، والذي يستخدم هيكل المشكلة ويسمح لك باستبدال حل مشكلة واحدة كبيرة بحل سلسلة من المهام الفرعية الأصغر ، وإن كانت مترابطة ، ولكنها أبسط. مبدأ التحلل هو أن التطبيق قيد الاختبار (وحدة منفصلة أو وظيفية) يمكن اعتباره مكونًا من أنظمة فرعية مستقلة نسبيًا ، كل منها أسهل بكثير وأكثر قابلية للفهم للاختبار من النظام بأكمله في وقت واحد.

إذا كان العميل يريد أن يتلقى اختبار التكامل ، فنحن بحاجة إلى تحليل الاختبار الوظيفي للتكامل للمنتج. للقيام بذلك ، من الضروري فهم الأجزاء التي تتكون منها أنظمة العميل ، وعدد الأنظمة المشتركة بشكل عام في تبادل البيانات ، وما هي الإجراءات والأشياء التي يمكن لمستخدمي الأنظمة تنفيذها ، وما إلى ذلك.

من الناحية النظرية ، كل شيء بسيط وواضح: من مشكلة كبيرة ، تحتاج إلى الحصول على عدد من المشكلات الصغيرة. قد لا يبدو الأمر معقدًا ، لكن في الممارسة العملية غالبًا ما نواجه حقيقة أننا ببساطة لا نفهم معايير تحلل المشكلة ، وبالتالي نقوم بكل شيء عشوائيًا. تتمثل عواقب سوء التفاهم في عبء العمل غير المتكافئ على مختبري المشروع ، والتقديرات غير الصحيحة لتكاليف العمالة ، والفهم غير الصحيح للمهام ، وفكرة مختلفة عن النتائج. لفهم هذا الموضوع بشكل أفضل ، دعنا ننتقل إلى مبدأ SMART.

مبدأ SMART

بشكل عام ، SMART هو اختصار ذاكري يستخدمه المديرون على مستويات مختلفة لحفظ مبادئ تحديد الأهداف. كل حرف من الاختصار له تفسيره الخاص:

    • خاص - محدد. عند تحديد مهمة ، يجب أن نفهم بوضوح النتيجة التي نريد تحقيقها. يجب أن تكون النتيجة واضحة ومفهومة لجميع المشاركين في العملية - اختبار موظفي الفريق والعملاء والمديرين من مختلف المستويات.
    • M سهل - قابل للقياس. نحن بحاجة إلى مهام يمكن قياسها. بمعنى آخر ، تفترض القابلية للقياس وجود معايير - مؤشرات ، مؤشرات أداء.
    • يمكن تحقيقه. في هذه الحالة ، سأعيد تسمية تعريف "قابل للتحقيق" إلى "يمكن الوصول إليه" (متاح للتنفيذ من قبل موظف بمستوى معين من التدريب والمؤهلات). لن يكلف القائد الكفء المبتدئ أبدًا بمهمة صعبة للغاية ، لأنه يدرك أن المبتدئ ببساطة لا يمكنه التعامل معها ، والوقت الذي يقضيه في محاولة حلها لا يمكن إرجاعه. مع مراعاة الخصائص والصفات الشخصية لموظفي فريق الاختبار في المشروع سيسمح بوضوح شديد (والأهم من ذلك - بشكل متساوٍ وعملي) بتوزيع العبء ، لإعطاء المبتدئين مهام بسيطة ، و "النجوم" والإيجابيات - المهام المعقدة المنطق وفق قوتهم ومهاراتهم.
    • R ذات صلة - ذات صلة وذات مغزى. هل إكمال مهمة ما في غاية الأهمية بالنسبة لنا؟ هل هذه المهمة ضرورية الآن؟ ماذا سنحصل إذا حللنا هذه المشكلة؟ وإذا لم نقرر؟
    • مقيدة بالزمن - محدودة بالوقت. يجب أن يكون لأي مهمة موعد نهائي خاص بها يجب حلها خلاله. يسمح لك تحديد الأطر الزمنية والحدود لإكمال المهمة بجعل العملية قابلة للتحكم وشفافة. يمكن للمدير في أي وقت رؤية تقدم المهمة.

لذلك ، أصبح لدى القارئ الآن فهم للمعايير التي يمكن استخدامها لتحليل مشكلة كبيرة. يمكننا المضي قدما.

بعد تقسيم مهمة كبيرة إلى عدد من المهام الصغيرة ، تحتاج إلى تحليل كل مهمة فرعية. دعونا نسلط الضوء عليهم. لذلك ، في مشروعنا ، تلوح في الأفق مجموعة الإجراءات التالية:

  • نحن نغطي بالاختبارات جميع الوظائف الرئيسية التي ينطوي عليها التكامل ؛
  • نقوم بتطوير كيانات وبيانات الاختبار ؛
  • نقوم باختبار المهام لتحسين الوظائف ؛
  • نبدأ في اكتشاف العيوب أثناء الاختبار ؛
  • فحص الإصدارات والإصلاحات الساخنة ؛
  • نتأكد من أنه في كل إصدار جديد من المنتج ، من الممكن نقل منتجين ذوي أولوية من نظام إلى آخر.

بالإضافة إلى هذه المهام الفرعية الرئيسية ، فقد حددت عددًا قليلاً من المهام الإضافية:

    • لا نريد إضاعة الوقت في الشرح للمطورين "ما هو الخطأ هنا وكيف يمكن إعادة إنتاجه" ، وبالتالي سنخلق عيوبًا كفؤة ومفهومة ؛
    • يجب أن يكون عمل الاختبار لدينا شفافًا قدر الإمكان ، لذلك سنقدم للعميل حالة وسيطة وفقًا لحالة الإصدار ؛
    • نريد أن يستمتع العميل بالعمل معنا ، وفي المرة القادمة التفت إلينا مرة أخرى.

    الآن دعنا ننتقل إلى كل مهمة فرعية معًا ونلقي نظرة على المقاييس القابلة للقياس.

    المقاييس التي تشكل مؤشرات الأداء الرئيسية

    تغطية وظيفية بالاختبارات.كيف يمكننا قياسه؟ استقرنا على المقياس "النسبة المئوية للتغطية xx لعدد وحدات المنتج عن طريق الاختبارات" (لمزيد من المعلومات حول كيفية حساب ذلك ، راجع مقالة Natalia Rukol).

    سيؤدي النقر فوق الصورة إلى فتح النسخة الكاملة.

    تطوير حالات الاختبار وكيانات الاختبار.قررنا هنا العمل باستخدام مقياس "عدد الوحدات / الكتل الوظيفية للمنتج الذي تم تطوير 100٪ من الكيانات من أجله".

    اختبار تعديلات العميل.في هذه الحالة ، قمنا ببساطة بإحصاء عدد المراجعات التي تم اختبارها لكل إصدار ومتوسط ​​الوقت الذي استغرقه الفريق في المراجعة. لقد جمعنا هذه المؤشرات من أجل تقييم الهدف من الإصدار (إصلاح الأخطاء أو إدخال وظائف عميل جديد) ، وبالتالي ، ما إذا كنا نفي بالمواعيد النهائية لتنفيذ ميزات معينة.

    "إثبات العيوب".قررنا استخدام عدة مقاييس من شأنها أن تعطينا معلومات حول حالة الإصدار: "عدد العيوب التي قدمها الفريق" ، "عدد عيوب أولوية Blocker لكل إصدار".

    "إصدارات اختبارية وإصلاحات سريعة"تم الحل من خلال مقاييس "النسبة المئوية للمهام المختبرة المضمنة في الإصدار و / أو الإصلاح السريع" (نسبة المهام المختبرة إلى إجمالي عدد المهام في الإصدار) ، و "النسبة المئوية لحالات الاختبار التي تم تمريرها في الإصدارات" و "النسبة المئوية للنجاح في تمرير القضايا على الإصدارات ".
    نحسب القياس الأخير بالصيغة:

    حيث P1 - مرت خطوات على الكتلة الأولى ،
    P2 - الخطوات التي مرت على الكتلة الثانية ،
    Pn - الخطوات التي مرت على الكتلة رقم n ،
    A1 - عدد الخطوات في الكتلة الأولى ،
    A2 - عدد الخطوات في الكتلة الثانية ،
    هو عدد خطوات الكتلة رقم n ،
    N هو العدد الإجمالي لجميع كتل المنتج.

    لقياس المشكلة المتعلقة بصحة المنتجات ذات الأولوية ، قمنا بتطوير مصفوفة بشكل خاص (لاحظت ما إذا كانت هذه القيمة أو تلك للمنتج تعمل أم لا تعمل) ثم حسبت "النسبة المئوية للقيم التي تعمل للمنتج 1 والمنتج 2 في الإصدار ". نحسب بالصيغة:

    حيث Pп1 هو عدد قيم العمل للمنتج الأول ،
    Ap1 - جميع قيم المنتج هي نفسها.

    سيؤدي النقر فوق الصورة إلى فتح النسخة الكاملة.

    بعد أن تعاملنا مع المهام الرئيسية ، انتقلنا إلى مهام إضافية.

    دعني أذكرك بأننا لم نرغب في قضاء وقت ثمين في شرح الأخطاء والتعليق على التقارير ، ولكن في نفس الوقت كان من المهم بالنسبة لنا أن يكون العميل راضيًا عن عملنا. وبالتالي ، بالنسبة للمهمة الفرعية الأولى ، قررنا استخدام المؤشرات الكمية "النسبة المئوية للعيوب المرفوضة في الإصدار الذي يحتوي على" لا يمكن إعادة إنتاج الحل "، وبالنسبة للمهمة الثانية -" عدد طلبات العملاء للتعليق على التقرير المؤقت "و مؤشر نوعي "رضا العملاء عن عملنا".
    لتقييم "رضا العملاء" ، قدمنا ​​ثلاثة مستويات - "كل شيء على ما يرام" ، و "هناك تعليقات / أسئلة صغيرة حول العمل" و "كل شيء سيء ، والعميل غير سعيد". هذا المؤشر ، بالمناسبة ، يساعد بشكل عام كثيرًا في اتخاذ القرار السريع داخل فريق المشروع. إذا كان العميل غير راضٍ أو منزعج بشأن شيء ما ، فإننا "على الطريق السريع" نجري مناقشة: نحاول تقليل المخاطر ، وفهم أسباب عدم الرضا ، والعمل على الحل في أسرع وقت ممكن وتقديمه إلى العميل.

    سيؤدي النقر فوق الصورة إلى فتح النسخة الكاملة.

    ما تعطينا مؤشرات الأداء الرئيسية في النهاية

    يعد إعداد KPI لمشروع إجراء مكلف ، ولكنه مثير للاهتمام ومفيد ، وإليك السبب.
    من خلال جمع المقاييس المذكورة أعلاه ، يمكنني الحصول على إجابات للأسئلة: ما الذي قام به فريقي جيدًا بالضبط ، وما هي المؤشرات التي نمت من خلالها ، قرارات الإدارة... يمكنني الرد على الأسئلة التالية في أي وقت:

    • ما هي حالة الإصدار؟
    • ما هي وحدات المنتج الأكثر أهمية وعربات التي تجرها الدواب ؛
    • ما هي الوحدات التي ينبغي إيلاء اهتمام خاص لها ؛
    • ما هي المقاييس التي تعمل مع المنتجات ذات الأولوية ؛
    • ما إذا كان من الممكن إعطاء المنتج للاستخدام الصناعي.

بعد تنفيذ المقاييس في مشروعي ، أصبح من الأسهل إعداد تقارير مؤقتة للعميل ، بذل فريق المشروع بأكمله (والأشخاص الذين يمكنهم الوصول إلى مؤشر الأداء الرئيسي للمشروع) كل جهد ممكن لتنمية برنامجنا
المؤشرات ، أصبح الجميع أكثر انتباهًا وتركيزًا!

بدلا من الاستنتاج

في "مختبر الجودة" ذهبنا إلى أبعد من ذلك بقليل ، ومع ذلك قررنا جمع قاعدة من المقاييس التي تنطبق على مشاريعنا. لا ، أنا لا أقول أنه يمكنك أخذ مواد جاهزة والعمل معها ، ولكن كل مدير يواجه موضوع تنفيذ مؤشرات الأداء الرئيسية في مشروعه يمكنه الرجوع إلى قاعدة البيانات هذه ، راجع المقاييس التي يتم جمع مؤشرات الأداء الرئيسية منها مشاريع أخرى ، وتكييف هذه المقاييس لتناسب احتياجاتك. لقد أعددنا أيضًا لوائح داخلية (نوع من التعليمات لتنفيذ مؤشرات الأداء الرئيسية في المشاريع) ، والتي تعمل من خلالها هذه العملية بسلاسة ودون عناء.

لا تخف من أن تأخذ الوقت الكافي للاستعداد و تنفيذ KPIفي المشروع: هذه التكاليف ستؤتي ثمارها بالكامل! سيكون عميلك راضيًا عن العمل المنجز والجودة الممتازة للمنتج. سوف يلجأ إليك للمساعدة مرارًا وتكرارًا!

الخامس السنوات الاخيرةأصبح الاختبار الآلي اتجاهًا في تطوير البرمجيات ، بمعنى ما ، أصبح تنفيذه "تكريمًا للموضة". ومع ذلك ، فإن تنفيذ الاختبارات الآلية وصيانتها عملية كثيفة الاستخدام للموارد ، وبالتالي فهي ليست إجراءً رخيصًا. غالبًا ما يؤدي الاستخدام الواسع النطاق لهذه الأداة إلى خسائر مالية كبيرة دون أي نتيجة ذات مغزى.

كيف يمكنك استخدام أداة بسيطة إلى حد ما لتقييم الفعالية المحتملة لاستخدام الاختبارات التلقائية في مشروع؟

ما هو تعريف "فعالية" أتمتة الاختبار؟

الطريقة الأكثر شيوعًا لتقييم الكفاءة (اقتصادية بشكل أساسي) هي حساب العائد على الاستثمار(عائد الاستثمار). يتم حسابها بكل بساطة ، كونها نسبة الربح إلى التكاليف. بمجرد أن تتجاوز قيمة عائد الاستثمار قيمة واحدة ، يعيد الحل الأموال المستثمرة فيه ويبدأ في جلب أموال جديدة.

في حالة الأتمتة ، الربح يعني التوفير في الاختبار اليدوي... بالإضافة إلى ذلك ، قد لا يكون الربح في هذه الحالة واضحًا - على سبيل المثال ، نتائج اكتشاف العيوب في عملية الاختبار المخصصة من قبل المهندسين ، الذين تم توفير وقتهم بسبب الأتمتة. يصعب حساب مثل هذا الربح ، لذا يمكنك إما وضع افتراض (على سبيل المثال + 10٪) أو حذفه.

ومع ذلك ، فإن المدخرات ليست دائمًا الهدف من تنفيذ الأتمتة. مثال واحد هو اختبار سرعة التنفيذ(سواء من حيث سرعة تنفيذ اختبار واحد أو من حيث تكرار الاختبار). لعدد من الأسباب ، يمكن أن تكون سرعة الاختبار حاسمة للأعمال - إذا كان الاستثمار في الأتمتة يؤتي ثماره من الأرباح الناتجة.

مثال آخر - استثناء " عامل بشري» من عملية اختبار النظام. هذا مهم عندما تكون دقة العمليات وصحتها أمرًا بالغ الأهمية للأعمال. يمكن أن تكون تكلفة مثل هذا الخطأ أعلى بكثير من تكلفة تطوير وصيانة اختبار تلقائي.

لماذا تقيس الأداء؟

يساعد قياس الفعالية في الإجابة عن الأسئلة: "هل يستحق تنفيذ الأتمتة في مشروع ما؟" ، "متى سيحقق لنا التنفيذ نتيجة ذات مغزى؟" ، "كم عدد ساعات الاختبار اليدوي التي سنستبدلها؟"؟ " وإلخ.

يمكن أن تساعد هذه الحسابات في صياغة أهداف (أو مقاييس) لفريق أتمتة الاختبار. على سبيل المثال ، توفير X ساعة شهريًا من الاختبار اليدوي ، مما يقلل من تكلفة فريق الاختبار بواسطة Y الوحدات التقليدية.

هل أعجبك المقال؟ أنشرها