.. DO NOT EDIT. .. THIS FILE WAS AUTOMATICALLY GENERATED BY SPHINX-GALLERY. .. TO MAKE CHANGES, EDIT THE SOURCE PYTHON FILE: .. "auto_examples/feature_selection/plot_rfe_with_cross_validation.py" .. LINE NUMBERS ARE GIVEN BELOW. .. only:: html .. note:: :class: sphx-glr-download-link-note :ref:`Go to the end ` to download the full example code. or to run this example in your browser via JupyterLite or Binder .. rst-class:: sphx-glr-example-title .. _sphx_glr_auto_examples_feature_selection_plot_rfe_with_cross_validation.py: =================================================== إزالة الميزات المتكررة باستخدام التحقق المتبادل =================================================== مثال على حذف الميزات التكراري (RFE) مع الضبط التلقائي لعدد الميزات المحددة مع التحقق المتبادل. .. GENERATED FROM PYTHON SOURCE LINES 10-14 .. code-block:: Python # Authors: The scikit-learn developers # SPDX-License-Identifier: BSD-3-Clause .. GENERATED FROM PYTHON SOURCE LINES 15-22 توليد البيانات --------------- نقوم ببناء مهمة تصنيف باستخدام 3 ميزات إعلامية. إن إدخال ميزتين إضافيتين متكررتين (أي مترابطتين) له تأثير أن الميزات المحددة تختلف اعتمادًا على طية التحقق المتبادل. الميزات المتبقية غير إعلامية حيث يتم رسمها عشوائيًا. .. GENERATED FROM PYTHON SOURCE LINES 22-37 .. code-block:: Python from sklearn.datasets import make_classification X, y = make_classification( n_samples=500, n_features=15, n_informative=3, n_redundant=2, n_repeated=0, n_classes=8, n_clusters_per_class=1, class_sep=0.8, random_state=0, ) .. GENERATED FROM PYTHON SOURCE LINES 38-43 تدريب النموذج واختياره ---------------------------- نقوم بإنشاء كائن RFE وحساب الدرجات التي تم التحقق منها بشكل متبادل. استراتيجية التسجيل "الدقة" تعمل على تحسين نسبة العينات المصنفة بشكل صحيح. .. GENERATED FROM PYTHON SOURCE LINES 43-64 .. code-block:: Python from sklearn.feature_selection import RFECV from sklearn.linear_model import LogisticRegression from sklearn.model_selection import StratifiedKFold min_features_to_select = 1 # الحد الأدنى لعدد الميزات المطلوب مراعاتها clf = LogisticRegression() cv = StratifiedKFold(5) rfecv = RFECV( estimator=clf, step=1, cv=cv, scoring="accuracy", min_features_to_select=min_features_to_select, n_jobs=2, ) rfecv.fit(X, y) print(f"العدد الأمثل للميزات: {rfecv.n_features_}") .. rst-class:: sphx-glr-script-out .. code-block:: none العدد الأمثل للميزات: 3 .. GENERATED FROM PYTHON SOURCE LINES 65-70 في الحالة الحالية، تم العثور على النموذج الذي يحتوي على 3 ميزات (والذي يتوافق مع نموذج التوليد الحقيقي) هو الأمثل. رسم عدد الميزات مقابل درجات التحقق المتبادل --------------------------------------------------- .. GENERATED FROM PYTHON SOURCE LINES 70-86 .. code-block:: Python import matplotlib.pyplot as plt import pandas as pd cv_results = pd.DataFrame(rfecv.cv_results_) plt.figure() plt.xlabel("عدد الميزات المحددة") plt.ylabel("متوسط دقة الاختبار") plt.errorbar( x=cv_results["n_features"], y=cv_results["mean_test_score"], yerr=cv_results["std_test_score"], ) plt.title("حذف الميزات التكراري \nمع ميزات مترابطة") plt.show() .. image-sg:: /auto_examples/feature_selection/images/sphx_glr_plot_rfe_with_cross_validation_001.png :alt: حذف الميزات التكراري مع ميزات مترابطة :srcset: /auto_examples/feature_selection/images/sphx_glr_plot_rfe_with_cross_validation_001.png :class: sphx-glr-single-img .. GENERATED FROM PYTHON SOURCE LINES 87-94 من الرسم البياني أعلاه، يمكن للمرء أن يلاحظ أيضًا هضبة من الدرجات المتكافئة (متوسط قيمة متشابه وأشرطة خطأ متداخلة) لـ 3 إلى 5 ميزات محددة. هذه هي نتيجة إدخال ميزات مترابطة. في الواقع، يمكن أن يقع النموذج الأمثل الذي تم اختياره بواسطة RFE ضمن هذا النطاق، اعتمادًا على تقنية التحقق المتبادل. تنخفض دقة الاختبار فوق 5 ميزات محددة، وهذا يعني أن الاحتفاظ بالميزات غير الإعلامية يؤدي إلى فرط التخصيص وبالتالي فهو ضار بالأداء الإحصائي للنماذج. .. rst-class:: sphx-glr-timing **Total running time of the script:** (0 minutes 0.881 seconds) .. _sphx_glr_download_auto_examples_feature_selection_plot_rfe_with_cross_validation.py: .. only:: html .. container:: sphx-glr-footer sphx-glr-footer-example .. container:: binder-badge .. image:: images/binder_badge_logo.svg :target: https://mybinder.org/v2/gh/scikit-learn/scikit-learn/main?urlpath=lab/tree/notebooks/auto_examples/feature_selection/plot_rfe_with_cross_validation.ipynb :alt: Launch binder :width: 150 px .. container:: lite-badge .. image:: images/jupyterlite_badge_logo.svg :target: ../../lite/lab/index.html?path=auto_examples/feature_selection/plot_rfe_with_cross_validation.ipynb :alt: Launch JupyterLite :width: 150 px .. container:: sphx-glr-download sphx-glr-download-jupyter :download:`Download Jupyter notebook: plot_rfe_with_cross_validation.ipynb ` .. container:: sphx-glr-download sphx-glr-download-python :download:`Download Python source code: plot_rfe_with_cross_validation.py ` .. container:: sphx-glr-download sphx-glr-download-zip :download:`Download zipped: plot_rfe_with_cross_validation.zip ` .. include:: plot_rfe_with_cross_validation.recommendations .. only:: html .. rst-class:: sphx-glr-signature `Gallery generated by Sphinx-Gallery `_