.. DO NOT EDIT.
.. THIS FILE WAS AUTOMATICALLY GENERATED BY SPHINX-GALLERY.
.. TO MAKE CHANGES, EDIT THE SOURCE PYTHON FILE:
.. "auto_examples/release_highlights/plot_release_highlights_0_22_0.py"
.. LINE NUMBERS ARE GIVEN BELOW.

.. only:: html

    .. note::
        :class: sphx-glr-download-link-note

        :ref:`Go to the end <sphx_glr_download_auto_examples_release_highlights_plot_release_highlights_0_22_0.py>`
        to download the full example code. or to run this example in your browser via JupyterLite or Binder

.. rst-class:: sphx-glr-example-title

.. _sphx_glr_auto_examples_release_highlights_plot_release_highlights_0_22_0.py:


========================================
أبرز ميزات الإصدار 0.22 من scikit-learn
========================================

.. currentmodule:: sklearn

يسعدنا أن نعلن عن إصدار scikit-learn 0.22، والذي يأتي
مع العديد من الإصلاحات للمشاكل والميزات الجديدة! نستعرض أدناه بعض الميزات الرئيسية
لهذا الإصدار. للحصول على قائمة شاملة بجميع التغييرات، يرجى
الرجوع إلى :ref:`ملاحظات الإصدار <release_notes_0_22>`.

لتثبيت أحدث إصدار (مع pip)::

    pip install --upgrade scikit-learn

أو مع conda::

    conda install -c conda-forge scikit-learn

.. GENERATED FROM PYTHON SOURCE LINES 22-26

.. code-block:: Python


    # المؤلفون: مطوري scikit-learn
    # معرف الترخيص: BSD-3-Clause


.. GENERATED FROM PYTHON SOURCE LINES 27-39

واجهة برمجة التطبيقات الجديدة للرسم
----------------

تتوفر واجهة برمجة تطبيقات جديدة لإنشاء الرسوم البيانية. تسمح هذه الواجهة الجديدة
بالتعديل السريع للمظهر المرئي للرسم البياني دون الحاجة إلى إعادة الحساب. كما أنه من الممكن
إضافة مخططات مختلفة إلى نفس
الشكل. يوضح المثال التالي `plot_roc_curve`،
ولكن يتم دعم المرافق الأخرى للمخططات مثل
`plot_partial_dependence`،
`plot_precision_recall_curve`، و
`plot_confusion_matrix`. اقرأ المزيد حول هذه الواجهة الجديدة في
:ref:`دليل المستخدم <visualizations>`.

.. GENERATED FROM PYTHON SOURCE LINES 39-69

.. code-block:: Python


    import matplotlib
    import matplotlib.pyplot as plt

    from sklearn.datasets import make_classification
    from sklearn.ensemble import RandomForestClassifier

    # from sklearn.metrics import plot_roc_curve
    from sklearn.metrics import RocCurveDisplay
    from sklearn.model_selection import train_test_split
    from sklearn.svm import SVC
    from sklearn.utils.fixes import parse_version

    X, y = make_classification(random_state=0)
    X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

    svc = SVC(random_state=42)
    svc.fit(X_train, y_train)
    rfc = RandomForestClassifier(random_state=42)
    rfc.fit(X_train, y_train)

    # plot_roc_curve تم إزالته في الإصدار 1.2. بدءًا من الإصدار 1.2، استخدم RocCurveDisplay بدلاً من ذلك.
    # svc_disp = plot_roc_curve(svc, X_test, y_test)
    # rfc_disp = plot_roc_curve(rfc, X_test, y_test, ax=svc_disp.ax_)
    svc_disp = RocCurveDisplay.from_estimator(svc, X_test, y_test)
    rfc_disp = RocCurveDisplay.from_estimator(rfc, X_test, y_test, ax=svc_disp.ax_)
    rfc_disp.figure_.suptitle("مقارنة منحنى ROC")

    plt.show()


.. image-sg:: /auto_examples/release_highlights/images/sphx_glr_plot_release_highlights_0_22_0_001.png
   :alt: مقارنة منحنى ROC
   :srcset: /auto_examples/release_highlights/images/sphx_glr_plot_release_highlights_0_22_0_001.png
   :class: sphx-glr-single-img


.. GENERATED FROM PYTHON SOURCE LINES 70-83

مصنف التكديس والمُرجع
---------------------------------
:class:`~ensemble.StackingClassifier` و
:class:`~ensemble.StackingRegressor`
تسمح لك بوجود مجموعة من المُقدرات مع مُقدر نهائي أو
مُرجع.
يتكون التكديس العام من تكديس ناتج المُقدرات الفردية واستخدام مُصنف لحساب التوقع النهائي. يسمح التكديس
باستخدام قوة كل مُقدر فردي من خلال استخدام ناتجهم
كمدخل لمُقدر نهائي.
يتم تكييف المُقدرات الأساسية على "X" الكاملة بينما
يتم تدريب المُقدر النهائي باستخدام تنبؤات مُصادقة عبر القيمة باستخدام "cross_val_predict".

اقرأ المزيد في :ref:`دليل المستخدم <stacking>`.

.. GENERATED FROM PYTHON SOURCE LINES 83-101

.. code-block:: Python


    from sklearn.datasets import load_iris
    from sklearn.ensemble import StackingClassifier
    from sklearn.linear_model import LogisticRegression
    from sklearn.model_selection import train_test_split
    from sklearn.pipeline import make_pipeline
    from sklearn.preprocessing import StandardScaler
    from sklearn.svm import LinearSVC

    X, y = load_iris(return_X_y=True)
    estimators = [
        ("rf", RandomForestClassifier(n_estimators=10, random_state=42)),
        ("svr", make_pipeline(StandardScaler(), LinearSVC(dual="auto", random_state=42))),
    ]
    clf = StackingClassifier(estimators=estimators, final_estimator=LogisticRegression())
    X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
    clf.fit(X_train, y_train).score(X_test, y_test)


.. rst-class:: sphx-glr-script-out

 .. code-block:: none


    0.9473684210526315


.. GENERATED FROM PYTHON SOURCE LINES 102-107

أهمية الميزات القائمة على التبديل
------------------------------------

يمكن استخدام :func:`inspection.permutation_importance` للحصول على
تقدير لأهمية كل ميزة، لأي مُقدر مُدرب:

.. GENERATED FROM PYTHON SOURCE LINES 107-138

.. code-block:: Python


    import matplotlib.pyplot as plt
    import numpy as np

    from sklearn.datasets import make_classification
    from sklearn.ensemble import RandomForestClassifier
    from sklearn.inspection import permutation_importance

    X, y = make_classification(random_state=0, n_features=5, n_informative=3)
    feature_names = np.array([f"x_{i}" for i in range(X.shape[1])])

    rf = RandomForestClassifier(random_state=0).fit(X, y)
    result = permutation_importance(rf, X, y, n_repeats=10, random_state=0, n_jobs=2)

    fig, ax = plt.subplots()
    sorted_idx = result.importances_mean.argsort()

    # تم إيقاف `labels` argument في boxplot في matplotlib 3.9 وتمت إعادة تسميته إلى `tick_labels`. يتعامل الكود التالي مع هذا، ولكن كمستخدم لـ scikit-learn، يمكنك على الأرجح كتابة كود أبسط من خلال استخدام `labels=...`
    # (matplotlib < 3.9) أو `tick_labels=...` (matplotlib >= 3.9).
    tick_labels_parameter_name = (
        "tick_labels"
        if parse_version(matplotlib.__version__) >= parse_version("3.9")
        else "labels"
    )
    tick_labels_dict = {tick_labels_parameter_name: feature_names[sorted_idx]}
    ax.boxplot(result.importances[sorted_idx].T, vert=False, **tick_labels_dict)
    ax.set_title("أهمية التبديل لكل ميزة")
    ax.set_ylabel("الميزات")
    fig.tight_layout()
    plt.show()


.. image-sg:: /auto_examples/release_highlights/images/sphx_glr_plot_release_highlights_0_22_0_002.png
   :alt: أهمية التبديل لكل ميزة
   :srcset: /auto_examples/release_highlights/images/sphx_glr_plot_release_highlights_0_22_0_002.png
   :class: sphx-glr-single-img


.. GENERATED FROM PYTHON SOURCE LINES 139-146

الدعم الأصلي للقيم المفقودة للتعزيز التدريجي
-------------------------------------------------------

:class:`ensemble.HistGradientBoostingClassifier`
و :class:`ensemble.HistGradientBoostingRegressor` لديهم الآن دعم أصلي
للقيم المفقودة (NaNs). وهذا يعني أنه لا توجد حاجة
لملء البيانات عند التدريب أو التنبؤ.

.. GENERATED FROM PYTHON SOURCE LINES 146-155

.. code-block:: Python


    from sklearn.ensemble import HistGradientBoostingClassifier

    X = np.array([0, 1, 2, np.nan]).reshape(-1, 1)
    y = [0, 0, 1, 1]

    gbdt = HistGradientBoostingClassifier(min_samples_leaf=1).fit(X, y)
    print(gbdt.predict(X))


.. rst-class:: sphx-glr-script-out

 .. code-block:: none

    [0 0 1 1]


.. GENERATED FROM PYTHON SOURCE LINES 156-167

رسم الجيران الأقرب القريب المُسبق
------------------------------------------
معظم المُقدرات القائمة على رسوم الجيران الأقرب تقبل الآن الرسوم البيانية المُسبقة
المتناثرة كمدخل، لإعادة استخدام نفس الرسم البياني لعدة مُقدرات.
لاستخدام هذه الميزة في خط أنابيب، يمكنك استخدام معلمة "memory"، إلى جانب
أحد المحولين الجديدين،
:class:`neighbors.KNeighborsTransformer` و
:class:`neighbors.RadiusNeighborsTransformer`. يمكن أيضًا إجراء عملية ما قبل الحساب
بواسطة مُقدرات مخصصة لاستخدام التنفيذ البديل، مثل
أساليب الجيران الأقرب التقريبية.
راجع المزيد من التفاصيل في :ref:`دليل المستخدم <neighbors_transformer>`.

.. GENERATED FROM PYTHON SOURCE LINES 167-188

.. code-block:: Python


    from tempfile import TemporaryDirectory

    from sklearn.manifold import Isomap
    from sklearn.neighbors import KNeighborsTransformer
    from sklearn.pipeline import make_pipeline

    X, y = make_classification(random_state=0)

    with TemporaryDirectory(prefix="sklearn_cache_") as tmpdir:
        estimator = make_pipeline(
            KNeighborsTransformer(n_neighbors=10, mode="distance"),
            Isomap(n_neighbors=10, metric="precomputed"),
            memory=tmpdir,
        )
        estimator.fit(X)

        # يمكننا تقليل عدد الجيران ولن يتم إعادة حساب الرسم البياني.
        estimator.set_params(isomap__n_neighbors=5)
        estimator.fit(X)


.. GENERATED FROM PYTHON SOURCE LINES 189-201

KNN Based Imputation
------------------------------------
نحن ندعم الآن إكمال القيم المفقودة باستخدام k-Nearest
Neighbors.

يتم إكمال القيم المفقودة لكل عينة باستخدام متوسط القيمة من
"n_neighbors" الأقرب للجيران الذين تم العثور عليهم في مجموعة التدريب. العينتان قريبتان إذا كانت الميزات التي لا يفتقدها أي منهما قريبة.
بشكل افتراضي، يتم استخدام مقياس المسافة
الذي يدعم القيم المفقودة،
:func:`~sklearn.metrics.pairwise.nan_euclidean_distances`، للعثور على الجيران الأقرب.

اقرأ المزيد في :ref:`دليل المستخدم <knnimpute>`.

.. GENERATED FROM PYTHON SOURCE LINES 201-208

.. code-block:: Python


    from sklearn.impute import KNNImputer

    X = [[1, 2, np.nan], [3, 4, 3], [np.nan, 6, 5], [8, 8, 7]]
    imputer = KNNImputer(n_neighbors=2)
    print(imputer.fit_transform(X))


.. rst-class:: sphx-glr-script-out

 .. code-block:: none

    [[1.  2.  4. ]
     [3.  4.  3. ]
     [5.5 6.  5. ]
     [8.  8.  7. ]]


.. GENERATED FROM PYTHON SOURCE LINES 209-215

تقليم الشجرة
------------

أصبح من الممكن الآن تقليم معظم المُقدرات القائمة على الشجرة بمجرد بناء الأشجار.
يعتمد التقليم على الحد الأدنى من التكلفة والتعقيد. اقرأ المزيد في
:ref:`دليل المستخدم <minimal_cost_complexity_pruning>` للحصول على التفاصيل.

.. GENERATED FROM PYTHON SOURCE LINES 215-232

.. code-block:: Python


    X, y = make_classification(random_state=0)

    rf = RandomForestClassifier(random_state=0, ccp_alpha=0).fit(X, y)
    print(
        "متوسط عدد العقد بدون تقليم {:.1f}".format(
            np.mean([e.tree_.node_count for e in rf.estimators_])
        )
    )

    rf = RandomForestClassifier(random_state=0, ccp_alpha=0.05).fit(X, y)
    print(
        "متوسط عدد العقد مع التقليم {:.1f}".format(
            np.mean([e.tree_.node_count for e in rf.estimators_])
        )
    )


.. rst-class:: sphx-glr-script-out

 .. code-block:: none

    متوسط عدد العقد بدون تقليم 22.3
    متوسط عدد العقد مع التقليم 6.4


.. GENERATED FROM PYTHON SOURCE LINES 233-237

استرجاع جداول البيانات من OpenML
-------------------------------
:func:`datasets.fetch_openml` يمكنه الآن إرجاع جداول بيانات Pandas وبالتالي
التعامل بشكل صحيح مع مجموعات البيانات ذات البيانات غير المتجانسة:

.. GENERATED FROM PYTHON SOURCE LINES 237-243

.. code-block:: Python


    from sklearn.datasets import fetch_openml

    titanic = fetch_openml("titanic", version=1, as_frame=True, parser="pandas")
    print(titanic.data.head()[["pclass", "embarked"]])


.. rst-class:: sphx-glr-script-out

 .. code-block:: none

       pclass embarked
    0       1        S
    1       1        S
    2       1        S
    3       1        S
    4       1        S


.. GENERATED FROM PYTHON SOURCE LINES 244-255

التحقق من توافق scikit-learn لمُقدر
---------------------------------------------------
يمكن للمطورين التحقق من توافق مُقدراتهم المتوافقة مع scikit-learn باستخدام :func:`~utils.estimator_checks.check_estimator`. على
سبيل المثال، تمرير "check_estimator(LinearSVC())".

نحن نوفر الآن مُزخرف "pytest" محدد يسمح لـ "pytest"
بتشغيل جميع الفحوصات بشكل مستقل والإبلاغ عن الفحوصات التي تفشل.

..note::
  تم تحديث هذا الإدخال بشكل طفيف في الإصدار 0.24، حيث لم يعد دعم تمرير الفئات
  : قم بتمرير الحالات بدلاً من ذلك.

.. GENERATED FROM PYTHON SOURCE LINES 255-266

.. code-block:: Python


    from sklearn.linear_model import LogisticRegression
    from sklearn.tree import DecisionTreeRegressor
    from sklearn.utils.estimator_checks import parametrize_with_checks


    @parametrize_with_checks([LogisticRegression(), DecisionTreeRegressor()])
    def test_sklearn_compatible_estimator(estimator, check):
        check(estimator)


.. GENERATED FROM PYTHON SOURCE LINES 267-278

ROC AUC الآن يدعم التصنيف متعدد الفئات
----------------------------------------------
يمكن أيضًا استخدام دالة :func:`~sklearn.metrics.roc_auc_score` في التصنيف متعدد الفئات.
يتم دعم استراتيجيتي المتوسط حاليًا: خوارزمية "one-vs-one" تحسب متوسط درجات ROC AUC الزوجية، و
تحسب خوارزمية "one-vs-rest" متوسط درجات ROC AUC لكل
فئة مقابل جميع الفئات الأخرى. في كلتا الحالتين، يتم حساب درجات ROC AUC متعددة الفئات
من تقديرات الاحتمالية التي تنتمي عينة إلى فئة معينة وفقًا للنموذج. تدعم خوارزميتا OvO و OvR
الوزن بشكل موحد (``average='macro'``) والوزن حسب الانتشار
(``average='weighted'``).

اقرأ المزيد في :ref:`دليل المستخدم <roc_metrics>`.

.. GENERATED FROM PYTHON SOURCE LINES 278-286

.. code-block:: Python


    from sklearn.datasets import make_classification
    from sklearn.metrics import roc_auc_score
    from sklearn.svm import SVC

    X, y = make_classification(n_classes=4, n_informative=16)
    clf = SVC(decision_function_shape="ovo", probability=True).fit(X, y)
    print(roc_auc_score(y, clf.predict_proba(X), multi_class="ovo"))


.. rst-class:: sphx-glr-script-out

 .. code-block:: none

    0.9992000000000001


.. rst-class:: sphx-glr-timing

   **Total running time of the script:** (0 minutes 1.687 seconds)


.. _sphx_glr_download_auto_examples_release_highlights_plot_release_highlights_0_22_0.py:

.. only:: html

  .. container:: sphx-glr-footer sphx-glr-footer-example

    .. container:: binder-badge

      .. image:: images/binder_badge_logo.svg
        :target: https://mybinder.org/v2/gh/scikit-learn/scikit-learn/main?urlpath=lab/tree/notebooks/auto_examples/release_highlights/plot_release_highlights_0_22_0.ipynb
        :alt: Launch binder
        :width: 150 px

    .. container:: lite-badge

      .. image:: images/jupyterlite_badge_logo.svg
        :target: ../../lite/lab/index.html?path=auto_examples/release_highlights/plot_release_highlights_0_22_0.ipynb
        :alt: Launch JupyterLite
        :width: 150 px

    .. container:: sphx-glr-download sphx-glr-download-jupyter

      :download:`Download Jupyter notebook: plot_release_highlights_0_22_0.ipynb <plot_release_highlights_0_22_0.ipynb>`

    .. container:: sphx-glr-download sphx-glr-download-python

      :download:`Download Python source code: plot_release_highlights_0_22_0.py <plot_release_highlights_0_22_0.py>`

    .. container:: sphx-glr-download sphx-glr-download-zip

      :download:`Download zipped: plot_release_highlights_0_22_0.zip <plot_release_highlights_0_22_0.zip>`


.. include:: plot_release_highlights_0_22_0.recommendations


.. only:: html

 .. rst-class:: sphx-glr-signature

    `Gallery generated by Sphinx-Gallery <https://sphinx-gallery.github.io>`_