6. تحويلات مجموعات البيانات#

يوفر Scikit-learn مكتبة من المحولات، والتي قد تنظف (انظر المعالجة المسبقة للبيانات)، أو تقلل (انظر تخفيض الأبعاد غير الخاضع للإشراف)، أو توسع (انظر Kernel Approximation) أو تولد (انظر استخراج الميزات) تمثيلات الميزات.

مثل المقدرات الأخرى، يتم تمثيلها بواسطة فئات باستخدام طريقة fit، والتي تتعلم معلمات النموذج (على سبيل المثال، المتوسط والانحراف المعياري لـ التطبيع) من مجموعة التدريب، وطريقة transform التي تطبق نموذج التحويل هذا على بيانات غير مرئية. قد يكون fit_transform أكثر ملاءمة وفعالية لنمذجة وتحويل بيانات التدريب في وقت واحد.

تمت تغطية الجمع بين هذه المحولات، إما بالتوازي أو بالتسلسل خطوط الأنابيب والمقدرات المركبة. مقاييس المقارنة الزوجية، والصلات، والنوى (Kernels) يغطي تحويل الميزة مسافات إلى مصفوفات تقارب، بينما تحويل هدف التنبؤ (y) يعتبر تحويلات مساحة الهدف (على سبيل المثال، التصنيفات الفئوية) للاستخدام في Scikit-learn.