6. تحويلات مجموعات البيانات#
يوفر Scikit-learn مكتبة من المحولات، والتي قد تنظف (انظر المعالجة المسبقة للبيانات)، أو تقلل (انظر تخفيض الأبعاد غير الخاضع للإشراف)، أو توسع (انظر Kernel Approximation) أو تولد (انظر استخراج الميزات) تمثيلات الميزات.
مثل المقدرات الأخرى، يتم تمثيلها بواسطة فئات باستخدام طريقة fit
،
والتي تتعلم معلمات النموذج (على سبيل المثال، المتوسط والانحراف المعياري لـ
التطبيع) من مجموعة التدريب، وطريقة transform
التي تطبق
نموذج التحويل هذا على بيانات غير مرئية. قد يكون fit_transform
أكثر
ملاءمة وفعالية لنمذجة وتحويل بيانات التدريب
في وقت واحد.
تمت تغطية الجمع بين هذه المحولات، إما بالتوازي أو بالتسلسل خطوط الأنابيب والمقدرات المركبة. مقاييس المقارنة الزوجية، والصلات، والنوى (Kernels) يغطي تحويل الميزة مسافات إلى مصفوفات تقارب، بينما تحويل هدف التنبؤ (y) يعتبر تحويلات مساحة الهدف (على سبيل المثال، التصنيفات الفئوية) للاستخدام في Scikit-learn.