Scikit-learn

Библиотека для машинного обучения.

Простой и эффективный инструмент для предиктивного анализа данных.

Основанный на NumPy, SciPy, и matplotlib.

BSD лицензия.

...

Сайт проекта

Платформы: Кроссплатформенность

Версии: Cloud/On-Premise

Применение

Классификация: определение к какой категории принадлежит объект.

Применение: выявление спама, распознавание изображений

Регрессия: прогнозирование атрибута с непрерывным значением связанного с объектом.

Применение: ответ на применение лекарство, прогнозирование оттока клиентов.

Кластеризация: автоматическая группировка похожих объектов в наборы.

Применение: сегментация клиентов, группировка экспериментальных результатов

Понижение размерности: снижение числа случайных переменных для анализа.

Применение: визуализация, увеличение эффективности

Выбор модели: сравнение, валидация и выбор параметром и моделей.

Применение: улучшение точности через настройку параметров

Препроцессинг: извлечение признаков и нормализация

Применение: преобразование входных данных, таких как текста, для применения алгоритмов машинного обучения

Преимущества

Scikit-learn в основном написан на Python и широко использует NumPy для высокопроизводительной линейной алгебры и операций с массивами. Кроме того, некоторые основные алгоритмы написаны на Cython для повышения производительности. Машины опорных векторов реализуются оболочкой Cython вокруг LIBSVM; логистическая регрессия и машины векторов линейной поддержки с помощью аналогичной оболочки для LIBLINEAR.

В таких случаях расширение этих методов с помощью Python может оказаться невозможным.

Scikit-learn хорошо интегрируется со многими другими библиотеками Python, такими как Matplotlib и plotly для построения графиков, NumPy для векторизации массивов, фреймы данных Pandas, SciPy и многие другие.