Содержание
404: Страница не найдена
Страница, которую вы пытались открыть по этому адресу, похоже, не существует. Обычно это результат плохой или устаревшей ссылки. Мы приносим свои извинения за доставленные неудобства.
Что я могу сделать сейчас?
Если вы впервые посещаете TechTarget, добро пожаловать! Извините за обстоятельства, при которых мы встречаемся. Вот куда вы можете пойти отсюда:
Поиск
- Пожалуйста, свяжитесь с нами, чтобы сообщить, что эта страница отсутствует, или используйте поле выше, чтобы продолжить поиск
- Наша страница «О нас» содержит дополнительную информацию о сайте, на котором вы находитесь, WhatIs.com.
- Посетите нашу домашнюю страницу и просмотрите наши технические темы
Просмотр по категории
ПоискСеть
-
восточно-западный трафикТрафик Восток-Запад в контексте сети — это передача пакетов данных с сервера на сервер в центре обработки данных.
-
CBRS (Гражданская широкополосная радиослужба)Гражданская широкополосная радиослужба, или CBRS, представляет собой набор операционных правил, заданных для сегмента общего беспроводного спектра и …
-
частный 5GPrivate 5G — это технология беспроводной сети, которая обеспечивает сотовую связь для случаев использования частных сетей, таких как частные …
ПоискБезопасность
-
Что такое модель безопасности с нулевым доверием?Модель безопасности с нулевым доверием — это подход к кибербезопасности, который по умолчанию запрещает доступ к цифровым ресурсам предприятия и …
-
RAT (троянец удаленного доступа)RAT (троян удаленного доступа) — это вредоносное ПО, которое злоумышленник использует для получения полных административных привилегий и удаленного управления целью ..
.
-
атака на цепочку поставокАтака на цепочку поставок — это тип кибератаки, нацеленной на организации путем сосредоточения внимания на более слабых звеньях в организации …
ПоискCIO
-
пространственные вычисленияПространственные вычисления широко характеризуют процессы и инструменты, используемые для захвата, обработки и взаимодействия с трехмерными данными.
-
Пользовательский опытДизайн взаимодействия с пользователем (UX) — это процесс и практика, используемые для разработки и реализации продукта, который обеспечит позитивное и …
-
соблюдение конфиденциальностиСоблюдение конфиденциальности — это соблюдение компанией установленных правил защиты личной информации, спецификаций или …
SearchHRSoftware
-
Поиск талантовПривлечение талантов — это стратегический процесс, который работодатели используют для анализа своих долгосрочных потребностей в талантах в контексте бизнеса .
..
-
удержание сотрудниковУдержание сотрудников — организационная цель сохранения продуктивных и талантливых работников и снижения текучести кадров за счет стимулирования …
-
гибридная рабочая модельГибридная модель работы — это структура рабочей силы, включающая сотрудников, работающих удаленно, и тех, кто работает на месте, в офисе компании…
SearchCustomerExperience
-
CRM (управление взаимоотношениями с клиентами) аналитикаАналитика CRM (управление взаимоотношениями с клиентами) включает в себя все программные средства, которые анализируют данные о клиентах и представляют…
-
разговорный маркетингДиалоговый маркетинг — это маркетинг, который вовлекает клиентов посредством диалога.
-
цифровой маркетингЦифровой маркетинг — это общий термин для любых усилий компании по установлению связи с клиентами с помощью электронных технологий.
Алгоритм опорных векторов
Хотя мы также говорим о проблемах регрессии, они лучше всего подходят для классификации. Цель алгоритма SVM — найти гиперплоскость в N-мерном пространстве, которая четко классифицирует точки данных. Размер гиперплоскости зависит от количества признаков. Если количество входных объектов равно двум, то гиперплоскость — это просто линия. Если количество входных объектов равно трем, то гиперплоскость становится двумерной плоскостью. Трудно представить, когда количество признаков превышает три.
Рассмотрим две независимые переменные x1, x2 и одну зависимую переменную в виде синего или красного круга.
Линейно разделимые точки данных
Из рисунка выше ясно, что существует несколько линий (здесь наша гиперплоскость является линией, потому что мы рассматриваем только два входных объекта x1, x2), которые разделяют наши точки данных или выполняют классификацию между красными и синие круги. Итак, как нам выбрать лучшую линию или вообще лучшую гиперплоскость, которая разделяет наши точки данных.
Выбор наилучшей гиперплоскости:
Один разумный выбор в качестве наилучшей гиперплоскости — это та, которая представляет наибольшее расстояние или границу между двумя классами.
Итак, мы выбираем гиперплоскость, расстояние от которой до ближайшей точки данных с каждой стороны максимально. Если такая гиперплоскость существует, она известна как гиперплоскость/жесткая граница с максимальным запасом. Итак, на приведенном выше рисунке мы выбираем L2.
Давайте рассмотрим сценарий, как показано ниже
Здесь у нас есть один синий шар на границе красного шара. Так как же SVM классифицирует данные? Это просто! Синий шар на границе красных является выбросом из синих шаров. Алгоритм SVM имеет характеристики, позволяющие игнорировать выбросы и находить лучшую гиперплоскость, которая максимизирует запас. SVM устойчив к выбросам.
Таким образом, в этом типе точек данных SVM находит максимальную маржу, как это делалось с предыдущими наборами данных, а также добавляет штраф каждый раз, когда точка пересекает маржу. Таким образом, поля в таких случаях называются мягкими краями. Когда в наборе данных есть мягкий запас, SVM пытается минимизировать (1/маржа+∧(∑штраф)) . Потеря шарнира — обычно используемый штраф. При отсутствии нарушений нет потери шарнира. При нарушении шарнира потери пропорциональны расстоянию нарушения.
До сих пор мы говорили о линейно разделимых данных (группа синих и красных шаров разделима прямой/линейной линией). Что делать, если данные не являются линейно разделимыми?
Допустим, наши данные выглядят так, как показано на рисунке выше. SVM решает эту проблему, создавая новую переменную с помощью ядра. Назовем точку х i на линии, и мы создаем новую переменную y i как функцию расстояния от начала координат o. Поэтому, если мы нанесем это, мы получим что-то вроде того, как показано ниже
В этом случае новая переменная y создается как функция расстояния от начала координат. Нелинейная функция, создающая новую переменную, называется ядром.
Ядро SVM:
Ядро SVM — это функция, которая берет низкоразмерное входное пространство и преобразует его в многомерное пространство, т. е. преобразует неразделимую задачу в разделимую. Это в основном полезно в задачах нелинейного разделения. Проще говоря, ядро выполняет чрезвычайно сложные преобразования данных, а затем определяет процесс разделения данных на основе определенных меток или выходных данных.
Преимущества SVM:
- Эффективен в случаях большой размерности
- Его эффективность памяти, поскольку он использует подмножество обучающих точек в решающей функции, называемой опорными векторами
- Различные функции ядра могут быть указаны для решающих функций и их можно указать пользовательские ядра
Реализация SVM на питоне:
Цель: Предсказать, является ли рак доброкачественным или злокачественным.
Использование исторических данных о пациентах с диагнозом рак позволяет врачам дифференцировать злокачественные и доброкачественные случаи с учетом независимых признаков.
Dataset: https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Original)
Python
|
Output:
Index(['ID', 'ClumpThickness', 'Cell Size', 'Cell Shape', ' маргинальная адгезия', «Единичный размер эпителиальных клеток», «Голые ядра», «Нормальные ядрышки», «Мягкий хроматин», 'Митозы', 'Класс'], dtype='объект')
Python
|
RangeIndex: 699 записей, от 0 до 698
Столбцы данных (всего 11 столбцов):
ID 699 ненулевой int64
ClumpThickness 699 ненулевой int64
Размер ячейки 699 ненулевой int64
Форма ячейки 699 ненулевой int64
Маргинальная адгезия 699 ненулевое значение int64
Размер одной эпителиальной клетки 699 ненулевое int64
Bare Nuclei 699 ненулевой объект
Нормальные ядрышки 699 ненулевые int64
Мягкий хроматин 699 ненулевой int64
Митозы 699 ненулевые int64
Класс 699 ненулевой int64
dtypes: int64(10), объект(1)
memory usage: 60.1+ KB
Python
|
Output:
count | mean | std | min | 25% | 50% | 75% | max | |
ID | 699 | 1.![]() | 617095.729819 | 61634.0 | 870688.5 | 1171710.0 | 1238298.0 | 13454352.0 |
clump Thickness | 699 | 4.417740e+00 | 2.815741 | 1.0 | 2.0 | 4.0 | 6.0 | 10.0 |
Cell Size | 699.0 | 4.417740e+00 | 2.815741 | 1.0 | 1.0 | 1.0 | 5.0 | 10.0 |
Cell Shape | 699.0 | 3.134478e+00 | 3.051459 | 1.0 | 1.0 | 1.0 | 5.0 | 10.0 |
Marginal Adhension | 699.0 | 2.806867e+00 | 2.971913 | 1.0 | 1.0 | 1.0 | 4.0 | 10.0 |
Single Epithelial cell size | 699.0 | 3.216023e+00 | 2.855379 | 1.![]() | 2.0 | 2.0 | 4.0 | 10.0 |
Normal Nucleoli | 699.0 | 3.437768e+00 | 2.214300 | 1.0 | 2.0 | 3.0 | 5.0 | 10.0 |
Bland chromatin | 699.0 | 2.866953e+00 | 2.438364 | 1.0 | 1.0 | 1.0 | 4.0 | 10.0 |
Mitoses | 699.0 | 1.589413e+00 | 3.053634 | 1.0 | 1.0 | 1.0 | 1.0 | 10.0 |
class | 699.0 | 2.689557e+00 | 1.715078 | 2.0 | 2.0 | 2.0 | 4.0 | 4.0 |
Python
|
Вывод:
ID 0 СгустокТолщина 0 Размер ячейки 0 Форма ячейки 0 Краевая адгезия 0 Размер одной эпителиальной клетки 0 Голые ядра 0 Нормальные ядрышки 0 Мягкий хроматин 0 Митозы 0 Класс 0 тип: int64
Python
|
Выход:
0,9749552772808586 0.9642857142857143
Python
|
Output:
Confusion Matrix: [[95 2] [ 3 40]]
Python
|
Output:
SVC(C=1.0, cache_size =200, class_weight=Нет, coef0=0.0, solution_function_shape='ovr', степень=3, гамма='auto_deprecated', ядро = 'rbf', max_iter = -1, вероятность = ложь, random_state = нет, сжатие = Истина, tol = 0,001, verbose = Ложь)
Python
|
Output:
0.998211091234347 0.9571428571428572
Python
|
Вывод:
1.0 0,9357142857142857
Python
|