Код по классификатору: Общероссийский классификатор продукции (ОКП) – скачать коды ОКП

Содержание

ОК-005 ОКП — Общероссийский классификатор продукции

Классификатор ОКП



Общероссийский классификатор продукции (ОКП продукции) является одной из частей системы классификации ЕСКК России.
Классификатор ОКП продукции представляет собой древовидную структуру кодов ОКП продукции, построенных по иерархическому принципу. Классификатор ОКП используется для решения проблем каталогизации при сертификации однородных групп продукции, построенных на основе группировок кодов ОКП.
Каждый код ОКП продукции содержит 6 цифр группы однородной продукции вида XX XXXX. Классификатор ОКП имеет пятиступенчатую иерархическую классификацию. Первую ступень кода ОКП составляют классы продукции XX 0000, затем идут подклассы классификатора ОКП XX X000, далее однородные группы продукции XX XX00, подгруппы кода ОКП XX XXX0 и, наконец, виды продукции XX XXXX.
Код ОКП продукции может находиться на третьем, четвертом или пятом уровне классификатора ОКП продукции. Если не удается найти точный шестизначный код ОКП продукции в классификаторе ОКП, то выбирается наиболее близкая однородная группа продукции.
В случае проведения сертификации продукции, выбор кода ОКП продукции осуществляет эксперт центра сертификации. Если данному товару соответствует несколько кодов ОКП продукции, то в сертификат соответствия орган по сертификации добавляет ссылку на приложение к сертификату соответствия с перечнем кодов ОКП продукции. Если коды ОКП продукции не помещаются на бланк приложения к сертификату, то в сертификат соответствия добавляются ссылки на приложения №2, 3 и т.д. печатаемые на обычной бумаге.

Поиск по классификатору ОК-005 ОКП продукции

Общероссийский классификатор продукции — коды ОКП

  • 01 0000 ЭЛЕКТРОЭНЕРГИЯ, ТЕПЛОЭНЕРГИЯ, ВОДА, ЛЕД, ХОЛОД.
  • 02 0000 НЕФТЬ, НЕФТЕПРОДУКТЫ, АЛЬТЕРНАТИВНЫЕ ВИДЫ ТОПЛИВА; ГАЗ.
  • 03 0000 УГОЛЬ, ПРОДУКТЫ ПЕРЕРАБОТКИ УГЛЯ, ТОРФ И СЛАНЦЫ ГОРЮЧИЕ.
  • 07 0000 СЫРЬЕ РУДНОЕ, НЕРУДНОЕ, ВТОРИЧНОЕ ЧЕРНОЙ МЕТАЛЛУРГИИ И КОКС.
  • 08 0000 ЧУГУН, ФЕРРОСПЛАВЫ, ЛИГАТУРЫ, СТАЛЬ.
  • 09 0000 ПРОКАТ ЧЕРНЫХ МЕТАЛЛОВ, ГОТОВЫЙ, ВКЛЮЧАЯ ЗАГОТОВКУ НА ЭКСПОРТ.
  • 11 0000 ИЗДЕЛИЯ ДАЛЬНЕЙШЕГО ПЕРЕДЕЛА ИЗ ПРОКАТА, ШАРЫ, ЦИЛЬБЕПСЫ.
  • 12 0000 МЕТАЛЛОИЗДЕЛИЯ ПРОМЫШЛЕННОГО НАЗНАЧЕНИЯ.
  • 13 0000 ТРУБЫ СТАЛЬНЫЕ.
  • 14 0000 МЕТАЛЛОПРОДУКЦИЯ ПРОЧАЯ И НЕКОНДИЦИОННАЯ.
  • 15 0000 СЫРЬЕ ОГНЕУПОРНОЕ И ПОЛУФАБРИКАТЫ КУСКОВЫЕ, ВКЛЮЧАЯ ЛОМ ОГНЕУПОРНЫХ ИЗДЕЛИЙ.
  • 16 0000 КРЕПЕЖНЫЕ ИЗДЕЛИЯ ОБЩЕМАШИНОСТРОИТЕЛЬНОГО ПРИМЕНЕНИЯ.
  • 17 0000 МЕТАЛЛЫ ЦВЕТНЫЕ, ИХ СЫРЬЕ, СПЛАВЫ И СОЕДИНЕНИЯ.
  • 18 0000 ПРОКАТ ЦВЕТНЫХ МЕТАЛЛОВ.
  • 19 0000 ПРОДУКЦИЯ ЭЛЕКТРОДНОЙ И ТВЕРДОСПЛАВНОЙ ПРОМЫШЛЕННОСТИ; ИЗДЕЛИЯ ИЗ ЦВЕТНЫХ МЕТАЛЛОВ.
  • 21 0000 ПРОДУКЦИЯ НЕОРГАНИЧЕСКОЙ ХИМИИ, СЫРЬЕ ГОРНОХИМИЧЕСКОЕ И УДОБРЕНИЯ.
  • 22 0000 ПОЛИМЕРЫ, ПЛАСТИЧЕСКИЕ МАССЫ, ХИМИЧЕСКИЕ ВОЛОКНА И КАУЧУКИ.
  • 23 0000 МАТЕРИАЛЫ ЛАКОКРАСОЧНЫЕ, ПОЛУПРОДУКТЫ, КИНО-, ФОТО- И МАГНИТНЫЕ МАТЕРИАЛЫ И ТОВАРЫ БЫТОВОЙ ХИМИИ.
  • 24 0000 ПРОДУКЦИЯ ОРГАНИЧЕСКОГО СИНТЕЗА, СИНТЕТИЧЕСКИЕ КРАСИТЕЛИ И НЕФТЕ-КОКСО-ЛЕСО-ХИМИЧЕСКАЯ ПРОДУКЦИЯ.
  • 25 0000 ПРОДУКЦИЯ РЕЗИНОТЕХНИЧЕСКАЯ; МАТЕРИАЛЫ И ИЗДЕЛИЯ АСБЕСТОВЫЕ И БЕЗАСБЕСТОВЫЕ ФРИКЦИОННЫЕ, УПЛОТНИТЕЛЬНЫЕ, ТЕПЛОИЗОЛЯЦИОННЫЕ.
  • 26 0000 РЕАКТИВЫ ХИМИЧЕСКИЕ И ВЕЩЕСТВА ВЫСОКОЧИСТЫЕ.
  • 29 0000 ИСПОЛНИТЕЛЬНЫЕ МЕХАНИЗМЫ, УСТРОЙСТВА И ДЕТАЛИ СУДОВЫХ СИСТЕМ И ТРУБОПРОВОДОВ.
  • 31 0000 ПРОДУКЦИЯ ТЯЖЕЛОГО, ЭНЕРГЕТИЧЕСКОГО И ТРАНСПОРТНОГО МАШИНОСТРОЕНИЯ.
  • 33 0000 МАШИНЫ ЭЛЕКТРИЧЕСКИЕ.
  • 34 0000 ОБОРУДОВАНИЕ И МАТЕРИАЛЫ ЭЛЕКТРОТЕХНИЧЕСКИЕ.
  • 35 0000 ПРОДУКЦИЯ КАБЕЛЬНАЯ.
  • 36 0000 ПРОДУКЦИЯ ХИМИЧЕСКОГО И НЕФТЯНОГО МАШИНОСТРОЕНИЯ.
  • 37 0000 АРМАТУРА ПРОМЫШЛЕННАЯ ТРУБОПРОВОДНАЯ.
  • 38 0000 ОБОРУДОВАНИЕ МЕТАЛЛООБРАБАТЫВАЮЩЕЕ И ДЕРЕВООБРАБАТЫВАЮЩЕЕ.
  • 39 0000 ИНСТРУМЕНТ, ТЕХНОЛОГИЧЕСКАЯ ОСНАСТКА, АБРАЗИВНЫЕ МАТЕРИАЛЫ.
  • 40 0000 ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА.
  • 41 0000 ПРОДУКЦИЯ ОБЩЕМАШИНОСТРОИТЕЛЬНОГО ПРИМЕНЕНИЯ.
  • 42 0000 ПРИБОРЫ И СРЕДСТВА АВТОМАТИЗАЦИИ ОБЩЕПРОМЫШЛЕННОГО НАЗНАЧЕНИЯ.
  • 43 0000 ПРИБОРЫ И СРЕДСТВА АВТОМАТИЗАЦИИ СПЕЦИАЛИЗИРОВАННОГО НАЗНАЧЕНИЯ.
  • 44 0000 ПРИБОРЫ И АППАРАТУРА ОПТИЧЕСКИЕ.
  • 45 0000 ИЗДЕЛИЯ АВТОМОБИЛЬНОЙ ПРОМЫШЛЕННОСТИ.
  • 46 0000 ПОДШИПНИКИ КАЧЕНИЯ.
  • 47 0000 ТРАКТОРЫ И СЕЛЬСКОХОЗЯЙСТВЕННЫЕ МАШИНЫ.
  • 48 0000 ПРОДУКЦИЯ СТРОИТЕЛЬНОГО, ДОРОЖНОГО И КОММУНАЛЬНОГО МАШИНОСТРОЕНИЯ.
  • 49 0000 ОБОРУДОВАНИЕ САНИТАРНО-ТЕХНИЧЕСКОЕ ; ЗАМОЧНЫЕ И СКОБЯНЫЕ ИЗДЕЛИЯ.
  • 50 0000 ПРОГРАММНЫЕ СРЕДСТВА И ИНФОРМАЦИОННЫЕ ПРОДУКТЫ ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ.
  • 51 0000 ОБОРУДОВАНИЕ ТЕХНОЛОГИЧЕСКОЕ ДЛЯ ЛЕГКОЙ И ПИЩЕВОЙ ПРОМЫШЛЕННОСТИ И БЫТОВЫЕ ПРИБОРЫ.
  • 52 0000 ОБОРУДОВАНИЕ ДЛЯ РЕГУЛИРОВАНИЯ ДОРОЖНОГО ДВИЖЕНИЯ, ОБСЛУЖИВАНИЯ СЕЛЬХОЗТЕХНИКИ И ВСПОМОГАТЕЛЬНОЕ СРЕДСТВ СВЯЗИ, КОНСТРУКЦИИ СТРОИТЕЛЬНЫЕ МЕТАЛЛИЧЕСКИЕ.
  • 53 0000 ПРОДУКЦИЯ ЛЕСОЗАГОТОВИТЕЛЬНОЙ И ЛЕСОПИЛЬНО-ДЕРЕВООБРАБАТЫВАЮЩЕЙ ПРОМЫШЛЕННОСТИ.
  • 54 0000 ПРОДУКЦИЯ ЦЕЛЛЮЛОЗНО-БУМАЖНОЙ ПРОМЫШЛЕННОСТИ.
  • 55 0000 ПРОДУКЦИЯ ФАНЕРНОГО ПРОИЗВОДСТВА, ПЛИТЫ, СПИЧКИ.
  • 56 0000 МЕБЕЛЬ.
  • 57 0000 МАТЕРИАЛЫ СТРОИТЕЛЬНЫЕ, КРОМЕ СБОРНЫХ ЖЕЛЕЗОБЕТОННЫХ КОНСТРУКЦИЙ И ДЕТАЛЕЙ.
  • 58 0000 КОНСТРУКЦИИ И ДЕТАЛИ СБОРНЫЕ ЖЕЛЕЗОБЕТОННЫЕ.
  • 59 0000 ИЗДЕЛИЯ ИЗ СТЕКЛА, ФАРФОРА И ФАЯНСА.
  • 60 0000 РЕЗИСТОРЫ ПОСТОЯННЫЕ.
  • 61 0000 РЕЗИСТОРЫ ПЕРЕМЕННЫЕ И ПРОЧИЕ.
  • 62 0000 КОНДЕНСАТОРЫ.
  • 63 0000 ЭЛЕКТРОННАЯ ТЕХНИКА, КРОМЕ РЕЗИСТОРОВ И КОНДЕНСАТОРОВ.
  • 64 0000 СУДОВОЕ ОБОРУДОВАНИЕ.
  • 65 0000 СРЕДСТВА РАДИОСВЯЗИ, РАДИОВЕЩАНИЯ И ТЕЛЕВИДЕНИЯ.
  • 66 0000 СРЕДСТВА ПРОВОДНОЙ СВЯЗИ И АППАРАТУРА РАДИОСВЯЗИ ОКОНЕЧНАЯ И ПРОМЕЖУТОЧНАЯ.
  • 67 0000 СРЕДСТВА РАДИОЛОКАЦИОННЫЕ.
  • 68 0000 СРЕДСТВА РАДИОНАВИГАЦИИ.
  • 69 0000 ТЕХНИКА АТОМНАЯ.
  • 70 0000 ПРОДУКЦИЯ АТОМНОЙ ПРОМЫШЛЕННОСТИ.
  • 71 0000 ОРУЖИЕ ОГНЕСТРЕЛЬНОЕ.
  • 72 0000 ВЗРЫВНЫЕ УСТРОЙСТВА И ВЗРЫВЧАТЫЕ ВЕЩЕСТВА НАРОДНОХОЗЯЙСТВЕННОГО НАЗНАЧЕНИЯ.
  • 74 0000 СУДА.
  • 75 0000 ТЕХНИКА АВИАЦИОННАЯ.
  • 80 0000 АВАРИЙНО-СПАСАТЕЛЬНЫЕ СРЕДСТВА СПЕЦИАЛИЗИРОВАННЫЕ.
  • 81 0000 ПРОДУКЦИЯ ТЕКСТИЛЬНОЙ ПРОМЫШЛЕННОСТИ.
  • 82 0000 ПРОДУКЦИЯ ТЕКСТИЛЬНОЙ ПРОМЫШЛЕННОСТИ — ТКАНИ СУРОВЫЕ.
  • 83 0000 ПРОДУКЦИЯ ТЕКСТИЛЬНОЙ ПРОМЫШЛЕННОСТИ — ТКАНИ ГОТОВЫЕ И МАТЕРИАЛЫ НЕТКАНЫЕ.
  • 84 0000 ПРОДУКЦИЯ ТРИКОТАЖНОЙ ПРОМЫШЛЕННОСТИ.
  • 85 0000 ИЗДЕЛИЯ ШВЕЙНЫЕ. обязательная сертификация качества
  • 86 0000 ПРОДУКЦИЯ КОЖЕВЕННОЙ ПРОМЫШЛЕННОСТИ.
  • 87 0000 ПРОДУКЦИЯ ПРОМЫШЛЕННОСТИ ИСКУССТВЕННЫХ КОЖ И ПЛЕНОЧНЫХ МАТЕРИАЛОВ, ИЗДЕЛИЯ КОЖГАЛАНТЕРЕЙНЫЕ И ШОРНО-СЕДЕЛЬНЫЕ ИЗ ВСЕХ ВИДОВ КОЖ.
  • 88 0000 ОБУВЬ КОЖАНАЯ. обязательная сертификация
  • 89 0000 МЕХА, МЕХОВЫЕ И ОВЧИННО-ШУБНЫЕ ИЗДЕЛИЯ.
  • 90 0000 ПРОДУКЦИЯ ТЕКСТИЛЬНОЙ ПРОМЫШЛЕННОСТИ — ПРЯЖА.
  • 91 0000 ПРОДУКЦИЯ ПИЩЕВОЙ ПРОМЫШЛЕННОСТИ. декларация о соответствии
  • 92 0000 ПРОДУКЦИЯ МЯСНОЙ, МОЛОЧНОЙ, РЫБНОЙ, МУКОМОЛЬНО-КРУПЯНОЙ, КОМБИКОРМОВОЙ И МИКРОБИОЛОГИЧЕСКОЙ ПРОМЫШЛЕННОСТИ. декларация о соответствии
  • 93 0000 МЕДИКАМЕНТЫ, ХИМИКО-ФАРМАЦЕВТИЧЕСКАЯ ПРОДУКЦИЯ И ПРОДУКЦИЯ МЕДИЦИНСКОГО НАЗНАЧЕНИЯ.
  • 94 0000 МЕДИЦИНСКАЯ ТЕХНИКА.
  • 95 0000 ПРОДУКЦИЯ ПОЛИГРАФИЧЕСКОЙ ПРОМЫШЛЕННОСТИ.
  • 96 0000 ИЗДЕЛИЯ КУЛЬТУРНО-БЫТОВОГО, ХОЗЯЙСТВЕННОГО, УЧЕБНОГО НАЗНАЧЕНИЯ, ТЕАТРАЛЬНО-ЗРЕЛИЩНЫХ ПРЕДПРИЯТИЙ, ВСПОМОГАТЕЛЬНЫЕ ДЛЯ ЛЕГКОЙ ПРОМЫШЛЕННОСТИ.
  • 97 0000 ПРОДУКЦИЯ РАСТЕНИЕВОДСТВА СЕЛЬСКОГО И ЛЕСНОГО ХОЗЯЙСТВА.
  • 98 0000 ПРОДУКЦИЯ ЖИВОТНОВОДСТВА.







© 1997-2022 Сертификационный центр АНО «МЦК».

Мы помогаем получить сертификат соответствия на товары и
услуги, оформить акт испытаний продукции и провести лабораторные
испытания материалов. Оказываем услуги по сертификации продукции в Москве и регионах.

Что такое ОКПО? Что такое общероссийский классификатор предприятий и организаций? — Контур.Бухгалтерия

В нашей статье мы разберем, что такое код ОКПО, кому и зачем он нужен, где его взять и как с его помощью получить максимум информации о предприятии.  

Общероссийский классификатор предприятий и организаций (ОКПО) — это главный государственный классификатор хозяйствующих субъектов страны. А код ОКПО — это восьми- или десятизначный номер в классификаторе, который орган статистики назначает организации или ИП. На территории России этот код должны иметь каждая организация или предприниматель.


Зачем нужен код ОКПО?


Общероссийский классификатор систематизирует все организации и предпринимателей во всех государственных базах данных. Коды ОКПО помогают различным ведомствам обмениваться информацией и проводить статистический анализ. То есть, прежде всего коды ОКПО необходимы нашей службе статистики. Государственная задача — создать единое информационное поле хозяйствующих субъектов на территории России, и это делается с помощью кодов.


С другой стороны, код ОКПО необходимо знать самим предпринимателям и руководителям организаций. Они требуются не каждый день, но в ряде ситуаций без них не обойтись.


  • Код ОКПО фирмы нужно указывать на всех отчетах и документах — налоговых, юридических и бухгалтерских. Договоры, разрешения и соглашения, лицензии и акты выполненных работ не обходятся без этого кода организации или ИП.
  • Без кода статистики не удастся оформить кредит в финансовой организации. Организация не сможет внести изменения в учредительные документы, сменить руководителя или открыть филиал.
  • При ввозе и вывозе продукции таможня требует коды для оформления товаров.
  • Зная код ОКПО, можно вести поиск по государственным базам данных и получить доступ к любой официальной информации о предприятии. Так вы можете проверить своих контрагентов на благонадежность: узнать, выполняет ли ваш партнер или поставщик обязательства перед государством, не является ли он банкротом.

Контур.Бухгалтерия рассчитает суммы, выберет проводки, заполнит и проверит отчеты для отправки через интернет. 

Начать пользоваться


Кому назначается код ОКПО?




В Общероссийский классификатор попадают все хозяйствующие субъекты: юридические лица (включая филиалы и представительства), индивидуальные предприниматели и организации, которые ведут деятельность без образования юрлица. Деятельность предприятия на рынке будет легальной только после получения кода ОКПО. Этот код становится опознавательным знаком ИП или организации для всех информационных систем Статистики.


Обратите внимание: одинаковых кодов ОКПО не бывает. Случается совпадение кодов, если хозяйствующий субъект был ликвидирован, и тогда его код по прошествии 5 лет можно присвоить новой организации или ИП. Если вы столкнулись с одинаковыми кодами ОКПО у организаций, просто сверьте ИНН: если ИНН не совпадают, то речь идет о разных организациях, и одна из них давно прекратила существование.


Есть ли код ОКПО у ИП?


Сегодня в большинстве случаев коды ОКПО даны предпринимателям с момента регистрации: их начали выдавать предпринимателям с 1999 года. Сейчас ИП имеют свой собственный раздел в классификаторе. Код у предпринимателей состоит из 10 цифр вместо 8, как у юрлиц и других организаций. Если вы начали предпринимательскую деятельность до 1999 года, обратитесь за кодом ОКПО в Управление Росстата.


Обычно предприниматели не знают свой код ОКПО, потому что им при заполнении документов можно ставить прочерк в строке с кодом. Также он не требуется при ведении дел или заполнении отчетов и деклараций.


Как получить свой код ОКПО при регистрации?


Федеральная служба госстатистики (она же Управление Росстата) выдает номера ОКПО. Эта служба ведет и сам Общероссийский классификатор: аккумулирует сведения о хозяйствующих субъектах. 


Организации и ИП при регистрации получают письмо Росстата с кодом ОКПО. Таким образом, получить его впервые очень просто: он выдается вместе с другими регистрационными документами.


Как узнать свой код ОКПО?


Если вы потеряли письмо с кодом, запросите его повторно в территориальном отделении Росстата (эта услуга платная). Запрос в статистику можно принести лично или отправить в электронном виде через сайт. 


Также можно воспользоваться сервисом Росстата, где поиск ведется по ИНН, ОГРН или типу уведомления. Так вы можете узнать не только свой код, но и коды контрагентов.


Еще один вариант для ИП и организаций — сервис “Коды Росстата Российской Федерации”. Выберите регион на этой странице, после этого вы увидите ссылки на контакты районных отделов статистики и официальный сайт Росстата в вашем регионе. Выберите ссылку “Сформировать и распечатать уведомление с кодами статистики” для ИП или для юрлиц. Введите данные для поиска кодов статистики: ИНН или ОГРН. К сожалению, сервис работает в тестовом режиме, и поиск для некоторых регионов дает сбой.



 




 


Как найти код ОКПО для организации?


Коды крупных предприятий / организаций можно узнать, если у вас на руках есть договора, лицензии, бухгалтерские документы фирмы, где этот код должен проставляться вместе с другими реквизитами. Часто код присутствует на печати предприятия.


Также номер ОКПО фирмы можно узнать с помощью поисковых систем в интернете. Многие организации публикуют код ОКПО на своем сайте в разделе реквизитов.


За кодом фирмы можно обратиться в Росстат: заполните необходимую форму, укажите свои паспортные данные, свидетельство о регистрации предприятия и ИНН. В течение нескольких дней вы получите информационное письмо с кодом ОКПО интересующей организации.


Также можно получить код в ФНС в выписке из ЕГРИП или ЕГРЮЛ. Заполните заявку, оплатите пошлину, и в течение 5 дней налоговая предоставит данные предприятию.




Как сменить код ОКПО?


Главная задача кода — указывать ту отрасль, в которой занято предприятие. Поэтому код ОКПО изменяется при смене отрасли деятельности и требуется тем предприятиям, которым пришлось кардинально сменить ведущую деятельность. Если код не указывает на отрасль деятельности, контролирующие органы могут наложить штраф на организацию. 


В остальных случаях номер ОКПО не меняется в течение всей жизни предприятия. Реорганизация или открытие филиалов, смена юридического адреса не требует смены кода.


Для смены кода обратитесь в территориальный орган статистики и запросите новый код ОКПО в связи со сменой деятельности. 


Как устроен ОКПО? Какова его структура и разделы?


Классификатор организаций и предпринимателей состоит из двух больших разделов:


  • 1 раздел с данными по юрлицам, их филиалам и представительствам, а также по организациям, которые ведут деятельность без получения юрлица;
  • 2 раздел с данными по индивидуальным предпринимателям.

Каждый большой раздел классификатора состоит из:


  • блока идентификации с самими кодами ОКПО;
  • блока наименования объектов с полными и сокращенными названиями организаций и именами ИП;
  • блока классификационных признаков с кодировками, которые содержат другие общероссийские классификаторы.

Классификатор постоянно меняется, Статистика вносит в него дополнения и изменения, поэтому справочник существует только в электронном виде и нигде не публикуется: издание заняло бы много томов, а переиздание происходило бы еженедельно.


Бухгалтерский веб-сервис Контур.Бухгалтерия позволяет узнавать коды ОКПО контрагентов за пару минут. Здесь вы можете вести учет, начислять зарплату, отправлять отчетность онлайн и пользоваться поддержкой наших специалистов. 


Попробовать бесплатно


Классификатор машинного обучения

на Python Классификатор машинного обучения

на Python — Edureka Машинное обучение

сейчас является модным словечком. Некоторые невероятные вещи делаются с помощью машинного обучения. От того, чтобы быть нашим личным помощником до определения наших маршрутов путешествий , помогая нам делать покупки, помогая нам в управлении нашим бизнесом, заботясь о нашем здоровье и благополучии, машинное обучение интегрировано в нашу повседневную жизнь на таких фундаментальных уровнях, что большую часть времени мы даже не осознаем, что полагаемся на него. В этой статье мы будем следовать подходу новичка к реализации стандартного классификатора машинного обучения в Python.

  • Обзор машинного обучения
  • Шаблон для классификаторов машинного обучения
  • Задача классификации машинного обучения

Машинное обучение — это концепция, которая позволяет машине учиться на примерах и опыте, и это тоже без явного программирования. Таким образом, вместо того, чтобы писать код, вы вводите данные в общий алгоритм, а алгоритм/машина строит логику на основе заданных данных.

Машинное обучение предполагает способность машин принимать решения, оценивать результаты своих действий и улучшать свое поведение для последовательного получения лучших результатов.

Процесс обучения происходит тремя основными способами:

  • Обучение с учителем
  • Обучение без учителя
  • Обучение с подкреплением

Инструменты машинного обучения довольно удобно представлены в библиотеке Python под названием scikit-learn, к которой очень легко получить доступ и применить.

Установите scikit-learn через командную строку, используя:

 pip install -U scikit-learn 

Если вы являетесь пользователем anaconda, в приглашении anaconda вы можете использовать:

 conda install scikit-learn 

Для установки требуется предварительная установка пакетов NumPy и SciPy в вашей системе.

Предварительная обработка: Первым и наиболее необходимым шагом в любом анализе данных на основе машинного обучения является часть предварительной обработки. Правильное представление и очистка данных абсолютно необходимы для того, чтобы модель машинного обучения хорошо обучалась и использовала свой потенциал.

Шаг 1 — Импорт необходимых библиотек

 импорт numpy как np 
import pandas as pd
import matplotlib.pyplot as plt

Шаг 2 — Импорт набора данных

 dataset = pd.read_csv() 

Затем мы разделяем набор данных на независимые и зависимые переменные. Независимые переменные должны быть входными данными, а зависимая переменная — выходными данными.

 X=dataset.iloc[<диапазон строк и входных столбцов>].values ​​y=dataset.iloc[<диапазон строк и выходных столбцов>].values ​​

Шаг 3 — Обработка отсутствующих данных

Набор данных может содержать пустые или нулевые значения, что может привести к ошибкам в наших результатах. Следовательно, нам нужно иметь дело с такими записями. Обычной практикой является замена нулевых значений общим значением, например средним или наиболее частым значением в этом столбце.

 из sklearn.preprocessing import Imputer 
imputer=Imputer(missing_values="NaN", Strategy="mean", axis=0)
imputer=imputer.fit(X[<диапазон строк и столбцов>])
X[ <диапазон строк и столбцов>]=imputer.transform(X[<диапазон строк и столбцов>])

Шаг 4 — Преобразовать категориальные переменные в числовые переменные columns>])
labelencoder_y = LabelEncoder()
y = labelencoder_y.fit_transform(y)

Теперь, после кодирования, может случиться так, что машина примет числовые данные за ранжирование закодированных столбцов. Таким образом, чтобы обеспечить равный вес, мы должны преобразовать числа в горячие векторы, используя класс OneHotEncoder.

 from sklearn.preprocessing import OneHotEncoder 
oneHE=OneHotEncoder(categorical_features=[<диапазон строк и столбцов>])
X=oneHE. fit_transform(X).toarray()

Шаг 5 — Выполнение масштабирования

9

2 Это шаг состоит в том, чтобы иметь дело с несоответствиями, возникающими из-за несоответствия масштабов переменных. Следовательно, мы масштабируем их все до одного диапазона, чтобы они получали одинаковый вес при вводе в модель. Для этого мы используем объект класса StandardScaler.

 из sklearn.preprocessing import StandardScaler 
sc_X=StandardScaler()
X=sc_X.fit_transform(X)

Шаг 6 — Разделить набор данных на данные для обучения и тестирования разделить на обучающую и тестовую выборки. Стандартное соотношение между поездом и тестом составляет 75%-25%. Мы можем изменить в соответствии с требованиями. Функция train_test_split() может сделать это за нас.

 из sklearn.model_selection импорта train_test_split 
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.25)

Построение модели: Этот шаг на самом деле довольно прост. Как только мы решим, какую модель применить к данным, мы можем создать объект соответствующего класса и подогнать объект к нашему обучающему набору, рассматривая X_train в качестве входных данных и y_train в качестве выходных данных.

 из sklearn.<модуль класса> import <класс модели> 
classifier = <класс модели>(<параметры>)
classifier.fit(X_train, y_train)

Теперь модель обучена и готова. Теперь мы можем применить нашу модель к тестовому набору и найти прогнозируемый результат.

 y_pred = classifier.predict(X_test) 

Просмотр результатов: Эффективность классификатора можно оценить по параметрам точности, прецизионности, полноты и f1-показателя. Эти значения можно увидеть с помощью метода, известного какclassification_report(). Это также можно рассматривать как матрицу путаницы, которая помогает нам узнать, сколько данных из какой категории были классифицированы правильно.

 из sklearn.metrics import путаница_матрица 
cm = путаница_матрица (y_test, y_pred)
печать (см)

из sklearn. metrics импортаclassification_report
target_names = [<список имен классов>]
print(classification_report(y_test, y_pred, target_names) =target_names))

Мы будем использовать очень популярный и простой набор данных Iris, содержащий размеры цветов в 3 категориях — Iris-setosa, Iris-versicolor и Iris-virginica. В наборе данных 150 записей.

 # Импорт библиотек. . 

 dataset.head() 

У нас есть 4 независимые переменные (исключая идентификатор), а именно номера столбцов 1–4, а столбец 5 является зависимой переменной. Так что мы можем их выделить.

 X = набор данных.iloc[:, 1:5].values ​​
y = набор данных.iloc[:, 5].values ​​

Теперь мы можем разделить набор данных на обучение и тестирование.

 # Разделение набора данных на обучающий набор и тестовый набор 
из sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0,25)

Теперь мы применим классификатор логистической регрессии к набор данных.

 # Построение и обучение модели 
из sklearn.linear_model import LogisticRegression
classifier = LogisticRegression()
classifier.fit(X_train, y_train)

# Прогнозирование результатов набора тестов
y_pred = classifier.predict(X_test)

Последним шагом будет анализ производительности обученной модели.

 # Составление матрицы путаницы 
из sklearn.metrics import путаница_матрица
cm = путаница_матрица (y_test, y_pred)
print(cm)

Это показывает нам, что 13 записей первой категории, 11 - второй и 9 - третьей категории правильно предсказаны моделью.

 # Генерация точности, прецизионности, отзыва и оценки f1 
из sklearn.metrics , target_names=target_names))

В отчете показаны значения точности, полноты, f1-оценки и точности модели в нашем тестовом наборе, который состоит из 38 записей (25% набора данных).

Поздравляем, вы успешно создали и внедрили свой первый классификатор машинного обучения на Python! Если вы хотите прочитать больше статей о самых популярных на рынке технологиях, таких как искусственный интеллект, DevOps, этический взлом, вы можете обратиться к официальному сайту Edureka.

Обратите внимание на другие статьи из этой серии, в которых объясняются различные другие аспекты Python и науки о данных.

1. Учебное пособие по Python

2. Язык программирования Python

3. Функции Python

4. Работа с файлами в Python

5. Учебное пособие по Python Numpy

6. Scikit Learn Machine Learning

7. Учебник Python Pandas

8. Matplotlib Tutorial

9. Tkinter Tutorial

10. Учебник по запросу

11. Парсинг с помощью Python

14. Учебное пособие по PyCharm

15. Учебное пособие по машинному обучению

16. Алгоритм линейной регрессии с нуля в Python

17. Python для науки о данных

18. Циклы в Python

19. Python Regex

20. Python Projects

21. Проекты машинного обучения

22. Массивы в Python

23. Наборы в Python

24. Java против Python

27. Как стать разработчиком Python?

28. Лямбда-функции Python

29. Как Netflix использует Python?

30. Что такое программирование сокетов в Python

31. Подключение к базе данных Python

32. Golang vs Python

33. Python Seaborn Tutorial

Первоначально опубликовано по адресу https://www.edureka.co 2 августа 2019 г. Эсма Бозкурт | Аналитика Vidhya

Всем привет, сегодня я расскажу об алгоритмах классификации. Вы можете найти мою статью о разнице между регрессией и классификацией здесь.

Мы сказали, что используем регрессию для предсказания числовых данных, таких как предсказание цены, и классификацию для задач, где нет непрерывной переменной, такой как маркировка, да или нет. Я должен сказать, что некоторые алгоритмы могут применяться и хорошо работать как для регрессии, так и для классификации (например, K-NN, SVM, дерево решений и случайный лес). Сегодняшние темы:

  • Наивный байесовский классификатор (на основе вероятности)
  • Классификатор K-ближайших соседей (на основе группы)
  • Логистическая регрессия (на основе максимальной энтропии)
  • Классификатор дерева решений (на основе дерева)
  • Классификатор на основе случайного леса
  • Классификатор Gradient Boost (ускорение на основе ансамбля)
  • Машина опорных векторов (SVM)

Наивный байесовский классификатор

Наивный байесовский алгоритм представляет собой метод классификации, основанный на теореме Байеса с предположением о независимости среди предикторов. Проще говоря, наивный байесовский классификатор предполагает, что наличие определенной функции в классе не связано с наличием какой-либо другой функции.

Теорема Байеса

P(A|B): Вероятность того, что событие A произойдет, когда произойдет событие B.

В этом наборе данных мы предскажем, будут ли наняты сотрудники или нет.

Делим данные на тестовые и обучающие. Мы используем train для обучения данных и тест для проверки нашего прогноза.

Он учится на данных с помощью функции подбора и делает прогнозы с помощью функции прогнозирования.

Показатель точности: это процент значений, классифицированных как правильные.

Показатель точности: Он показывает, сколько значений, которые мы предполагаем положительно, на самом деле являются положительными.

Оценка отзыва: показывает «Сколько истинных положительных результатов было правильно определено?».

Оценка F1: это среднее гармоническое значений Precision и Recall. Если для задачи важны как значения Precision, так и Recall, значение F1 также станет важным.

Матрица путаницы b-критерия

Числа в матрице путаницы представляют собой количество значений TN, FP, FN, TP в данных. Здесь наша вероятность

Точность: (TP + TN) / (TN + FP + FN + TP)
Точность: TP / (FP + TP)
Чувствительность: TP / (TP + FN)
Специфичность: TN / (TN + FP)

Матрица путаницы

Рассчитаем точность в соответствии с матрицей путаницы:

(233+15) / (233+16+38+15) = 0,8211920529801

Классификатор K-ближайших соседей

Он включен в зеленый класс, потому что у него больше своих зеленых соседей.

KNN делает прогнозы в соответствии с плотностью классов ближайших соседей вектора, образованного независимыми переменными прогнозируемого значения. Рассчитывается расстояние от прогнозируемой точки до других точек. Для этого используется функция расчета расстояния Минковского. (К: Мы говорим вам, сколько ближайших соседей будет вычислено.)

Для получения более успешных результатов в алгоритмах на основе расстояния, таких как KNN, данные нормализуются.

Логистическая регрессия

Логистическая регрессия пытается найти наилучшую линию, разделяющую два класса. Он часто используется в задачах линейной классификации. Из-за линейности он очень похож на линейную регрессию.

ROC-кривая отображает долю ложноположительных результатов в сравнении с частотой верных положительных результатов. Площадь под этой кривой находится с помощью функции roc_auc_score(). Чем ближе это поле к 1, тем лучше прогнозируется модель. Чтобы найти оценку ROC-AUC:

Классификатор дерева решений

Дерево решений — это тип алгоритма обучения с учителем, который в основном используется в задачах классификации. Он начинается с одного узла и превращается в древовидную структуру. Он создает модель, которая предсказывает значение переменной, извлекая простые правила из свойств данных и изучая эти правила (прямо как человек).

Теперь давайте предскажем виды цветов в наборе данных Iris.

Классификатор случайного леса (бэггинг)

В Бэггинге каждый набор подмножеств данных используется для обучения их деревьев решений.