Обзоры и отзывы Обзоры и отзывы обо всем

Ищите обзор или отзыв?

Если у Вас есть любой вопрос вы можете задать его ниже или введите то, что вы ищете!

Машинное обучение

Want create site? Find Free WordPress Themes and plugins.

Машинное обучение (Machine Learning)  — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться в процессе применения решений множества подобных задач. Для построения таких алгоритмов используются различные математические средства, такие как: математическая статистика, численные методы, теории вероятностей, теории графов и методы оптимизации.

Различают два типа машинного обучения:

  1. Обучение по прецедентам, (индуктивное обучение), которое основано на выявлении эмпирических закономерностей в данных. Многие методы индуктивного обучения разрабатывались как альтернатива классическим статистическим подходам. Многие методы тесно связаны с интеллектуальным анализом данных и извлечением информации.

 

  1. Дедуктивное обучение предполагает формализацию знаний экспертов и их перенос в компьютер в виде определенной базы данных.

Содержание

 

Общая постановка задачи обучения по прецедентам

Имеется множество ситуаций и множество возможных откликов на заданные ситуации. Существует некоторая зависимость между откликами и ситуациями, но она неизвестна. Известна только конечная совокупность прецедентов — пар объектов и ответов, которая называется обучающей выборкой. На основе этих данных требуется восстановить неявную зависимость, то есть построить алгоритм, способный для любой возможной входной ситуации выдать достаточно точный определяющий ответ. Эта зависимость не обязательно выражается аналитически, и здесь нейронные сети реализуют принцип эмпирически формируемого решения. Важной особенностью при этом является способность системы к обобщению, то есть к адекватному отклику на данные, выходящие за пределы имеющейся обучающей выборки. Для измерения точности ответов вводится оценочный функционал качества.

Данная постановка является обобщением классических задач аппроксимации функций. В классических задачах аппроксимации объектами являются действительные числа или векторы. В реальных прикладных задачах входные данные об объектах могут быть неполными, неточными, нечисловыми, разнородными. Эти особенности приводят к большому разнообразию методов машинного обучения.

Способы машинного обучения

Способы машинного обучения делятся на два вида:

  1. Контролируемое обучение
  2. Неконтролируемое обучение

Контролируемое обучение:

1.     Дерево принятия решений —  это средство поддержки принятия решений, которое использует древовидный граф (модель принятия решений), а также возможные последствия их работы, которые включают в себя вероятность наступления события и его полезность. Если рассматривать данную модель принятия решений как метод, то оно позволяет подойти к решению задачи с систематической стороны, что в итоге приводит к логически обоснованному результату. Данную модель можно применить в таких сферах, как:

  • оценка кредитоспособности физического лица
  • предугадывание доходов с определенной единицы товара или же группы товаров

2.     Наивные байесовские классификаторы представляют собой группу простых вероятностных классификаторов, которые основаны на применении Теоремы Байеса. При более подробном ознакомлении с данным методом можно выделить следующие сферы применения данной теоремы:

  • сортировка спама в электронной почте;
  • сегментация новостных статей по их тематике;
  • программное обеспечение для распознавания лиц.

3.     Метод наименьших квадратов. Наименьшие квадраты выступают в роли метода для реализации линейной регрессии. Чаще всего она представляется в виде прямой линии, проходящей через множество точек. Можно нарисовать линию, а затем измерить расстояние по вертикали от каждой точки к линии и «перенести» эту сумму вверх. Необходимой линией будет та конструкция, где сумма расстояний будет минимальной. Метод наименьших квадратов относится к типам метрики ошибок, которая минимизирует большинство погрешностей.

Неконтролируемое обучение

1.     Алгоритмы кластеризации Задача алгоритмов кластеризации состоит в группировке множества объектов таким образом, чтобы максимально похожие между собой элементы были помещены в один кластер.

Алгоритмы кластеризации используют в IT, биологии и социологии. Например, в биологии с помощью кластеризации анализируют сложнейшие сети взаимодействующих генов, которые состоят порой даже из тысяч элементов. А при анализе результатов социологических исследований осуществляется анализ методом Уорда, при котором во внутри кластерном пространстве оптимизируется минимальная дисперсия, в итоге чего создаются группы приблизительно равных размеров.

2.     Метод главных компонент  (PCA) — это процедура, использующая ортогональное преобразование с целью конвертации набора наблюдений за возможно коррелированными переменными в набор значений линейно некоррелированных переменных, которые называются главными компонентами. Некоторые из областей применения PCA включают в себя сжатие и упрощение данных для облегчения обучения. PCA не подойдет для применения в случаях использования источников с плохо упорядоченными данными.

3.     Сингулярное разложение(SVD). В линейной алгебре под сингулярным разложением понимают разложение прямоугольной матрицы. Для матрицы M размерностью [m*n] существует такое разложение, что M = UΣV, где U и V — унитарные матрицы, а Σ — диагональная матрица. Метод главных компонент является простым применением сингулярного разложения. Первые алгоритмы компьютерного обучения использовали PCA и SVD для представления лиц в виде сумм базисных компонент, чтобы выполнить уменьшение размерности, а затем сопоставить их с изображениями из обучающей выборки. Несмотря на то, что современные методы характеризуются более сложной реализацией, многие из них по-прежнему работают на базе подобных алгоритмов.

 

Классические задачи, решаемые с помощью машинного обучения

  • Медицинская диагностика
  • Банковский скоринг (проверка платежеспособности лица, желающего получить кредит)
  • Предсказание притока/оттока клиентов
  • Предсказание продаваемости товара по определенной стоимости
  • Категоризация текстовых документов
  • Категоризация рекламы (целевая реклама)
  • Бизнес-аналитика/анализ бизнес-планов

Типы входных данных при обучении

  • Текстовая последовательность
  • Определенная последовательность звуков
  • Фотография/изображение
  • Видеозапись/видеоряд

Типы функционалов качества

  • При обучении с учителем— функционал качества может определяться как средняя ошибка ответов. Предполагается, что искомый алгоритм должен его минимизировать. Для предотвращения переобучения в минимизируемый функционал качества часто в явном или неявном виде добавляют регуляризатор.
  • При обучении без учителя— функционалы качества могут определяться по-разному, например, как отношение средних межкластерных и внутрикластерных расстояний.
  • При обучении с подкреплением— функционалы качества определяются физической средой, показывающей качество приспособления агента.

Практические сферы применения

Целью машинного обучения является частичная или полная автоматизация решения сложных профессиональных задач в самых разных областях человеческой деятельности.

Машинное обучение применяется при выполнении таких задач, как:

  • Распознавание рукописного текста
  • Распознавание человеческой речи
  • Распознавание различных звуков
  • Распознавание жестов
  • Бизнес-аналитика
  • Аналитика клиентской базы
  • Кредитный скоринг
  • Биржевой анализ
  • Выявление спама
  • Выявление мошенников
  • Техническая диагностика
  • Диагностика заболеваний
  • Социология
  • Биоинформатика

Область применений машинного обучения расширяется ежедневно. Повсеместная информатизация приводит к накоплению огромных объёмов данных в науке, производстве, бизнесе, транспорте, здравоохранении. Возникающие при этом задачи прогнозирования, управления и принятия решений часто сводятся к обучению по прецедентам. Раньше, когда таких данных не было, эти задачи либо вообще не ставились, либо решались совершенно другими методами.

Did you find apk for android? You can find new Free Android Games and apps.

Оставьте свой отзыв

You must be logged in to post a comment.