Ссылки по теме выпускной работы
-
Гума С.В. Исследование методов сравнительного анализа текстов на примере рекомендательной системы фильмов
Описание: Персональный сайт на портале магистров ДонНТУ, 2019 г.
Руководитель: к.ф-м.н., доц. Скворцов Анатолий Ефремович
Консультант: ст. пр. Коломойцева Ирина Александровна
-
Титаренко М.Г. Исследование методов классификации информации о внешнеторговой деятельности государств в рамках информационно-поисковой системы
Описание: Персональный сайт на портале магистров ДонНТУ, 2018 г.
Руководитель: к.ф-м.н., доц. Скворцов Анатолий Ефремович
Консультант: ст. пр. Коломойцева Ирина Александровна
-
Власюк Д.А. Исследование методов извлечения знаний из HTML-страниц сети Интернет о спортивных соревнованиях
Описание: Персональный сайт на портале магистров ДонНТУ, 2019 г.
Руководитель: к.ф-м.н., доц. Скворцов Анатолий Ефремович
Консультант: ст. пр. Коломойцева Ирина Александровна
-
Полетаев В.А. Исследование методов поиска изображений в графических базах данных
Описание: Персональный сайт на портале магистров ДонНТУ, 2019 г.
Руководитель: к.ф-м.н., доц. Скворцов Анатолий Ефремович
Консультант: ст. пр. Коломойцева Ирина Александровна
-
Сторожук Н.О. Исследование методов и алгоритмов определения жанра литературных произведений на основе технологии Text Mining
Описание: Персональный сайт на портале магистров ДонНТУ, 2018 г.
Руководитель: к.ф-м.н., доц. Скворцов Анатолий Ефремович
Консультант: ст. пр. Коломойцева Ирина Александровна
-
An Empirical Study of the Naïve Bayes Classifier
Авторы: Irina Rish
Описание: В статье рассматривается разбор характеристик данных, которые влияют на эффективность наивного байесовского метода. В работе используется метод Монте-Карло, которые позволяет систематически изучать точность классификации для нескольких классов сгенерированных задач.
-
An Analysis of Bayesian Classifiers, NASA Ames Research Center
Авторы: Wayne Iba, Kevin Thompson
Описание: В статье проводится анализ байесовского классификатора путем вычисления вероятности того, что алгоритм вызовет произвольную пару описаний понятий, затем это выражение используется для вычисления правильной классификации по пространству вероятности экземпляров.
-
Применение в задаче классификации SMS сообщений оптимизированного наивного байесовского классификатора
Авторы: Бурлаков М. Е.
Описание: В работе рассматривается процесс оптимизации наивного байесовского классификатора. Также рассмотрен механизм расчета вероятности и процесс построения обучающей таблицы для практического решения задачи классификации SMS сообщений наивным байесовским классификатором.
-
Повышение точности байесовского классификатора текстовых документов
Авторы: Трифонов П. В.
Описание: В статье рассматриваются способы улучшения байесовского классификатора путем построения по заданному набору документов, классификация которых была выполнена экспертами вручную, некоторой модели, которая может быть использована в дальнейшем для принятия решения о принадлежности документов к указанными категориям.
-
Naïve Bayes modification for text Streams classification
Авторы: Lomakina L.S., Lomakin D.V., Subbotin A.N.
Описание: В работе рассматривается модификация наивной байесовской классификации потоков текстовой информации. Также в статье предложен реальный классификатор, позволяющий обрабатывать текстовые потоки в режиме реального времени.
-
История возникновения спама и способы противодействия его распространению
Авторы: Лютова Е.И., Коломойцева И.А.
Описание: В работе рассмотрена история возникновения нежелательной массовой рассылке, а также известные способы борьбы с ней. Проанализированы программные обеспечения для фильтрации спама.
-
Алгоритмы компьютерного зрения на основе сверточных нейронных сетей
Описание: Учебное пособие, в виде лекции по компьютерному зрению. Содержит основные положения о глубоком обучении, сверточных нейронных сетях, детектировании объектов и т.д.
-
25. Метод опорных векторов (SVM)
Описание: В статье выполнен обзор алгоритма SVM, проанализированы его недостатки и достоинства, определены возможные сферы применения.
-
Алгоритм C4.5
Описание: В статье выполнен обзор алгоритма C4.5, проанализированы его недостатки и достоинства, определены возможные сферы применения.
-
Метод k-средних
Описание: В статье выполнен обзор метода k-средних, проанализированы его недостатки и достоинства, определены возможные сферы применения.
-
Алгоритм Apriori
Описание: В статье выполнен обзор алгоритма Apriori, проанализированы его недостатки и достоинства, определены возможные сферы применения. Приведен пример реализации алгоритма.
-
EM-алгоритм
Описание: В статье выполнен обзор EM-алгоритма, проанализированы его недостатки и достоинства, определены возможные сферы применения. Приведен пример реализации алгоритма.
-
Алгоритм AdaBoost
Описание: В статье выполнен обзор алгоритм усиления классификаторов AdaBoost, проанализированы его недостатки и достоинства, определены возможные сферы применения. Приведен пример реализации алгоритма.
-
Алгоритм CART
Описание: В статье выполнен обзор одного из самых популярных алгоритмов Data Mining - CART. Проанализированы его недостатки и достоинства, определены возможные сферы применения. Приведен пример реализации алгоритма.
- Алгоритм k-ближайших соседей
-
Наивный баейсовский классификатор
Описание: В статье выполнен обзор наивного баейсовского классификатора, проанализированы его недостатки и достоинства, определены возможные сферы применения.
-
Методы отбора фич
Описание: В статье приведены основные методы отбора фич, а также методы оценки эффективности их отбора.
-
Точный критерий Фишера
Описание: В статье описывается история возникновения и обоснование критерия Фишера.
-
Оценка точности классификатора
Описание: В статье описаны основные критерии оцеки точности классификатора.
-
Открытый курс машинного обучения. Тема 3. Классификация, деревья решений и метод ближайших соседей
Описание: В статье подробно рассмотрены подходы к классификации и несколько алгоритмов классификации, а также приведена их имплементация.
-
Методы классификации и прогнозирования. Деревья решений
Описание: В лекции описывается метод деревьев решений, рассматриваются элементы дерева решения, процесс его построения. Приведены примеры деревьев, решающих задачу классификации, а также даны алгоритмы конструирования деревьев решений CART и C4.5.
-
Оценка классификатора (точность, полнота, F-мера)
Описание: В статье описано назначение и формулы вычисления основных оценочных параметров классификации.
-
Наивный байесовский классификатор
Описание: В заметке описывается теория и практическое применение наивного байесовского классификатора.
-
Топ-10 data mining-алгоритмов простым языком
Описание: В статье кратко и концентрировано описаны основные Data Mining алгоритмы и их назначение.
-
Международный научно-практический журнал
Программные продукты и системы
Описание:Издание рассчитано на пользователей, программистов, разработчиков во всех областях жизнедеятельности. Предоставляет открытый доступ к научным публикациям.
-
Expert Systems with Applications
Описание:Издание обладает очень большим количеством научных статей связанных с экспертными системами и разрабатываемыми приложениями. Полезен для работников научной IT сферы. Публикации не имеют открытого доступа.
-
Интернетика:Навигация в сложных сетях: модели и алгоритмы. Книжный дом «Либроком»
Авторы: Ландэ Д.В., Снарский А.А., Безсуднов И.В.
Описание: В книге рассматриваются вопросы, относящиеся к информационной структуре веб-пространства, теории сложных сетей, моделям информационного поиска и глубинного анализа текстов, общим закономерностям современных информационных потоков и их моделированию. В книге рассматриваются вопросы, относящиеся к информационной структуре веб-пространства, теории сложных сетей, моделям информационного поиска и глубинного анализа текстов, общим закономерностям современных информационных потоков и их моделированию.
-
Поиск знаний в Internet.
Авторы: Ландэ Д.В.
Описание: Книга посвящена современным подходам к получению новых знаний на основе анализа информационного пространства сети Internet и методам обработки информационных потоков с целью выявления значимых тенденций, понятий, феноменов, их взаимосвязей.
-
Python Weekly
Описание: Это бесплатный еженедельный электронный бюллетень, в котором публикуются новости, статьи, новые выпуски, вакансии и многое другое.
-
Программирование на Python
Описание: Курс посвящен базовым понятиям и элементам языка программирования Python (операторы, числовые и строковые переменные, списки, условия и циклы). Курс является вводным и наиболее подойдет слушателям, не имеющим опыта написания программ ни на одном из языков программирования.
-
Python 3 для начинающих
Описание: Сайт призван помочь начинающим научиться программировать на python 3.
-
Python: основы и применение
Описание: Курс посвящен базовым принципам языка Python и программирования в целом. Он хорошо подойдет тем, кто уже может писать простейшие программы на Python или тем, кто до этого программировал на других языках.
-
Питоньютор
Описание: Интерактивный учебник языка Python, дает теорию в удобной форме, и позволяет решать задачи прямо на сайте.
-
Язык программирования Python
Описание: Изучается язык программирования Python, его основные библиотеки и некоторые приложения на примере языка Python рассматриваются такие важные понятия как: объектно-ориентированное программирование, функциональное программирование, событийно-управляемые программы (GUI-приложения), форматы представления данных (Unicode, XML и т.п.).
-
Kaggle
Описание: Интернет-сообщество специалистов по обработке данных и машинному обучению, принадлежащее Google LLC. Kaggle позволяет пользователям находить и публиковать наборы данных и многое другое.
-
IFAR-10
Описание: CIFAR-10 – это популярный набор данных компьютерного зрения, собранный Алексом Крижевским, Винодом Наиром и Джеффри Хинтоном. Этот набор данных используется для распознавания объектов и состоит из 60000 цветных изображений 32x32 в 10 классах, по 6000 изображений на класс.
-
ImageNet
Описание: Один из популярных наборов данных для проектов Computer Vision, предоставляет доступную базу данных изображений, которая организована в соответствии с иерархией WordNet.
-
COCO or Common Objects in COntext
Описание: Крупномасштабный набор данных для обнаружения объектов, сегментации и субтитров. Набор данных содержит фотографии 91 типа объектов, которые легко узнаваемы и имеют в общей сложности 2,5 миллиона помеченных экземпляров в изображениях 328 тыс.
-
MPII Human Pose Dataset
Описание: Набор данных MPII Human Pose используется для оценки позы человека. Набор данных включает в себя около 25 тыс. изображений, содержащих более 40 тыс. людей с аннотированными суставами тела.
-
Visual Tracker Benchmark
Описание: Портал содержит данные и код оценки производительности алгоритмов визуального отслеживания. На сайте предоставлены результаты тестов, набор данных с анотациями, библиотека кодов.
-
Data Science
Описание: Портал содержит множество полезных статей по Data Science.
-
UCI Machine Learning Repository
Описание: Репозиторий с наборами данных для машинного обучения. Очень полезен для тестирования качества классификации.
-
Хабр
Описание: Портал с огромным количеством пользовательских статей, связанных с IT сферой.
-
SCI-HUB
Описание: Очень полезный сайт для получения доступа к научным публикациям с закрытым доступом.
-
CYBERLENINKA
Описание: Научная электронная библиотека, предоставляющая открытый доступ к множеству научных публикаций.
-
НОУ ИНТУИТ
Описание: Организация, которая предоставляет возможность дистанционного образования с помощью своих материалов, которые выложены на их сайте.
-
Towards Data Science
Описание: Ресурс предоставляет множество статей, концепций, идей и кодов по направлению Data Science.
Материалы магистров ДонНТУ
Научные работы и статьи
Техническая и справочная литература
Описание: В статье выполнен обзор алгоритма k-ближайших соседей, проанализированы его недостатки и достоинства, определены возможные сферы применения.