Ссылки по теме выпускной работы
-
Пилипенко А.С. Исследование методов и алгоритмов определения тональности естественно-языкового текста
Описание: Персональный сайт на портале магистров ДонНТУ, 2020 г.
Руководитель: к.ф-м.н., доц. Скворцов А.Е.
-
Гума С. Н. Исследование методов сравнительного анализа текстов на примере рекомендательной системы фильмов
Описание: Персональный сайт на портале магистров ДонНТУ, 2019 г.
Руководитель: к.ф-м.н., доц. Скворцов А.Е.
-
Сторожук Н.О. Исследование методов и алгоритмов определения жанра литературных произведений на основе технологии Text Mining
Описание: Персональный сайт на портале магистров ДонНТУ, 2018 г.
Руководитель: к.ф-м.н., доц. Скворцов А.Е.
-
Столбунская А.С. Создание интеллектуальной системы стилистической оценки текста
Описание: Персональный сайт на портале магистров ДонНТУ, 2018 г.
Руководитель: доц. Кравец Т.Н.
-
Прокапович А.А. Разработка алгоритмического обеспечения интеллектуального модуля анализа эмоционального содержания естественно языковых сообщений блогов и форумов
Описание: Персональный сайт на портале магистров ДонНТУ, 2014 г.
Руководитель: к.т.н., доц. Егошина А.А.
-
Сарры Н.А. Методы и алгоритмы извлечения структурированных данных из текстов новостей
Описание: Персональный сайт на портале магистров ДонНТУ, 2012 г.
Руководитель: к.т.н., доц. Звенигородский А.С.
-
Text mining with sentiment analysis on seafarers’ medical documents
Авторы: Nalini Chintalapudi, Gopi Battineni, Marzio Di Caniob, Getu Gamo Sagaro, Francesco Amenta
Описание: В данном исследовании представлены приложения для поиска текстов с ассоциативным анализом тональности в медицинских записях моряков. Несчастные случаи и проблемы, связанные с болезнями, в основном происходят с моряками. Это дает большое преимущество организациям здравоохранения и врачам для визуализации симптомов пациентов. Обеспечивает лучшее понимание проблем пациентов, мониторинг медицинских записей и оценку отзывов пациентов.
-
Analysis of sentiments conveyed through Twitter concerning COVID-19
Авторы: Mohamed Chiny, Marouane Chihab, Omar Bencharef and Younes Chihab1
Описание: В связи с социальными и экономическими последствиями пандемии COVID-19 авторы попытались определить отношение пользователей социальных сетей, в данном случае Twitter, к этой теме с помощью анализа настроений. Было собрано 178 683 твита, используя API Twitter, на основе запросов по высокочастотному хэштегу #covid19. После предварительной обработки твиты бли классифицированы в бинарном виде (положительные и отрицательные) и в соответствии с их интенсивностью (валентностью), используя модель VADER, а затем словарь NRCLex, который позволяетсоотнесены по тональности в соответствии с их аффективным классом. Результаты показывают, что в целом чувства, выявленные с помощью твитов, являются положительными. Кроме того, пользователи, похоже, интересуются пандемией как тенденцией, а не как темой, связанной с другими социальными или экономическими аспектами.
-
Использование синтаксиса для анализа тональности твитов на русском языке
Авторы: Ю.В. Адаскина, П.В. Паничева, А.М. Попов
Описание: Представлен подход к решению задачи анализа тональности в рамках тестирования SentiRuEval – открытого соревнования систем анализа тональности на русском языке. Описанный алгоритм был применен в дорожке по анализу тональности твитов о банках и телекоммуникационных компаниях. Для этих данных была разработана и оценена классификация на три класса: положительный, отрицательный и нейтральный.
-
Методы анализа тональности текста
Авторы: В. В. Ильев
Описание: Классификация текстов – одна из областей обработки натуральных языков. Эта область набирает всё большую популярность с каждым годом. Информатизация населения и перевод текстов в электронный вид приводят к необходимости разработки эффективных алгоритмов анализ и классификации этих текстов.
-
Анализ тональности отзывов пользователей в мета-области фильмов
Авторы: Л. В. Журавлева, К. А. Стригулин
Описание: В статье рассмотрена задача анализа тональности текста на примере отзывов о фильмах. Рассмотрена проблематика подхода, основанного на словарях, создан свой собственный словарь сентиментов и для него проведены исследования на корпусе данных.
-
Корпусные исследования и анализ тональности
Авторы: Т.А. Семина
Описание:В статье рассмотрены современные корпусы для анализа тональности и сферы их применения в лингвистике. Проведен анализ самых известных баз данных на английском языке. Кроме того, в статье описан корпус статей, собранных автором, и разметка, которая проводится на данном корпусе.
-
A BERT based Sentiment Analysis and Key Entity Detection Approach for Online Financial Texts
Авторы: Lingyun Zhao; Lin Li; Xinhao Zheng; Jianwei Zhang
Описание: Появление и быстрое развитие Интернета оказывают все большее влияние на финансовую сферу. Как быстро и точно извлечь ключевую информацию из массивных негативных финансовых текстов стало одним из ключевых вопросов для инвесторов и лиц, принимающих решения. Для решения этой проблемы мы предлагаем подход к анализу настроений и обнаружению ключевых сущностей на основе BERT, который применяется для поиска финансовых текстов в Интернете и анализа общественного мнения в социальных сетях.
-
Аналитический обзор подходов к распознаванию тональности русскоязычных текстовых данных
Авторы: А.А. Карпов, А.А. Двойникова
Описание: В последние годы анализ тональности, или сентимент-анализ, высказываний пользователей находит практическое применение во многих областях: оценка качества товаров и услуг по отзывам покупателей в Интернете, анализ негативных эмоций в сообщениях, прогноз фондовых рынков, политических ситуаций на основе новостных лент и многих других. В связи с этим разрабатываются разнообразные системы и методы для сентимент-анализа русскоязычных текстовых данных.
-
Sentiment analysis of nationwide lockdown due to COVID 19 outbreak: Evidence from India
Авторы: Gopalkrishna Barkur, a Vibha, Giridhar B. Kamatha
Описание: С января 2020 года компания Elsevier создала ресурсный центр COVID-19 с бесплатной информацией на английском и китайском языках о новом коронавирусе COVID-19. Ресурсный центр COVID-19 размещен на Elsevier Connect, общедоступном новостном и информационном сайте компании. Настоящим Elsevier предоставляет разрешение на немедленное размещение всех исследований, связанных с COVID-19, которые доступны в ресурсном центре COVID-19 – включая содержание данного исследования – в PubMed Central и других репозиториях, финансируемых государством, таких как база данных ВОЗ COVID, с правами на неограниченное повторное использование и анализ исследований в любой форме и любыми средствами с указанием первоисточника. Эти права предоставляются бесплатно компанией Elsevier до тех пор, пока ресурсный центр COVID-19 остается активным.
-
Клиент всегда прав: анализ тональности текста в отзывах о качестве банковского обслуживания
Авторы: Е.Г. Брунова, Ю.В. Бидуля
Описание: Целью исследования является разработка алгоритма на основе правил для анализа тональности текста. Материалом послужили отзывы на русском языке о качестве банковского обслуживания из народного рейтинга банков (сайт www.banki.ru). Анализ тональности текста рассматривается как задача классификации, т. е. отнесение текста к одному из двух классов – с положительной и отрицательной оценкой. В основу алгоритма положено использование определенных лексико-грамматических конструкций наряду с оценочным лексиконом, содержащим классы слов с положительной и отрицательной оценкой, а также три служебных класса.
-
Sentiment analysis on product reviews based on weighted word embeddings and deep neural networks
Авторы: Aytuğ Onan
Описание: Анализ тональности текста – это одна из основных задач обработки естественного языка, в которой извлекаются отношения, мысли, мнения или суждения по отношению к определенному предмету. Интернет – это неструктурированный и богатый источник информации, содержащий множество текстовых документов с мнениями и отзывами. Распознавание тональности может быть полезным для отдельных лиц, принимающих решения, коммерческих организаций и правительств. В этой статье мы представляем основанный на глубоком обучении подход к анализу настроений в отзывах о товарах, полученных из Twitter. Представленная архитектура сочетает в себе TF-IDF взвешенное встраивание слов Glove с архитектурой CNN-LSTM.
-
Managing demand volatility during unplanned events with sentiment analysis: a case study of the COVID-19 pandemic
Авторы: Angie Nguyen, Samir Lamouri, Robert Pellerin
Описание: Данная статья ставит целью определить, влияют ли настроения, передаваемые новостными СМИ, на поведение потребителей. В нем представлено тематическое исследование, проведенное в три этапа: (1) сбор и подготовка данных; (2) разработка модели анализа настроений; (3) проведение статистического анализа для анализа корреляции между настроениями в новостях и потреблением наркотиков во время кризиса COVID-19.
-
A survey of sentiment analysis in the Portuguese language
Авторы: Denilson Alves Pereira
Описание: Целью данной работы является обзор усилий, предпринятых специально для анализа тональности текстов на португальском языке. В ней классифицируются и описываются современные работы, включающие подходы к каждой из задач анализа настроений, а также вспомогательные языковые ресурсы, такие как инструменты обработки естественного языка, лексиконы, корпорации, онтологии и наборы данных.
-
Национальная библиотека Украины имени В.И. Вернадского
Крупнейшая библиотека Украины, главный научно-информационный центр государства. Входит в число десяти крупнейших национальных библиотек мира.
-
НТБ ДонНТУ
Научно-техническая библиотека Донецкого национльного технического университета.
-
IPR BOOKS
В электронно-библиотечной системе IPR BOOKS можно найти учебники и учебные пособия, монографии, производственно-практические, справочные издания, а также деловую литературу для практикующих специалистов. В ЭБС включены издания за последние 10 лет, перечень их постоянно растет.
-
eLibrary
Научная электронная библиотека eLIBRARY.RU – это крупнейший российский информационно-аналитический портал в области науки, технологии, медицины и образования.
-
КиберЛенинка
КиберЛенинка – это научная электронная библиотека, построенная на парадигме открытой науки (Open Science), основными задачами которой является популяризация науки и научной деятельности, общественный контроль качества научных публикаций, развитие междисциплинарных исследований, современного института научной рецензии, повышение цитируемости российской науки и построение инфраструктуры знаний.
-
disserCat – научная электронная библиотека диссертаций и авторефератов
Научная электронная библиотека диссертаций и авторефератов disserCat – это самый крупный каталог научных работ в российском интернете.
-
METANIT.COM
На сайте можно найти материалы по таким направлениям, как язык C# и семейство технологий .NET (ASP.NET, WPF, Entity Framework и т.д.), технологии на базе Java ( Java SE, программирование под ОС Андроид и т.д.), Python, Dart (в том числе Flutter), работа с базами данных (MS SQL Server, MySQL, MongoDB) а также WEB-технологии, такие как HTML5, AJAX, jQuery, Node.js, ExtJS, Angular, React и др.
-
GitHub
Крупнейший веб-сервис для хостинга IT-проектов и их совместной разработки. Основан на системе контроля версий Git
-
StackOverflow
Система вопросов и ответов о программировании.
-
Хабр (Habr)
Сайт в формате системы тематических коллективных блогов с элементами новостного сайта, созданный для публикации новостей, аналитических статей, мыслей, связанных с информационными технологиями, бизнесом и интернетом.
-
Tproger
Tproger – издание о разработке и обо всём, что с ней связано.
-
Proglib – библиотека программиста
Библиотека программиста – источник образовательного контента в IT-сфере. Здесь публикуют обзоры книг, видеолекции и видеоуроки, дайджесты и образовательные статьи.
-
Kaggle
Площадка для соревнований по машинному обучению с множеством интересных датасетов.
-
Devpractice
На сайте можно найти уроки по Python как для начинающих, так и для тех, у кого уже есть немного опыта в программировании.
-
Pythonworld.ru
Сайт с уроками и туториалами по Python 3 (преимущественно для новичков).
-
Бесплатный курс от ru.code-basics
Этот курс посвящен азам написания программ на Python.
-
Pytonru
Сайт содержит большое количество уроков для тех, кто уже продвинулся в изучении языка и хочет сделать что-то интересное.
-
A Byte of Python
A Byte of Python
– это бесплатная книга по программированию на языке Python. Она служит учебником или руководством по языку Python для начинающих. -
Learnpython.org
Сайт примечателен тем, что, помимо уроков по Python, предоставляет возможность проверить знания на практике: написать код, запустить программу и получить отчет по ошибкам.
-
Форум Python Программистов
Профессиональные программисты отвечают на вопросы новичков и более опытных разработчиков.
-
Изучаем Python – Полный курс для начинающих
В 4-х часовой лекции собрана информация по установке и настройке Python и PyCharm, показано создание калькулятора и игры. Лектор рассказывает о важных составляющих яызка от переменных и списков до модулей и функций.
-
Programming with Mosh
Лектор дает материал на хорошем английском, доступны также субтитры на русском языке.
-
ZProger [ IT ]
Канал содержит не только уроки по Python, но и информацию о Linux-системах и системном администрировании.
-
DoCode.ru
Канал сайта DoCode.ru, который содержит различные уроки по Python от базовых конструкций вплоть до использвоания плагинов для автоматизации. Также есть уроки по JavaScript.
-
Google Python Class
Плейлист от Google Developers о веб-программировании на Python. Опытные разработчики демонстрируют практическое применение материала, представленного на теоретических курсах Google's Python Class.
-
Scikit-learn
В данной библиотеке есть алгоритмы для машинного обучения и интеллектуального анализа данных: кластеризации, регрессии и классификации.
-
TensorFlow
Основная библиотека с открытым исходным кодом, которая помогает в разработке и обучении моделей машинного обучения. Создана Google.
-
Keras
Благодаря модульности и масштабированию библиотека позволяет легко и быстро создавать прототипы. Поддерживает как сверточные и рекуррентные сети, так и их комбинации.
-
NLTK (Natural Language Toolkit)
Набор библиотек для обработки естественного языка. Основные функции: разметка текста, определение именованных объектов, отображение синтаксического дерева, раскрывающего части речи и зависимости.
-
Dostoevsky
Библиотека для анализа тональности текстов на русском языке.
-
RuTweetCorp
Русскоязычный корпус коротких текстов RuTweetCorp, состоящий из 17 639 674 записей.
-
Multi-Domain Sentiment Dataset (version 2.0)
Датасет, который содержит отзывы о товарах на Amazon.
-
Twitter US Airline Sentiment
Набор данных из Twitter об авиакомпаниях США, датируемый февралем 2015 года, разделённый на положительные, негативные и нейтральные твиты.
-
Stanford Sentiment Treebank
Стэнфордский датасет для анализа тональности.
-
Sentiment140
Датасет с 160 000 твитов с удалёнными смайликами.