ДонНТУ   Портал магистров

Ссылки по теме выпускной работы

    Материалы магистров ДонНТУ

  1. Автореферат В.С. Анохиной "Автоматизация извлечения знаний из Internet в форме онтологии для построения прикладных баз знаний"

    Руководитель: к.т.н., О.И. Федеяв

  2. Магистерская работа А.А. Фоменко "Инструментальные средства создания интеллектуальных САПР на основе семантических продукций, определенных над формальными грамматиками"

    Руководитель: доц. каф. ПМИ А.В. Григорьев

  3. Магистерская работа А.В. Коварской "Создание инструментальных средств построения экспертных систем на основе грамматического подхода"

    Руководитель: доц. каф. ПМИ А.В. Григорьев

  4. Магистерская работа Ю.Н. Купневич "Инструментальные средства обработки и хранения гетерогенных данных в системах дистанционного обучения"

    Руководитель: к.т.н., доц. А.М. Фонотов

  5. Магистерская работа А.И. Криницкой "Разработка инструментальных средст очистки web-страниц от информационного шума"

    Руководитель: к.т.н., Т.В. Мартыненко

    Научные работы и статьи

  6. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика

    Авторы: Е.И. Большакова, Э.С. Клышинский, Д.В. Ландэ, А.А. Носков, О.В. Пескова, Е.В. Ягунова 

    Описание: В учебном пособии рассматриваются базовые вопросы компьютерной лингвистики: от теории лингвистического и математического моделирования до вариантов технологических решений. Дается лингвистическая интерпретация основных лингвистических объектов и единиц анализа. Приведены сведения, необходимые для создания отдельных подсистем, отвечающих за анализ текстов на естественном языке. Рассматриваются вопросы построения систем классификации и кластеризации текстовых данных, основы фрактальной теории текстовой информации. Предназначено для студентов и аспирантов высших учебных заведений, работающих в области обработки текстов на естественном языке.

  7. Где скрывается смысл бессмысленного текста?

    Авторы: Е. В. Ягунова 

    Описание: Коммуницируемый смысл содержится в тексте. Именно текст является основной единицей данного исследования, звучащий текст в контексте восприятия в ситуации речевой коммуникации. Но что же такое текст? И что из себя представляет коммуницируемый смысл?

  8. Эксперимент в психолингвистике:Конспекты лекций и методические рекомендации

    Авторы: Е.В. Ягунова 

    Описание: В учебном пособии рассматривается роль эксперимента в психолингвистике. Учебное пособие содержит две части: в первой даются общие методические рекомендации для планирования и проведения эксперимента (с предварительной оценкой возможности статистической обработки полученных результатов), во второй – в качестве примера экспериментальной методики рассматривается ассоциативный эксперимент. Основой данного учебного пособия послужили исследования школы В.Б.Касевича, а также школ Л.А.Чистович, Л.В.Бондарко, петербургской психолингвистической школы А.С.Штерн и Л.В.Сахарного. К ученикам и последователям всех этих школ причисляет себя автор.

  9. Теория речевой коммуникации

    Авторы: Е.В. Ягунова 

    Описание: Учебно-методические указания, задачи для самостоятельной работы и программа курса «Теория речевой коммуникации» первоначально разработаны на кафедре теории и методики преподавания искусств и гуманитарных наук Санкт-Петербургского государственного университета. Эти учебно-методические указания и программа рекомендованы для студентов и магистрантов гуманитарных факультетов Санкт-Петербургского государственного университета. Они могут быть также использованы при проведении занятий по разным дисциплинам в области теоретической и прикладной лингвистики.

  10. Определение стилевых и жанровых характеристик коллекций текстов на основе частеречной сочетаемости

    Авторы: А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова  

    Описание: Тексты разных функциональных стилей отличаются по частотности синтаксических конструкций. Тем не менее, до настоящего времени не проводилось анализа особенностей синтаксической структуры для текстов разных функциональных стилей, жанров и/или предметных областей. Одной из причин недостаточной изученности этого вопроса оказывается то, что существующие методы синтаксического анализа не позволяют проводить однозначную синтаксическую разметку текстов. Ниже мы предлагаем метод, также не проводящий полный синтаксический разбор текста.

  11. Эксперимент и вычисления в анализе ключевых слов художественного текста

    Авторы: Е.В. Ягунова 

    Описание: В статье излагаются пути выделения и классификации ключевых слов художественного текста. Методика предполагает объединение традиционного эксперимента с информантами и анализа формальных признаков, значения которых выявляются в ходе вычислительного эксперимента.

  12. Ключевые слова в исследовании текстов Н.В. Гоголя

    Авторы: Е.В. Ягунова 

    Описание: В этой статье приводятся результаты исследования процедур понимания текста, где понимание текста приравнивается к извлечению из него информационной структуры. Извлечение наиболее важной информации, передаваемой текстом, может быть смоделировано через процедуры выделения ключевых слов текста. В результате этих процедур исследователь получает наборы ключевых слов (см., напр., (Сахарный и др. 1984; Сахарный и др. 1988; Сиротко-Сибирский 2006 и др.)). Ключевые слова в наборе заведомо неравноправны не только по степени уверенности отнесения слова к ключевым, но и по определению специфической роли для каждого ключевого слова.

  13. Извлечение и классификация коллокаций на материале научных текстов. Предварительные наблюдения

    Авторы: Е.В. Ягунова, Л.М. Пивоварова 

    Описание: В данном докладе мы рассматриваем автоматическое извлечение информации о предметной области корпуса научных текстов, что неотделимо от задач выделения наиболее важных терминов. Нас интересует предметная область научных текстов, посвященных теоретической и прикладной лингвистике. Большинство интересующих нас терминов этой предметной области оказываются неоднословными.

  14. Природа коллокаций в русском языке. Опыт автоматического извлечения и классификации на материале новостных текстов

    Авторы: Е.В. Ягунова, Л.М. Пивоварова 

    Описание: Поскольку текст есть структурированная последовательность единиц разных уровней, сложносоставные подструктуры текста (коллокации) выступают важным объектом при исследовании процедур анализа (и синтеза) текста. Таким образом, создается возможность исследования структурных единиц текста разных языковых – и текстовых – уровней и их роль в процедурах анализа и синтеза речи (текстов). Результаты такого исследования могут быть востребованы специалистами в самых разных областях: теоретическая и прикладная лингвистика, автоматический анализ текста. Более того, формализация методов анализа и синтеза речи, отражающая реальные стратегии восприятия и порождения речи человеком, является одной из наиболее фундаментальных проблем междисциплинарной области исследования восприятия речи человеком (т.е. задачей для лингвистов, физиологов, психологов, работающих в этом направлении).

  15. Реализация ресурса знаний в системе извлечения информации из текста

    Авторы: Д.А. Александровский, Д.А.Кормалев, Е.П.Куршев, Е.А.Сулейманова, И.В.Трофимов

    Описание: Задача извлечения информации из текста состоит в автоматической обработке документов с целью распознавания и выделения релевантной информации и представления ее в структурированной форме. Практически в любой предметной области для точного извлечения требуются априорные знания о ней — знания о понятиях, объектах и отношениях, связанных с целями извлечения или являющихся целями. В свою очередь, извлеченная из текстов информация может нести в себе новые знания о предметной области и быть полезна для дальнейшего извлечения. Тесная связь между априорной и извлеченной информацией, а также между предметными и лингвистическими знаниями сформировала потребность в унификации средств представления. В статье рассматривается интегрированный ресурс знаний (РЗ) системы извлечения информации, объединяющий базу предметных знаний и словарь.

  16. Использование но ластеров для улучшения извлечения информации из текстов

    Авторы: Д. Котельников 

    Описание: Новостные кластеры содержат разнообразные описания одного и того же события, изложенные разными авторами. В работе описывается метод обогащения шаблонов, извлекающих информацию из текста, за счет нахождение в новостном кластере нескольких близких по содержанию предложений, в которых хотя бы в одном удалось обнаружить извлекаемое событие. Полученные таким образом примеры могут быть использованы для машинного обучения.

  17. Технология извлечения информации из текстов, основанная на знаниях

    Авторы: И.В. Трофимов, Д.А. Кормалев, Е.П. Куршев, Е.А. Сулейманова 

    Описание: Значительная доля информации, доступной в электронном виде, представлена текстами на естественном языке. Заключенная в них полезная информация не структурирована, а значит, ее невозможно обработать и проанализировать классическими вычислительными методами и средствами.

  18. Автоматизированное пополнение шаблонов для системы извлечения информации из текста

    Авторы: Д.С. Котельников, Н.В. Лукашевич

    Описание: В работе описывается способ автоматизированного пополнения шаблонов для системы извлечения информации из текстов. В качестве источника разнообразных описаний события используются новостные кластеры. Пополнение шаблонов производится за счет нахождения в новостном кластере близких по содержанию предложений, при условии обнаружения хотя бы одном них извлекаемого события. Проведены эксперименты, в которых показана возможность автоматического обнаружения дополнительной лексической информации для отражения в шаблонах системы извлечения информации из текстов.

  19. Технологии извлечения, обработки и анализа информации

    Авторы: Н.Л. Шубина, Л.Н. Беляева, А.А. Виландеберк

    Описание: Разработка методов извлечения знаний из источников разного состава, природы и качества основывается на применении гуманитарных технологий в социальной сфере. Свободное и произвольное движение информации при решении конкретных проблем определяет необходимость не просто извлечь информацию, но и сделать ее активной, то есть обеспечить максимальное использование информации на всех видах носителей, электронных в том числе, и содействовать распространению и получению знаний.

  20. Техническая и справочная литература

  21. Национальная библиотека Украины имени В.И. Вернадского

    Крупнейшая библиотека Украины, главный научно-информационный центр государства. Входит в число десяти крупнейших национальных библиотек мира.

  22. Академик

    Словари и энциклопедии на различную тематику

  23. Википедия свободная инцеклопедия

    Свободно пополняемая энциклопедия на любую тематику

  24. ИНТЕЛТЕК-ПЛЮС

    Область деятельности НПЦ "ИНТЕЛТЕК ПЛЮС" - сфера высоких информационных технологий. Это разработка объектных СУБД и сложных информационно-поисковых систем, программ для опубликования корпоративных информационных систем в Интернет, научно-исследовательская деятельность в области полнотекстового поиска и семантического анализа текста, продвижение объектных технологий ведущих мировых производителей на российский рынок.

  25. Специализированные сайты и порталы

  26. CIT-форум

    Крупнейший архив научной и практической информации по всем направлениям компьютерных наук

  27. Лаборатория компьютерной лингвистики

    Конфренции и публикации института проблем передачи информации им. А.А.Харкевича, РАН

  28. Модели речевой дейтельности

    Инфррмация о синтаксисе и семантике различных языков

  29. Проект мониторинга Рунета Webground

    Сервис WebGround позволяет: оперативно получать информацию по мере ее появления в Интернете;создавать собственные информационные базы - персональные архивы информации для последующей обработки и ретроспективного анализа;в режиме реального времени анализировать и воспринимать большой объем поступающей информации;пользоваться автоматически классифицированной и тематически сгруппированной информацией.

  30. Щербак.net

    Сайт SHCHERBAK.NET – это блог кандидата технических наук по специальности "Системы и средства искусственного интеллекта" Щербака Сергея Сергеевича обо всем что касается искусственного интеллекта, онтологий и Semantic Web.

  31. Украинская лингвистическая лаборатория

    Сайт проекта Украинская Лингвистическая Лаборатория. Ядро проекта составляют ученые кафедры математической информатики Киевского национального университета имени Тараса Шевченко.

  32. Международная конференция по компьютерной лингвистике

    На cайте можено познакомиться с материалами конференций, узнать последние новости Диалога - междисциплинарного форума, собирающего ведущих лингвистов, специалистов в области автоматической обработки языка, ведущие компании, работающие в области компьютерной лингвистики

  33. Cсылки посвяшенные извлечению информации в интернете

  34. Лингвистическое обеспечение информационно-поисковой системы Excalibur

    Автор: А.Н. Королёв 
    Описание: Лингвистическое обеспечение информационно-поисковой системы Excalibur RetrievalWare: Аналитический аспект 

  35. Лингвистический процессор для информационно-поисковой системы

    Автор: А.М. Андреев, Д.В. Березкин, А.В Брик 
    Описание: В работе описан способ построения многовариантного синтаксического анализатора текстов на естественном языке, использующего метод с недетерминированной стратегией. 

  36. Система обработки текстов на естественном языке

    Автор: А.В. Анисимов, А.А. Марченко 
    Описание: В работе описывается система, которая была создана для решения таких задач обработки текстов на естественном языке (Natural Language Processing, NLP), как анализ текстов на естественном языке, синтез текстов, автоматическая генерация реферата текста, автоматическая индексация (определение тематики) текста, автоматический перевод текста с одного языка на другой, поддержка диалога на естественном языке и т.д. 

  37. Обработка текстов на естественном языке

    Автор: Константин Селезнев 
    Описание: В статье представлен подход автора к рассмотрению проблем обработки текстов на естественном языке 

  38. Построение синтаксического анализатора текстов на естественном языке

    Автор: А.М. Андреев, Д.В. Березкин, А.В. Брик, Ю.М. Смирнов
    Описание: Предмет данной работы - блок синтаксического анализа ЛП, предоставляющий исходные данные для семантического анализатора и, как правило, определяющий качество работы ЛП в целом. Автор: 

  39. Ссылки и статьи посвященные извлечению информации из новостей

  40. Д.В. Ландэ, А. А. Снарский, И.В. Безсуднов. ИНТЕРНЕТИКА.Навигация в сложных сетях: модели и алгоритмы

    Основная идея этой книги – показать связь двух активно развивающихся в настоящее время направлений – теорий информационного поиска и сложных сетей. Именно на стыке этих двух областей может лежать решение открытой проблемы эффективной навигации в современных информационных сетях.

  41. Л.М. Пивоварова, Е.В. Ягунова. Информационная структура научного текста. Текст в контексте коллекции

    Тема доклада определяется желанием понять особенности структуры научного текста (в отличие от новостного или художественного текстов). Наша задача состояла в определении информационно наиболее важных структурных составляющих: ключевых слов, характеризующих смысл текста, и терминологически нагруженных коллокаций, характеризующих тематику коллекции.

  42. А.Н.Савина, Е.В.Ягунова. Исследование коллокаций с помощью экспериментов с информантами

    Доклад посвящен решению одного из вопросов широкой области изучения природы коллокаций и возможной их классификации. Этот доклад представляет работу в рамках общего проекта, посвященного этой теме.

  43. Е.В. Ягунова, Л.М. Пивоварова.От коллокаций к конструкциям

    Название статьи само по себе содержит некоторую провокацию: названные в нем существительные являются терминами с очень размытым значением. В зависимости от той или иной научной парадигмы изменяется трактовка того, что такое «коллокация» и что такое «конструкция».

  44. Л.М. Пивоварова, Е.В. Ягунова. Извлечение и классификация терминологических коллокаций на материале лингвистических научных текстов (предварительные наблюдения)

    В настоящее время проводится исследование, целью которого является изучение возможности выделения формальных признаков, необходимых для определения предметной области коллекций текстов и ключевых слов, описывающих рассматриваемые коллекции

  45. Julia Kiseleva. Grouping Web Users based on Query Log

    Описание: Grouping web users is one of the most important research topics in web usage mining. Existing approaches grouping web users based on the snapshots of web user sessions. Web user groups generated based on their historical web sessions are useful in intelligent web advertisement and web caching. In this paper we focus on the grouping web users using their web logs.

  46. Julia Kiseleva.Unsupervised Query Segmentation Using Click Data and Dictionaries Information

    Описание: We describe results of experiments with an unsupervised framework for query segmentation, transforming keyword queries into structured queries. The resulting queries can be used to more accurately search product databases, and potentially improve result presentation and query suggestion. The key to developing an accurate and scalable system for this task is to train a query segmentation or attribute detection system over labeled data, which can be acquired automatically from query and click-through logs. The main contribution of our work is a improving method to automatically acquire such training data – resulting in significantly higher segmentation performance, compared to previously reported methods.

  47. Александр Беленький. Текстомайнинг. Извлечение информации из неструктурированных текстов

    Описание: Статья посвященная текстомайингу, в которой описываются наиболее популярные программы по извлечению данных

  48. Николай Ильин, Сергей Киселев, Владислав Рябышкин, Сергей Танков. Технологии извлечения знаний из текста

    Описание: Основные знания аналитики получают в результате сравнения, анализа и синтеза информации из разрозненных фактов, размещенных в текстах. Как используются технологии извлечения знаний из больших текстовых массивов на русском языке?

  49. История компьютера - Анализ текста

    Описание:Задача извлечения информации заключается в обработке текста на естественном языке с целью извлечения заданных элементов. На входе системы извлечения информации –– слабоструктурированный или неструктурированный текст на естественном языке; на выходе–заполненные структуры данных (экзофреймы), позволяющие проводить дальнейшую автоматическую или ручную обработку информации. Извлечение информации можно рассматривать как особый вид аннотирования текстов, когда в роли аннотации выступает специфическая структура данных.

  50. Прикладная лингвистика

    Описание: Статья из фонда знаний "Ломоносов" посвященная прикладной лингвистике

  51. Лаборатория по извлечению данных ixLab

    Описание: Сайт лаборатории занимающейся извлечением данных

  52. Домашняя страница Евгения Рабчевсокого

    Описание: Публикации связанные с областью извлечения данных

  53. Text Mining: современные технологии на информационных рудниках

    Описание: Сегодня вопросы анализа структурированной информации в различных прикладных областях в зависимости от специфики задач решены на 90 — 100%. С точки зрения технологий это объясняется очень просто: современные инструменты анализа позволяют «видеть» данные, хранящиеся в БД. На рынке широко представлены такие привычные пользователям технологии, как OLAP, BI и Data Mining, основанные на популярных методах статистической обработки, прогнозирования и визуализации.

  54. Технологии извлечения, обработки и анализа информации

    Описание: Подборка материалов по извлечению данных